本文发布于 2026-06-18 17:02导读
看似“自主生成”的内容,实则暗藏隐蔽的人为操纵与信息陷阱,各类AI“投毒”乱象正在侵蚀网络信息生态。
2025年末,有操盘者提前重仓某中小市值个股,批量发布虚假利好帖文污染网络语料。相关不实信息被爬虫抓取、进入大模型检索增强生成(RAG)环节,致使AI输出“看好”该股的倾向性内容。最终,操纵者高位套现,散户遭受损失。
上述“人为语料投毒+AI信任滥用”的乱象并非个例,近两年高发、频发。虚假信息借助大模型快速传播,造成舆论失序、信息失真,引发新闻业界与学界的普遍担忧。
面对AI投毒、虚假信息泛滥等一系列问题,新闻行业、学界呼吁建立大模型信源白名单制度,规范AI内容生态,筑牢AI时代的信息安全根基。
一、生成式AI野蛮生长,冲击网络内容生态
数据“投毒”、虚假信息泛滥等乱象频发,冲击着网络内容生态。
“人为篡改、伪造数据的‘投毒’手段越来越隐蔽,不法分子借助大模型的传播力放大不实内容,从资本市场、民生服务到公共舆论场,虚假信息无孔不入。”中国经济传媒协会名誉副会长刘灿国注意到,当前大模型“投毒”行为频发、虚假信息大肆传播,这些低质内容混入大模型检索和训练过程,污染了互联网内容生态。
刘灿国还发现,生成式AI进一步放大了错误信息的传播范围。权威声音被海量碎片化虚假信息淹没,网络舆情极易偏离客观事实、滋生负面情绪、引发公共争议,舆论失序、信息失真,打破了清朗有序的网络传播格局,为网络治理、社会稳定埋下隐患。
事实上,针对AI语料不合规、数据“投毒”等突出乱象,监管层面已出台整治举措。国家网信办已于今年4月启动“清朗·整治AI应用乱象”专项行动,重点整治大模型训练语料不合规、AI数据“投毒”、信源不标注、缺乏交叉验证等七类问题。
在国家广告研究院品牌实验室副主任陈妮看来,专项行动标志着国内AI治理从事后内容管控转向源头语料治理,数据合规、信源可溯成为不可触碰的行业红线。“更关键的是,媒体内容作为训练数据的‘资产属性’正在获得政策层面的确认,为规范大模型发展指明了方向。”
监管划定合规底线后,如何建立长效机制成为行业核心议题。新闻业界、学界专家呼吁,由中央网信办、政策制定部门效仿互联网新闻信息稿源名单,推出大模型信源白名单制度,大模型优先采信主流媒体等权威语料,为清朗网络空间保驾护航。
二、落地大模型信源白名单制度,筑牢AI时代信息根基
想要理解白名单制度的现实紧迫性,首先需要看清AI分发模式给新闻行业带来的冲击。
6月16日,路透社新闻研究所发布《数字新闻报告2026》,报告的十大结论之一指出:AI对新闻业最大的冲击是用户可能不会再点击新闻信息源(original source)。
大模型带来的“零跳转”对新闻业的冲击,对国内媒体来说更为严峻。
每经科技首席技术官岳琦透露了一个洞察:在一些特定场景下国外主流大模型对权威媒体官网内容的引用率超过20%,而国内部分类似场景引用率常常不足1%。“这一方面说明国内主流媒体对官网的技术迭代和内容呈现重视度不够,同时也表明大量国内媒体的优质内容没有被Al‘看见’。”
国内外权威信源引用率的巨大差距,进一步凸显搭建白名单机制的现实意义。
“设立大模型抓取信源白名单机制,从源头净化AI内容生态,维护主流媒体公信力,保障信息真实性与权威性,真正让大模型用可信信源、出优质内容。”经济参考报副总编辑宋振远对白名单抱以较高期待。
广西日报社总编辑刘昆提出,大模型时代要确立主流媒体的“数据权威”地位,白名单是一件必要又紧迫的基础制度设计。“给大模型核心训练数据与生成内容标注引用来源建立‘白名单’制度,不仅是实用有力的管理手段,更是打造未来健康、清朗、可信数字信息生态。”
他认为,白名单制度能够发挥三大“定盘星”作用:一是正本清源,要求大模型在解读公共事务、时政新闻、经济数据等内容时,优先选用白名单内权威信源,从源头防范数据“投毒”和虚假信息,筑牢事实根基;二是明晰权责,强制信源标注实现内容全链路溯源,一旦AI生成信息出错,可快速定位责任主体,倒逼内容生产者严谨创作;三是价值引领,以白名单为标杆,引导行业资源向优质原创内容倾斜,营造“良币驱逐劣币”的良性生态。
建立大模型白名单制度的核心价值正在于,正本清源,重构可信信息生态。
当出台大模型信源白名单成为业界、学界共同呼声,具体怎么制定标准?准入范围是什么?
陈妮分析说,用户更关注大模型的答案“对不对”,而不是谁发布的;信源可信度需从权威性、专业性、时效性等多维度综合评判,不同场景权重各异;内容生产主体纷繁复杂,如果简单按平台划分易出现偏差。“虽然称为大模型信源白名单,实质是搭建一个信源分级与动态治理体系。”
1.分层划定白名单:坚持权威优先,分类管控、动态调整、持续监测
接受访谈的专家一致认为,白名单绝非单一目录,需遵循分层管理、权责对等、动态更新的原则,搭建金字塔式信源体系,区分核心信源、专业信源与补充信源,兼顾权威性、专业性与实用性,杜绝“一刀切”。
第一层为核心基准信源,强制作为大模型首要采信对象。该层级纳入党中央机关报、国家通讯社、中央重点新闻网站、各省(区、市)党委机关报等主流媒体。这些媒体是国家政策、公共事实、重大舆情的法定发布主体,权威性不可替代。要求大模型在解读大政方针、时政新闻、宏观数据等内容时,必须优先抓取此类信源,且生成内容时显著标注来源,守住信息安全底线。
第二层为专业垂直信源,服务细分领域信息需求。主要收录具备正规新闻采编资质的国家级行业媒体、权威财经媒体、学术期刊、国家高端智库、正规科研机构等。这类主体在科技、法律、医疗、产业经济等垂直领域具备专业优势,大模型在对应领域需将其作为主要信源,并做多源交叉验证,保障专业内容的准确性。财经类信源范围可适当延伸至交易所、监管机构等官方平台,评估标准侧重资质、牌照与合规记录,让专业信源各司其职。
第三层为专业补充名录,审慎开放优质自媒体准入通道。综合多位专家观点,由于内容审核体系不完善、易滋生虚假信息,自媒体原则上不得进入核心与专业白名单。但是,极少数在自然科学、工程技术、医疗卫生等高度专业化的非公共政策领域,拥有经严格验证的顶尖学术资质、积累了长期专业声誉的个人学者或研究团队自媒体,经相关高校、科研院所实名推荐,经网信部门与行业主管部门双重审核后,具备正规专业资质、长期无违规记录的专家自媒体,可纳入专项补充名录。并且,还需设置严格限制:引用范围仅限其认证专业领域,添加风险提示,并建立动态退出机制,一旦出现不实内容立即除名。
此外,依附于第三方平台的账号暂不纳入名单,优先选取拥有独立官网的内容主体,便于溯源管理。
2.出台配套保障措施:多方协同,推动制度落地见效
分层分级的信源体系只是基础框架,大模型信源白名单制度的长效运行,离不开主管部门、媒体、大模型企业三方协同,搭配技术、监管等多重配套机制,避免制度流于形式。
对于主管部门来说,一是加快完善法律法规与行业标准,细化AI内容抓取、授权、标注的具体规则,明确侵权追责机制,提高违规成本;二是建立信源动态复核机制,定期评估白名单主体内容质量、合规情况,及时清退违规主体、吸纳优质机构;三是推动建立训练数据来源登记披露制度,要求大模型厂商公示语料来源与授权文件,从源头规范数据使用。
对于各类媒体而言,需主动完成转型升级。一方面坚守内容主业,持续产出深度、独家、可验证的优质内容,强化核心竞争力;另一方面推进官方网站技术优化和内容生产模式改造,积极建设可被AI直接读取的权威数据集,主动对接大模型合规合作需求。
对于大模型企业,必须严格遵守白名单规则,优先选用名单内权威信源,规范信源标注与链接跳转。在检索增强生成时主动规避无授权内容、“黑帽”GEO产出的低质内容,落实信源溯源与风险提示要求。同时积极探索商业授权合作,按照市场规则向媒体支付内容使用费,构建“权威生产—合规使用—价值反哺”的良性循环。
观媒原创内容,未经授权不得转载、链接、转贴或以其他方式使用。本站其他转载内容,版权归原作者及出处所有。如有侵权,请联系我们进行删除。文章内容为作者个人观点,不代表观媒赞同其观点和对其真实性负责。本站只提供参考,不构成任何实际建议。