本文发布于 2026-01-09 16:43【摘要】本文聚焦南方新闻网的实践探索,阐述了AI赋能媒体系统性变革的战略路径与体系构建。南方新闻网立足“媒体+政务”资源积累,构建以粤数港人工智能语料库为基础、正元大模型安全防护围栏为保障、多模型混动技术框架优化成本、南方AI智能体实现场景落地的四位一体解决方案,形成了“知识+服务+安全”闭环,为主流媒体实现系统性变革提供了可复制的实践范式。文章认为,AI赋能是主流媒体提升舆论引导力和公共服务能力的关键路径,需持续推进技术、数据与业务深度融合。
大模型时代主流媒体面临的机遇与挑战
随着ChatGPT、DeepSeek等生成式人工智能的加速迭代,以大模型、大数据、大算力为核心支柱的智能技术,正以前所未有的力度渗透到社会生产生活各方面。在媒体领域,人工智能不再是辅助工具的简单升级,而是引发内容生产、传播逻辑、运营模式、产业生态全方位变革的核心驱动力。从内容创作的自动生成到传播渠道的精准匹配、从用户交互的智能响应到运营管理的高效协同,大模型技术正在重塑媒体行业的底层架构,推动行业向智能化深度跨越。
尤其是随着大模型算力的基础设施化,“技术平权”让媒体行业竞争格局正在悄然发生变化。主流媒体获得了迅速拉近甚至抹平与互联网企业、科技公司技术鸿沟的契机,独家数据资源、特色应用场景、创新交互方式正成为媒体行业竞争决胜的关键。
AI赋能主流媒体的核心判断与战略依据
(一)生态变革:生成式AI重构互联网服务形态
以生成式人工智能为代表的智能技术,正在打破传统互联网的服务模式与生态格局。从客户端到电脑软件、从社交平台到政务系统,各类应用程序都在加速接入生成式AI功能,实现从“工具型”向“智能型”转化。
这种变革并非局部的技术升级,而是全局性的生态重构。在内容生产领域,AI可辅助完成新闻写作、编辑校对、创意策划等工作;在传播推广领域,AI可实现用户画像精准匹配、传播渠道智能选择、传播效果实时分析;在运营管理领域,AI可优化流程管控、降低运营成本、提升决策效率;在经营发展领域,AI可拓展服务边界、创新盈利模式、培育新增长点。对于主流媒体而言,这种生态变革既是挑战更是机遇,唯有主动融入、积极布局,才能在未来生态格局中占据主导地位。
(二)技术趋势:高质量语料库成为模型核心竞争力
生成式人工智能的性能表现,本质上取决于其背后的大模型能力,而大模型的核心支撑则是语料库质量与规模。在技术发展初期,数据规模是决定模型能力的关键因素,随着提示词工程、RAG(检索增强生成)、微调、知识图谱等技术框架的日趋成熟,语料库质量已成为提升模型精准度、可靠性和专业性的核心要素。
与通用大模型追求“大而全”的语料库不同,行业应用场景下的大模型更需要“小而精”的专业语料库。对于媒体、政务领域而言,语料库不仅需要具备海量数据规模,更需要满足来源可信、内容权威、立场正确、动态更新等要求。高质量的专业语料库能够让大模型快速掌握行业知识、政策规范、业务流程,避免出现通用模型常见的“张冠李戴”“胡言乱语”等问题,真正实现“专业对口”的智能服务。
(三)传播演进:语料库的意识形态属性影响舆论导向
生成式人工智能通过交互式对话向用户传递信息、表达观点,其形成的看法、意见和评判会潜移默化地影响用户认知,进而对社会共识产生广泛影响。这一影响的形成,与语料库所包含的价值导向、文化背景和知识立场密切相关——这些内容会自然融入AI生成过程中,成为影响公众认知的潜在因素。
如果生成式AI所使用的语料未经筛选、包含大量不实或低质信息,就可能传递误导性内容、扰乱公众理解,甚至影响信息生态;反之,若能构建内容真实、来源可信、导向积极的语料库,则能让AI成为传递信息的有效工具。因此,构建高质量、可信赖的语料库,是主流媒体构筑AI应用比较优势的重要因素。
(四)供求关系:专业语料库的市场缺口亟待填补
当前,生成式人工智能在媒体、政务等领域的应用需求日益旺盛,但核心资源供给却存在明显短板。从媒体端来看,主流媒体需要依托生成式AI提升内容生产效率、优化政务服务质量,但现有通用大模型缺乏专业领域的语料支撑,难以满足专业性强、容错率低的业务需求。从企业端来看,互联网企业推出生成式AI产品服务时,需要高质量、可信的语料库增强模型能力,但市场上缺乏来源权威、经过审核校准的专业语料库。从政府端来看,各级党政机关希望通过AI提升办公效率、优化服务体验,但面临着数据安全、立场合规等多重约束,急需定制化的语料库解决方案。
国内目前尚无由媒体数据构成、来源可信、动态更新、审核校准观点立场、屏蔽虚假不良信息的人工智能语料库,这一市场缺口为主流媒体提供了差异化竞争切入点。
(五)媒体机遇:技术平权下的核心竞争力重塑
生成式人工智能的普及打破了技术壁垒,推动了“技术平权”时代的到来。以往,媒体机构与互联网企业、科技公司在技术研发能力上存在较大差距,难以在技术驱动的竞争中占据优势。而如今,大模型技术的开源化、模块化发展,使得媒体机构能够依托现有技术框架,结合自身特色资源进行二次开发,快速构建具有行业属性的智能应用。
在这一背景下,行业竞争焦点从单纯的技术能力比拼转向数据资源、场景应用和交互方式竞争。在这方面,主流媒体拥有两大核心优势:一是独家的权威数据资源,包括政策文件、政务信息、新闻报道等,这些数据是构建专业语料库的基础;二是丰富的场景应用经验,媒体的本质就是连接万物。主流媒体在“+政务”“+文化”“+旅游”等众多领域,积累了大量真实的应用场景和用户需求,具备把原始语料加工成高质量数据集和场景交互优化的独特优势。
南方新闻网的实践基础与痛点洞察
(一)“媒体+政务”的深耕积累与资源沉淀
南方新闻网通过深度参与广东数字政府建设,形成了强大的服务能力和资源沉淀。截至目前,南方新闻网已累计服务超过7000家省内外各级党政机关和群团事业单位,服务范围覆盖政务公开、政务服务、网络安全等多个领域,提供系统定制开发、数字产品租赁、信创适配改造、网络安全运营等多元化技术服务。
在长期的政务服务实践中,南方新闻网积累了三大核心资源:一是海量的权威数据,包括政策文件、机关公文、办事指南、政民互动记录、新闻报道、网评文章等,形成了超1.9PB的政务动态大数据和媒体内容大数据;二是丰富的应用场景,涵盖公文写作、政策咨询、业务办理、谣言辟谣、文化传承等多个政务及公共服务领域;三是深度的用户需求洞察,通过与各级党政机关的密切合作,精准掌握了政府部门在AI应用方面的核心诉求,以及基层工作人员和群众在使用智能服务时的痛点、难点。
(二)通用大模型的应用痛点与现实困境
在探索实践中,南方新闻网曾尝试直接使用通用大模型为政府单位和企业提供服务,但在实际应用中暴露出诸多难以解决的痛点问题,主要集中在三个方面:一是专业性不足。通用大模型缺乏政务领域的专业知识储备,对政策文件、办事流程、机构职能等内容的理解不够精准,常出现政策引用错误、流程解读偏差等问题,难以满足政务服务“专业性强、容错率低”的核心要求。二是准确性欠缺。通用大模型的训练数据来源复杂,部分数据缺乏权威验证,导致生成内容存在“胡言乱语”的现象,尤其在涉及敏感政策、突发事件等领域时,容易产生误导性信息,给意识形态安全带来风险。三是使用成本高。通用大模型的API调用费用较高,对于需要大量使用AI服务的党政机关而言,长期使用将产生高昂的运营成本;同时,全尺寸大模型对算力要求较高,本地化部署的硬件投入巨大,难以大规模推广应用。
(三)聚焦核心环节构建体系化解决方案
针对通用大模型在政务领域应用的痛点问题,南方新闻网明确了战略方向,即聚焦生成式人工智能链条的四大关键环节——数据、安全、成本、场景,围绕政务垂直领域的核心需求,构建体系化、定制化的AI解决方案。
这一战略决策的核心逻辑在于,数据是基础,只有构建高质量的专业语料库,才能让AI具备政务领域的专业知识;安全是底线,必须建立全方位的安全防护体系,确保AI生成内容的意识形态安全和数据安全;成本是关键,需通过技术创新降低AI应用的算力成本和运营成本,让政务机关能够“用得起、用得久”;场景是落点,只有结合具体业务场景打造智能应用,才能让AI真正融入政务服务流程,发挥实际价值。
基于这一逻辑,南方新闻网自主研发推出粤数港人工智能语料库、正元大模型安全防护围栏、多模型混动技术框架、南方AI智能体,形成“数据—安全—成本—场景”四位一体的体系化解决方案,为通用大模型在政务领域的落地应用提供完整的技术支撑。
体系化解决方案:四大核心能力的构建与应用
(一)粤数港人工智能语料库:专业知识的核心载体
粤数港人工智能语料库是南方新闻网AI解决方案的基础核心,旨在为大模型提供政务领域的专业知识支撑,解决通用模型专业性不足的痛点。该语料库采用三层数据结构设计,实现了数据从汇聚存储到加工应用的全流程闭环。
底层为数据湖,主要负责汇聚和存储初始数据。数据来源涵盖两大核心领域:一是政务数据,包括广东省各级党政机关的政策文件、机关公文、办事指南、政民互动记录、机构职能信息等政务动态数据;二是媒体数据,包括南方新闻网多年积累的新闻报道、评论文章、深度分析等内容数据。目前,数据湖已存储各类数据超1.9PB,形成了国内规模领先、来源权威的政务与媒体融合大数据资源池。
中间层为数据集,是大模型知识增强和调用训练的核心环节。南方新闻网基于媒体、政务服务的核心需求,对数据湖中的原始数据进行深度加工,构建了多个核心知识库和微调数据集,包括政策文件知识库、办事指南知识库、内容安全知识库、政民互动知识图谱、机构职能知识图、公文签报样例库等。这些数据集通过知识图谱构建、语义标注、场景化分类等处理,能够直接为大模型提供精准的知识调用和训练支撑。
顶层为数据产品,是经过大模型加工标注后形成的标准化服务输出,可供第三方系统直接调取使用。其中,“广东省政策文件动态数据包”已成功接入“粤省事”“粤商通”“涉企服务平台”等30多个政务系统平台,为这些平台提供政策检索、智能解读、精准推送等基于大模型的数据服务。
(二)正元大模型安全防护围栏:意识形态的安全屏障
正元大模型安全防护围栏是南方新闻网针对政务领域AI应用的安全需求研发的核心技术产品,旨在解决通用模型安全性不足的痛点,筑牢意识形态安全防线。该产品由南方新闻网联合哈尔滨工业大学、中山大学开展产学研攻关打造,目前已取得5项国家发明专利,技术水平处于国内领先地位。该安全防护围栏具备全方位的安全检测与防护能力,可对大模型生成的文字、图片、人脸、视频等各类内容进行多维度安全审核,重点覆盖意识形态安全、网络安全、隐私安全等领域。
(三)多模型混动技术框架:成本优化与本地化部署的关键支撑
多模型混动技术框架是南方新闻网为解决政务领域AI应用成本高、数据出域等痛点研发的创新技术方案,通过混合使用不同参数的大模型和普通算法,实现算力成本优化与本地化部署的双重目标。
该技术框架的核心逻辑是“按需分配、精准匹配”,即根据业务需求的复杂程度,灵活选择不同规模的模型和算法进行组合应用。对于政策解读、复杂公文写作等需要深度语义理解和专业知识支撑的复杂问题,调用大参数模型进行处理;对于简单咨询、信息查询等常规性业务,采用小模型或普通算法来完成;对于“政策咨询—办事指引—结果反馈”等多步骤复杂任务,则采用原子化拆分策略,将复杂任务拆解为多个简单子任务,通过组合使用多个小模型实现全流程闭环处理。
(四)南方AI智能体:场景化业务融合的落地载体
南方AI智能体是南方新闻网AI解决方案的场景化落地核心,在粤数港工人智能语料库的专业知识支撑、正元大模型安全防护围栏的安全保障、多模型混动技术框架的成本优化基础上,针对政务领域的具体业务场景,打造了一系列“即拿即用”的智能应用产品,实现了AI技术与政务服务的深度融合。
南方AI智能体的核心特点是“场景化、定制化、闭环化”,每个智能体都聚焦特定业务领域,通过向量检索、提示词优化、召回机制等工程化处理,实现“知识问答+业务办理+服务落地”的全流程服务。目前,南方新闻网已推出多个标杆性智能体产品,覆盖媒体、政策服务、妇儿服务、体育、地情文化传承等多个核心场景。
结语
AI赋能是主流媒体在数字化时代实现高质量发展的必由之路,也是主流媒体坚守意识形态阵地、提升公共服务能力、增强竞争力的核心抓手。南方新闻网基于“生态变革、技术趋势、传播演进、供求关系、媒体机遇”五大判断,立足“媒体+政务”核心优势,构建了“粤数港人工智能语料库、正元大模型安全防护围栏、多模型混动技术框架、南方AI智能体”四位一体的体系化解决方案,在实践中取得了显著成效,为行业提供了可复制、可推广的经验。
尽管面临着成本、人才、技术迭代等多重挑战,但AI赋能主流媒体系统性变革的趋势不可逆转。未来,南方新闻网将继续坚持技术创新与业务融合相结合、自身发展与行业协同相结合、经济效益与社会效益相结合,持续深化AI解决方案的构建与应用,不断拓展服务边界、提升服务质量,在AI时代打造主流媒体系统性变革的标杆,为传播主流价值、服务人民群众、推动国家治理体系和治理能力现代化作出更大贡献。
(作者:南方网信科技总经理)
观媒原创内容,未经授权不得转载、链接、转贴或以其他方式使用。本站其他转载内容,版权归原作者及出处所有。如有侵权,请联系我们进行删除。文章内容为作者个人观点,不代表观媒赞同其观点和对其真实性负责。本站只提供参考,不构成任何实际建议。