无锡日报报业集团与央视网共建“无锡主流价值高质量城市语料库”

本文发布于 2026-04-28 18:46
来源:无锡日报报业集团(公众号)   

数据是人工智能的“燃料”,语料是模型训练的基石。

近日,在2026年江苏省高质量数据集建设(无锡)现场会暨数据标注产业供需对接会上,报业集团与央视国际网络无锡有限公司签署《无锡主流价值高质量城市语料库战略合作框架协议》,标志着“无锡主流价值高质量城市语料库”项目正式启动。

32561

作为无锡主流舆论阵地,报业集团厚植地方影响力,积淀深厚权威内容;央视国际网络无锡有限公司则拥有融媒体全链条技术优势与国家级平台视野。此次合作扎根党媒视角,确保语料库在新闻真实性及合规性上的安全,为区域人工智能发展提供“可信、可控、可溯源”的数据底座。双方将依托各自在权威内容资源与媒体大数据技术方面的优势,携手打造立足无锡、辐射苏南的城市级高质量语料基础设施,为无锡建设“人工智能+”标杆城市注入强劲的“主流价值”动能,串起城市数字化转型的“现代产业链”。

事实上,以“智能数据链”激活“现代产业链”,集团早已提前布局。

近年来,集团紧扣市委、市政府建设“人工智能+”标杆城市的战略部署,立足党媒核心定位,构建导向正确、来源权威、特色鲜明、安全可控的城市级语料基础。集团常态化推进内容智能审核技术调研与自研,系统梳理存量优质资源,完成清洗、审校、标注、入库全流程管控,精心打磨出兼具无锡地域特色与地方文化底蕴的专属语料资源。换句话说,我们不仅提供“好数据”,更提供具备 “无锡腔调、无锡特质” 的优质训练语料,为区域大模型产业发展与城市数字化转型提供坚实可靠的数据支撑。

把语料库建实、用活是一项系统性工程。

立足顶层设计,稳步推进语料库系统化建设

语料库建设不是一蹴而就,关键在于起步稳、底子实。集团遵循“整体规划、分期实施”原则,结合“锡融智变”技术体系三年规划,以常态化语料资源建设为主线,依托自研的媒体资源管理体系,全面系统梳理无锡全域党媒矩阵内容资源。图文、视频、文稿等原生媒体资源正分门别类、精细化加工与深度整理,为城市专属语料库搭建垒起基石。

依托技术沉淀,实现语料生产智能化提质增效

集团深耕融媒技术创新,凭借获“王选新闻科学技术奖”的“锡融智变”融媒创新平台成熟成果,持续探索AI技术与媒体资源管理的深度融合。目前,已落地基于图像识别模型的定制化智能编目能力,创新媒体素材的智能标识覆盖,率先建成一批完成多模态标准化标注的城市高清图片与视频资源库。历史老素材、新增传播内容,都能被高效激活。同时,集团主动对接大模型行业发展规律,精准匹配主流大模型对近三年新鲜语料的需求,统筹整合优质即时内容与珍贵历史文献数据,兼顾语料的时效性与完整性。

坚持务实创新,构建语料多元可持续应用生态

在扎实做好语料库基础建设的同时,集团立足产业发展实际,坚持务实落地、适度创新的发展理念,科学规划语料资源的多维度应用路径。一方面,持续输出可信、可控、可溯源的标准化城市语料,面向政企单位、科创企业、研发机构提供合规语料供给、本地化行业大模型适配等基础服务,助力无锡数据标注产业与人工智能产业集聚发展。另一方面,依托语料库海量权威数据底座,紧扣全国报业融合发展规划中“人工智能+”的核心主线,探索开源共享、生态共建模式,逐步拓展知识库、行业智库、定制化智能信息服务等多元化应用场景,务实前行。

以媒体为基,以数智为翼。下一步,集团将继续对标市委关于AI产业、数据要素建设的工作部署与宣传思想文化数字化发展要求,优化语料加工、审核、管理的全链条工作机制,稳步扩充高质量城市语料储备,不断完善融合创新模式,以高质量语料底座赋能区域人工智能产业升级,以主流价值数据资源讲好无锡故事、传播江南文脉,为打造数字经济发展新高地贡献党媒力量。


原标题:以“智能数据链”激活“现代产业链”!锡报+央视网共建无锡高质量城市语料库
推荐阅读
版权声明

观媒原创内容,未经授权不得转载、链接、转贴或以其他方式使用。本站其他转载内容,版权归原作者及出处所有。如有侵权,请联系我们进行删除。文章内容为作者个人观点,不代表观媒赞同其观点和对其真实性负责。本站只提供参考,不构成任何实际建议。