人民网主流价值语料库入选“高质量数据集典型案例”

本文发布于 2025-09-13 15:04
来源:人民网   

人民网北京9月13日电 (记者夏晓伦、许维娜)近日,国家数据局发布一批“高质量数据集典型案例”,人民网“主流价值语料库”成功入选。

此次评选是为落实“人工智能+”行动有关部署,按照《国家数据局综合司关于征集高质量数据集典型案例的通知》工作安排,经严格的申报推荐、专家评审环节最终确定名单。

作为中央重点新闻网站排头兵,人民网依托传播内容认知全国重点实验室科研能力,早在2023年初就启动了主流价值语料库的建设工作。该语料库依托党报党网长期建设形成的新闻资讯、理论评论、政策法规和科普知识等优质资源,经科学采样、归集、清洗、标注、定制、风控等环节精心打磨而成。目前,语料库已入库3000多万篇基础语料、31万对问答语料、500多万对图文语料,在国内多家主流大模型厂家得到实际应用,正向纠偏作用明显。

主流价值语料库入选国家数据局发布的“高质量数据集典型案例”,是人民日报社AI建设的阶段性成果。人民网将持续保持项目建设的力度和质量,继续扩大语料库规模,不断深挖重点领域,为人工智能行业供给更多高质量语料。

据悉,国家数据局将定期围绕高质量数据集组织相关技术交流及主题研讨等活动。现将案例名单公布如下。(按推荐单位排序,排名不分先后)


原标题:国家数据局发布“高质量数据集典型案例” 人民网“主流价值语料库”入选
推荐阅读
版权声明

观媒原创内容,未经授权不得转载、链接、转贴或以其他方式使用。本站其他转载内容,版权归原作者及出处所有。如有侵权,请联系我们进行删除。文章内容为作者个人观点,不代表观媒赞同其观点和对其真实性负责。本站只提供参考,不构成任何实际建议。