用户登录
账 户:
密 码:
忘记密码
账  户:
新 密 码:
确认密码:
验证码:
获取验证码
60s
注册账号
账 户:
密 码:
验证码:
获取验证码
60s
首页 行业动态 人工智能高质量语料库共建启动 首批22家共建单位聚力打造权威可信语料体系
人工智能高质量语料库共建启动 首批22家共建单位聚力打造权威可信语料体系
2026.05.25

  本报讯 (记者徐平 李婧璇)5月23日,人工智能高质量语料库建设共建单位启动会议在广东深圳召开,来自出版、传媒、版权保护、数字技术等领域的首批22家共建单位代表齐聚现场,联合发布《人工智能高质量语料库建设倡议书》,推动我国人工智能高质量语料库建设的标准化、合规化和协同化。

  当前,我国人工智能产业进入规模化落地、规范化发展的关键阶段,大模型对高质量、正版化、可确权、可商用的权威知识语料需求持续攀升。但是,模型训练行业长期面临语料来源杂乱、内容质量参差不齐、版权授权壁垒突出、侵权风险高发等痛点和难题,制约着人工智能产业健康长远发展。为破解行业发展瓶颈、补齐可信合规语料短板,中国大百科全书出版社牵头发起人工智能高质量语料库共建工作,汇聚出版行业、媒体行业、科技企业、版权保护力量,构建良性产业生态。

  会上,中国大百科全书出版社社长高世屹详细介绍了语料库共建的时代背景、核心目的与行业价值,并宣读首批22家共建单位名单。他表示,共建工作以整合优质行业资源、打通版权授权堵点、构建互利共赢产业生态为核心目标,全程坚守“先授权、后使用”原则,聚力打造可确权、可商用的正版权威语料库。

  22家共建单位现场发布《人工智能高质量语料库建设倡议书》,向全行业及社会各界发出五点倡议:坚持版权为先,筑牢合法合规底线;坚持质量为本,共建权威可信语料体系;坚持标准引领,规范全流程管理;坚持协同共治,强化行业自律联合维权;坚持开放共享,健全授权机制。

  交流研讨环节,人民出版社、人民文学出版社、学习出版社、“学习强国”学习平台、中国新闻出版传媒集团、中华书局、中信出版集团、中国地图出版社集团、视觉(中国)文化发展股份有限公司等多家单位代表,围绕语料行业标准制定、版权授权模式创新、数字技术支撑赋能、行业自律共治等议题深入交流。大家一致表示,将坚守版权底线与质量红线,携手整治行业乱象,共商合规大计、共建语料体系、共护正版资源、共筑产业生态。

  此次人工智能高质量语料库共建启动,表明我国人工智能高质量语料库建设从理念倡议迈向实质行动,从分散探索转向抱团协同。共建单位表示,将坚守守正创新初心,恪守版权为先、质量为本原则,全力将人工智能高质量语料库打造为经得起法律检验、技术检验和时代检验的标杆工程。未来,共建各方还将依托区块链等前沿技术,实现语料授权、流转、交易全链路可追溯,持续开展行业标准研发、年度论坛举办、行业报告发布等工作,不断吸纳行业新力量壮大共建版图。




















来源:中国新闻出版广电报