国家重点研发计划是当前我国最高级别的研发项目,聚焦产业核心竞争力、自主创新能力和国家安全等战略需求,致力于突破重大科学问题和关键共性技术。
在“文化科技与现代服务业”重点专项中,“基于生成式人工智能的专业知识服务关键技术研发与应用”项目于近日正式启动,标志着我国出版业向知识服务型生态转型进入实质性攻坚阶段。
数传集团作为连续5次参与国家重点研发计划的核心技术单位,将联合中国新闻出版研究院、武汉理工大学等8家出版和知识服务领域头部机构,共同推进这一具有里程碑意义的战略工程。
该项目计划经过三年的研发与应用,形成系列预期成果,包括研制人工智能专业知识服务系列国家标准,构建支持多方协同共建的知识数据池,发布百亿级参数垂直领域大模型,研发检索增强生成技术工具,建设交互式知识服务平台,从而形成基于生成式人工智能的专业知识服务新模式。
项目研究成果将直接赋能出版业从传统内容生产向“知识服务生态“转型升级——
1、理论创新
研究生成式人工智能的专业知识服务模式,为特定领域的新型专业知识服务构建和应用提供指导。
2、标准引领
拟研制的生成式人工智能专业知识服务国家标准,为生成式人工智能在出版领域的数据资源汇聚、应用标注方式及服务质量测评等应用方面提供规范。
3、难点突破
解决出版领域数据分散储存及权属不明确的难点,构建适应不同出版机构需求的数据协同汇聚机制,实现数据标准化、规范化汇聚,推动出版资源有效整合利用。
4、产业应用
提升出版垂域大模型在专业知识服务领域的适配能力及服务水平,提高大模型知识服务内容输出的质量与准确度,形成出版智能化工具链。
5、行业转型
推动交互式专业知识服务平台研发,帮助出版业从单一图书销售转向全链条知识服务,带动千亿级知识服务市场发展。
此次项目研究任务包括五个核心课题,分别为:
• 课题一:基于生成式人工智能的专业知识服务模式和标准规范研究
• 课题二:专业知识资源汇聚与数据处理技术研究
• 课题三:特定领域知识服务大模型构建技术研究
• 课题四:检索增强的可信度专业知识服务技术研究
• 课题五:专业知识服务系统平台研发与应用
数传集团将深度参与课题二、三、五的研发工作:
在课题二中,数传集团将重点开展两大方向研究:
①出版领域多源数据汇聚的质量控制与评估体系构建
②知识服务场景下的数据基础设施架构设计
作为国家首批“数据要素X”典型案例单位,集团将依托三大核心优势:
第一,数据资源基础——覆盖全国70%以上出版机构的3亿读者数据库;第二,技术积累优势——基于出版大数据平台研发形成的数据专有技术;第三,行业实践沉淀——在出版业数字化转型领域长达10余年的工程化经验。
突破出版数据流通中的储存、确权、安全等治理难题,为出版行业数据资产的深度开发与应用构建标准化、智能化的技术支撑体系。
在课题三中,数传集团将重点开展两大方向研究:
①高质量指令数据构建,专业知识资源数据支撑
②参与特定垂直领域大模型的通用构建框架研究
集团将依托出版首个专业大模型BOOKSGPT的研发经验,重点攻关大模型在专业知识服务领域的技术瓶颈,增强大模型生成内容与特定专业领域的适配性,破解专业知识服务场景中的精准化知识供给难题。
在课题五中,数传集团将重点开展两大方向研究:
①专业知识内容提供
②专业知识服务平台研发和应用验证
集团将依托核心产品AI RAYS的研发经验以及海量专业知识内容资源,解决当前知识服务平台两大痛点:
第一,通过研发多模态交互技术,实现用户与知识服务系统的多维度交互,丰富知识服务表现形式,解决当前知识服务平台交互方式单一的问题;
第二,通过知识推理过程的可视化呈现,让用户清晰了解答案的来源路径,提升用户使用体验,解决知识服务可信度不足的问题。
此次项目启动汇聚了中宣部文化改革发展局、文旅部科技教育司、国家自然基金委高技术研究发展中心等主管部门,以及产学研各领域专家。
与会专家指出,该项目将有效破解专业知识服务智能化转型的技术瓶颈,进一步推动出版业与人工智能的深度融合,为我国从“出版大国”迈向“出版强国”提供关键科技支撑。数传集团等参研单位的技术积累和产业实践,对实现理论创新与产业应用的有机结合具有重要价值。
数传集团的深度参与,既体现了企业服务国家重大需求的责任担当,也彰显了集团布局下一代知识服务基础设施的前瞻视野。