11月21日,在中国新闻技术工作者联合会2024年学术年会上,由新华社技术局、媒体融合生产技术与系统国家重点实验室、上海算法创新研究院等科研单位、科技企业联合编制的《新闻行业大规模预训练模型》系列团体标准正式发布。
《新闻行业大规模预训练模型》系列标准由5部分组成,从语言模型实用性要求、评测要求、安全性要求、研发数据要求和多模态要求等角度出发,为新闻行业大规模预训练模型构建出一个全面而系统的框架。
《语言模型实用性要求》明确了预训练语言模型在完成新闻任务时的使用场景要求、效果要求以及产品化要求,为模型的实际应用提供了具体指导。
《语言模型评测要求》规定了新闻行业预训练语言模型的评测指标和评测方法,并给出了具体的评测示例,以确保评测过程的科学性和规范性。
《语言模型安全性要求》详细规定了各环节所涉及的安全性要求,确保新闻领域预训练模型应用,能够遵守相关法律法规。
《研发数据要求》对用于训练、微调和评估预训练模型的所有数据提出了技术要求,确保了在预训练模型研发过程中,数据的质量和规范性,从而确保模型的可靠性,提升模型性能。
《多模态要求》规定了预训练模型在处理多模态数据时的技术标准,进一步拓展了预训练模型应用范围,使其在多模态新闻内容生成和处理方面也能高效、可靠地发挥作用。
《新闻行业大规模预训练模型》系列团体标准的发布,规范了预训练模型在新闻场景的使用,为新闻行业研发和应用生成式人工智能技术提供了坚实基础和有力保障,将有效推动新闻行业智能化进程,助力培育媒体新质生产力。
媒体融合生产技术与系统国家重点实验室持续加强生成式人工智能在媒体领域的应用基础研究,推出了“新华妙笔”、“新华智元”等一批基于生成式人工智能的创新应用示范产品,同时也以学科交叉联盟方式不断深化与国内高校、科研机构、科技企业的科研合作,探索“产学研用一体化”新模式。
往期精彩
中央第九巡视组巡视人民日报社工作动员会召开
报纸也“睛彩” 看看这组航天报道的高光时刻
谁在假冒媒体发“新闻”?
378件!20人!第34届中国新闻奖评选、第18届长江韬奋奖评选结果公示
点击分享 让更多人看到