近日,由新华社技术局、媒体融合生产技术与系统国家重点实验室、中国传媒大学、传播大脑科技(浙江)股份有限公司等30余家单位共同起草的《新闻行业大规模预训练模型》系列团体标准正式发布。传播大脑结合实际研究、应用场景,积极参与了《语言模型实用性要求》、《语言模型评测要求》、《多模态要求》等标准的制定。
《新闻行业大规模预训练模型》系列标准由5部分组成,从语言模型实用性要求、评测要求、安全性要求、研发数据要求和多模态要求等角度出发,为新闻行业大规模预训练模型构建出一个全面而系统的框架。
《语言模型实用性要求》明确了预训练语言模型在完成新闻任务时的使用场景要求、效果要求以及产品化要求,为模型的实际应用提供了具体指导。
《语言模型评测要求》规定了新闻行业预训练语言模型的评测指标和评测方法,并给出了具体的评测示例,以确保评测过程的科学性和规范性。
《语言模型安全性要求》详细规定了各环节所涉及的安全性要求,确保新闻领域预训练模型应用,能够遵守相关法律法规。
《研发数据要求》对用于训练、微调和评估预训练模型的所有数据提出了技术要求,确保了在预训练模型研发过程中,数据的质量和规范性,从而确保模型的可靠性,提升模型性能。
《多模态要求》规定了预训练模型在处理多模态数据时的技术标准,进一步拓展了预训练模型应用范围,使其在多模态新闻内容生成和处理方面也能高效、可靠地发挥作用。
系列标准的发布,规范了预训练模型在新闻场景的使用,为新闻行业研发和应用生成式人工智能技术提供了坚实基础和有力保障。作为标准的联合参编单位之一,传播大脑科技公司将持续加强传播大模型的研发和应用。
传播大模型是在通用大模型的基础上,依托媒体自身的高质量内容数据进行训练,专为媒体场景设计的垂直大模型,目前已形成了智能对话、创作、多模检索、创意设计及审校5大核心功能。
2024年2月,传播大模型通过生成式人工智能(大语言模型)上线备案,成为由媒体技术公司研发的首个通过备案的媒体垂类大模型,8月,传播大脑内容生成算法通过国家网信办算法备案。
目前,传播大模型已应用于浙江省内多家融媒体中心,并与重庆、江西、西藏、福建、广西等多个省市媒体达成合作意向。