打开APP
拓尔思数字经济研究院副院长文雅:大模型+小应用,破解人工智能应用场景困局
大河财立方
2024-09-10 19:13:41

编者按

党的二十届三中全会对加快构建促进数字经济发展体制机制和完善数据要素市场制度规则等作出部署,为下一步推进数据领域的改革发展指明了方向。

7月29日起,河南日报社财经全媒体中心、大河财立方、郑州数据交易中心联合推出系列高端访谈栏目《财金先生·数据要素会客厅》,通过采访专家学者、数交所负责人、优质数商等,解读数据要素市场政策,传递行业发展战略思考,分享企业实践经验举措,共创数据工作全新局面,推动国家数据事业高质量发展。

大河财立方记者 李铮 实习生 李雯雯

人工智能是新一轮科技革命和产业变革的重要驱动力量,2024年政府工作报告不仅3次提到“人工智能”,更首次提出了开展“人工智能+”行动。作为人工智能领域的重要技术成果,大模型也持续升温,成为全球数字技术创新最活跃的前沿领域,技术升级竞短争长。

“大模型不应被视为单一的产品,而是人工智能+应用中的能力底座。”拓尔思数字经济研究院副院长文雅在接受大河财立方记者采访时表示,“百模大战”乃至“千模大战”后,大模型如何在场景、产业中落地,实现商业价值,进而加速产业升级,是当前开发者们亟须解决的问题。

大模型越来越卷,算力困境如何解决?

近两年来,作为数字经济的新赛道,众多大型预训练模型之间的竞争愈发突显,老牌互联网大厂、新质独角兽企业、新型创新创业公司等都在争相开发、部署自己的大模型,各类产品如雨后春笋般涌现。这一趋势推动了人工智能技术和应用的进步,也带来了一系列挑战和问题。

“首先是成本问题,大模型的研发、训练和维护成本非常高昂,尤其是对于算力的需求极大。”文雅说,算力是大模型发展的关键资源,但是算力的成本和技术门槛都很高。针对大模型发展中的算力困境,文雅认为,从宏观层面来看,目前多地正在积极建设超算中心,打造国家级的算力底座,促进超算算力一体化运营,对解决算力问题是非常好的探索和尝试。

在OpenAI、谷歌等国际巨头的推动下,大模型不断朝着万亿、十万亿参数发展,算力需求该如何满足?文雅表示,做好硬件集群算力、软件有效算力、异构聚合算力这三个维度的工作,即使国产AI芯片单个算力不强,也能通过综合手段提升算力,突破瓶颈,满足国内大模型训练的需求。“大模型在To B和To G的实际应用场景中,百亿级参数已经完全够用。”文雅说,“我们在实践中已经验证,很多垂直场景用小模型优化后的结果比通用大模型要好,垂直应用场景和私域数据精准治理的重要性远超大模型本身,也降低了对算力资源的需求。”

同时,由于在预训练阶段,模型从大量数据中学习,而数据中不可避免地包含了错误、过时或矛盾的信息,导致大模型经常会生成不真实、虚构、不一致或无意义的内容,被称为幻觉现象。针对这一核心问题,文雅介绍说,拓尔思主要采用了构造高质量微调数据、外挂知识库增强、让模型自我检查,以及在不确定时选择保守回答策略等有效措施。这些方法不仅减少了模型生成虚假内容的风险,也增强了用户对模型输出的信任。

“大模型+小应用”,更能加速实践落地

过去一年多,国产大模型深度下沉,拥抱行业,与产业、场景结合已经成为一个趋势。“将大模型的能力与具体的行业需求相结合并不容易。即便技术上可行,如何将大模型转化为实际的产品和服务,并实现盈利仍然是一大挑战。”文雅说。

“大模型是一个连接者,具有强大的知识吸收与整合能力。没有一个大模型能够适用于所有场景,需要根据实际情况选择最适合的大模型。”文雅介绍,大模型工程化落地先要遵循降本增效、业务创新、体验增强三类价值。行业知识数据、业务嵌入与融合、成熟的工程化能力是大模型垂直应用场景落地效果保障的三要素。拓尔思作为国内首家在A股上市的大数据技术企业,依托多年来在金融、媒体、政务等领域积累的数据优势,推出的拓天大模型一体化平台,覆盖从知识数据治理、AI训练平台、AI能力平台到AI服务平台的完整流程,最大化利用大模型能力,为用户提供专业化定制化服务,有行业知识可增强、部署模式可选择、私有数据可训练、指令微调可定制、业务场景可适配的特点,以“大模型+小应用”的模式助力用户搭建专属的大模型应用集。

文雅说,大模型落地不是简单地部署和调试一套大模型,AI开发新范式、高效精准的数据治理、全数据要素运营、风险管控机制是大模型工程化落地的四个重要抓手。在大模型实践落地过程中,拓尔思已经形成了一套全要素融合的高效AI开发新范式,实现了大模型应用开发到运营的闭环,同时沉淀了一套精准“治数”“用数”的工具与方法。

目前,拓尔思已在金融、媒体、安全、企业等优势行业率先实现了大模型应用场景的成功落地,如平安银行的审计大脑、招商银行的智能消保助手、人民日报的AIGC智能编辑助手、共青团的团团助手、环境报“碳引擎”知识问答助手、四川泸州和自贡公安的情指行智能助手、海尔智能客服等场景已率先实现大模型与传统业务的融合,帮助用户提体验、降本增效。

期待政策供给完善,激活数据要素更大价值

《企业数据资源相关会计处理暂行规定》自2024年1月1日起正式实施,数据资产化时代开启。拓尔思今年一季度就完成了数据资源入表,半年报中入表金额达1738万元,全部为开发支出。

“数据是拓尔思业务增长的重要驱动力。”文雅说,通过不断积累高质量的数据资产,不断处理和分析“鲜活”的海量数据,实现自身技术实力的不断提升,拓尔思不仅可以为老客户提供持续高价值的数据服务,增加客户黏性,实现存量市场的增值,也不断用数据服务开拓新客户。

党的二十届三中全会明确提出构建全国一体化技术和数据市场,健全数据等市场制度和规则。国家数据局近日也表示,今年将陆续推出数据产权、数据流通、收益分配、安全治理等制度文件,加大政策供给,这也正是文雅等行业人士所期待的。

“目前数据产权规则尚不清晰,缺乏明确的法律规定,这是数据要素市场发展的重要障碍之一。”文雅说,只有明确数据的所有权、使用权和收益权,解决数据确权问题,建立健全的数据交易机制和收益分配制度,才能在激励数据的产生和流通的同时,保证数据产生的价值能够合理地被分享。

文雅表示,大数据、人工智能、区块链等技术的不断发展,将为数据要素市场的技术创新和应用深化提供有力支撑。未来,数据要素将在更多领域实现深度应用,推动产业升级和转型,并逐渐形成包括数据采集、存储、加工、交易、应用等环节在内的完整生态体系。“可以预见,政府将继续加大对数据要素市场的支持力度,出台更多相关政策法规和标准规范,为数据要素市场的健康发展提供有力保障,同时,也将加大监管和执法力度,确保市场秩序和数据安全。”

责编:任浩鹏丨审校:陈筱娟丨审核:徐姣

监审:万军伟丨监制:王鲁峰

热评
暂无评论,去APP抢占沙发吧