打开APP
语言数据驱动新质生产力发展
中国社会科学网
2024-09-26 09:40:12

随着信息技术的不断发展和数字经济的蓬然兴起,数字人文赋能与语言数据驱动已然成为推动教育变革和新质生产力发展的重要动能。一方面,以大数据、人工智能为代表的数字技术与人文学科的融合正在深刻重塑语言教育理念、框架模式、资源集群以及评价体系,引领教育跃向智能化、个性化、精准化。另一方面,海量的语言数据资源为人工智能时代语言服务行业的发展提供持续推力,并依托与服务、商贸、金融等相关行业的深度融合,驱动新质生产力的加速发展。数字人文赋能教育、语言数据驱动新质生产力发展之有效路径主要涵盖以下方面内容。

更新理念内核,学科交叉融合。数字人文的理念内核是利用数字技术推动人文学科的创新发展。在教学中,加强对数字素养、计算思维的培育,将数据分析、人工智能基础理论纳入专业课程体系,提升学生利用数字技术解决语言问题的综合能力。拓展教师的专业视野,提升运用数字化的教学工具、开发数字化的课程资源、分析教学数据的能力。同时,高校要不断加强数字人文实验室、虚拟仿真教学平台建设,支持教师开展跨学科项目研究、教学模式创新。

夯实语料基础,盈汇数字资源。高质量的语言数据是语言教育数字化转型的核心要素。因此,加快多元、多维、多模态语言资源数字化建设成为发展路径之关键所在。应有效提升专业学术语料库建设的质量,科学整合多渠道的文献资源。加强语言教学过程的数据采集,建立教、学、评、管一体化数据管理机制,为精准教学、个性化学习提供高信度数据支持。通过协作共建,拓展虚拟仿真资源供给,开发覆盖各类真实场景的高品质沉浸式体验课程。同时,推进相关数字资源的智能化标注、语义化组织、知识化关联,有效提高资源挖掘、检索、利用的效能。

创新教学模式,精准因材施教。运用大数据分析,实时采集学生学习行为数据,精准刻画个体学情,切实因材施教。基于知识图谱、领域本体,精细化语言点分层分级,推送个性化学习内容,实现高质量微技能训练。利用虚拟现实、增强现实,创设沉浸式跨文化交际情境,提供全真体验式学习情境。在此基础上,整合优质数字教育资源,创新在线开放课程、微课等教学形态,实现线上线下、课内课外有机衔接的混合式教学模式。

突破关键技术,跃迁服务能力。加强语言计算、自然语言处理关键技术的创新应用,依托生成式预训练模型等前沿算法,基于海量多语言语料库开展大规模机器学习,提高机翻、跨语言信息检索、多模态交互任务的精准度。强化情感计算、观点挖掘、语义推理等认知智能关键技术攻关,增强对语言内涵的把握力。通过研发个性化、情境化的自然语言交互系统,推动教育大数据、学习分析技术在教学中的应用实效。同时,促进人工智能通用技术与专用芯片、专用数据库的协同发展,开发安全可控、高效智能语言服务的基础硬件。

培育复合型人才,精进数字化能力。深化人才培养改革,强化数字人文技能。加强校企合作,与高新企业共建人工智能和大数据产业学院、智能语言实验室,为学生提供实战驱动的实习、实训平台。实施智慧教学提升计划,建立数字教学产教创新联盟,开发智慧教学案例库、资源库,遴选数字化教学标杆。汇聚政产学研各方力量协同创新,不断推进高水平人才培养和创新成果产出。

发挥数据要素价值,推动产业数字转型。作为新型生产要素,数据愈加深刻影响和重塑生产方式、组织形态和产业结构。通过探索建立国家级智能语言服务开放创新平台,提供数据接入、处理、分析、应用一站式服务,降低相关企业的数据获取和应用成本。面向商贸、金融等相关行业开展语言数据采集,建设专业领域语料库、知识图谱,为产业智能化应用夯实数据根基。同时,鼓励行业龙头企业发挥引带作用,运用语音交互、知识图谱等技术优化产品设计和服务流程,驱动产业链上下游的数字化转型。

融合应用新场景,催生新业态模式。推动语言智能技术与经济社会各领域的深度融合,不断挖掘新增长点。开发面向跨境电商的多语言商品信息提取、用户评价分析工具,助力企业精准营销。创新金融领域的智能投顾、智能风控系统,提高金融服务的时效性。在文旅领域推广景区智能语音讲解、文物档案语义检索等,创新沉浸式体验服务。加强智慧城市、数字政府等领域的政务服务人机对话系统建设,提高社会治理效能。

加速核心技术攻关,把控新质生产力发展先机。要在语言智能领域超前部署,力争在前沿阵地弯道超车。具体举措包括加强自然语言理解、知识计算、类脑智能基础理论研究,突破机阅理解、深度语义分析、开放域对话生成等关键技术。布局新一代感知交互技术,重点突破智能语音处理、语音合成、情感识别、多语种快速学习技术,大幅提升人机交互体验。发挥大科学装置优势,整合国家超级计算中心等创新资源,加强对语言类脑、类人智能芯片、智能语言处理引擎的研发。

健全产业发展生态,完善制度政策保障。加强数据确权和流通管理,建立数据资产评估、交易机制,推动数据要素市场化配置改革。实施语言数据资源“聚通用”工程,依托现有语料库资源,推进国家语言资源库建设,促进数据共享开放、增值利用。发展第三方数据服务机构,制定语言服务业的统计分类标准,并将其纳入国民经济核算体系。此外,鼓励社会资本设立产业投资基金,加大对初创型语言技术企业的投融资支持。建立数据安全多方治理体系,加强数据全生命周期安全管理。

当前,我国在数字人文理念认同、数字资源供给、数字化教学创新、核心技术研发、复合型人才培养等方面存在困难与挑战,亟待采取有力举措予以破解。

一是我国在语言数据资源开发利用、自然语言处理领域起步较晚,高端芯片、开源算法等产业基础能力相对薄弱,某些核心技术对国外依赖度较高。因此,急需突破关键技术,布局前沿交叉研究,夯实产业基础。二是资源共享不足,数据壁垒突出。应有效整合分散的语料资源,推进国家语言资源库体系建设,打造梯次化、体系化资源供给。三是高层次复合型人才匮乏,教育培养相对滞后。应大力推进外语类专业课程体系改革,强化数字素养培育。四是创新动力不够强劲,商业模式尚不成熟。应鼓励龙头企业通过技术协作开发、数据资源开放建设等方式带动中小微企业走向专业化发展模式,加强校企协同创新攻关。五是统一的标准规范缺失,行业监管有待加强。应制定语言数据和外语教育融合发展统筹规划,推动该规划与国家人工智能、大数据战略的衔接。制定数据确权、交易流通、安全保护等方面的法律法规和行业标准,强化算法的透明度和可解释性。不断完善科研诚信制度,健全人工智能伦理道德规范。

综上,应充分发挥数字人文的引领作用和语言数据的驱动效应,加快教育与智能技术的深度融合,有效驱动新质生产力。实现这一发展目标需要政府、高校、企业、社会组织多元主体协同发力,加快构建开放包容、协同高效的创新生态系统。

(作者系辽宁科技大学外国语学院副教授)


来源:《中国社会科学报》2024年9月26日第2984期

作者:石峰

来源: 中国社会科学网
编辑: 项江涛报纸 张黎明网络
免责声明:本文由顶端号作者上传发布,仅代表作者观点,顶端新闻仅提供信息发布平台。如文章内容涉及侵权或其他问题,请30日内与本平台联系,反映情况属实我们将第一时间删除。
热评
暂无评论,去APP抢占沙发吧