沈艳：人工智能在数字金融中的应用—

题记：2024年7月3日，2024中国数字经济发展和治理学术年会在清华大学成功举办。北京大学国家发展研究院教授、北大数字金融中心副主任沈艳以《人工智能在数字金融中的应用》为题进行了主旨演讲。本文根据沈艳教授现场发言内容整理。

很荣幸受邀，谢谢叶老师刚刚的介绍。我今天的主题是“人工智能在数字金融中的应用”，并抛砖引玉，提供一些思考。我们的大背景是，2023年10月总书记提出来的五篇大文章当中，特别提到要做好数字金融大文章。

先介绍一下什么是数字金融。它是过去十多年当中金融体系里面最重要的创新，主要是利用数字技术为我们在支付、贷款、保险、投资等方面的新金融工具、金融模式，也包括金融基础设施建设。

我认为可以从三个维度去理解数字金融的发展变化：

第一个维度刻画金融部门，包括货币以及支付、信贷、保险、资产管理以及外汇等相关机构与业务活动。

第二个维度是数字技术，涉及到AI、区块链、云计算等等。今天讨论的AI，很多时候是把很多数字技术包含在内探讨，比如在运用人工智能时，也离不开大数据、区块链、云计算、算力等的讨论。

第三个维度是商业模式，比如B2C、B2B、P2P、B2G，以及平台本身多边的模式。

当我们讲创新的时候指的是什么呢？可能主要是在今天我们考虑人工智能的时候，涉及的是场景、数据、算法、算力，他们在改善金融服务方面的作用。金融服务包括四个维度：改善金融的触达、提高金融的效率、能不能提升我们的风控，以及金融安全的问题。其中，金融安全的问题既包含程序应用的安全，也包括是否触发金融风险。

我主要从四个领域来简介人工智能在数字金融当中的应用。

首先是智能客服。银行常常要面对用户大量的业务咨询，因此往往需要庞大的客服群体。但是，客户咨询在时间上的分布并不均匀，可能很多时候没有人打电话，人员过多构成浪费；但是人员过少又会在高峰期无法快速回应客户的需求，造成客户体验差的现象。另外，年轻人离职率也很高，银行也面临好不容易培训上手的客服用不了多久就流失的现象。某金融集团的智能服务在一年中共有超过10亿次客服的回答量，他们的智能语音服务可以覆盖其中的86%，解决率达到92.3%。这就极大提升了服务效率。然后，客户与智能客服的对话形成新的文本，进一步分析这些文本可以开展智能服销业务，进一步向潜在客户推荐相应的金融产品。2021年实现了1000多亿近2000亿的智能服销的成果。

第二个领域，数字信贷。长久以来，小微企业和个人面临“贷款贵、贷款难”问题，金融存在不够普惠的现象。相较于大企业，中小微企业和银行等金融机构之间的信息不对称更不易于解决。事前防范“逆选择”风险和事后防范“道德风险”，均需要金融机构能以较低成本来做好上述风控。人工智能能够帮助我们在数字信贷方面有所作为。一方面，利用平台可以获取大数据，降低客户获取的难度；基于大数据可以和恰当的机器学习模型相结合的新的风控模型，可以提升事前风控能力、降低逆选择风险。另一方面，平台可以用较低成本获取客户再贷款之后的一些行为和交易信息，这也有助于做好贷款管理，防范道德风险。微众、网商这样的互联网银行，以非常少的人员来服务非常多的客户，这是人工智能用在模型的预测以及还款能力的预测等方面的应用，这也是相对比较成熟的技术应用。

第三个领域，量化投资。量化当中的应用，首先是投资信息的搜集。其次，会通过人工智能的模型对交易习惯做一些学习。再次，做大模型的一些预测，看看能不能够提升数据，做到因子的提取，做到降维。全球用AIML（人工智能标记语言）、人工智能或者是机器学习这一类对冲基金的占比，从2010年到2018年一直是增加的，但是2019年以后就开始下降。收益率做了一个比对，2019年本年以及2019年往前推三年和2019年往前推五年，基于人工智能或者机器学习方法量化方法的影响。最主要的信息，往前倒五年，会看到人工智能+量化总体回报率最高；但三年的时候（收益）就还好，但是好的程度没有那么高了。2019年单年，人工智能、机器学习的模型本身的表现不如市场上原有的传统模型。

近期一个比较热烈的讨论是，GPT4是不是在选股方面可以表现得更好？是不是将来我们就可以直接拿大模型代替投资经理？2024年5月摩根大通发布了IndexGPT，通过IndexGPT可以创建一个主题投资篮子，芝加哥大学的一个研究发现GPT4在选股方面可以超越大部分的人类分析师，可以提供更高的阿尔法和夏普比例，这是非常引发关注的一个研究，但对这一研究发现也存在质疑。最主要的问题是表现好可能是因为训练数据被污染，也就是测试的数据是到2021年，但训练数据是否包含了2021年以后的数据的问题。

第四个领域，智能投顾。对于人工智能在数字金融当中的应用，还有一个很高的期待，就是智能投顾。因为投资的管理，往往财富管理更多是集中在高净值人群上，大众甚至中产阶级往往不能得到很好的服务。那么，智能投顾能不能帮我们解决投资难的问题？中国经过几十年高速度的发展，财富管理有没有可能也更普惠一些，让中产阶级甚至大众都能得到优质的理财服务呢？

智能投顾的作用可能要取决于以下几方面问题的答案：

第一，真的降低资产配置的成本；

第二，要能够为客户真实地定制个性化的服务，能够粘住这个客户；

第三，既然它是自助式的智能投顾，客户自己操作的成本要比较低。

目前，中国金融机构在智能投顾方面已经有了不少有益的尝试，但仍然存在不少挑战。一是算法本身会有诸多的局限性；二是千人千面对数据以及计算能力都有诸多要求；三是再好也好不过市场的总体环境，市场的总体环境会决定收益率；四是目前的投资者教育不足。我们看到，一些金融机构在投资者教育方面也加大了力度，未来人工智能在智能投顾方面的应用还有很大的空间。

介绍人工智能在数字金融四个经典场景中应用的时候，我们也要看到其中还存在不少挑战。

第一，算法局限性的问题。知其然不知其所以然，如果用在分析客户情绪、回答客户问题的场景中，也许出错成本不算高。但是，在涉及大量资金的核心业务上，比如对大额信贷资金的发放，完全不懂得算法规律是非常危险的做法。这是因为现有的预测模型往往是基于历史信息，如果未来发生一个重要的结构性的变化就可能带来重大损失。例如2020年对冲基金在疫情中表现差强人意，就和模型无法事先预测到巨大的结构性变化分不开。

第二，数据的局限性。运用人工智能模型的时候，不能忽略数据局限性带来的问题。这是因为数据很多时候不是为了人工智能的目标生成的，往往是这个企业自己业务的一个副产品。企业为了让业务顺利发展会不断调整模型参数，这就导致从数据观察到的变化，究竟是外部环境发生变化还是内部模型变化带来的，无法分清楚，这会进一步加大利用数据做预测的难度。二是数据质量可能达不到相应目标的要求。要防止“垃圾进、垃圾出”，需要在训练模型时，就采用大量高质量的数据。我国虽然是数据要素非常丰富的国家，但是根据国际数据公司（International Data Cooperation）的研究，我国目前的数据主要是娱乐类数据，而工业用的、可以提升生产率的数据占比较低。在采用大模型时，需要考虑到对应的场景是否有足够高质量的数据的问题，以避免“巧妇难为无米之炊”的困境。

第三个问题是人工智能的算法安全，目前还是在一个非常初级的阶段。在算法安全方面，存在通过给大语言模型一些指令，让大语言模型做一些违背开发者规则的事情的现象。例如2023年以“奶奶漏洞”为代表的越狱指令，是一位工程师对ChatGPT说，自己和祖母的感情深厚，现在我祖母去世了，她每天在我睡觉之前都给我念windows序列号。通过这段对话，该工程师获得了真实的序列号。当然后来这个漏洞很快就被弥补，但核心问题是，现有的大语言模型的开发者对于算法安全自身还没有完全的把握。因此，在金融领域中，涉及核心业务的大规模应用应采取谨慎态度。

总结而言，目前人工智能在数字金融当中的广泛应用主要是四个领域，其中比较成熟的是客户服务和数字信贷方面。如果能够处理好算法安全与监管等问题，人工智能在数字金融方面的广泛应用仍有广阔前景。

沈艳，北京大学国家发展研究院教授、北京大学数字金融研究中心副主任。沈艳教授的主要研究领域包括大数据和互联网金融、理论和实证计量经济学、微观金融、社会经济状况等。