如何打造银行的chatGPT，专访摸象科技CEO高鹏博士

高鹏：摸象科技创始人兼董事长，摸象浙大金融智能联合实验室主任，人工智能首席科学家。博士毕业于浙江大学计算机学院人工智能所，师从中国工程院潘云鹤院士，拥有15项人工智能发明专利，曾获得全美PMP项目管理证书，是中国第一套移动通信BOSS计费系统的开发者。

2023开年至今，AI赛道最火的莫过于OpenAI的ChatGPT，微软CEO纳徳拉说：这辈子我从没见过，至少是从事科技工作的这30年，chatGPT是我从没见过的技术扩散，这完全等于是工业革命，这将对每个人有帮助，微软的每个产品将接入chatGPT。

ChatGPT 是一个基于GPT-3.5架构的大型生成式预训练语言模型训练的智能对话机器人，专注于开放域的人机对话、输出写作内容。跟以前的聊天机器人比，ChatGPT最让人印象深刻的就是能用像模像样的“人话”来回答几乎任何领域的用户问题，并对上下文有一定程度的理解。ChatGPT不仅会聊天，还可以帮助人类写代码、修复bug、写工作周报、写小说、进行考试答题、绘画、看病以及大幅度提高搜索效率和体验等。

那么，类chatGPT的技术，如大规模预训练模型，如增强搜索和AIGC，如何可创造出高可用性的对话机器人，用于银行的零售金融场景？

带着这一问题，笔者访问了国内银行AI的领先公司，摸象科技的CEO高鹏。摸象科技是一家浙大系金融+AI科创公司，为中国的2000+银行提供高智能的数字员工。摸象科技以自主研发金融超级大脑及金融零售AI直营管理平台已初步建立，已具备150+银行零售场景知识库以及毫秒级AI实时决策引擎，初步实现机器学习的正向数据循环，帮助国内2000+银行全面实现金融全自动化场景实时推荐智能运营，截止到2022年底，公司已与中国建设银行、工商银行、中国银行、浦发银行、光大银行、兴业银行、渤海银行等客户合作，每年提供4亿次以上AI智能服务。摸象科技拥有国家级技术专利31项，200多项软件著作权，荣获国家高新技术企业、省级研发中心、ISO9000机构等国家级资质认证，与浙江大学成立“浙大摸象数据智能联合实验室”，完全自有知识产权，具备垂直于金融行业的人工智能核心技术，被亿欧评选为2020年中国人工智能商业落地价值潜力企业100强，并入选杭州未来科技城准独角兽企业、鲲鹏计划企业。让我们看看高鹏博士是怎么看待未来chatGPT技术如何应用于银行的吧：

Q：chatGPT这种技术的核心是什么？和之前的聊天机器人比，有什么样的不同？

A：ChatGPT的核心底座是GPT-3.5。GPT-3.5是美国OpenAI实验室新推出的一种自然语言处理工具，基于Transformer深度神经网络模型（类似谷歌公司Bert模型），该模型可以处理事件序列数据，拥有语言理解和文本生成能力。和其他类似NLP对话机器人相比，ChatGPT的技术创新和优势我总结主要以下三点：

1、ChatGPT通过连接大量的语料库来训练模型，得益于微软的投资和支持，微软搜索引擎提供了这些语料库真实世界中的海量对话数据，训练使用了约45TB数据，其中包含多达近1万亿个单词的文本内容。使得ChatGPT具备与真正人类几乎无异的聊天场景进行交流。

2、ChatGPT在算法层面一个重要的创新，就是把强化学习引入到大模型的训练和使用上。以前的对话机器人实现开放域对话的最大困难，在于用户输入的话题各种各样，任务空间太大，很难有足够的监督信号拿来训练。ChatGPT引入RLHF (Reinforcement Learning with Human Feedback，即基于人类反馈的强化学习)技术，利用人类反馈信号学习到的奖励模型（reward model），来为任意一个问题自动估算监督信号。在训练过程中，人类训练者扮演着用户和助手的角色，这比过去大模型训练时的“模型输出结果+人工标注结果”模式省时省力、效率更高。这样ChatGPT充分利用强化学习的尝试探索（exploration）能力来解决开放域任务空间太大的挑战，取得了很好的效果。

3、RLHF 还解决了预训练生成模型的一个核心问题，即如何让AI模型的产出和人类的常识、认知、需求、价值观保持一致。这样它在回答开放域问题时基本上和人类价值观保持一致：例如ChatGPT能够知道它有“不知道”的地方，或者拒绝回答它认为不适合回答的问题，以及跟人类主流价值观不契合的内容。

ChatGPT证明了我们现在是可以直接去追求理想大语言模型的（LLM模型）。通过增加预训练数据的多样性，涵盖越来越多的领域，LLM自主从领域数据中通过预训练过程学习领域知识，随着模型规模不断增大，不断扩展解决各种领域问题。

Q：chatGPT有什么不足之处？

ChatGPT模型的能力也受一定限制：首先是高质量的领域知识的获取和整理，这个并不是那么容易的。其次目前ChatGPT的能力上限由奖励模型决定，该模型需要巨量的语料来拟合真实世界，同时对人类训练者的工作量以及综合素质要求较高。人类在训练和标注时的错误，可能就会造成ChatGPT出现“创造不存在的知识和信息”的错误，或者主观臆测提问者的意图等问题，这方面的优化挑战将是长期持续的过程。

Q：chatGPT能直接应用于银行吗？

暂时还不能直接把open AI的chatGPT引入银行直接进行服务。虽然chatGPT已经具有比较高的可用性，但它还是提供“仅供参考”的回答，还没有达到金融行业需要的高可靠性要求；其次中国金融行业领域的大部分数据集还没有开放，因此可供chatGPT学习的领域数据源是非常少的，它还没有具备足够的知识储备。

目前我们必须确保以负责任和合规的方式构建金融行业的AI。面对快速发展的技术和不断变化的社会期望，金融行业应主动基于内部数据集进行LLM训练，并以结果为中心，形成自己的AI能力。

Q：垂直于金融行业做训练的话，训练出的高智能AI能做一些什么呢？

如果要在垂直行业创造类ChatGPT的AI系统，首先是需要具备高质行业数据集，我们可基于数据集形成新的prompt dataset，再将PPO策略应用于有监督数据微调过的预训练模型，通过模型测试新的prompt dataset，得到数个输出，之后使用奖励模型对数个输出进行打分，计算reward数值，再不断进行迭代更新，这个AI就会具有持续自学习的能力。当AI和用户对话的场景越多，输入和反馈次数越多，AI就会具有和用户深度交流的高智能水平，注意，由于我们的持续训练仍是集中与金融行业场景的，因此这个AI也仍是一个垂直的chatGPT，它仅在金融对话方面具有高智能水平。

目前我们想到的垂直于金融的AI，可以实现与用户交流金融产品、进行推荐、帮助用户进行资产配置和组合、帮助用户办理业务等能力。

Q：能不能讲一下这种高智能AI使用上以后，银行能得到怎样的提升呢？

首先受益的是银行的用户，目前银行的APP场景都上了数字人，但很多数字人还是基于原有的NLP系统进行配置好的FAQ对话，这样很难让用户产生愉悦的交流体验，而植入高智能AI之后，数字人可与用户进行更加智能的高可用性交流，更接近于真人客户经理的交流体验；

受益者还有银行的客户经理，目前银行客户经理需要记忆数千种产品的卖点、办理方式、重要知识点等知识，平均每个客户经理要为数千名长尾客户提供服务，工作非常的繁重。高智能AI可以嵌入到客户经理的工作场景中，帮助客户经理挖掘潜客需求、主动联系客户做金融产品推荐、帮助客户经理做资产组合方案、辅助客户经理对客户应答和服务，以及帮助客户经理写交流纪要等，帮助客户经理提升效率和服务质量。

Q：摸象科技的高智能AI已经用于银行了吗？

摸象科技自主研发金融超级大脑及金融零售AI直营管理平台已初步建立，已具备150+银行零售场景知识库以及毫秒级AI实时决策引擎，初步实现机器学习的正向数据循环。

目前摸象科技已经与61家银行合作，其中包括中国建设银行、中国工商银行、中国银行、兴业银行、浦发银行等，有8000个AI机器人战斗在银行的各种工作岗位上，每年提供4亿次以上金融AI智能服务，帮助银行的客户经理联络、接待、推荐，帮助银行降本增效。

Q：训练的难度在于哪里，摸象科技的技术门槛在于哪里？

首先用于训练的高质量数据比较难以获取。中国金融行业的领域知识和数据不对外开放，所有访问数据的系统都是私有云部署，机器人和用户互动的数据需要打通数据回流通道形成闭环，因此在私有化环境下获取、清洗和整理领域数据难度比较大，数据预处理工作量大。其次训练模型还是采用“模型输出结果+人工标注结果”，标注工作量巨大，同时各单位局点之间的数据不能共享，也是造成训练难度较大的原因之一。但从另一个角度，这些难点恰好也是形成了我们很高的技术门槛：

摸象垂直金融行业的金融超级大脑，内置基于机器学习+深度神经网络的AI训练平台及训练好的垂直于150个业务类目的场景模型。每个模型有自己的独立业务知识库和推理引擎，平台底座则包括通用和行业知识库，以及知识获取、检索、推理等知识库管理工具，以及数据和知识标注、人机协同等用于机器学习训练的模块。

受ChatGPT启发，我们也在思考引入RLHF技术，将“模型输出结果+人工标注结果”的模式转变成自动估算监督+自动奖励模式，不断提高机器自主学习能力。

标签： 专访摸象科技

第三届中国人口与发展论坛在京召开

多地上调城乡居民基础养老金，涨了多少？

如何打造银行的chatGPT，专访摸象科技CEO高鹏博士

相关文章