当前位置: 首页 » 资讯 » 金融 » 正文

金融保险:深度学习——挑战、偏见与路径(下篇)

作者:陈辉博士 来源: 头条号 92201/15

小城不小,大城不大;从“小城”走出,一路向北走向“大城”;希望通过小城故事,一起去感悟所谓我们的“小成”与“大成”。 金融保险:深度学习——挑战、偏见与路径(下篇) “中央财经大学金融科技书系”第一本书《金融保险:深度学习》,在2018年底

标签:

小城不小,大城不大;从“小城”走出,一路向北走向“大城”;希望通过小城故事,一起去感悟所谓我们的“小成”与“大成”。

金融保险:深度学习——挑战、偏见与路径(下篇)

“中央财经大学金融科技书系”第一本书《金融保险:深度学习》,在2018年底终于正式出版,这是中央财经大学中国精算研究院金融科技中心的又一力作。金融科技中心的成员主要有张宁博士、陈辉博士,主要聚焦于大数据、人工智能、区块链在金融和保险中的应用,已经开发上线“保险大数据APP”、“金融脑”金融人工智能平台,“中央财经大学金融科技书系”也将陆续出版。

近年来,“中央财经大学金融科技书系”编委会成员先后出版了多本金融科技相关的专业书籍,为此,我们梳理了一套金融科技书系,希望通过金融科技书系去理清金融科技的发展脉络,去提升金融科技的认知能力,去改变我们的思维方式,去升华我们的智慧。

“中央财经大学金融科技书系”编委会成员专注于金融科技研究,我们不仅仅是一个团队,而是连接金融领域研究力量和人工智能大数据等领域研究力量的平台,希望“中央财经大学金融科技书系”的每一本书都开启一个“认知革命”的故事,一个“预见未来”的故事,成为金融科技理论研究与实践探索领域创新篇章的动听音符。

下面我给大家介绍张宁博士所著的《金融保险:深度学习》的一些内容“人工智能+金融:挑战、偏见与路径”,因内容比较多,我将分上下两篇来介绍。



上篇:

【挑战】

【偏见】

下篇:

【路径】

尽管金融仿佛在不断地与人工智能融合,但是,真实的情况更加复杂。

人工智能更像一个刺猬,在金融业务的很多外端,越来越多的人工智能得以应用,并发挥出效率优势,例如,越来越多的金融中的投资顾问和保险顾问等,但是,这些都起到辅助的作用。

人工智能仿佛只能给金融行业打工,但是,不能成为股东,也就是说,金融行业的核心技术与人工智能还有相当的距离。金融业本身是数学风险的行业,或者说是在不确定的条件下,进行资本资产配置和定价,其核心是风险管理、资本资产配置和定价,但这些仿佛离人工智能还很遥远。

可以预计,金融与人工智能的融合将分三个阶段进行:

第一个阶段——科技赋能阶段,这个阶段强调的是场景应用,是其他领域成熟的人工智能技术,平行地应用在金融里面,来提升业务某些环节的效率。

第二个阶段——科技增能阶段,这个阶段强调的是模型的应用,但由于这些模型直接应用会带来合规风险,所以,我们预计这个阶段会产生大量为金融行业服务的第三方专业服务。这个阶段是主动的,金融行业认识到人工智能的特点以及优势,主动在业务环节中应用人工智能,获得效率提升,甚至改变业务方式。

第三个阶段——科技产能阶段,这个阶段的特点是价值应用,这一类的金融核心业务将进行人工智能化,人工智能将成为金融核心价值的创造手段之一,甚至成为主要的创造手段,这个阶段也要求监管智能化。

2010~2030年人工智能的路径如图2所示。



图2 2010-2030年人工智能的路径

在科技赋能阶段,很多都是场景应用,例如,程序化的交易量化投资,也看到基于车联网的保险的动态定价,还有显卡用于金融计算,笔者的团队在这方面也做了一些工作,将其他行业成熟的自然语言理解技术,平行地应用到金融领域中。例如,为实现相应的金融报告、行研报告的理解和特征抽取,经过大量的训练,可以自动生成相应的行业报告或者符合规则的金融报告。

在科技增能阶段,一些相关研究成果也成为本书中的内容,例如,基于手背纹理的生理年龄的区别与健康状态的评价、混合步态以及身材等参数,这种远程评价可以大幅度提升效率,可以用于健康险或者人身险的定价,也可以用于金融的偏好识别和估计。

对金融的偏好识别,我们使用了大量的数据,风险偏好就不再是简单的、固定的,而是动态变化的了,例如,身材、健康状态以及衰老的状态都会影响风险偏好,这些风险偏好最终会影响金融的投资和判断,使用的模型是循环神经网络和卷积神经网络以及注意力模型。

我们还在金融欺诈识别方面做了一些工作,不管是保险中的欺诈还是投资信贷方面的欺诈,有许多信息可以捕捉到欺诈的概率,我们使用Res Net(这就是谷歌的Alpha Zero的技术网络)来处理这些信息,从而获得欺诈的识别。在这个过程中,我们可以评价一些如衰老的风险指数以及身材的指数,这里衰老的风险指数并不是指老年人口占多少,而是通过步态、心理等多方面的数据来分析整体人群的健康状态。

在科技产能阶段,这是金融和人工智能真正融合的核心,它必须要突破三个最核心的障碍,金融才能完美地拥抱人工智能。按照影响程度排序:

第一个障碍,也是最重要的障碍就是可解释性,也就是要克服新一代人工智能的黑箱问题。

第二个障碍,就是不确定条件下的人工智能,或者说是人工智能处理风险的能力。

第三个障碍,就是金融中的通用学习有没有可能。

从来没有一个行业像金融这么迫切需要人工智能的可解释性,而这恰好也与深度学习的黑箱特征有关,这里的根本原因在于,世界各个国家以及组织对金融都是进行监管的,金融业牵一发而动全身,一旦发生系统性金融风险,将会波及诸多经济和政治,2008年金融危机就是这样的例子。

这就要求金融业务的过程应该是透明的。若不能告诉监管机关,这些结果就都是由一个黑箱得出的。尽管金融是在不确定条件下处理问题的,但处理机制不应该是黑箱,否则一个由诸多黑箱组推动的行业,将会产生重大的系统性风险。

就如对保险产品来说,客户本身也关心为什么一个36岁的人买这款产品要比25岁的人价格高,你不能告诉客户这是一个深度网络给出的结果,而应该告诉他,36岁的人死亡率比较高。同样对风险也是这样,公司的管理层或者董事会想知道风险的特征是什么?影响风险的这些因素到底是如何影响风险的?这都是当前深度网络面临的核心问题。

我们给出了一个尝试性的方案,这个方案称为网络探针。深度网络某种程度是黑箱,所以,我们通过信息几何和符号计算的基础数学理论,设置一些相应的探针,由此来发现这个黑箱的运作机制,并结合精算的极端估计,给出这个黑箱异常行为的可能性判断。这就如同我们想知道一个烤地瓜熟没熟,最好的方式是用温度计插入到不同深度来看一下温度,同时,我们还不希望这个地瓜某些部位糊掉,也就是说,我们还关心它的极端风险。这些都是金融行业需要的,同时,也可以用于其他行业。网络探针示意图如图3所示。



图3 网络探针示意图

有了这样的技术,金融行业应用人工智能应该有这样的迭代关系,也就是说,从成熟的金融模型开始,考虑大量潜在的非结构化数据,通过使用机器学习或者深度学习模型,捕捉这些数据的信息,然后,通过前面提到的探针技术、稀疏结构、注意力机制发现一个初步可解释的模型,将这个模型用于成熟模型的子模型,如此迭代,实现金融核心技术与人工智能的结合。

但是,该技术仍然是基于工程的方法,在书中我们介绍了金融深度学习可解释问题的数学工具“信息几何”。目前看来,它是最后可能解决该核心问题的有效工具。

人工智能把握风险的能力,实际上是我们对人工智能网络风险能力持有的怀疑态度。

我们用1年多的时间做了强化学习在投资中的应用,这里训练出的“投资脑”,完全没有人类的投资经验,而是通过市场反馈形成了自己的逻辑。

我们做了整体的对比,做了一个长期的投资计划,这里面有三个选手:

选手1:优秀的投资经理。

选手2:当前很火热的量化投资程序,注意,这里的量化程序并不是人工智能,而是指基于规则的量化投资,也就是说,不需要人为干扰,它可以帮助人类实现规则锚定的投资方案。

选手3:我们基于强化学习、继续强化学习和训练的金融大脑,这个金融大脑从开始就没有受到人类的规则限制,而是通过自己近百万次的学习(这里面当然要有一些技巧,因为使用谷歌提出的技术成本太大),然后,在300多个交易日,形成了200多次交易,我们对此进行了分析,希望从中得到人工智能对风险把控的能力判断。

通过最终的投资记录比较,我们可以发现如图4示的结论。


图4 投资记录比较结果

收益与风险

人类投资收益是8.9%,研发投资程序是7.6%,而人工智能可以达到16.3。从收益角度看,人工智能占有绝对优势,但是,我们要注意到风险控制能力,如果量化投资程序是100分的话,而人工智能只能拿到50分。

具体体现在两个方面:

一方面是极端风险出现的次数,基本上,人类和量化投资程序没有出现极端风险,但人工智能明确出现了我们定义的极端风险三次;

另一方面是“最差战绩”,也就是说,损失最大的一笔投资,人类投资收益是-13.7%,而人工智能达到了-18.1%。

综合评价:以上结果很容易给人这样一个认识:人工智能只是一个没有经验的选手,它在投资市场里之所以获得高收入,是因为冒了太大的风险,完全是收益驱动的,或者说只是因为运气好。类似于赌博的新手,通常开始运气都不会太差。

事实真的如此吗?

大局观

通过深入挖掘,研究发现一些令人思考的问题:

人类的投资人关注的投资周期是短期和中期,但是,人工智能关注的是中期和长期,这里的长期稳定率是80天以上。

所以,从大局观的角度来看,人工智能如果是100分的话,人类投资人能拿到80分,进一步还有很多的数据和统计来印证这一点。

重新定义风险和收益的平衡点

这值得我们思考,无论是金融还是保险,本身都与风险有关,这些对比其实是采取了人类的经验来评价人工智能的表现,类似于用人的经验来考虑人工智能围棋的能力,这似乎有些问题。

换个角度想,也许人工智能没有人类这些规则的束缚,能找到更好的收益和风险的平衡点——基于它的风险把控能力,实际是金融应用人工智能的潜力所在。

通用学习针对的是三类人工智能中的通用人工智能,或者说是它的入门门槛。但聚焦在金融领域,就是人工智能能否在金融领域进行通用学习?如果我们把这里的通用学习指基于样本自动而生成深度网络并进行训练,那么直观上看,很多人会觉得业务很繁杂以至于难以实现。

但是,事实上是有可能的。金融的业务与业务之间、部门与部门之间、甚至监管和行业之间、市场与行业之间,信息传递主要表现为固定集中的表格、有规则的报告、有规则的文件等,也就是说,存在着天然的特征,这使得通用人工智能学习成为可能。

我们的研究团队用一个二值网络作为前置条件,可以根据样本自动构建深度网络,实现通用人工智能,并能够给出一定范围优化的参数和训练路径,这种方式可以取代一些金融模型,但还需要深入探索。

尽管有挑战、有偏见,但是,融合将会继续,根据人工智能技术发展的分析,以及对金融行业发展的预期,我们认为,金融行业会有一些从业人员受到人工智能技术的替代,比例会从6%上升到35%,这个时间大约在2035年。

这个过程如果继续下去,就会带来一个有趣的问题,那就是:金融行业会产生著名的勒德谬论吗?

18世纪的时候,一个叫勒德的工人,夜晚进入工厂砸毁了机器来发泄自己的不满,因为蒸汽机带动的织布机取代了他的工作,他被辞退后就希望用这种方式来阻止机器取代工人的过程,很显然,这是不可能完成的任务。

理论上最好的“阻止”该过程的方式就是:人类在工作链条的更高端找到位置。

但是,我们要问一个问题,如果工作链条的最高端的位置也被人工智能取代了,会发生什么?政府是否需要提供经济学家100多年前提到的“无条件基本收入”呢?

这值得我们进一步去思考。

免责声明:本网转载合作媒体、机构或其他网站的公开信息,并不意味着赞同其观点或证实其内容的真实性,信息仅供参考,不作为交易和服务的根据。转载文章版权归原作者所有,如有侵权或其它问题请及时告之,本网将及时修改或删除。凡以任何方式登录本网站或直接、间接使用本网站资料者,视为自愿接受本网站声明的约束。联系电话 010-57193596,谢谢。

热门推荐

中国支付,渗入大马

来源:头条号 作者:陈辉博士09/26 15:28

财中网合作