金融保险:深度学习——挑战、偏见与路径(上篇)
“中央财经大学金融科技书系”第一本书《金融保险:深度学习》,在2018年底终于正式出版,这是中央财经大学中国精算研究院金融科技中心的又一力作。金融科技中心的成员主要有张宁博士、陈辉博士,主要聚焦于大数据、人工智能、区块链在金融和保险中的应用,已经开发上线“保险大数据APP”、“金融脑”金融人工智能平台,“中央财经大学金融科技书系”也将陆续出版。 近年来,“中央财经大学金融科技书系”编委会成员先后出版了多本金融科技相关的专业书籍,为此,我们梳理了一套金融科技书系,希望通过金融科技书系去理清金融科技的发展脉络,去提升金融科技的认知能力,去改变我们的思维方式,去升华我们的智慧。 “中央财经大学金融科技书系”编委会成员专注于金融科技研究,我们不仅仅是一个团队,而是连接金融领域研究力量和人工智能大数据等领域研究力量的平台,希望“中央财经大学金融科技书系”的每一本书都开启一个“认知革命”的故事,一个“预见未来”的故事,成为金融科技理论研究与实践探索领域创新篇章的动听音符。 下面我给大家介绍张宁博士所著的《金融保险:深度学习》的一些内容“人工智能+金融:挑战、偏见与路径”,因内容比较多,我将分上下两篇来介绍。人工智能+金融:挑战、偏见与路径(上篇) 当前,人工智能已经在许多行业产生巨大变革,同样,在金融领域,也对人工智能的到来,有了许多期待。很明显,人工智能进入金融领域,也会给金融行业自身带来很大的变革,或者说在人工智能时代,金融行业自身面临着巨大的挑战。 一般来说,从金融领域来看待人工智能,整体上很多人认为存在巨大的危机感,也就是说,危机感是行业认知的一个共识,他们认为,人工智能进入金融领域,会取代很多原本从事金融行业的人,带来大量的金融行业的失业,这一点已经从一些现象得到了判断和肯定,例如,最典型的就是银行的信贷审核员的工作,现在已经在人工智能或者是计算机技术的支持下大量减少,根据经合组织的统计,从2014~2017年,人工智能取代了金融行业大约5%左右的就业,很多人认为,这个趋势会快速增长,这也给金融从业人员带来了很大的危机感,或者说是压力。 而从人工智能来看待金融,则对人工智能,对金融的变革充满了期待,从人工智能角度来说,金融行业的数据是一个天然的优势,而且这些数据自身非常规范,甚至在某些程度上,这些数据可以直接利用,这与金融行业从开始就注重信息基础设施建设分不开,对人工智能来说,数据是一个天然的资源,即便不用关心最终要解决的目的,有了数据也可以获得很多价值。 【挑战】 传统金融模型面临的挑战 现代金融学是建立在数理基础上的学科,现代金融学的五大支柱(M-M理论、投资组合理论、资本资产定价理论、APT理论和期权定价理论)形成了当前金融理论最主要的基础,这些模型已经在金融行业普遍使用,但这些模型以及以这些模型为基础的其他模型是否能够被人工智能或机器学习所取代或改进呢? 现在看来,这个问题的回答有极大的可能性是肯定的。无论是保险精算中的定价模型,还是数理金融中的产品定价和风险度量,都可能在大数据的背景下被改变、增强或者调整(见图1)。从本质上来说,这些模型是从数据中统计规律,并进行集成或者抽象的提升,那么对大规模数据使用一些机器学习或深度学习的方法,就一样可以完成目标的获取和模式的识别。尽管我们尚不能够做到完全使用人工智能技术完成整个建模与修正的过程,但至少新一代人工智能技术在上述收集与识别的过程中是可以发挥作用的。
图1 模型正在被深度学习取代的方向 除了模型外,值得我们思考的还有很多。金融学诸多推理和应用是基于“有效市场”理论,经济学的许多理论来源于“理性人假设”,并在这些“假设”上利用数学推理构建了宏伟大厦。但这些预定的假设并不是数学的公理,对于经济和金融来说,检验“真理”的标准是“实践”,也就是说,真实的情况如果不符合假设,那么后续建立的大厦可能要进行调整和变化,至少用一个不同的假设推理出来的结果不能直接地应用到新的情况中。 大数据和人工智能则可以在新情况的应用中发挥作用。当新的情况发生,大数据中的信息可以对于该情况进行捕捉,基于机器学习和深度学习的方法可以提炼特征,这在一定程度上可以弥补由于“假设”偏差导致的“风险”。 人性/理性被更好的度量 如前所述,理性人假设是经济学(包括金融学)的基础,但越来越多的研究表明,理性人假设存在很多问题,相应地诞生了金融物理学、分形市场理论、行为金融学等,这些学科都在试图“偏离理性人假设”,前两者是从数学推理中获得的新的理论结果,后者是通过经验推理来解释的。 与这些新的学科对应的,大数据和新一代人工智能可能从最基础的层面挑战传统金融学(甚至是经济学),这种挑战具体表现为:人的情感、偏好以及情绪波动甚至心理,存在被度量的可能,也就是所谓的“看穿心理”。一旦人的非理性能够被捕捉,其对经济学和金融学影响是深远的,在足够强的深度网络支撑下,日本科学家已经可以对人脑所想的形象进行大体分类,而基于人脸表情识别的技术已经越来越成熟。我们研究团队已经能够根据个体给出准确率不低于70%的动态风险偏好判断。这些研究逐渐积累发展,势必对金融学产生难以想象的变革。 这些变革,类似于深度学习,已经在图像处理、语音识别等领域展示的威力,对于金融业产生深刻影响只需等待随着时间而变得成熟的技术水平与核心障碍的清除。 金融业务模式被智能化替代(计算以外的能力被替代) 就目前的发展趋势来看,金融业务模式被智能化替代的进程正在飞速加快,这是因为智能化服务模式已经从技术成熟转向了现实中的成功应用。以人脸识别与文字识别为例,在技术成熟后被投入众多领域进行实践应用,而十分喜人的结果证明了应用这些技术的可行性。因此,金融业如果考虑使用这类已经过实践检验的技术来替代人工服务的一些步骤,其进展将是毋庸置疑的迅速。 可以想象,会有其他成熟的智能化解决方案快速地融入金融领域当中,使得金融业务的许多环节发生变化,这种变化主要是取代传统的人力劳动。在历史上,计算机技术更主要替代“人所并不特别擅长的计算”,但当前的趋势是人所擅长的“其他的能力”也正在被取代,这是金融业务模式被挑战的根本原因。 金融监管存在更多智能化可能 从某种程度来说,金融监管也是一个“反馈——调整——反馈”的过程。 在这个过程中,机器学习可以被用来进行更有效的监管,这些监管也是基于大规模数据的,同样会大幅度降低人力的使用率。监管过程中会有许多数据的交流以及大量历史数据的存储,这些通过使用机器学习技术可以进行特征的抽取、模式的鉴别以及风险的预判。这些信息不必再经过人为获取和人工整合,就可以直接用来进行监管,同时,还能够进行市场的监测。 可以想象,在这种模式下,监管某种程度上会变得更加自动化、更加智能化、更加以数据化为导向。宏观审慎监管、微观监管,以及行为监管,都可以在不同层面上互相支持;甚至在一些特定的人工智能的支撑下,政策可以被先行检验,压力可以被先行确定,极端风险可以被先行预测和控制。 金融数据价值存在巨大空间挖掘 尽管金融行业有大量的数据,且数据格式非常规范,但是,金融行业利用数据的能力仍然欠缺,这是人工智能或者机器学习所能够施展才华的地方。 受到传统业务模式的限制,大量金融数据在企业中的应用只是为了支撑这些业务中的既定模式,而没有被考虑衍生新的价值,这个过程在当前是可以被改变的。实际上,随着金融市场竞争越来越充分,以及随着中国市场逐步开放,金融企业必然要开拓传统业务以外的新业务,衍生新的价值,以保持其强大的竞争力。就像许多成熟的行业一样,这些新的价值大部分来源于数据,或者需要数据的支持,而该过程中新一代人工智能技术的介入是必不可少的。 信用评价面临大数据的冲击 传统的信用评价体系正在被挑战——尽管这些信用评价体系已经在过去产生了巨大的作用,也对市场产生了巨大影响。信用评价本身是一个高维度的转换。从数学角度来说,是一个高维度的数据信息转化为单一的数字的过程,也就是说,是将财务、资产等多重信息通过整合分析最终转化成一个象征着信用等级的数字的降维过程。无论是传统的信用评价体系,还是当前基于大数据的模式,都是在这个降维过程中尽量捕捉到有用的信息。 很明显,基于更多维度数据来获得信用评价结果,能够更加细微地发现敏感信息。而市场中大量的风险元素可以被捕捉或者逐渐可以被捕捉,那些在传统模式下很难发现的一些风险特征、预警指标都可以在大数据的支撑下真实地反映出来。 从金融的具体行业来看 保险定价、保险理赔保险新产品的设计,以及相应的客户关系的维护、客户价值的挖掘,以及特定产品的智能推荐,都离不开人工智能技术的应用。这也是当前很多互联网巨头依赖于其所擅长的用户粘性,快速进入保险领域并获得承认的一个重要原因,众安保险的成功便是一个典型的例子。本质上来说,“流量+数据+人工智能”的新模式可以挑战任何既存的业务模式。 保险以外的银行领域,网上业务以及相应的理财智能推送,相应的金融助理、信贷审核,以及信贷申请人的信用分析等,都可以大量使用机器学习技术。银行的一些客户服务,例如,客户鉴别、欺诈识别、关键语音记录分析等,也都可以用人工智能技术来替代。 此外,保险领域也会涉及投资。投资领域中,在基金的投研报告、投资顾问系统、特定股票期权期货的数据分析、特定投资企业或者投资目标的量化和评价中,机器学习或者深度学习都可以发挥作用,而且企业内部深度学习所带来的黑箱问题在投资领域中并不突出,至少可以作为一个并行的、可对比的方案来提供参考。 【偏见】 尽管大数据与人工智能对金融保险的挑战已经成为共识,但是,传统金融领域的固有偏见仍然在影响着每一个行业的从业人员,只有抛弃这些偏见才能正视挑战,推进融合,这个过程是不以人的意志为转移的。 门户偏见 俗话说:一致是强有力的,而纷争易于被征服。 偏见充斥人类认知,在金融里面,也有相应的门户偏见。银行业、基金业、保险业、信托业,尽管同属金融这一大类,但由于各自的特征而显得不算融洽。偏见就意味着,人们局限在所熟悉的细分领域来理解金融科技,从这个细分领域的认知角度去看待和使用科技力量。我们要意识到,科技本身是金融以外的东西,站在金融层面去看,科技对于金融的每一个细分行业都是平等的;只站在一个细分知识储备去看,那是坐井观天。 事实上,金融细分领域的方法模型或者技术从本质上来说,是围绕着特定条件下的对象标签——价格进行的,这个特定条件包括时间,也包括空间,甚至包括维度的变化。这一特点非常重要,它将会帮助我们建立金融的强化学习模型并理解端到端的监管。以标签获取预测为例:保险里的精算定价和金融工程里面确定衍生品的价格,并没有本质上的区别,它们是在张量空间①的约束下的映射——当考虑金融深度学习构建和调整结构时张量的统一思维非常重要。从逻辑上说,金融的不同体系都是在信息结构支撑下完成的流动性映射,从人工智能的角度来看,这些体系都是特定的分类和回归。考虑到非结构化数据,所有细分领域是没有区别的;甚至区块链所构建的本质并不只是中心化,而是代码算法保证效率公平平衡。 也就是说,莫要用传统的金融分类来限制科技的无边界。 过度宏观推理 古语有言:纸上得来终觉浅,绝知此事要躬行。 宏观金融分析作为一项有效的分析手段,其语言组织通俗易懂的特点,被大众所熟悉。但我们需要警惕的是,如果宏观金融的分析有所偏差,向广大受众传播了错误的信息,后果是难以承担的。但目前的许多宏观金融分析并不是基于严密的逻辑推理或相关论文,而是更多地从结论出发构建假设,主观地、有选择性地进行分析,最终得到想要的结论。而针对这样的错误引导,没有经过仔细辨别或由于一时惰性,极易被其误导。 这样的误导对接纳和应用金融科技是致命的,如果说金融是处理不确定性,那么科技是确定性的步进过程,它并不容纳这种不严格,这是许多做金融的人士理解并应用金融科技的主要障碍之一。 高冷倨傲,排斥学习 俗话说:位置上的屁股不代表真理的脑袋。 优越的薪酬或者已经有的地位,或者是经历过诸多风险的经验,使得金融从业者充满了自我优越感,会用金融的思维去理解科技,使得金融科技成为金融思维主导,这是一件可怕的事情。在金融里(在国内的金融业里),我们常常过度依赖于模型,或者是过度依赖于“拍脑袋”,这二者听上去如此不可思议,但还是神奇地占据了国内金融众多参与者的思想,并能够神奇地融合到一个团体中(例如,一个企业、一个会议、一个监管机关等)。而恰恰金融科技所施展身手的是这两者的中间路径,我们所熟悉的定义好的金融参数或者有解释的金融参数,在深度学习中很难映照,我们“拍脑袋”拍出来的既有经验可以被强化学习逐步“获得”。过度依赖经验或者相信权威不是长久之计,需要保持一颗谦虚好学的心才能与时俱进地发展。 人常常会自满,以为有了话语权就是有了真理,殊不知,话语权的获得除了实力还有关系、年龄、人脉等诸多途径。在面对人工智能这一全新的领域时,拥有话语权并不能帮助更好地掌握新的知识,唯有从头开始、踏踏实实地学习,才能在全新的领域中获得拥有话语权的机会。 迷信权威 古人道:尽信书则不如无书。 金融科技的热潮,引来许多“砖家”的出现。中国的“专家”与众不同,是可以迁移的,做一个领域的专家,被人们熟知,那么他轻轻一跳,哪怕是不相干的领域,也会被承认。所以,许多金融的专家摇身一变,瞬间成了金融科技专家,而没有人去检查一下,他们是否有资格来谈论科技,或者他们是否实质地了解金融科技与金融的关系? 我们不否认金融专家可以通过迁移转为金融科技专家。人工智能里有个神奇的工具叫作迁移学习,可以帮助许多初创企业在他们擅长的传统场景快速简单地利用既有AI成果。在这个过程中,需要对输出层进行调整,这个调整就是利用了新的场景的知识,权重的变化可以融合旧经验和新场景。同样成为金融科技专家,也需要对科技进行深入了解。 其实,科技就是要颠覆既得利益者。金融引入科技,就是要颠覆这些所谓的权威。正是因为有了这样的危机,权威专家们才要重新包装。 盲目跟风 俗话有言:邯郸学步,东施效颦。 现在看来,大数据人工智能区块链所迸发出来的核心技术发展——原本应该居于这场浪潮的核心,但是,现在被边缘化了,大家已经开始脱实就虚,就仿佛是金融危机前的衍生品,已经不知道所架设的基础资产是什么了。但无论投资、应用还是研究,终究是要做一件事情,衍生品也好,金融科技也好,总要有根基,放弃跟风的热潮,沉下心来认真想一想,就会发现与众不同的地方。 迷信传统模型 俗话说:脱离模型看问题,进入数据创造价值。 金融中有一股热流,类似如笔者一样学数学出身的人们更多的是相信模型。与人们的常识想法,过多地相信模型在当今是一个需要改进的观念,或者说,人们所相信的“模型”需要一个更新修正的定义。笔者认为,模式是比模型更好的载体,模型是模式的一种。但是,我们引入模式是因为在大数据的时代,模式可以定义为非结构化数据的特征,而这种特征可以超越我们熟悉的传统模型的概念,进而可以描述诸多传统上不能量化的问题。当我们赋予这些模式可以识别的路径,其实,已经涵盖了所有的金融问题,这种思想是我们要重新建立的重要认知。站的高一点,都是风景。 不变应万变 俗话说:变化远比想象的快。 金融市场的信息瞬息万变,但是,金融行业的体系规则等,在监管和市场的双重夹击下却相对稳定。事实上,正是因为市场的不确定性的判断,使得金融机构不愿意发生变革,如同在惊涛骇浪中,行驶的大船不愿意做任何航向的调整,以维持视线内的稳定。但是,科技的力量常常是颠覆性的,这种颠覆性并不是赋予一个连续的准备周期,而是0和1的区别,它不会使市场不确定性减少,但是,却可以更快地埋葬不求变革。当我们构建足够精细的模式时候,它所捕捉泛化的看起来是要解决的问题的联合分布或者条件分布,但实际上是在“拟合”既有经验的认知。很显然,任何经验在足够高维度的流形式是局部的,这是决定金融科技会不断变化的本质因素。在行动上以不变应万变,那是自杀。 与己无关高高挂起 我们无比确信,我们后代所感知的金融市场一定与我们今天不同。 金融市场的参与者、监管者都应该看到,当金融的本质被抽象出来后,其科技带来的增效是直接的,在部分模块,科技可以创造新产能。从更深一层来说,既有的金融业务连接——请注意互联网经济的核心是连接,在约定俗成和监管限制下是规范的。从来没有一个行业像金融一样建立了这样好的一个通用学习的基础,尽管当前的“可解释性”黑箱问题存在,但是,可以看到,通过稀疏结构分析、探针网络、信息流以及反馈参数架构,该问题正在消融。市场面临的将是灌输了经验的或者说经过经验Finetune的AI,而监管面临的是智能监管的智能。【路径】见下一篇文章:《金融保险:深度学习——挑战、偏见与路径(下篇)》。