南美的一只蝴蝶扇动翅膀,可能导致北半球的一场飓风。
在电影《蝴蝶效应》中,男主角伊万为了弥补幼年的遗憾,一次次回到过去改变事情发生的轨迹,但每一次都发现被改变的结局又将产生更大的遗憾。电影的最后,伊万绝望地选择了自杀。
伊万的绝望源自于每一个事件的改动,所引发联动的可能性数量实在太过复杂庞大,对结果的预测根本不是人力所能及。但如果伊万有一张智能图谱,能够自动衍化出所有可能结果的发生概率,他是不是就能利用自己的穿越天赋,排列出人生的最优解?
“当类似于‘央行加息’这样的消息在媒体上出现,我们捕获之后通过自然语言处理技术将其转化为金融行业事理图谱的输入,探测各种可能受到影响的联动路径,比如贷款成本提高,可能导致购房热情下降,从而影响到房地产及其上下游企业,这些企业与本行客户群体存在哪些关联关系,同时利用量化模型计算出各种结果的风险概率,提供给银行信贷和风控部门作为决策依据。”
海致星图总裁杨娟在接受亿欧金融专访时,举了这么一个例子。
每天、甚至每分每秒,金融市场上都有无数像“央行加息”这样的蝴蝶在振动着它们的翅膀,其牵扯的实体关系常常是数以亿计。人力显然无法覆盖风险传导过程中千丝万缕的可能性,但机器天然具备人类不可比拟的算力,使得飓风的预测成为了可能。
从算力到预测,机器是如何发展智能的?
杨娟认为,机器智能发展有三个阶段——计算智能、感知智能和认知智能。计算智能包括强大的算力和不断优化的算法,感知智能就是将语音、图像、视频等不同的信息转化成机器可理解的数字化信息,认知智能则要将识别的信息进行关联思考,以产出“知识”。
然而机器本身不具备人类的思维能力,无法将信息进行关联推理。“世界是复杂关系的总和,如何创建起一张与之相对应的关系网络,来帮助机器理解世界,这就是知识图谱要做的事。”杨娟总结道。
可以说,拥有海量数据和强大算力的机器是空有内力却没有招式可以发挥,而知识图谱对其来说,就是一部画满了武功招式的秘籍,帮助机器智能完成“一流高手”到“顶尖高手”的蝶变。
近两年,市场对机器智能的要求越来越高,知识图谱也随之越来越火。
“知识图谱”这一概念源起于谷歌。2012年,谷歌将数以亿计的实体和数以百亿计的事实关系组织在一起,正式推出“知识图谱”。此后,百度率先将其引入中国。
2016年,海致星图成为国内将“知识图谱”应用于金融领域的先行者。在百度出身的创始团队和拥有IBM、阿里云等产业背景的运营团队联手之下,海致星图短短三年间发展迅速,现如今已经服务于四十余家金融机构,覆盖银行、券商、证券交易所、保险等各类不同金融客户群体。
目前,银行仍然是海致星图最主要的合作群体。银行的传统风控手段普遍具有‘重线下,轻线上;重策略,轻运营’的特点。
“说白了,就是对人的依赖性很大。”
杨娟向亿欧金融表示:“过去银行传统的业务范围决定了它们只需要传统的风控手段就可以满足,但现在,普惠金融和零售业务的拓展,线上场景的大量增加,都使银行对智能化的需求越来越高。”
随着外部市场环境的日益复杂,银行在金融科技领域的投入不断增大。
知识图谱与银行业务的结合,往往是全方位、全链条的结合。从对公业务到零售业务,从获客、准入、审贷、风险预警到催收,每一个环节都存在着知识图谱的用武之地。
在获客环节,对公业务中,当知识图谱通过对上下游产业链的识别,发现上游企业的相关利好信息,可以推导出其下游企业出现扩大生产的需求,从而提前预测这些企业的潜在资金需求;零售业务则常常通过对海量多种数据源的聚合,识别出卡主之间的关系,例如通过发放工资数据识别同一个单位的同事、通过一张借记卡还两张信用卡识别夫妻关系等,当发现某一位卡主工资上涨时,该卡主的妻子或同一家公司的同事极可能消费能力也有所增强。
同样,在风控和催收环节,除了风险传导的预测外,对失信人周边关系的识别,也有利于帮助银行发现潜在失信人群或通过与失信人联系密切的关系来提高贷款回收的成功率。
这些服务的本质还是基于同一套知识图谱,即将金融机构多源异构的数据进行融合,包括客户、合约、产品、用户行为、账户信息、交易流水等信息,经过图分析和图挖掘相关算法进行处理后,构建起一张复杂的知识网络,最终不断对外产生各类“知识”,例如风险提示、潜在客户、黑灰名单等。
当问及与银行合作的难点时,杨娟向亿欧金融表示:“银行是信息化水平最为先进的客户群体之一,对第三方的科技水平和服务能力要求很高,所以一开始拓展银行客户时,确实很艰难。但另一方面,银行客户的粘性也很高,一旦产品技术受到认可,几乎就意味着长期稳定的合作关系。”
同时,杨娟表示,金融机构业务的同质性很强,有了堪称行业示范的客户合作案例后,沟通成本大大降低,后续的客户拓展也就容易很多。
自2014年以来,我国的大数据行业迎来爆发期。据统计,截至2018年年底,仅在贵州一省就有近9000家大数据企业。“乱花渐欲迷人眼”,如何才能从成千上万标榜着“大数据”的企业中鉴别出真正有技术实力的企业呢?
杨娟表示,一家好的大数据公司应该跨过三道门槛:
第一道门槛是对多源数据的融合、整理能力。随着各种智能设备的发展,现在各种维度的数据越来越多,企业愁的不是没数据,而是如何融合那么多不同种类的数据,因此,如何融合多源大数据的是考验大数据相关产品技术的第一关。
第二道门槛是对大数据的运算和挖掘能力。过去可能还是小数据,现在是真的大数据了,种类丰富、量大而且增长迅速。在某股份制商业银行的信用卡中心,8000多万持卡人,实体超30亿,关系有300多亿,而且每天都在不断增长。企业基于业务的经营要求,常常需要实时返回计算结果,因此对平台的运算和数据挖掘处理能力要求很高。
第三道门槛是算法和模型输出的结果能否与业务紧密结合,为企业带来经济价值,而这一点也是很多考虑引入科技的金融机构最为关心的。
对于近日备受关注的数据安全和个人数据隐私问题,杨娟表示,海致星图采用的是“云+端”模式,即海致的云平台自有数据结合金融机构所提供的数据,其中,金融机构提供的数据都是去除个人标识的标签化数据。
此外,杨娟还认为不断趋严的数据监管政策对企业而言是一件好事。
“前两年和客户谈大数据,很多人对大数据的认知都是‘你有什么数据可以卖给我’,现在客户逐渐意识到,大数据的真正价值在于对多源、复杂、海量的数据进行分析和挖掘,这时算法能力和平台能力才开始得到体现。” 杨娟表示,这是一个良币驱逐劣币的过程,“一些靠灰色手段获得数据的公司会慢慢消失。”
海致星图目前也正在拓展除金融外的其它领域,例如零售、能源、消费电子等,希望将其在金融行业中的成功经验和平台的数据处理能力平移到更多的行业场景中。
当然,金融行业有着海量的数据和同样庞大的资金规模,天然就是一块美味诱人的蛋糕,在其它行业拥有成功经验的科技企业,也总有一天会进军到金融行业。而积累行业数据、优化算法模型的同时,提供优质服务来增强客户粘性,是先行者们保持优势的不二法则。
银行与金融科技融合的理想境界是什么?是银行即服务。
2019年6月14日,亿欧智库研究院将在“2019丨全球新经济年会·金融科技峰会”上发布《2019开放银行与金融科技发展研究报告》,深度解读金融科技赋能开放银行的融合与落地应用——上海·虹桥·世贸展馆邀您见证!抢票链接:https://www.iyiou.com/post/ad/id/818