6月15日,亿欧金融在上海正式举行“ 2018智能+新商业峰会——智能+新金融峰会 ”,探析AI、区块链散布式技术和大数据带来的金融业智能化,瞻望新一代智能金融的根底设备和将来使用蓝图,推进智能金融的演进。
此次峰会由上海市经济和信息化委员会、上海市商务委员会、上海市长宁区人民政府、上海市互联网金融行业协会指点,上海市长宁区青年结合会和亿欧公司结合主办。
英凡研讨院、星合资本、百融金服、融360、同盾科技、包银消费金融、新网银行、网商银行、快牛金科、拍拍贷、恒移动互联网在带来全新社交体验的同时,也或多或少使人们产生了依赖。移动互联网使网络、智能终端、数字技术等新技术得到整合,建立了新的产业生态链,催生全新文化产业形态。昌公司、光速中国、宜信新金融产业基金等单位列席本次峰会。
恒昌CTO薛正华现场宣布了题为《新科技驱动的新普惠金融》演讲,薛正华演讲要点如下:
1、网贷是一个十分有应战的行业,想做好特别不容易。
2、网贷行业竞争十分剧烈,同时随着监管收紧,很多政策上的红利也渐渐消逝了。
3、金融范畴中心的东西是风控。风控的根底是什么?大数据。
4、信贷知识图谱将成为金融产业的根底设备,在诸多范畴的使用变得越来越重要。
5、人工智能作为金融产业的根底,将来将使用在整个信贷全生命周期,从获客到风控到贷后的资产管理都将发扬宏大作用。
以下是薛正华演讲注释:
各位亲爱的嘉宾们,大家下午好!十分感激大家这么晚了还可以坚持在这里听我们的各种想法和报告。我想给大家出现一些在金融科技范畴的一些实战的干货,和大家分享一下。
首先我想和大家分享一个数据,大家看到这个是最近几年网贷行业变化的状况,在大家左手边是整个网贷行业成交量的走势,2016年底,2017年左右的时分到达了高点,从2017年开端往下走。
右手边的图,大家可以看到的是,整个正常运转网贷平台的数量,2015年底开端有一个跳水,为什么会呈现这种状况?我觉得这个跟很多行业十分相似,就是刚开端的时分都是上千家平台,我不晓得大家记不记得“千团大战”,大家想想明天还剩下几个团购公司。
网贷也是一样的,最多的时分应该有三五千家,但是在这两年少量的没有竞争力的一些网贷公司纷繁倒下了,为什么倒下?我觉得有几方面的缘由。
第一,从事这个范畴的网贷平台没无意识到网贷是一个十分有应战的行业,想做好特别不容易。
第二,竞争十分剧烈,同时随着监管的收紧,很多政策上的红利也渐渐消逝了,所以说这是为什么会呈现这么一个图形的缘由。
这两年大家在说大数据,大家晓得在金融范畴中心的东西是风控。假如风控凶猛,可以把业务规模往大撑,这样可以进入收益的正循环。假如你的风控不行,业务规模越大,死的越快。所以说,风控是金融最中心的东西,不论是网贷还是传统的金融业务,是一样的。
那么, 风控的根底是什么?大数据。 不论是网贷平台还是银行,假如没有足够强的大数据作为根底,你说能把风控做好,没有人置信。所以,大数据是风控的根底,这个逻辑十分清楚,想把金融行业做好就得把风控做好,想把风控做好就有得十分弱小的数据根底。
在过来几年,我们在大数据方面有几方面的来源。一个是我们本人业务的数据,另外一个是地下的一些数据,比方说网上地下的这些名单,包括在58,百度、贴吧、赶集地下的中央搜集的,这些名单我们会挑选处置,选出白名单、灰名单和黑名单,我们如今也有4000万左右的数据。另外一局部是用户合法受权的一些数据,这个我们会把它作为信贷的重要考量的规范。
有了这些数据之后,如何用这个数据?这是一个十分关键的成绩,怎样支持恒昌的中心业务,怎样把信贷做好。恒昌2016、2017年投入了十分大的团队在做的任务,就是大规模的信贷知识图谱,我们构建了支持上亿,上百亿关系的超大信贷知识图谱。
信贷知识图谱怎样用?我给大家举几个实例,大家右手边是真实的案例,我们把西南部一个省,2015年、2016年两年的数据做了一个数据剖析,王某在做借款的时分会提交很多信息,比方你的姓名、身份证、联络方式、联络人、电话号码,包括你的任务单位等等十分多的信息,知识图谱零碎把这些数据作为一个节点存在。
另外一个借款人姓高,也有很多属性,我们的知识图谱零碎会把他的属性和曾经有的属性停止自动关联和婚配,我们发现三团体是同一家公司的,那么我们零碎会给他自动构建一个同事关系链,我们经过大数据统计剖析,我们发现当一团体四周不论什么关系衔接起来的,假如有两个呈现过逾期,这团体呈现逾期的概率是89%。假如有三团体都是有成绩的,那么他呈现的概率是91%、96%。我们用大数据的办法,用图的关系生成一些新的欺诈和信誉有关的。这是用知识图谱做的事情。
我再举一个例子,这是一个实例,目前我们公司做了有超越100万的存款用户,用户外面,每个用户假定有一百个属性,各种属性,大家想想这个数据项有多少,有一个多亿的数据项。想在一个多亿数据项外面找到不同数据项之间的关联是比拟费事的,在知识图谱外面我们经过机器自动找出关系。
举一个例子,比方大家的右手边看到这个实例。这五团体在不同的工夫、不同的地点来提交的,我们发现这五团体居然用同一个邮箱,这是不能够的。邮箱我们每团体只要一个,为什么呈现这样的状况,这是十分典型中介代办的欺诈案例。中介为了省事,由于他要包装很多人骗贷,就会请求邮箱,假如我们经过了会发一些邮件信息,他为了处置起来方便就用一个。这个时分,我们经过这些技术,经过知识图谱关系,自动把欺诈的进程炸出来,不必人去做。
信贷知识图谱还无能什么?第三个业务场景,就是行业的难题——失联修复,就是说在小额贷行业外面,很多人借钱当前电话号码一扔,就找不到他了,其实也能找到,由于他是小额的,找这团体花的本钱太高了,很多大公司就不找了,但是这样的话就形成逾期,而且很多人晓得这个东西当前就恶性逾期,这是一个十分不好的成绩。怎样处理这个成绩呢?我们在过来也是应用图谱,在我们的零碎中一团体四周有一两百团体一度联络人,我们经过算法和剖析,在一百多个一度联络人当中挑选出哪些人跟他有强相关性,我们会给每一个编一个权重来计算判别,比方经过频次比拟高,比方说称谓外面爸爸妈妈之类的,我们会把权重加高,或许单位的指导等等,我们经过一度联络人找到他。
大家可以看到,其实我们在上线这个技术的当月,我们的失联修复曾经到了行业的十分高的程度,目前我们曾经到了40%的程度,我置信随着我们图谱数据量增多,我们最终到达80%,90%的程度,彻底把这个难题处理掉。
方才和大家分享了一些大数据方面的任务。人工智能范畴我们在2016年12月份的时分,上线了人脸辨认,前期我们跟行业外面做的十分好的顶级的人脸辨认公司协作,停止借款人身份证的辨认。
2017年10月份,恒昌的声纹辨认零碎上线,声纹和眼睛的虹膜都是人体独一的标识,为什么做这个事情,我们发现大局部欺诈是中介包装,普通人是比拟难的,但是中介由于整天研讨各家平台风控的破绽等等,它是比拟专业的。怎样可以防住这些人欺诈呢?我们后来讨论很多,我们发现,有一个东西很难改动就是他的声响,我们经过声纹的辨认,他上次帮借款人骗我们,比方他是借款人的某某指导,下次变成另外一个公司的指导,我们就依据他的声响判别出来他曾经呈现过了,到目前为止我们曾经累计了30万的声纹,目前我们的技术可以做到9秒钟辨认出30万样本中这个声响能否呈现过,应用语音辨认技术把声响翻译成文本,比对一下文本和上次文本的差别究竟多大,来辨认出是不是有欺诈。
我们目前正在全国试点的技术,就是我们的近程面审技术,过来人要到门店去看,效率比拟低。2017年10月份,恒昌研发了近程面审,客户可以在任何工夫、任何地点停止面审,进步效率,降低欺诈的能够,特别降低内外勾搭的欺诈,由于你不晓得被谁审。
明天更多是在把人工智能的一些技术,除了方才大家看到的反欺诈技术之外,我们使用在我们整个信贷全生命周期,从获客到风控到贷后的资产管理。这是我们目前流量方面做的任务,我们在过来一年多,我们协作了三四百家渠道,包括融360,包括百融等等都有四五十家大的,还有三百多家小的存款超市,和他们协作。协作之后怎样耐久波动地开展呢?我们对整个渠道上百家的渠道停止量化评分,我们依据客户的转化状况,以及逾期状况停止量化评分,以此挑选出来哪些渠道是好的客户,哪些渠道是差的渠道,不时循环迭代,这外面也是对渠道停止量化评分,做调控,以及精准管控。
第二块也是我们最中心的东西,我们会持续地把我们的风控应用图谱以及深度学习的技术停止反欺诈的辨认。最初会把整团体工智能技术使用在贷后的资产管理等多方面。
另一方面我们做了一次改良,我们让每一次打分之后必需有一个反应,我的评分不一定是准的,我们评1-10分,1是容易的,10是比拟难的。你实践作业进程当中,发现这个1挺难回款的,应该是5才对,这个分数反应给机器,我们差不多有六七百个做贷后作业的人,这六七百团体均匀每天打电话的次数在200-300通,假定算200,每天可以反应12万的数据通知机器你评错了,或许你评的很准,这样的话,人和机器不时的交互,机器经过大数据剖析的后果通知人,让人愈加高效回款,人实践的作业状况反应给机器,模型就会不时迭代,越来越突出。我们置信应用这些技术可以把贷后深度学习的技术做的更好。
最初,大家可以看到左手边的技术都是我们曾经上线的技术,右手边的这些技术也是正在不时完善的技术。我们置信经过我们的大数据技术,经过我们的生物辨认技术,经过我们的深度学习做的模型技术,在获客的模型,在风控反欺诈,在贷后的模型,我置信人工智能的技术、大数据的技术,一定会让普惠金融做的越来越好。
谢谢大家!
本文系投稿稿件,作者:薛正华;转载请注明作者姓名和“来源:亿欧”;文章内容系作者团体观念,不代表亿欧对观念赞同或支持。