金融 机构每年都会因欺诈活动蒙受少量的资金损失。传统的欺诈方式包括伪造身份骗贷、车险骗保等。随着 互联网金融 的开展,层出不穷的 营销 活动和品类单一的 网贷 产品让欺诈分子有了更多无隙可乘,他们的欺诈本钱似乎也更低了,足不出户就可以日进斗金。
为了限制欺诈活动,金融机构和 互联网 公司都会构建本人的反欺诈团队和防备零碎,经过种种规则和预测模型将欺诈分子拒之门外。
但是,道高一尺,魔高一丈,再紧密的规则也难免会有破绽,加之欺诈手腕一日千里和集团欺诈盛行,采用传统的反欺诈工具总是略显主动。
因而,关系图谱就有了用武之地。关系图谱之于反欺诈,就好像飞机之于军队,可以从更高的维度去侦测和打击对手,完成升维打击。
什么是关系图谱?
关系图谱是描绘集体及集体之间关系的图。下图给出了一个挪动领取场景的关系图谱示例,集体类型可以包括IP地址、设备、领取账户、账户联络人等,集体之间也可以存在不同的关系,比方IP登录行为、设备登录行为、联络人注销行为等。
关系图谱如何完成“升维打击”?
次要有四种手腕,详细如下:
(1)全维度的事中侦测。在欺诈检测零碎中,诸如登录工夫和地位(例如IP地址)之类的行为线索很容易被欺诈分子改动或伪造,但是欺诈分子很难片面地理解他们所在的整个关系网络(例如转账、购物、登录、阅读、还款)。因而,即使欺诈分子尽能够地掩盖了痕迹,也难免会在关系网络上显露马脚。比方上图中的共用设备、共用联络人信息、共用IP等就可以作为可疑特征用于辨认欺诈事情。
(2)全局的可视化预先剖析。一方面,反欺诈部门剖析人员可以依据已定性案件在关系图谱上出现出来的全局特征,优化风控规则和模型。例如,一个可疑账号能够会登录多个设备,而这些设备往往会被登录多个可疑账号。关系图谱可以十分直观地出现这种直接的多对多关系。另一方面,也可以发掘看似独立却存在直接联络的案件之间的关系,辨认中心作案人员和其他疑似欺诈分子。
(3)全渠道的标签传达。关系图谱也可以基于现有黑名单,为可疑集体打上相应标签,用于反欺诈规则和风险提示。假定已确认一个黄牛常用 手机 号,可在关系图谱中把这个手机号直接和直接关联的账户、手机号、地址、银行卡等集体打上“疑似黄牛”的标签。这种道路便是标签传达(如下图)。
(4)高效的信息检索。传统的数据存储通常基于关系型数据库,比方转账、登录等各种关系辨别存储在不同的表中,想要抽取多级关系信息则需求衔接多个表才干完成。
而关系图谱普通存储于图数据库中,常用的图数据库如neo4j、orientDB等。当关系深度较小时,比方深度为2(相似查询冤家的冤家这种关系),关系型数据库和图数据库的功能相当;当关系深度超越2时,关系型数据库所需的查询工夫到达图数据库所需工夫的上百倍甚至上千倍,这时图数据库的功能优势就十分分明了。
构建关系图谱的关键点是什么?
数据,数据,还是数据。
目前构建关系图谱的一个严重应战在于用户的行为数据是割裂的,分布在政府机关、传统金融机构、运营商和互联网公司的数据中心,任何一方都很难获取用户端到端、全渠道的数据,缺失关键信息则会明显影响侦测欺诈行为的效果。可以说,数据决议了关系图谱作用的下限,而图谱的本体设计和相关图算法都要基于原始数据。
因而,各家公司都在积极外拓数据源,近些年各类数据效劳公司如雨后春笋般涌现,也印证了市场需求。
另一方面,关系图谱还需求充沛应用已无数据,比方工夫序列信息,构建静态关系图谱(如下图)来更无效地预测和辨认欺诈风险。
随着物联网的技术开展和场景丰厚,可以瞻望这样一个将来:一团体的一切行为都将被数字化并映射到关系图谱上……
【来源: 钛 媒体 】