跳出微软研讨院心向产品化，她如何推进无监视学习反欺诈技术的使用？

2025-08-05 14:40:19

导读技术的深度使用在给人类带来“光”的同时，也有“暗”在生长。科技风险已成为各行业次要的风险之一，从电信诈骗，到钓鱼木马、买卖团体信息，再到如今有组织的羊毛党，欺诈者不断在开辟攻击手腕和范畴，这也要求着平安和风险剖析技术的更迭换代。近年来不时开展的大数据与人工智能技术，逐步成为风控与反欺诈从业者的无力武器。成立四年的DataVisor打出“无监视学习算法”这一旗帜，再结合监视学习、自动规则引擎，为客户

技术的深度使用在给人类带来“光”的同时，也有“暗”在生长。科技风险已成为各行业次要的风险之一，从电信诈骗，到钓鱼木马、买卖团体信息，再到如今有组织的羊毛党，欺诈者不断在开辟攻击手腕和范畴，这也要求着平安和风险剖析技术的更迭换代。

近年来不时开展的大数据与人工智能技术，逐步成为风控与反欺诈从业者的无力武器。成立四年的DataVisor打出“无监视学习算法”这一旗帜，再结合监视学习、自动规则引擎，为客户提供多使用场景的维护，包括少量虚伪账户注册、账号盗取、欺诈买卖、身份盗用、洗钱买卖、冒充评价、渣滓邮件、虚伪装置推行等。

跳出微软研究院心向产品化，她如何推动无监督学习反欺诈技术的应用？

开创人、CEO Yinglian Xie （谢映莲）毕业于卡内基梅隆大学计算机系并获得博士学位，有超越十年的平安范畴行业经历，不断努力于打击大规模网络线上攻击，此后任职微软硅谷研讨院。近日，她与雷锋网停止了一次深化的访谈。

三大技术构建护城河

跳出微软研究院心向产品化，她如何推动无监督学习反欺诈技术的应用？

“人工智能产业开展有四个维度：场景、大数据、计算才能与算法。大数据是根底，计算才能是前提，算法靠人才。在细分场景曾经确定的前提下，大数据十分重要。而这局部需求行业顶级专家的深度参与，经过大数据的清洗、标签，把行业顶级专家的知识转移给机器，从而让人工智能站在巨人的肩膀之上。 ” 清华教授邓志东通知雷锋网。

在理想中，各行业或许拥有较多的数据积聚，但带标签的数据却很少，需求依赖行业顶级专家的深度参与，人力限制是一方面，另一方面是有标签的数据较难得，拿到之后通常也存在滞后效应，无法检测新型的未知类型的攻击。而标签数据的及时性和精确性，直接影响模型的效果。无监视学习曾经无法满足现状，从业者开端使用无监视学习来应对这种状况。

望文生义，无监视学习可以不依赖于标签和训练数据，自动发掘新攻击。当攻击疾速变化时，也能自动持续跟踪发掘。“它最大的益处是，化‘主动跟着朋友跑’，为‘在攻击发作之前或同时做出反响’”，谢映莲说，并且还能检测埋伏期账户，起到提早预警作用。

据引见，DataVisor普通经过发掘平台用户的三类数据：账户注册信息、行为信息以及其他信息（IP、天文地位、设备等）。“下一步，把该平台一段工夫内停止同一行为的用户放在一同来检测，聚类剖析，发现账号间的类似性和相关性，构成单个用户画像。”比方，当一个新用户注册时，平台无法获知更多信息，但是联络一切用户时，能够有一些用户运用十分相反或类似的头像、名字、手机型号等，行为就凸显出来了。

谢映莲通知雷锋网，目前无监视机器学习在实践使用中比拟少，难度是在于如何设计算法、体系架构以及保证算法的效果。

另一个也在无监视学习体系下的技术是自动规则引擎。传统规则引擎都是人工调试，DataVisor在此根底上应用机器学习技术，发掘出了很多欺诈群组，而每个群组都有一条或许多条规则，那么如何将这些后果转化成人类可以了解的规则，以满足监管或许其他需求呢？

据称，他们会总结规则的类似性，并用统计原理对规则的生成停止严厉的测试，从而使之既有解释性，又能满足平台的需求。

“总的来说，这三种技术有着不同的作用，构成互补。有监视学习在有标签的状况下，可以发掘出有规律的特征，与无监视学习可以结合应用。而自动规则引擎次要就是满足解释性需求，并且增加人工调试的繁琐和错误率。”

此外，他们还打造了DataVisor 全球智能信誉库，为上述技术提供数据支持。次要经过发掘、整合攻击信号，并停止二度计算，提炼出更具有代表性的信号。据称，数据库拥有来自不同范畴超越20亿用户的欺诈行为数据，如IP地址、UA信息、邮箱域名、设备类型等。

基于以上三种技术加全球智能信誉库，他们开发了用户剖析平台。由于该平台自身就具有通用和可延展性，所以可以与不同的数据、不同的运用场景挂钩对接，也就呈现了八大使用场景。

进入中国，发力金融

那么在实践使用，DataVisor是如何结合使用场景，为客户提供效劳的呢？

谢映莲表示，第一阶段十分重要的任务就是协助客户梳理和清洗数据，数据的质量与算法的好坏也是密不可分。虽然DataVisor会面临数据片面与精确性的应战，但她也指出，各机构关于数据的认识曾经比拟激烈，“会有一些（数据梳理）根底，虽然良莠不齐。”

下一步是了解客户的业务场景和需求痛点，“将我们的算法和对方数据相结合，协助客户处理实践成绩。”上述完成后，需求对相当于技术框架和产品停止调试，依据客户反应停止一到两次调优，然后进入产品上线阶段。

客户可以经过DataVisor用户界面、用户剖析控制台获取检测后果，或许经过DataVisor后果API批量导出或实时传送检测后果，或许直接购置规则自行建册。依据客户不同的业务需求，DataVisor数据剖析平台提供多品种型部署选项，包括外部部署、SaaS效劳和公有云部署。

据称，DataVisor的客户有如美国最大点评网站Yelp、Pinterest，以及财富500强金融机构等。 2016年11月，正式进入中国市场后，在国际树立协作的公司包括群众点评、猎豹挪动、昔日头条等。

DataVisor还表示下一步将会发力金融行业。据谢映莲引见，以后与金融机构的协作次要集中在账号维护、信贷请求、买卖结算和反洗钱方面。以前述财富500强公司为例，该公司在超越200个国度提供效劳并且曾经进入金融效劳行业超越100年，DataVisor次要为其提供反买卖欺诈效劳。该欺诈与风险战略总监可以在欺诈者发起攻击前数天或数小时检测到他们，使欺诈买卖损失增加超越30%。

另外，美国最大的商家结算领取平台在采用DataVisor一站式风险数据剖析平台后，实时阻止了17%的买卖纠纷欺诈，每年均匀为平台商户节省超越5万美元。

而说到国际风控市场，俨然一片红海，相关技术提供商曾经不胜枚举，漂洋过海的DataVisor如何在竞争中占据一席之地？

“市场宽广，难免会有竞争，但我以为这会是良性竞争”，谢映莲持着悲观的观念，“市场不同的参与者会起到不同的作用，有些专做白黑名单、辨认指纹这些信号类型的任务，有些像我们提供算法战争台，都是在完善生态零碎。”

她表示，外部有很多华人工程师，中国也是公司将来的战略重点，并泄漏了 DataVisor国际开展方案。首先，会持续进步无监视机器学习技术的智能化，使之能婚配适用更普遍的场景，增加人工干涉。其次，依据客户需求，停止本地化调整，比方说，对中文言语文字处置的优化；另一方面，国际有较多羊毛党、刷机行为，规模性更强，会思索中国的攻击特点停止调整。

心向技术产品化

“经过微软的多年经历，认识到无监视学习的重要性，大家觉得以前的办法是‘头痛医头，脚痛医脚’，而透过互联网上领取、刷单行为，我们看到实质其实是账号层面的欺诈。所以我们降生一个想法——处理账号生命周期中存在的各种欺诈。”

谢映莲向雷锋网 (大众号：雷锋网) 描绘其立项创业的心路。她表示，微软研讨院有很好的研讨气氛，但是对团体来讲，并不满足于经过和微软各个部门协作停止的部分创新。其中的“她们”还包括结合开创人兼CTO俞舫，异样来自微软硅谷研讨院。

“反欺诈行业一个特点是，对手在不时变化，成绩不是运动的。我们在不停地追求新技术应对攻击，另一边又在将这种技术才能产品化，两个进程都充溢着应战性，也让我十分兴奋。”

这些或可总结为支持她过来十年以及将来能够的数十年，从事该行业的动力。

==============全文完==============

【昔日福利】比特币等虚拟货币的动摇性总是出乎人预料，资本和人心难以捉摸，但价钱的另一影响要素却朴素得多——技术和使用价值。这也是2017年区块链行业的关键词。过来的一年，在众多大小公司涌入区块链，POC项目和代币遍地开花的同时，也有一些先行者呼吁，“不要为了区块链而区块链”。
技术的开展永无尽头，在这条探究的路途上，我们看到的不只是尸骨，还有正在建造的座座丰碑。2017年，雷锋网(大众号：雷锋网)曾与数十家区块链行业传统企业、新创公司停止对话，并报道。如今我们选取了其中8家代表性机构的理论案例，包括工商银行、招商银行、安全集团、银联、蚂蚁金服等，汇编成特辑报告。除此外，还有20+智能金融公司案例，涵盖普惠金融、风控信贷、财富管理等议题。

以下为特辑局部目录：
● 世界经济论坛报告：全方位评价Fintech将如何推翻金融业竞争格式，包括途径、形式和结局
● 前瑞银大牛：区块链如何革新传统金融两大使用形式？
● 区块链+金融，带你直击理论使用中的需求和痛点
● 比特币、以太坊、区块链、代币、ICO，你需求晓得的一切都在这了

戳这里 https://www.leiphone.com/specialEdition/detail/s/5a4c9564b9e38 ，检查雷锋网Fintech年度特辑全文。

跳出微软研究院心向产品化，她如何推动无监督学习反欺诈技术的应用？

。

免责声明：本文章由会员“金原”发布如果文章侵权，请联系我们处理，本站仅提供信息存储空间服务如因作品内容、版权和其他问题请于本站联系

标签：