农企新闻网

安防创新百人会丨建十亿级声纹库!快商通李稀敏分享声纹如何“治骗”

发布者:马阳
导读人的声响各有不同,我们用耳朵就能分辨出四周人声响的不同,但这样的“不同”该如何出现出来呢?第二次世界大战前期,贝尔实验室研讨和创造了“音响光谱图像显示器”,把声波用光谱图像加以显示,这样的图像称为语谱图,后来又命名为声纹。经过可见的语谱图,贝尔实验室完成了人工说话人辨认。上世纪60年代,贝尔实验室又提出了基于形式婚配和概率统计方差剖析的说话人辨认办法,尔后声纹辨认技术失掉疾速开展,从单模板模型开展
安防创新百人会丨建十亿级声纹库!快商通李稀敏分享声纹如何“治骗”

人的声响各有不同,我们用耳朵就能分辨出四周人声响的不同,但这样的“不同”该如何出现出来呢?第二次世界大战前期,贝尔实验室研讨和创造了“音响光谱图像显示器”,把声波用光谱图像加以显示,这样的图像称为语谱图,后来又命名为声纹。

经过可见的语谱图,贝尔实验室完成了人工说话人辨认。上世纪60年代,贝尔实验室又提出了基于形式婚配和概率统计方差剖析的说话人辨认办法,尔后声纹辨认技术失掉疾速开展,从单模板模型开展到多模板模型,从模板模型开展到矢量量化模型、高斯混合模型、隐马尔可夫模型,再到人工神经网络……

21世纪以来,“ 声纹辨认 技术次要有3次打破。”李稀敏这样通知亿欧。 李稀敏是清华大学退职博士,人机对话与声纹辨认范畴资深专家,同时他也是厦门快商通科技股份无限公司的AI研发中心总监、快商通声纹研发团队的中心成员

声纹辨认技术的三个分水岭

除了上述的身份外,李稀敏还是一名知乎“楼主”,他守旧的 “声纹辨认的使用理论”专栏,详细引见了声纹辨认的技术、资源、使用等,目前还在不时更新中。在承受亿欧采访时,为了便于了解,李稀敏将近年来声纹辨认技术的开展总结为3个分水岭。

安防创新百人会丨建十亿级声纹库!快商通李稀敏分享声纹如何“治骗”

(近年声纹辨认技术开展的3个分水岭)

第一个分水岭是2000年 。在2000年以前,停止声纹辨认验证,次要是基于模板婚配,这种算法基于信号比对,通常要求比对单方的内容相反,比方要验证说“床前明月光”的人是谁,那验证人也必需要说“床前明月光”才干验证,假如他说“疑似地上霜”的话,验证就不能完成。2000年当前, 开端呈现基于高斯混合模型的声纹辨认算法 ,高斯混合模型是典型基于统计学习实际的办法,该算法采用少量数据为每个说话人训练模型,运用高斯混合模型验证曾经与文本有关了,即要验证“床前明月光”的说话人时,说“疑似地上霜”也可以验证成功。之后发生的许多主流研讨办法都是在高斯混合模型的根底上改良的,但高斯混合模型注册语音的工夫过长,无法满足实践使用场景的需求,因而需求新的技术来打破限制。

第二个分水岭是2010年左右 ,这时分呈现了 iVector/PLDA算法 。iVector最大的亮点在于,把语音映射到了一个固定的且低维的向量上,这意味这一切机器学习的算法都可以用来处理声纹辨认的成绩了,因而这是一个宏大的提高。PLDA是一种信道补偿算法,由于在iVector中,既包括说话人的信息,也包括信道信息,而我们只关怀说话人的信息,所以才做信道补偿, 目前PLDA是最好的信道补偿算法 ,但噪声对后果仍然有很大的影响。

第三分水岭是在2011年在第十一届全国人机语音通讯学术会议上,邓力分享了他在微软DNN-based speech recognition的研讨后果,将辨认率提升了30% ,这将声纹辨认的精确率一下子提升了一个层次。DNN能从少量样本中学习到高度笼统的说话人特征,并对噪声有很强的免疫力,至此深度学习被引入业界,国际对声纹辨认技术的关注点也放到了深度学习上。

声纹辨认在公共平安范畴大有用处

将深度学习引入声纹辨认范畴后,经过了几年的开展,目前声纹辨认技术曾经绝对完善,那么声纹终究可以怎样用呢?李稀敏通知亿欧, 绝对于其他身份认证方式,声纹辨认具有易采集、非接触、高牢靠等特点,操作复杂,且验证内容可变化,因而在公共平安范畴大有用处

最重要的一个使用场景是电信反欺诈 。”李稀敏说, 电信诈骗 是经过电话、网络或短信的方式假造虚伪信息,设置骗局,是一种非接触性的诈骗。依据相关统计,超越50%的电信诈骗是经过打电话停止的,“所以电话是重灾区,”李稀敏说:“而声纹辨认也是一种非接触式的办法,可以直接在电话里就辨认出说话人的身份,无效增加电信诈骗的发作。”据理解, 目前快商通声纹曾经与公安局、电信公司展开协作,树立了静态声纹数据库,支持十亿级声纹库实时检索,可以疾速停止1:N大规模检索。 “十亿差不多就是中国网民的数量,目前能支持这个级别的声纹实时检索的,我们是业内首家。”李稀敏通知亿欧。

在公共平安范畴,除了电信反欺诈外,司法社区矫正也是声纹辨认的一个典型使用场景。社区矫正是指针对判处控制、宣告缓刑、裁定假释、暂予监外执行这四类立功行为较轻的对象所施行的非开释性矫正处分。虽然我国从2009年开端在社区矫正中启用信息化管理手腕,但实践操作中仍存在脱管、漏管景象,“采用声纹对矫正人员身份停止验证,可以无效处理‘人机别离’的成绩。”李稀敏说,而且只需经过电话即可完成验证,这极大地降低了司法所的任务强度,对矫正对象而言,这样的方式也更能表现出对人格的尊重,有助于其顺利回归社会。

处理借贷黑中介的良方

除了公共平安范畴外,金融范畴也对声纹辨认有着激烈的需求,“特别是在金融借贷方面。”李稀敏引见道, 在 消费金融 行业,大局部坏账来源于黑中介主导的产业链式诈骗 ,黑中介应用社交媒体、路边小广告等骗取借款人信任,以协助操持存款为名,提供全套虚伪存款资质证明资料。因而如何在审查环节及时鉴别出黑中介,成为降低消费金融公司坏账率的关键要素,“声纹辨认就是一种很好的方法。”

李稀敏通知亿欧,日前快商通声纹与国际某民营金融集团上线了声纹信贷反欺诈零碎,目的就在于用声纹辨认出黑中介,降低金融公司损失,目前快商通已获得声纹反欺诈在金融范畴使用的专利证书。

李稀敏引见道, 当存款订单进入电核环节,零碎会自动提取声纹并与零碎黑名单做比照,同时与最近的或同区域订单的声纹做穿插比照,假如命中黑名单,或发现反复的联络人信息,零碎则会提示该人有严重欺诈嫌疑。

安防创新百人会丨建十亿级声纹库!快商通李稀敏分享声纹如何“治骗”

(快商通声纹信贷反欺诈零碎架构)

“事先在打造这个零碎的时分,如何在误报和漏报之间找到均衡点,是一个难题。”李稀敏说,误报和漏报就像是一个跷跷板的两端,假如漏报率高了,误报率就会降低,反之亦然。“成绩就在于,假如漏报率太高了,抓不住黑中介,那么这个零碎就得到意义了;但假如误报率太高,那么这个零碎的报警零碎会响个不停,这也是不理想的。”最终,快商通声纹团队依据实践使用需求,将该零碎的误报率降到万分之五以下,漏报率控制在20%左右。

快商通声纹业务将迎来井喷式增长

大多数人都曾因不佳的交通状况而迟过到、叫过苦。经济的快速发展带动的是社会各方面的全面提升,但在此过程中,交通的发展却没跟得上前进的步幅,各类交通难题让交管部门伤透脑筋,如何利用AI来解决相关难题已成当务之急。

虽然目前声纹辨认曾经能在多个范畴落地使用,但声纹辨认技术仍面临着许多应战。其中一个比拟罕见应战是跨信道的辨认,李稀敏说,不同的设备、传输通道会形成信道的不同,不同的信道有不同的乐音,编码方式也存在差别,因而给声纹辨认的算法加大了难度。除此之外,还有语音分解、口音变化等成绩也会给声纹辨认带来应战。

安防创新百人会丨建十亿级声纹库!快商通李稀敏分享声纹如何“治骗”

(快商通声纹辨认构造图)

“所以我们也不断在想方法提升本人的技术程度。”而要想有技术的效果,人才是关键。李稀敏通知亿欧,最近一位全球语音范畴的威望专家参加了快商通声纹团队,担任公司首席迷信家,担任人才培育及公司战略规划指点等任务,这位专家曾担任过全球自然言语处置和计算机言语学范畴的国际顶级学术会议ACL和语音通讯范畴的国际顶级学术会议InterSpeech的大会主席。

据理解, 快商通声纹研发团队中心成员100%具有国际外名校博士学位,目前经过快商通声纹引擎树立的声纹模型数已超越五千万 ,在波动性、辨认率和处置速度上处于业界抢先地位。

“往年是投资声纹辨认的元年。”李稀敏以为,国际的声纹辨认还处于起步阶段,随着技术的成熟,将来声纹辨认将在越来越多的范畴失掉使用,“ 我估计往年快商通声纹的业务会有井喷式增长 。”李稀敏泄漏,往年快商通声纹将持续深耕公共平安和金融平安两大重点范畴,进一步推进声纹在这些范畴的使用。

“当然,我们AI研发中心也不是只做声纹。”李稀敏通知亿欧,快商通正在准备一个开放平台。“如今用户更希望企业能提供一篮子的处理方案,不想把效劳器放在本人那里,而是在需求的时分,调用云上的接口。”李稀敏通知亿欧,目前该平台只是各个研发组算法的集成,尚未完全开放,但将来快商通会看准需求迸发的机遇,真正开放这个平台。而将来依托这个大的开放平台,快商通的声纹业务也许会有更大的开展空间。


安防创新百人会丨建十亿级声纹库!快商通李稀敏分享声纹如何“治骗”

近年来, 人工智能 正疾速浸透到安防行业的各个环节,安防也是目前AI公司争战的主战场。紧跟“新科技、新理念、新政策”,亿欧高度注重人工智能在安防行业的使用落地,并推出《安防创新百人会》栏目。

我们将采访100家安防产业链上下游企业,同时,亿欧将于2018年5月25日在北京举行“亿欧GIIS·安防AI创新千人峰会”,本栏目所采访企业也将是大会重要参与方。

假如您有适宜的企业引荐,或许想参加“亿欧安防AI创新学习群”(余凯、孙剑、徐立、浦世亮、陈宁等行业大咖都在群里),均可联络亿欧记者李论(微信:lilun18846810390)。


安防创新百人会丨建十亿级声纹库!快商通李稀敏分享声纹如何“治骗”

5月25日,相约北京·千禧酒店,与安防行业大咖共话安防AI创新!我国这片创新热土正在发生一场全面而深刻的产业结构变革。呈献一场安防行业千人盛宴。

在这里,安防巨头厂商海康、大华、宇视将论述安防产品AI创新;CV四小龙商汤、旷视、依图、云从将引见创企如何抢占市场树立壁垒;投资机构真格、明势、IDG、高榕将共谈最受资本喜爱的公司当具有哪些特质;还有中科院威望专家,将带来AI以及各种生物辨认的最前沿科技。

仅剩200张门票,理解大会概况及抢票请戳: GIIS 2018·安防AI创新峰会

版权声明

凡来源为亿欧网的内容,其版权均属北京亿欧网盟科技无限公司一切。文章内容系作者团体观念,不代表亿欧对观念赞同或支持。