农企新闻网

深度学习助力OCR技术打破,易道博识AI开放平台提供一站式辨认技术效劳

发布者:何楠华
导读人工智能技术正在浸透到各行各业的商业使用当中,其中以深度学习加持的计算机视觉技术最为突出,且具有相当刚性的适用价值。从文娱交互到金融、安防,再到自动驾驶、智慧城市等等,计算机视觉技术正在改动传统的行业生态,大幅进步社会消费效率。在机器视觉范畴,市场上既有互联网巨头的强势规划,亦有资本火上浇油的独角兽公司的风生水起,如何在垂直细分场景下寻觅商业时机成为一个关键成绩。日前,猎云网记者采访到易道博识结合

人工智能技术正在浸透到各行各业的商业使用当中,其中以深度学习加持的计算机视觉技术最为突出,且具有相当刚性的适用价值。从文娱交互到金融、安防,再到自动驾驶、智慧城市等等,计算机视觉技术正在改动传统的行业生态,大幅进步社会消费效率。

在机器视觉范畴,市场上既有互联网巨头的强势规划,亦有资本火上浇油的独角兽公司的风生水起,如何在垂直细分场景下寻觅商业时机成为一个关键成绩。日前,猎云网记者采访到易道博识结合开创人兼CTO康铁钢,理解到易道博识如何从OCR(光学字符辨认)辨认切入,以及推进AI技术疾速商业化落地的途径考虑。

深度学习助力OCR技术突破,易道博识AI开放平台提供一站式识别技术服务

易道博识成立于2013年,开创人兼CEO朱军民毕业于中科院自动化所形式辨认与智能零碎专业,后在汉王从事OCR中心研发任务,具有10多年人工智能技术经历。结合开创人兼CTO康铁钢是朱军民在中科院自动化所的研讨生同窗,毕业后曾在贝尔实验室等外企任务,专业方向是形式辨认图像处置等,也比拟擅长对技术停止产品转化和市场任务范畴,目前公司团队中,研发人员占到半数以上。

据理解,易道博识从2013、2014年就开端做诸如银行卡、身份证等卡证辨认的产品使用,但事先这些产品在业界的使用还没有失掉普遍认可。

在康铁钢看来,彼时技术和产品还处于预备阶段,之所以没有一下子翻开场面,是由于这类产品的迸发期风口还没有到来。2015年是一个非常关键的转机点。随着挪动互联网开展起来,领取宝、微信等扫码领取成为主流付款方式,手机上的扫卡、扫码使用变得高频,之后众多app,尤其是互联网金融范畴的使用都开端提出辨认身份证、银行卡的技术需求,易道博识的业务量也随之呈现分明增长。2016年底,易道博识完成了首轮千万级人民币的融资。到了2017年,公司全体营收完成了翻倍增长,累计效劳超越500家大型客户,其中包括中国安全、PICC、华为、万达集团、民生银行、广发银行、长江证券、翼领取、中国挪动、首汽集团、丰田金融等等。

深度学习助力OCR技术突破,易道博识AI开放平台提供一站式识别技术服务

经过为客户提供AI辨认技术效劳和行业智能处理方案的方式,易道博识一方面有了稳健的营收和现金流,另一方面对市场一线的需求变化也有了进一步判别。在商业形式和技术道路的考量上,易道博识逐步探索出了本人的方式。

康铁钢表示:“可以这样了解,我们是一家做机器视觉的人工智能公司,中心技术可以分为两方面,一方面是文字辨认,包括我们罕见的身份证、银行卡、行驶证、房产证、车牌以及各类票据辨认技术等等。另外一方面是人脸和图像辨认。文字辨认是我们的竞争优势所在,基于这些底层辨认技术,我们开发了AI开放平台,用户可以基于易道博识AI开放平台提供的产品,协助他们开发各种使用。”

OCR技术的演进,近年来大大得益于深度学习的开展。康铁钢引见,之前的OCR辨认技术就是基于传统方式的图像处置、提取特征等,容易受光线、角度等搅扰,辨认率较差。但如今市面上依然有人在做这样的技术,由于这种传统办法也有它特定的优势,例如计算量比拟小,在终端就可以处置。当然它的优势也很分明,那就是辨认精度不够高。绝对基于深度学习平台开发的OCR辨认技术来讲,传统OCR辨认对输出的图像质量要求十分高,例如字要拍得十分明晰,画面没有褶皱,必需坚持固定的角度等等,在实践运用中存在诸多受限条件,对业务效率的提升并不分明。

从2016年开端,易到博识开端研发基于深度学习的OCR技术,辨认率精确率大幅提升,进步到了98%以上。初期DeepOCR的计算量十分大,所以必需部署在云端。易道博识团队经过不时提升DeepOCR辨认技术的功能,经过紧缩辨认技术的模型等途径,使之在挪动端也到达了十分高的辨认率,用户体验失掉分明提升。在产品线上,易道博识也从单一依托OCR辨认,延展到对人脸和物体的辨认,以及提供数据业务等范畴,协助简化业务流程,完成高效智能自动化。

深度学习助力OCR技术突破,易道博识AI开放平台提供一站式识别技术服务

康铁钢表示:“我们不只是一个提供智能OCR辨认技术的企业,我们还可以提供更完好的处理方案。目前做AI开放平台的想法,也是从市场的实在需求动身的。之前我们的客户,比方说一些大型的银行,券商或保险公司等,它的业务特性决议为确保本身数据平安,更倾向于选择公有云部署。我们把中心的辨认技术放到他们的效劳器上,嵌入到外部业务环节当中,协助他们改造业务流程,降低人工本钱,提升用户体验,加强风控平安,这是我们不断以来在做的任务。但是公有云部署本钱较高,能够需求少量资金投入,关于小型客户来说大多难以接受。但是中小企业关于辨认技术的需求正在激增,尤其是关于创业公司,这个痛点相对不在多数,所以我们从市场的角度动身,也希望能抓住这个时机。”

目前,易道博识的AI开放平台为企业提供辨认技术的Saas效劳,已开放的技术产品包括三大类:文字辨认、人脸辨认、数据业务,合计30余项产品。其中文字辨认包括各种罕见的卡证、票据、表单的辨认,例如身份证、银行卡、营业执照、房产证、港澳通行证、发票、车票、银行表单等等,证件辨认速度均匀工夫小于400ms,辨认精度超越99%。支持恣意角度身份证图像辨认,提供公安部高清人像数据源验证接口,支持视频流中霎时辨认获取驾驶证/行驶证上的要素信息等,都是不小的技术亮点。此外,易道博识提供的产品效劳还包括条码辨认、车牌辨认、支票汇票甚至数学公式的辨认,细分使用越来越多元。人脸辨认和数据效劳与这些详细的辨认使用相反相成,构成一体化的行业智能处理方案,比提供单一技术产品更契合市场需求。

深度学习助力OCR技术突破,易道博识AI开放平台提供一站式识别技术服务

据泄漏,基于AI开放平台,易道博识还计划着手研发可供C端用户运用的辨认产品,协助团体用户把拍上去的图像直接转化成可编辑的文本、表格等,方便人们在任务生活中运用,提升团体的任务效率。新产品能够会采用收费+付费相结合的战略,为公司的辨认产品拓展更大的市场,也为更普遍的客户群体提供效劳,从而触及更多潜在客户。

“C端产品虽然不一能给我们带来可观的收益,但可以让更多的用户体验到我们的AI产品技术,可以提升我们的知名度。只需我们的产品做得真的不错,团体用户试用之后也能够转化为公司前期的推销行为,或许是在触及到辨认技术和产品的时分为我们发明良好的口碑,打造传达效应。假如能从C端衍生出波动的支出来源,我们求之不得,但我们并不依赖这个范畴生活,而是更情愿把它作为一种尝试。”

在商业形式方面,康铁钢说:“从我们的观念来讲,最重要的一点一定是做技术,专注于做中心的辨认技术,专注于做机器视觉范畴的技术。而另外一点,我们会临时效劳于行业内的大型客户,但to C业务也是我们想尝试的方向,它的用户量级可观,开展成熟之后也会更波动。”

据泄漏,目前易道博识正在准备新一轮融资,虽然公司现金储藏足够,但还是希冀能跑得更快一点。

“抓住时机吧,毕竟技术窗口期就这几年工夫。再努力一点去扩展市场,走得更快一点,接触更多的战略资源和时机,进而迅速壮大到达业内领军的优势位置。”康铁钢在采访的最初说道。

项目:机器视觉范畴商业自动化使用
公司:北京易道博识科技无限公司
官网: www.exocr.com

AD: 6月15日,北京千禧大酒店!猎云网将与您相约“破界·推翻——猎云网2018年度区块链产业峰会”,共同见证行业嘉宾的思想洞见与最新前沿趋向!