要将智能决策应用到更多的行业和领域中,陈雨强认为有三道题要解开,包括认知、算法、数据三个层面。
创业家 & i黑马 讯(张晓军)7月6日消息,由创业黑马主办的“2018中国独角兽峰会”在京举行,创业黑马现场发布2018权威榜单“中国人工智能独角兽”,第四范式位列其中,是唯一入榜的机器学习平台公司。第四范式联合创始人兼首席研究科学家陈雨强出席活动并发表主题演讲。
陈雨强在演讲中表示,真正能帮助到企业发展的AI,其实是能制定策略的AI,无论是内容的推荐,风险的预判,还是其他很多已经成功利用上AI的公司来说,智能决策是最关键的一点。
要将智能决策应用到更多的行业和领域中,陈雨强认为有三道题要解开,包括认知、算法、数据三个层面,而要解决这些问题,核心是总结出一套企业构建AI能力的方法论。
以下为经i黑马编辑过的演讲节选:
AI是现在非常火的一个话题,已经在多个领域证明了它强大的能力。但我今天要跟大家分享的是AI落地,如何让AI真正在各行各业发挥作用?这是现在很多人都非常关心的问题。
在大多数人的眼里,AI指的是那些让机器拥有人类技能的技术。所以,如果一个技术能帮助人做听、看、说、跑等一些事情的话,都会被认为是AI。我们会比较关注人脸、语音、无人车这样的AI。但从另一个角度上看, 国内外科技巨头这些已经成功利用AI获得巨大收益的公司,并不是靠听、看、说、跑这类AI技术进行公司经营的。
那真正能帮助企业进行经营的AI能力什么呢?我们认为一个企业的经营通常来说分为三层,高层来决定战略,中层来决定策略,底层来决定执行。在过去,互联网或者移动互联网解决的是执行问题,不需要我们业务员再去街上发传单、不需要一个个去打电话,我们通过互联网可以去触达到很多很多客户,但在过去,中层策略的制定,还是由人来做的。
而现在真正利用AI创造核心价值的公司,都是将AI技术提到了中层的策略制定层,让机器自己能够在给出战略目标后自动精细化决策。
企业要解决的三个瓶颈问题
智能化地决策在一些头部企业已经产生了非常多的成功案例,像是内容推荐、风险预判等。但它怎么能推广到更多的行业和企业中去呢?我们不得不承认这有很大的瓶颈。我们总结起来,企业首先需要解开三个瓶颈问题:
第一道题:算法科学家与业务人员的认知鸿沟
如何解释用人脸识别去抓坏人这个问题,深度学习科学家他会告诉你什么是卷积操作、池化、梯度、学习率,这些事情无异于一个脑外科神经学家通过给你讲怎么从视神经到V1、V2、V3、V4,到脑顶层来告诉你人怎么识别一个物体。显然,业务人员根本听不懂这样的语言,从业务人员的角度看来,看到的是全国哪些城市犯罪率高、男性还是女性更容易犯罪、早上还是晚上犯案、动机是什么?所以,业务人员的关注点和科技人员的关注点差别非常大。要让各行各业的业务人员也能够用上AI,存在一个巨大的认知鸿沟。
那么第四范式做了一件什么事情?第四范式把构建人工智能的过程做了标准化,借助教育领域库伯的学习圈理论,我们标准化成了四个步骤,分别是行动、反馈、反思和理论。通过学习圈理论,我们将业务闭环与AI产生的过程融合到一起,能够大幅的降低非机器学习专业人士认知AI的门槛,让更多普通人也能够使用上人工智能。
第二道题:BI的数据系统无法满足AI需求
库伯学习理论里,反思和理论部分,就是深度学习的建模过程。但巧妇难为无米之炊,如果说人工智能没有好的数据,无法拥有一个好效果。前面的行为、反馈这两个步骤其实是采集数据和标注数据的过程。可能很多企业都拥有数据,但他们过去收集的数据并不是照着AI方式来做的。一般来说,数据有两种方式,一种叫做BI数据,一种叫做AI数据。BI的目标是让人来总结出新的规则,它要知道一些统计的概况,并且一定要抓大放小,因为人不可能看到所有的方面,只需要看到最主要的因素。但是AI数据不同,AI数据是给机器来看的,给机器看的一个核心目标是要做到面面俱到,把所有能够提供给机器的数据,完整而原封不动地喂给机器,所以说,AI大数据其实要做到完整和实时。
这样的差异导致了现在的数据处理系统也没有办法满足AI需求。在这种的情况下,第四范式也开发了一套AI大数据系统,从数据收集、数据管理到数据应用,整个步骤都根据AI应用的目标进行设计,可以存储PB级别巨大的数据,可以实时的存取并快速的进行批量处理。
第三道题:算法科学家的稀缺难以满足AI落地需求
刚才提到行动和反馈是指数据门槛,但最终我们还需要对数据进行反思和理论。反思和理论是人在学习的一个名词,对于机器学习来说,就是机器学习,这需要非常深的理论基础,以及非常广泛的应用经验。仅有少数的杰出的科学家拥有扎实的建模理论,以及知道对于一个具体的实际问题,应该怎样设计网络结构。但这些需要时间与学识的积累,没有办法复制到所有行业,最后导致即使很多行业有他的数据,但是并没有办法使用AI。
所以,怎么样能够让机器学习自动的建模、自动的调参、自动的选择网络结构,甚至是自动选择的数据、自动决定数据组合的方式,就变得非常关键。在学术领域里这些工作被称作自动机器学习(Auto-ML),这个领域即使在学术界也是非常前沿,在全世界领域内的研究都还在早期,而第四范式三年前开始率先研究这个领域,在这个方向的研究与推进上在国际上扮演着非常重要的角色。人工智能最高的学术会议之一NIPS,今年将Auto-ML方向的比赛首次交给企业来办,就选择了第四范式,这获得了学界非常大的关注。
第四范式的Auto-ML已经封装到先知平台中,帮助众多客户使用上机器学习,来解决他们的实际问题。某家国有银行客户的业务人员,使用第四范式先知,在60%召回的情况下,将反欺诈线上效果提升了7倍。也有客户使用学习圈技术参加国际的反欺诈大赛,一些非专业数据科学家的比赛选手,在大赛上获得了第二名,打败了中众多反欺诈领域的专业公司。在医疗领域,第四范式与瑞金医院的合作中,共同发布了瑞宁知糖的应用,判断一个人3年之后患糖尿病的概率,利用Auto-ML技术,医生找到了超过50万条规则,相比于传统的欧美标准、中国标准,都有非常显著的提高。在去年英国首相访问中国的时候,还专程参观了瑞宁知糖的应用。最后,在图象领域应用同样一套理论,我们帮助表单OCR识别完成了效能的巨大提升,手写大写、小写数字识别的准确率分别都达到了97%之上,使用大小写互相校验的话,测试准确率可以达到100%。
一套构建AI能力的方法论
第四基于机器学习圈理论,总结了一套AI落地企业,构建AI能力的方法论,这套方法论首先是定义目标问题(Needs),然后拥有过程数据(Big Data),以及反馈数据(Response),通过AI算法(Algorithm)加上底层的计算能力(Infrastructure),完成AI的闭环,最后形成AI应用。这套理论我们称为BRAIN理论,只要能满足BRAIN的五大条件,就能让一个企业拥有AI能力。
基于BRAIN理论,AI落地会产生一个比较本质的改变,在过去,AI的落地只能被称之为“用能”:当企业自身不能够构造AI能力时,只能基于外部通用AI方案的固定能力,适配到一个特殊的领域与场景。这样做最大的问题在于“用能”所使用的方案不可能针对于每个客户单独设计,自然也无法识别其非标的价值。而现实中每家客户的问题不一样,要提升的目标点也不完全相同,如果走“用能”的模式,没有公司能服务所有的企业,并针对性解决企业个性化的目标与问题。同时,“用能”的成本非常高,用标准能力的成本看起来是降低了,但是一旦有任何改变,就只能完全依赖技术提供商的支持,相当于把自己AI的半条命放在了别人手上。
第四范式希望将来把AI落地改变为“赋能”的模式。第四范式有底层的AI平台,在这个AI平台之上,有非常多的合作伙伴,甚至是终端用户都可以进行AI的应用开发。这样的话,企业就能自建完整的AI能力,且门槛低,成本合理可控,还可以任意根据自己的需求进行改变。
第四范式也在这样的思路之下,希望通过一个应用,把平台化低门槛AI做到极致。今年3月份我们发布的国内第一款全免费的智能客服,可以向大家展示,人工智能应用开发门槛能被降低到什么样的程度。
接入第四范式智能客服只需要三步:
第一,构建机器人;
第二,确定并对接企业需要接入的渠道;
第三,发布使用。
用这种方式,接入一个公众号智能客服只要5秒钟,让一个IOS、安卓应用程序原生内置智能客服能力也只需要短短3分钟,同时后台可以自学习迭代,并且企业可以定制化专有的应用与场景。目前,已有上千家客户已经很快的接入。
最后总结一下,第四范式认为AI的落地需要一个更强大的平台,降低进入的门槛。第四范式一直在通过产品致力于降低认知的门槛、数据的门槛与算法的门槛,通过这样的产品,希望将来AI的落地模式产生根本性的变化,从“用能”到“赋能”,让AI不再神秘,成为所有企业标配且普惠的技术。
i黑马 分享到: