雷锋网 AI 科技评论按:在人工智能的浪潮之下,以深度学习为首的机器学习办法迅速席卷了各个范畴,给许多成绩带来了全新的处理方案(当然同时也带来了新的成绩等候处理)。
除了我们熟习的 CV、NLP 之外,优化实际、运筹学也和深度学习之间相互发生着联络和影响。近日我们就采访了来自 UC 伯克利大学电子工程和计算机学院以及工业工程和运筹学学院教授 Laurent El Ghaoui,听听看他对这些范畴的见地。
(* 本文由雷锋网 AI 科技评论记者李宗仁、杨晓凡共同完成)
依据团体主页引见,Laurent El Ghaoui 教授的研讨方向包括鲁棒优化、机器学习和统计(重点在于稀疏性)以及旧事媒体的统计剖析。教授也著有《优化模型(Optimization Models)》、《优化模型与使用(Optimization models and applications)》等专著。我们很想晓得教授对优化成绩有哪些感悟、在他看来机器学习学习办法和传统优化办法之间又有哪些联络和区别。以下为采访全文。
雷锋网 AI 科技评论:您的研讨范畴包括机器学习、数据发掘、统计学和算法优化,您的研讨和使用经历也很丰厚。您最近在研讨什么呢?有什么停顿或许打破吗?
Ghaoui 教授:近期我们在探究深度学习模型,这很有应战性由于它很不波动,训练也需求很多工夫和很少数据。许多深度学习研讨中关注的都是模型,我们关注的也是如何改良出更好的模型。比方从数据的角度看,深度学习模型选用什么样的架构才是对的、网络应该有多少层、每个层应该做什么。我们也在开发一些新办法,我觉得很兴奋。虽然我们的研讨还没有完毕,但是我觉得这将会成为一种训练神经网络的完全不同的办法,很有能够会更波动、更容易训练、训练起来更快、不同的数据层之间的并行化水平更初等等,同时还有潜力依据数据决议什么是最好的架构。这让我很兴奋,我还不是很确定它能成,但是我希望下个季度里我们能做出一些打破。
雷锋网 AI 科技评论:您也参与过很多不同范畴的使用,比方房屋、动力、金融、政治,您能横跨这么多范畴,有什么办法论或许秘诀吗?
Ghaoui 教授:我的确参与过很多不同的范畴,不过这没什么秘诀,就是 AI 技术自身驱动着我而已。我举个例子吧,我已经和批发巨头 Walmart 协作过,帮他们依据购置需求优化商品价钱。我研讨了这个成绩,发现它和依据用电需求预测第二天所需的发电量是同一个成绩。这儿没什么秘诀,这些成绩的数学方式总是一样的,我甚至觉得很奇异为什么是一样的。完全不同的角度、不同的行业、不同的成绩,但是 AI 模型总是如出一辙。我很诧异,这里没有隐藏的机密,但它就是这样的状况。这就是 AI 的力气。在面前支撑的不是我本人知识,而是事情就是这样的。到了某个水平当前,一切的成绩看起来都是完全一样的,一样的技术,同一回事。
雷锋网 AI 科技评论:这个时代的数据在爆炸般增长,这也会给统计剖析带来越来越大的应战。依据您的研讨经历,您觉得我们都有哪些办法可以应对这些应战?
Ghaoui 教授:这件事很有意思。在这里,针对这个成绩我想说 AI 的速度十分重要,够快才干协助人类实时天文解数据,而不是像如今的深度学习 AI 那样,训练一个 AI 有时分可以花 30 天的工夫。所以我们需求做的下一步就是实时化。并且我觉得,为了到达这个目的,我们需求和硬件之间树立好的互动、并且有好的硬件架构才行。为了当大规模 AI 可以实时运转,需求软硬件协同设计,需求和硬件有更好的整合。如今人们用效劳器组成云效劳、用 GPU 等等,就觉得这个成绩处理了,其实并不是这样的。训练模型需求的工夫还是太长了,我们需求走向下一个阶段。
雷锋网 AI 科技评论:在机器学习模型的使用中,后果的可解释性是一个十分重要的方面。有没有方法改善机器学习模型的可解释性?
Ghaoui 教授:这对我来说也是一个十分重要的成绩。虽然我的演讲中没有提到它,但我觉得它异样是目前的 AI 模型面临的宏大应战之一。常常来说,模型是一个黑盒子,它不会通知你为什么判别这个病人有这个疾病、或许这个司机是一个好司机或许坏司机、或许应不应该存款给这团体。我觉得将来,为了让人类和机器之间有更好的互动,我们有必要了解为什么机器做出了这些决议。以后的 AI 很成功,比方在翻译方面就是。它不会通知我为什么把这个单词翻译成了另一个单词,我本人不关怀为什么,别的人也没人关怀。只需翻译出的后果是好的,它就可以持续是一个完全的黑盒子、完全复杂的零碎,我也看不清、你也看不清,这都没什么成绩。但是关于某些义务,尤其是医疗保健中,我们需求理解基于这张大脑的图像就判别了这团体有没有癌症的缘由是什么,AI 需求有才能说“它在这儿,而且我把它和这个和那个做了比照”。
所以可解释性十分重要。但是如今的机器学习模型并不擅长被解释,所以我以为可解释性该当无限于模型的选择,由于这样最少可以有更好的解释性。有一些模型是关注于解释性的;有一些模型能够不那么复杂、没有那么多的预定义,但是更好解释。它们能通知你做出决议是由于这个这个那个缘由、是由于这五个特征,等等,所以这笔存款没有经过。
雷锋网 AI 科技评论:稀疏性、正则化和鲁棒性之间有什么联络吗?能否给我们讲一个您处置它们的故事?
Ghaoui 教授:这和方才说的关于可解释性的是一回事。我觉得假如 AI 模型中的规则太复杂了,那细微改动图像就会招致模型做出错误的预测也是很自然的事情。这就是深度学习中缺乏鲁棒性的表现。很多人都在研讨这个成绩,我觉得这对我的意义就是我们必需回到更复杂的模型上去,很高的表现假如很软弱那也是没有用的。输出发作细微的变化,模型表现就会变成零。所以我觉得我们不应该仅仅关注高的模型表现,我们该当关注的是波动前提下的表现、是牢靠的表现,不能太软弱。
雷锋网 (大众号:雷锋网) AI 科技评论:您也是航空航天范畴的一名优秀教员,这和 AI 范畴之间也挺远的。这其中有什么联络吗?
Ghaoui 教授:我们后面讨论过的一些想法,比方尝试帮沃尔玛处理成绩、尝试帮银行处理成绩等等,到了最初一切的模型都是一样的,而且和驾驶飞机穿过一片雾十分类似。降落、落地、穿过雾一切这些我的论文中研讨的驾驶类型,实践上都和向将来做一笔投资有着一样的数学模型。由于其中就是有这些类似性,是异样的成绩、有着异样的方程方式。如今我曾经老了,1990 年代我年老的时分航天还是事先的抢手范畴。如今没人想着它了,每团体想的都是 AI。事先这就是我的终点,实践上它和 AI 很接近,一切这些成绩都很类似。
雷锋网 AI 科技评论:您能引见一些鲁棒优化的理想使用吗?
Ghaoui 教授:这其实不完全是属于 AI 范畴的技术。对我来说它是 AI 技术,不过它不是关于预测、判别图像或许其它什么东西的,它的重点在于控制。那么,鲁棒优化是一种你不需求完全清楚模型的样子就能对它停止控制的办法。比方你想做一笔投资,你就需求晓得你所投资的商品在将来的价钱是怎样样的。在鲁棒优化中,你不需求确切晓得接上去会发作什么,而这恰恰是实践生活中常常呈现的状况。在理想中,你历来都不晓得将来会发作什么,所以你不应该用机器学习预测将来会发作什么,而且还以为它做出的预测是完满无缺的。这就仿佛,我在浓雾天里开车,如今的 AI 就好比透过浓雾看到路向一边转弯了,然后我就信任我的 AI 模型做出的预测,闭上眼睛,沿着预测出的弯去开。我们最好可以记得,将来发作的事情能够会有误差,你不是完全明白的,所以你明天做出的决议也必需要参加到考量中,由于你并不能确切晓得将来是什么样的。关于 AI 来说,你也不应该完全信任它的预测。
雷锋网 AI 科技评论:您这次离开中国的次要目的是什么?有什么您很感兴味的东西吗?
Ghaoui 教授:我想说,我对这个积极为将来投资的国度十分着迷。这种特性也不只中国有,全世界都看失掉,这是古代社会的一个积极建立力气。关于本国人来说,中国很值得敬仰,我也希望其它国度可以多和中国积极互动,我本人也会积极参与。我本人的目的是经过我的公司、实验室等等一些建立性力气在学界和产业界展开协作、做出效果,希望可以传递到我这一颗建立性的心。
雷锋网 AI 科技评论:在您之间的演讲中,您已经说过即使是明天,工程和社会迷信之间也有一些隔膜,尤其是在学术界。您关于在工程和社会迷信之间树立新的互动形式有什么想法吗?
Ghaoui 教授:没错,在有了古代科技和 AI 之后,我们完全有能够用不同的方法测量社会成绩。我本人最喜欢的角度是经过文本。很多人都识字、很多人都晓得如何阅读文本。那你要如何处置知识、处置少量的文本、从文本里提取知识呢,我觉得这其中就是日常社会和 AI 之间的联络的很好表现。举个例子,我不懂中文,不过我们有翻译技术。但是假如我有很多很多的文章,我也没方法把它们全部翻译了再一个一个看。这件事还是太艰难了,即使把许多中文文档翻译成了许多英文文档,还是很难做。所以我以为 AI 开展的下一步不只仅是要翻译,它还需求能紧缩、能总结,这样我只需求阅读 10 条旧事就好,而不是阅读一百万条。
。
