农企新闻网

《硅谷》里神乎其神的紧缩技术,AI正在一点点做出来

发布者:李龙华
导读好剧总是追的特别快,比方说我们熟习的黄暴神剧《硅谷》,往年该迎来第五季了。这部剧里让人印象深入的东西很多,而剧里几个配角创造的创业神器、号称能改动世界命运的“魔笛手”相对是其中之一。给没看过这部剧的冤家引见一下,所谓的“魔笛手”是剧中配角创造的紧缩算法。原本这个东西是他们用来打造音乐网站的,后果后来这个技术被证明可以把文件无损紧缩到极小,并且速度极快

《硅谷》里神乎其神的压缩技术,AI正在一点点做出来

好剧总是追的特别快,比方说我们熟习的黄暴神剧《硅谷》,往年该迎来第五季了。

这部剧里让人印象深入的东西很多,而剧里几个配角创造的创业神器、号称能改动世界命运的“魔笛手”相对是其中之一。

给没看过这部剧的冤家引见一下,所谓的“魔笛手”是剧中配角创造的紧缩算法。原本这个东西是他们用来打造音乐网站的,后果后来这个技术被证明可以把文件无损紧缩到极小,并且速度极快,从而引出了令人无法直视的各种剧情。

听说在写剧本之初,主创人员已经想过写一种什么技术,能让观众马上懂得其意义,又跟真正的技术世界比拟贴合。最终他们发现,紧缩是最好的选择。由于差不多每团体都晓得文件越小越好,假如配角搞出来一个能让数据有限存储的东西,那当然就赚大了。

《硅谷》里神乎其神的压缩技术,AI正在一点点做出来

现实上,人类跟数据的无损紧缩这件事,曾经硬杠了几十年。成熟的紧缩技术,曾经经过互联网变成了大少数人的日常用品。但虽然如此,紧缩这件事一直没有走到起点,《硅谷》里那种神一样的紧缩技术,照旧是我们盼望而不可及的。

但在明天,人工智能开端把紧缩这件事放在本人的义务栏里,并且一步步对《硅谷》里的“魔笛手”发起应战。

折腾了半个世纪的无损紧缩

我们日常在对紧缩的次要需求,被称为无损紧缩。它可以将文件变小,然后再经过某种方式复原出来正常运用。虽然明天这听起来很普通,但其实人类曾经为它折腾了50多年。

当然,发现数据应该紧缩后再停止传输和存储,是更早之前的事情。从19世纪的摩斯电码时代人类就曾经发现了,很少数据中的有效局部是可以被归类和省略的,从而可以换取更快的传输速度和更少的存储空间。

这可以说是一种符号世界里的知识,比方说一团体跟另一团体说“老中央见”,那么就意味着他们把这句话中的地址信息在彼此都理解的状况下停止了紧缩,从而延长了讲话工夫。

相似道理的紧缩技术很早就使用在计算机世界,在大型机当道的时分其价值曾经被证明。但真正紧缩开端盛行,还是在互联网青云直上之后。

1977年,是无损紧缩这件事跨时代的一个年份。这一年,以色列海法理工学院的迷信家Abraham Lempel 和 Jacob Ziv结合宣布了一种紧缩算法,以两人名字共同命名为LZ算法。这一年发布的技术被称为LZ77。第二年,两人又发布了改良版的LZ78。尔后一切无损数据紧缩技术,差不多都是从这两种演化而来。

另一个无损紧缩的时代,开端在八十年代末。

这个时分,随着互联网开端起飞,各种商业紧缩软件曾经成熟,但还短少能独大的那一家。

事先盛行的紧缩软件叫做Arc,后来一个名叫Phil Katz的年老人突发奇想之下,希望可以做个更好的版本。于是,这个之后被称为互联网天赋和第一代极客的大牛做了名字充溢寻衅意味的PKArc。后果1988年,Phil Katz原告进犯商标和知识产权。于是第二年他又做了新的修正版,用了新的IMPLODE算法,也就是我们明天无比熟习的ZIP。

《硅谷》里神乎其神的压缩技术,AI正在一点点做出来

遗憾的是,这位无损紧缩的时代人物没有逃脱老天对天赋的妒忌。随同着严重的妄想症、抑郁症和酗酒,他37岁就分开了人世。但是ZIP却统治了紧缩世界的话语标准,直到明天。

人工智能正在改动紧缩

在相当长的一段工夫里,紧缩都被以为是无需再停止改善的东西。但随着新终端、新的存储方式到来,人类又一次对紧缩提出了新的要求。

就像《硅谷》里说的那样,挪动互联网和云计算的加持下,人类正在以几何增长的速度制造新数据,这些数据能够很快就会没有中央存储。既然大家都不想删除文件,那么只能寄希望于文件变小一点了。

《硅谷》里所谓的魔笛算法,一度引发了不少跟风打造属于本人的“魔笛”,但是效果普遍没有剧里那么犀利。

最终这个义务,很能够还是要落在人工智能的头上。

2016年,谷歌相关团队推出了一款叫做RAISR(Rapid and Accurate Image Super-ResoluTIon)的图像紧缩技术。这个处理方案就是以人工智能技术作为紧缩途径,效果能到达将图片紧缩到源文件的1/4, 却根本不改动图片的明晰度。

《硅谷》里神乎其神的压缩技术,AI正在一点点做出来

能到达这种效果的窍门,在于给机器学习输出少量的图片紧缩数据。让智能体去学习图片紧缩的形式,从而创立契合每个图片要求的滤波器。由此发生的紧缩后图片只是被疏忽了数据细节,却保存了可以让人眼辨认的局部。

在极大水平紧缩文件的同时,这种技术还能提升文件紧缩速度。次要用来提供挪动端的图像传输和阅读效率,让用户取得更好的图片观看体验。

谷歌发布的AI+紧缩技术使用在图片范畴,而一些新的方案,正在把AI向通用紧缩范畴扩张。

在一篇斯坦福大学相关团队最近发布的论文中,阐释了一种被称为DeepZip的紧缩方式。望文生义,这种技术将深度学习和紧缩交融在了一同,希望应用AI技术取得更好的紧缩体验。

这篇论文里,研讨者阐释了应用RNN,即循环神经网络技术停止文件紧缩的方式。所谓RNN,是一种深度学习中的经典神经网络技术。抽象一点解释,这种神经网络框架就好比让一团体拥有了一定的知识根底再去学习下一个知识,往复循环构成对临时记忆的了解才能。

研讨者发现,运用RNN技术可以分明改善外部有依赖关系文件,比方图像、视频、文本文档的紧缩效率。很能够是我们进一步提升紧缩效率,化大为小的打破口。

总而言之,不同的AI技术正在尝试从史无前例的角度撬开无损紧缩的大门,希望能像电视剧里那样,搞出一个量变来。

明天的世界,的确在等待更好的紧缩

那么究竟为什么一定要有更好的紧缩方式呢?或许说即便有了这种技术,是不是真正能像《硅谷》里描绘的那样改动世界呢?

这要从究竟哪些方向需求紧缩的技术革新来看。

首先,关于剧中所描绘的“数据末日”,产业界有各种各样的看法。有人以为人类的数据量的确在爆炸,很能够面临存储瓶颈,从而引发社会对数据空间的抢夺。但也有人以为,更大的云空间也在不时建立中,数据量很能够永远也追不上不时扩展的云空间。

孰是孰非不好定论,关于紧缩技术的提高,更多人以为是和挪动设备、可穿戴设备以及物联网设备的普及化相关的。这些设备都对数据传输的速率有要求,速度越快体验越好。那么紧缩才能的退化,显然可以加强这些联网设备的任务才能,尤其是关于物联网设备来说。

但最有能够的需求,是来自于那些新技术风口。

比方VR、无人驾驶的高精地图、基因图谱数据,以及深度学习所运用的训练数据集,这些文件都比我们日常接触的互联网数据大上很多。随着VR、无人驾驶、人工智能这些东西一步步产业化、日常化,对它们的传输、保管和运用需求也在不时扩展。而且这些都是高精度文件,对紧缩的效果和质量也提出了新要求。

所以,高精度、高速率的紧缩处理方案正在被热切盼望着。甚至能够成为未被注重的宏大市场。用AI紧缩来满足AI的需求,能够是接上去我们会晤到的常态。

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或许下载钛媒体App

《硅谷》里神乎其神的压缩技术,AI正在一点点做出来