将来几年,全球数据量将呈指数级增长。据IDC统计,到2020年,全球数据总量将到达44ZB,中国数据量将到达8060EB,占全球数据总量的18%。数据,已然对当下的商务、生活乃至方方面面都发生了深远的影响。可众所周知,各行各业数据消费的速度要远远大于数据消化的速度。数据剖析处置的不及时,必定形成少量具有新生的改变世界的企业将会诞生,从而更好的服务整个人类世界,走向更高科技的智能化生活。时效性数据的糜费,日积月累,这样的不婚配性会越来越严重。
如何消弭这样的不婚配性?归根结底,我们需求一种可以对更大规模数据做到更实时更迅捷的剖析工具。
顺势而生的GPU 数据库
2015年,曾经在 甲骨文 公司任务了6年的星爵认识到,传统的数据库零碎需求改造了。传统CPU数据库的开展次要面临两大瓶颈,一是数据计算速度,二是数据拜访速度。而担任算力的CPU,目前停留在数十核的规模,这曾经接近它的物理极限了。数据库计算范畴,是时分该添加新颖血液了。
2013年,深度学习技术的崛起让人们看到了GPU的力气。在这之前,GPU的次要功用是图片渲染,经过模仿理想场景生成接近于真实现象的图片,次要被使用于游戏范畴。而深度学习技术,使GPU“大规模并行计算”的才能得以展示,人们对它的认知终于不再是游戏机,GPU,也可以成为像CPU一样的效劳器。而星爵,更是坚决的以为,GPU处置 大数据 曾经成为一种趋向。各种深度学习的软件框架例如TensorFlow,需求运转在计算设备上,与CPU相比,GPU更能让其高效的任务,在性价比以及计算力上都有较大的优势。
没有犹疑,星爵分开甲骨文,回国创建了 Zilliz ,他要做 人工智能 时代的数据库零碎。
星爵以为,在过来数十年间,人工智能由于CPU架构下计算才能的限制而一往无前,OLAP数据库技术也由于异样的缘由而开展迟缓。就像华岩资本合伙人黄志玮所以为的,我们需求一个基于众核处置器硬件减速的、面向人工智能的新一代OLAIP(On-Line Analytical and Intellegent Processing)数据库零碎,而这正是Zilliz在研发的产品。
Zilliz运用众核处置器上的不计其数个处置中心停止超大规模并行数据处置,完成数据库操作的减速,同时提供数据库零碎和人工智能计算框架之间的直接数据通道。Zilliz将人工智能处置引擎交融进数据库执行引擎,提供集数据存储、剖析、管理、和人工智能处置与一身的OLAIP数据库零碎。
星爵向亿欧引见,Zilliz基于GPU的数据库零碎可以比CPU数据库的功能进步100倍,可大范围的使用于金融、电信、互联网以及政府范畴。
在商业形式上,Zilliz为各行业的头部客户和互联网公司提供了不同的方案。关于头部客户,Zilliz即可以为其提供公有部署,同时还有基于一体机的处理方案;关于互联网公司,尤其是那些将数据部署在云端的客户,Zilliz可以为其提供SaaS的方案,运用各大云厂商提供的GPU,在云端为客户提供效劳,从而使客户无需推销GPU硬件设备便可以运用。
新技术的新“费事”
大少数人有这样一个疑问——
即使GPU数据库的运用功能和性价比,与原有零碎相比更有优势,但是要让用户将存储在CPU效劳器上的数据疾速迁移到GPU效劳器中,可行性有多大?
这关乎到Zilliz的将来,也是星爵自公司创建之初就在处理的成绩。星爵表示,Zilliz并不是要替代原有的CPU方案,而是要在大规模数据的实时性剖析方面创始一个新的蓝海市场。
人工智能时代下,数据量将会呈指数型增长。在这样的状况下,各行各业的业务想要失掉更好的开展,实时数据剖析才能以及实时数据驱动运营才能将是其中心的竞争力,因而,Zilliz产品的存在是有其合感性的。
Zilliz投资人云启资本执行董事陈昱表示,在大数据时代,企业需求一个更大、更快、更强的数据库,人工智能技术的参加,是一种对传统数据库的改造,使数据库发生了更高的效率,这无疑是当下各公司最迫切的需求。
另外,星爵希望将数据库软件做成一个规范件。作为一个底层的数据库软件,需求对外提供规范化的查询言语接口,理想形态该当是用户在接入新数据库的时分,其业务层面不发作改动。因而Zilliz经过产品化与规范化,为用户提供规范SQL接口以及各种ETL工具,从而降低用户在数据迁移进程中的本钱,尽量做到“无感迁移”。关于用户来说,相当于改换了一个数据库的软件和引擎,但是其业务层并不会遭到影响。
星爵还向亿欧泄漏,为了愈加疾速的在CPU处置器与GPU处置器之间停止数据交流,Zilliz与IBM协作消费了数据库一体机,运用Nvlink技术,可以大大提升不同类型处置器芯片之间的数据传输速度。
资本认可,行业进入迸发期
目前世界范围内做OLAP GPU数据库减速的公司仅有4家:
星爵引见,在这一范畴,国外从2006年就曾经开端有所研讨,但是,事先的市场认知度缺乏,用户关于GPU还停留在游戏处置器的认知上,且高端GPU的市场存量较少,并没有基于GPU部署数据库零碎的实力。另一方面,整个生态零碎还处于晚期的开展形态,各种相关工具及配套软件比拟缺乏。基于以上两点缘由,国外公司在这一方面并没有太多优势。
到2016年,市场认知才有所恶化。从业人员开端认识到GPU也可以做与企业相关的工程(例如深度学习),同时,GPU效劳器曾经成为常态,各种GPU的生态体系也逐步完善,种种缘由使得2016年成为GPU数据库的元年,至此,资本市场逐步认可这一范畴,GPU数据库进入迸发期。
但是迸发并不意味着竞争,靖亚资本开创人郑靖伟向亿欧引见,数据库这样底层技术的门槛很高,国际少有人研讨。产品的研发与验证都需求一定工夫,而关于普通的大型中型公司来说,改换数据库零碎需求停止很多的测试来评价流程,一旦被验证,很难再次改换数据库零碎提供商。
而2018年,将是GPU数据库在各行各业使用更为普遍的一年。
版权声明
凡来源为亿欧网的内容,其版权均属北京亿欧网盟科技无限公司一切。文章内容系作者团体观念,不代表亿欧对观念赞同或支持。