农企新闻网

徐宗本院士再论大数据:政府开放共享大数据 才干关联聚合发生更大价值

发布者:高阳林
导读中科院院士、数学家徐宗本演讲。 南都记者 马强 摄“大家以为数学家都像陈景润一样,边走路边考虑数学成绩,然后撞电线杆上了,其实不是。”2月8日下午,中国迷信院院士、数学家徐宗本列席南都报系2017年总结惩处会暨南都大数据研讨院揭牌典礼,现场分享了题为《再论大数据》的主题演讲。“画面中看似混杂无序的小碎片,经过成倍数据的叠加,最初构成一张大象的图像。当数据到达质变和量变的临界点时,人们可以明晰看到数

徐宗本院士再论大数据:政府开放共享大数据 才能关联聚合产生更大价值

中科院院士、数学家徐宗本演讲。 南都记者 马强 摄

“大家以为数学家都像陈景润一样,边走路边考虑数学成绩,然后撞电线杆上了,其实不是。”2月8日下午,中国迷信院院士、数学家徐宗本列席南都报系2017年总结惩处会暨南都大数据研讨院揭牌典礼,现场分享了题为《再论大数据》的主题演讲。

“画面中看似混杂无序的小碎片,经过成倍数据的叠加,最初构成一张大象的图像。当数据到达质变和量变的临界点时,人们可以明晰看到数据面前的故事,这就是大数据。而数据假如不相关联和剖析,就无法发明更大的价值,好比有人只看到大象的鼻子,有人只揣摩大象的尾巴,但是怎样也看不到大象的全体。”围绕大数据原理,与其它信息技术的关系及盈利形式等成绩,徐宗本借抽象比喻与案例,将本来深奥的内容生动化。在他看来,目前国际大数据产业链条存在缺乏强健性、完好性的成绩。在国度大数据战略推进下,各地树立数据中心的积极性十分高。但在大数据产业价值链上,存储只是一局部,假如缺乏剖析发掘才能,并构成数据产品,就好比只买米不做饭。

徐宗本总结,做大数据首先要明白目的,“数据是根底,平台是支撑,剖析是中心,赚钱是霸道。于大数据产业而言,数据就是根本的消费材料,而平台为搜集存储数据提供支撑,最为中心的是剖析,经过对数据的详细加工处理实践成绩,进而变现发明价值。”

   ◎谈大数据产业

国际大数据产业处在初步阶段 红利未失掉充沛释放

南都:人们常有一个疑惑,多多数量级的数据才干被定义为“大数据”?

徐宗本:大数据需求有很大空间才干存储,假如这样了解大数据,就是比拟低级的看法。首先,我们需求认清几个概念。材料是指记载日常生活、运营、管理、消费进程的载体,比方一张报告,一份视频等。假如这些材料放在计算机上,那就是数据。数据是材料的数字化,以编码构成存在的信息载体。大数据则是大而复杂的数据,具有海量性、时变性、异构性、散布性的特征。数据从质变到量变会发生一个临界点,严厉上超越这个临界点才到达“大”的含义,所以大数据是个绝对概念,与特定的决策成绩相关联。

南都:在你看来,目前国际大数据产业开展处于什么阶段?

徐宗本:与国外相比,我以为根本处于同一程度。如今大数据上升为国度战略,政府在积极推进,这是一个制度优势。同时,我们还有一个自然优势,就是人多市场大,数据资源丰厚,而且目前国际互联网开展也走在前头。但总体而言,大数据产业还处在初步阶段。产业链条缺乏强健性和完好性,未支持构成波动的价值链。数据开放共享开展也较为落后,大数据的红利未失掉充沛释放。此外,中央政府还只满足于规划和战略层面,尚未详细落实。更重要的是对需求的认知模糊。企业的大数据盈利形式并不明晰,中心技术也有待打破。最初一些政策法规跟进不及时,数据垄断、数据平安事情多发。关于大数据产业,人们在张望,也存在自觉性。

   ◎谈大数据价值

数据只存储不剖析变不了现 发明价值关键在于形式

南都:为什么大数据能发生价值?

徐宗本:我以为与四个大数据原理有关。首先是质变量变原理,积聚的数据量足够充沛后,可以处理详细成绩。第二个是关联聚合原理,比方研讨大象,假如一团体只盯着大象的鼻子、尾巴,你察看20年,积聚再少数据,也不能反映原来的相貌。数据只要聚合才干发生价值,共享则能缩小价值。另外还有“剖析出价值”原理,目前各地树立了太少数据中心,甚至呈现产能过剩的成绩。假如数据只存储不加以剖析,则变不了现。最初,数据自身拥有的可复制、可重用、可加工的特点,使得数据的价值可以随着分散的范围而增大。这就是功效倍增原理。

南都:你曾提到大数据假如只存储不剖析,就好比只买米不做饭,是这样吗?

徐宗本:是的。大数据产业的实质在于剖析数据。很多人不晓得,这个比喻其实出自北方报业记者一篇报道。事先,我在广东参与一场活动,分享关于大数据的一些看法,记者用这个比喻做标题,解读得十分精确。这也是为什么你们一约请我来参与活动,我就来了。由于我置信你们的程度。

南都:大数据的盈利形式有哪些?

徐宗本:很多人很关怀大数据怎样赚钱。大数据产业链上,包括数据资源获取与管理;数据传输、存储和处置;数据剖析、发掘与了解;结合范畴的大数据使用。基于价值链条的不同,可分为全链条形式和节点聚焦形式两种。前者关注聚焦全部环节,后者是做精两头产品,专注于某一环。第三种形式是垂直行业的协作共建形式,行业公司和技术公司合资成立公司,这样既可以维护数据源,又能加强效劳。第四种形式是产研共生,一个公司和一个研讨院协作,可保证产质量量的可继续性。最初是推进产业的平台形式,这种更适用于政府,由政府搭建平台提供公共效劳,企业在其中孵化产品。其实大数据可以做很多事情,关键在于形式要对。

   ◎谈大数据使用

大数据带来思想的改动 应用不同数据能进步效率效劳

南都:如今人工智能、物联网等技术开展迅速,人工智能的中心是大数据的剖析,物联网的开展也离不开大数据。如何对待大数据的使用成绩?

徐宗本:如今大数据的实践使用案例曾经不少,比方对医疗数据的使用,经过对少量的影像和病例数据剖析,进而作出医疗诊断,有些技术程度曾经到达能与医生相匹敌的水平。当然,目前大数据的使用程度仍处于低位程度,数据开放共享停顿滞后,大数据的生机还未失掉充沛释放。如今80%的数据掌握在政府手中,很多人在呼吁政府开放共享数据,这样才干让数据发生关联聚合发生更大的价值。

南都:在大数据使用进程中,一些企业有时并不晓得本身需求什么样的数据,并且拿到数据后,也能够不清楚这个数据可完成多大价值。这是为什么?

徐宗本:我觉得是缺乏大数据思想的缘由。在我看来,大数据带来的是思想的改动,可以为我们提供社会迷信办法论。如今企业做商业剖析更多的还是基于业内数据剖析。举个例子,比方我开了一家火锅店,目的是进步营业额。大数据怎样来帮助呢?假如只是剖析一天有多少顾客量,点了什么菜,消费额多少,这并屡见不鲜。需求留意的是,人们吃火锅跟天气、地域、小区四周有关。假如你搜集和剖析了天气数据、人口散布数据等,你就可以晓得天马上冷了,人们想吃火锅了,哪里的人最喜欢吃麻辣火锅,店铺四周的小区住户是什么人,这样应用不同数据可以进步我们的效率和效劳。

   ◎谈数据平安

必需采用技术手腕维护用户隐私

南都:数据流通才干发明价值。但数据流经过程中,能够触及团体隐私和数据平安的成绩?

徐宗本:掌握大数据的政府部门、企业都负有不可推脱的责任,那就是必需采用技术手腕,维护用户的隐私。比方将数据笼统化,停止脱敏和匿名化处置,同时还要承诺不能泄露和合法买卖数据。

可以看到,如今大众关于团体隐私尤为关注。但另一方面,数据不流通不运用就无法发明价值,不要以为我一切的数据都不能让他人晓得。举个例子,你的病例信息,谁来看比拟好?假如大家都不提供病例信息,医生就无法经过少量医疗数据,发现疾病规律和作出预测。而且,在数据剖析进程中,医生并不需求晓得甲乙丙丁详细是谁。另外,还触及到承诺和默契的成绩。比方遇上妇产科医生是男的,产妇让不让他接生?所以,我以为企业应该自动担起维护责任,经过用户协议、隐私政策等方式,通知用户是怎样搜集和运用数据的,作出相应的承诺。

南都:当被掌握的信息越来越多,一个直观的感受是针对你的营销越来越精准。假如有一天机器比你更理解你本人,这是一件值得担忧的事吗?

徐宗本:互联网或大数据来了当前,改动最大的是客户关系,客户在消费位置不一样,过来用户是上帝,如今叫做消费材料的一局部。随着数据的积聚,机器对你的行为习气、购置力、价值观喜好等,作出的预测当然会越来越精准,但不能够做到百分百。由于一旦认识到某个成绩,人可以忽然改动主见,就让你预测不出来。人和机器的不同在于,人可以发生认识、情感和顿悟。我以为不必担忧,机器替代不了人。

责任编辑:陈近梅