曾记得十几天之前否?那时我们趾高气扬的跨进了2018,满怀着对将来的盼望和保重……然后我们惊奇的发现,2018第一个火起来的词叫“撒币”。
不是我说啥,这可真出戏啊。
似乎一夜之间,直播答题和这个叫做”撒币”的关键词就火了。王思聪的冲顶大会、映客的芝士超人、花椒的百万赢家,一时之间大佬们疯狂争当“大撒币”,人民群众则纷繁出头相当被币砸到的那个侥幸儿。
当然了,不论这些平台们如何“撒”,最终“币”还是要回到他们本人口袋里的,毕竟做生意是为了赚钱,搞出来这么大局面当然是为了放后招,没听说过哪位出题让人答是为了做慈悲的。除非...除非AI化装成选手,也来答个题,说不定无能到王思聪们没币可撒...
毕竟,答题也是讲迷信的对不对?
AI答题这件事其实也不新颖,不信你百度输出一个“长城有多长”之类的,马上就会给你跳出来答案。这里就是用了AI的专业答题姿态:知识图谱。
借着直播答题的春风,明天讲讲知识图谱的故事吧。虽然在机器视觉、语音交互等“网红技术”面前,作为AI重要分支之一的知识图谱似乎不那么出位。但是以使用度和脑洞指数来说,这个技术相对当仁不让。更重要的是,在“AI感知”通向“AI了解”的大路上,知识图谱近乎是无法绕开的一道关卡。
更更重要的是——他能帮你答题啊。
知识图谱是什么鬼?
知识图谱这个概念被提出并不算太久,但是要追根溯源了解这个技术究竟是玩什么的,那能够真要往上倒腾几十年才行。
上世纪40年代,人工智能被提出之后,有数迷信家们就开端揣摩,究竟用什么方式能让机器模仿出人的智慧呢?揣摩来揣摩去,人关于信息可以停止关联了解似乎是个路子。所谓信息关联,就是人类在承受一个信息后,会把它放在记忆中停止归结和调用。比方说你打小看法了你三舅,绝不能够过几年管他叫二哥。
应用这个思绪,上世纪50年代末,学术界提出了语义网络(semantic network)的想象,计划把数据停止构造化的处置,让单个信息组分解有联络、能共鸣的“知识”。明天我们用到的很多技术都来源于语义网络,比方机器翻译、自然言语处置等等,知识图谱也是其中之一。
上世纪80年代,遭到多方面安慰的地球人开端了一次AI复兴运动,而这次运动的配角,就是各国开端打造专家零碎和知识库。那时分迷信家们置信,假如把人类少量知识停止逻辑化关联和语义网络存储,最终人类就能打造出全知全能,啥啥都懂的人工智能。惋惜好景不长,最终AI没等来呢PC先来了,专家零碎纷繁被弃置。但是海量知识构成的知识库却成为了宝物传播了上去。
2002年,基于语义web技术和Freebase等优质知识库,谷歌宣布推出了知识图谱(Knowledge Graph)概念,并在2013年投入运用。所谓知识图谱,实践上是树立在网页百科知识库根底上,应用语义网络停止知识关联的技术。它可以用来协助学术人员疾速搜集和了解信息,也可以用来剖析情报,区分信息真伪。在产业端则为搜索、内容引荐和智能问答提供了根底,成为明天AI范畴不是非常抢手,却也足够强势的一个技术类别。
假如说了这么多还没明白,那就举个直白的例子吧:
假设你这几天很猎奇一个叫PGone的词为啥火了。然后你去搜索一下,后果给你引荐的词是PGtwo、PGthree...那你就跟没搜一样。假设蹦出来两个词,一个是贾乃亮一个是地沟油,那么你就了然了嘛...
所谓的知识图谱,就是让智能体去了解知识之间网络关系,并能自动以此提供效劳的技术。
明天的知识图谱专治各种“撒币”
假设你以为本文到此就该完毕了,那么你又错了。
上文说了知识图谱专治各种“大撒币”行为,并不是随意讲讲的。我们要晓得,2002年知识图谱技术假设跟王思聪刚一波正面,那是根本没有胜算的。
这里有几种能够:首先是假设你的知识库是更新到前年的,人家问你PGone的嫂子是谁你怎样办?或许人家不问你长城有多长,问你最长的墙有多长怎样办?
在考教真人的直播答题进程中,能够面临各种言语上的调整、发问方式的改动,以及参加最新信息。这都是几年前基于单一构造知识库的知识图谱技术难以胜任的。
这就把知识图谱难住了吗?不可以,毕竟为答题而生,必需要搞点新高度出来才行。
这项技术在近几年间发作了重要变化,比方:
1、大数据+机器学习带来了史无前例的效率契机。
明天的AI复兴,是树立在机器学习驱动大数据的根底上的,知识图谱也是如此。举例来说,搜索引擎知识图谱技术,是树立在搜索数据和百科、问答等数据库之上的。数据自身的优质化是知识图谱运转的根底。而在机器学习、深度学习范畴的积聚,则让图谱技术完成了及时化、逐渐完善图谱关联强度和了解力提升。换句话说,知识图谱技术正在变得愈发即时性与可生长。
2、语音交互成为启动知识图谱的新方式。
知识图谱想要真的为人类所用,那么就不能是人类用固定方式去动身知识图谱的模板。而应该是知识图谱自动了解人类的言语和思想习气,做到自动输入效劳。这就需求知识图谱与语音交互严密结合。
3、强语义了解才能成为关键。
能听懂“长城有多长”,却听不懂“长城从东到西一共多少间隔”的知识图谱,显然是知识没谱。深度学习各种语意、语义、语序和方言的知识图谱才能,也成为了目前知识图谱技术的唤醒中心。
这几种才能加持下,把知识图谱假装成选手去搞点“撒币”,显然曾经不算什么了...但是假如只干这点事,其实也蛮亏的。
撒出一个今天
无论是语音交互还是机器视觉,我们明天正在努力教会AI一件事,就是辨认。可是,在辨认之后呢?AI下一步要干什么?
辨认的下一步当然是了解和处置,但假如想让AI开启这些才能,很多人都以为,知识图谱的迸发将是AI下一步的必经之路。
明天知识图谱的中心,在于经过数据生成可视化的知识链条,用链条构成网络,应用网络来停止预测、生成自动化,最终生成机器自动提供的智能化效劳。
要晓得,人类了解世界并不是基于一个个散乱的信息,而是基于信息面前的“知识”。
我们等待的知识图谱技术,是经过这种技术的完善,把AI调整到自动输入效劳形式。经典计算阶段是你想到的,电脑帮你做出来。而知识图谱时代,是你想不到的,AI可以想到。
能做到这一步的AI技术,当然不会只满足去答答题,做个直播。人家的使命是改动世界好不好?
其实,知识图谱作为一种隐藏的后端技术,明天曾经悄然规划在了我们的生活。比方我们明天在百度搜“李白写过哪些饮酒诗?”,曾经不是跳出来有这些关键词的网站,而是直接跳出来你的答案,这面前就是知识图谱即便曾经解答了你的成绩。
更重要的是,知识图谱技术作为AI交互手腕的必要触达点,正在为其他AI产业提供协助,比方智能处置、无人驾驶。
更远的将来,或许是应用知识图谱技术达成物联网间的协作、人机交互的全新晋级,那么最终所能抵达的,远远不是答题这一件大事而已。
所以呢,直播平台上谁给谁撒币,谁是大撒币,其实也不是很重要了。真正重要的是,技术正在努力把将来的币,撒到如今的土壤里。
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或许下载钛媒体App