到了明天,曾经很少有人再提人工智能音箱了。运用率低、售价跳水、缺乏销售数据……我们不能武断地说智能音箱凉了,但确实不少所谓的AI企业的硬件梦碎了。
绝对于一些自觉涌入AI的公司,一些科技公司似乎找到了另外一条硬件路——翻译机。 科大讯飞 推出了晓译翻译机、谷歌推出了实时翻译耳机,搜狗也在最近推出了搜狗游览翻译宝和搜狗速记翻译笔。
开端出现扎堆趋向的智能翻译机,能否会推翻智能音箱成为下一个AI硬件浪潮?
打败大魔王,AI消费级硬件,燃眉之急是走出手机的暗影
我们可以先从智能音箱的前车之鉴来看,智能翻译机最该避开哪些坑。
除了产质量量良莠不齐等等弊端之外,智能音箱最大的成绩是没有一项功用超出手机功用的子集。播放音乐、语音交互、传达命令,这些功用其实都能在手机上很好的完成,让智能音箱的运用率不时被压榨。
其实不光是智能音箱,如今开端搭载挪动AI芯片的手机几乎是AI消费级硬件界的大魔王,让很多产品毫无用武之地。智能翻译机也是一样,翻译App曾经能满足大局部的消费级翻译需求,翻译机一方面要赶上翻译App文字、图片多种媒介适用的特点,另一方面还要保证离线运用、 操作 复杂和续航工夫长,从而取得与手机之间的差别化优势。这很能够会成为让智能翻译机不会重蹈智能音箱覆辙的重要优势。
三次迭代,什么才是,智能翻译机的最终形状?
其实这是一个最粗浅道理,智能翻译机的产品迭代的方向也不断朝着替代和逾越翻译App开展。
第一代智能翻译机应该是以科大讯飞的晓译为代表,主打随说随译。这一代产品其实是最为为难的:虽然有弱小的自然言语处置技术,可以较为精确的停止翻译任务,但很多功用还需衔接手机借助网络才干运用。
这类作为手机外置产品的翻译机和手机中的翻译App比起来简直毫无竞争力,除了晓译之外,同类产品还有有道翻译蛋、全球译等等。虽然到后来第一代智能翻译机都添加了离线言语的品种,但比起App的拍照翻译等功用,还是差了一截。
谷歌推出的实时翻译耳机Pixel Buds可以被看做第二代智能翻译机,这类翻译机经常以耳机的形状呈现,有些需求WiFi/蓝牙与手机衔接。同类产品还有IBM Watson和Lingmo推出的Translate One2One。实时翻译耳机相比单纯的翻译机有着更丰厚的功用,除了用作翻译还可以当成蓝牙耳机运用,并且翻译速度更快,在单方都配置耳机时可以很好的停止拾音和语音生成,方便交流。但大少数翻译耳机还是作为手机外设存在,本身并不具有真正的翻译功用,甚至谷歌的Pixel Buds只能配适谷歌Pixel手机。
而搜狗推出的搜狗游览翻译宝,可以说是第三代智能翻译机了。除了进步翻译速度和精确率外,还参加了OCR技术,让用户可以停止实景翻译,并且摆脱了翻译APP对网络衔接的依赖。
硬件与软件的胶着战,第三代智能翻译机赢了吗?
在短短的两三年之间,市面上的智能翻译机就曾经停止了这么屡次迭代,产品形状和功用也都发作了不小的变化。异样的,翻译App也在不时停止晋级,从一开端的“词典”开展到可以整句翻译、语音翻译和明天的拍照翻译。你追我赶之中,这一次第三代智能翻译机走到翻译App后面了吗?
首先看来,搜狗游览翻译宝终于做到了摆脱对手机和网络的依赖,在离线形态下也可以完成翻译任务。做到这一步,就是拿下了最关键的赛点。在旅游场景中,国外、交通工具上都有能够没有网络信号,在商务场景中,有些场所也不合适运用手机。这些需求交流,却无法运用手机和网络的中央,为智能翻译机翻开了不可替代的强需求市场,可以说离线功用是智能翻译机的根深立命之本。
除了离线场景之外,智能翻译机不断没法逾越的是翻译App多样化的翻译方式。借助手机本身多传感器的特性,翻译App可以对文字、图片、语音多种媒介停止翻译,适用性更高。如今参加了拍照翻译的第三代智能翻译机终于扳回一城,并且在语音翻译的拾音功用上,搜狗游览翻译宝有着更专业的双麦克风阵列和降噪算法,应用语音加强技术缩小原音,即便在乐音环境下也不会有误听误译的状况呈现。
从价钱来看,搜狗这次推出了两款产品,一款是使用于旅游场景的游览翻译宝,另一款是使用于会议、课堂场景的速记翻译笔,两款产品的售价辨别是1498元和299元。好在智能翻译机的售价没有随着产品迭代水涨船高,这一售价还是绝对敌对的。除了单纯的售卖形式,很多游览社也开端提供共享租赁效劳,或许将来智能翻译时机经过这一契机走进人们的生活。
高准入门槛和优质的参与者,或许才是智能翻译机的王牌
智能翻译机不会成为智能音箱的另一个缘由,就是这一行业较高的准入门槛。
和智能音箱复杂的接纳语音信号、下达指令不同,智能翻译机的实时离线翻译对机器翻译、语音辨认、图像辨认、语音生成甚至知识图谱技术都有很高的要求。
就拿在海内餐馆点菜运用搜狗游览翻译宝这一复杂的场景来说,就需求拍下照片停止图像辨认,找到其中的文字并翻译成中文,和别人对话时,智能翻译机需求经过定向波束扫描躲避乐音,精确拾音并停止翻译。在翻译进程中,还需求拥有相关范畴的知识图谱,才干精确的捕获到俚语、术语、双关语等等人类专属的文字游戏。而想要这一切都在离线形态下停止,还需求弱小的紧缩技术,让模型得以存储终端中。
所以在智能翻译机范畴很难见到相似智能音箱的盛况:各种相关的和不相关的企业都来赶风口。目前智能翻译机范畴的参与者,根本有三类。
第一类是专业从事AI技术开发的企业,如科大讯飞和IBM Waston。第二类是拥有宏大用户规模,经过本身产品,像输出法、搜索等业务在知识图谱和语音技术上建起壁垒的企业,比方搜狗、谷歌。第三类,是一些垂直研发翻译产品的企业,像有道云、全球译等等。较高的准入门槛对智能翻译机构成了一种维护,竞争对手都各有优势,不至于出品太过劣质的产品让市场对整个品类绝望。
智能音箱留给我们最大的反思大约就是,宁愿在泥土中多冬眠一会儿,也不要开出畸形的花。如今智能翻译机曾经开端破土而出,愿它能结下AI消费硬件的第一枚果实。
【本文为协作媒体受权 投资界 转载,文章版权归 原作者及原出处 一切。文章系作者团体观念,不代表投资界立场,转载请联络原作者及原出处取得受权。有任何疑问都请联络(editor@zero2ipo.com.cn)】