目前,微软、Google、亚马逊、苹果、Facebook都巨头都在规划人工智能,将人工智能作为公司片面开展战略,触及方方面面,不破费一通功夫,很难一下子理解各大公司的技术、规划和产品落地。
明天,在北京召开的微软2018人工智能大会上,微软把自家做的事一股脑全说了。
在雷锋看来,发布会的两点次要有:微软着重强调了其新的“世界观”:智能云和智能边缘;展现了微软在语音语义、视觉、机器翻译的多项技术;微软发布ONNX项目及ML.NET打造开源跨平台人工智能开发框架;搭载着全新的“全双工语音技术”的微软小冰带来了原创诗歌、歌曲和儿童故事;中国挪动、大疆、唯品会、小米生态链辨别展现了与微软人工智能的协作效果。
微软新世界观:智能云和智能边缘
云计算、物联网、大数据、人工智能正在将我们的世界将变成一台宏大的计算机。
微软全球执行副总裁、人工智能及微软研讨事业部担任人沈向洋博士引见到,在这样的新时代,微软有了全新的世界观:智能云和智能边缘。
智能云指的是微软Azure,是微软专为人工智能打造的云平台。Azure会聚了微软在人工智能范畴的全部投入与技术积聚,是开发、部署、运转人工智能的云平台,同时也是将智能云与智能边缘融会贯穿的关键环节。
微软不断在拓展Azure的功用,Azure目前有四个方面:私有云Azure、混合云Azure Stack、物联网Azure IoT Edge和Azure Sphere,以这四个方面打造出完好的计算环境,支持全新使用场景。
Azure Stack是Azure私有云在本地数据中心的扩展,可以在边缘和离线环境运转、满足多种监管要求。例如石油开发公司同时运用Azure私有云和Azure Stack可以依照办公地点灵敏分配计算资源。
Azure IoT Edge是微软在2017年Build大会推出的针对智能边缘计算的产品,可以在Linux和Windows上运转,而2018年Build大会上,微软宣布将 Azure IoT Edge 开源,允许开发者停止扩展、添加功用,并部署就任何环境中。
Azure 上的认知效劳也可以扩展到Azure IoT Edge,目前微软曾经推出了定制视觉效劳,可以让无人机或其它工业配备无需衔接到云,就能做出疾速的呼应和处置。会上,大疆展现了与微软的协作,应用Azure IoT Edge和微软人工智能效劳,大疆开收回适用于农业、修建行业、公共平安及更多使用场景的处理方案。
Azure Sphere次要用于维护和驱动智能云上的设备。2020年,全球智能边缘设备的总数将超越200亿 台,世界会成为一台超级计算机,但是我们也会担忧平安成绩。Azure Sphere方案将提供经过特殊设计的平安芯片、平安操作零碎和可以守护每台设备的云端平安。
在引见完Azure云平台的四个方面后,沈向洋引见了微软将Azure与AI结合,打造最才子工智能云平台的四个方向:认知效劳、对话式人工智能、开放平台与工具、实时人工智能根底设备。
Azure 认知效劳
在两年前的Build 2016微软全球开发者大会上,微软初次发布了运转于Azure的认知效劳,以API的方式为开发者提供易用的人工智能技术才能。目前微软在全球推出包括语音、视觉、言语、机器翻译等功用的24项效劳,超越100万开发者运用。
CaptionBot 能像人一样了解和描绘一张图片聚焦消费升级、多维视频、家庭场景、数字营销、新零售等创新领域,为用户提供更多元、更前沿、更贴心的产品,满足用户日益多样化、个性化的需求。,例如,你上传一张照片,CaptionBot可以给出一段文字描绘:比尔盖茨正拿着一副网球拍,他看起来很快乐。
此外,还引见了微软 OCR((Optical Character Recognition光学字符辨认) ,将为各种人工智能使用添加图形文字辨认功用,目前支持从Office到Skype、Bing、HoloLens的微软使用,可以辨认图像内的文字,例如辨认车牌号、海报甚至是手写的笔记。
CaptionBot和OCR都是Azure预制的人工智能效劳,微软也针对变化的场景推出了定制视觉效劳,可以让不具有深度学习、机器视觉背景的开发者定制图像标签模型、物件认知模型。
微软技术院士黄学东引见了微软在人工智能语音语义方面的停顿。在计算机视觉方面,2015年微软亚洲研讨院发布的152层残差网络(ResNet)的图像辨认精确率曾经到达96%,胜过人类;2017年8月,微软在Switchboard语音辨认基准测试中的错误率曾经降低至5.1%,到达了媲美人类专业速记员的程度;2018年1月,微软亚洲研讨院自然言语计算组率先在斯坦福大学发起的SQuAD文本了解应战赛上取得逾越人类的分数;2018年3月,微软亚洲研讨院与微软雷德蒙研讨院宣布,其研发的机器翻译零碎在通用新闻报道测试集newstest2017的中-英测试集上,第一个到达了可以与人工翻译媲美的程度。
5月初,雷锋网曾报道,谷歌在I/O大会上展现了Google语音助手的Duplex(双工)技术,能自动给餐馆、理发店打电话,协助用户预定工夫。由于其声响和音调与人类简直没有差异,能完成延续对话还能了解上下文疾速反响,在冤家圈大火了一把。这时,微软坐不住了,赶忙收回了 技术声明 ,标明微软小冰在两年前就完成了AI与人类通电话,并且在谷歌之前就发布了完成AI与人双向交流的全双工语音技术。
在现场,黄学东忍不住Diss了一下,说Google动不动就吹嘘, ”微软不只有全双工,微软更完成了全三工、全四工、全五工……”
现场展现了一款“全多工”的产品——微软与Roobo协作的AI会议零碎。微软特意在现场预备了四团体的现场会议演示,可以看到,这款AI会议零碎能辨认不同人的声响,实时以文字记载下大家的发言内容,同时辨认出触及任务布置的内容生成代办事项。这个产品,可以说是每个团队中会议记载员的救星。
黄学东还展现了语音定制技术,依据上传的录音,可以生成和用户一样声响的AI助手。上传30分钟的录音,失掉的AI说话与用户类似度不高,但是以10小时的录音停止训练后,就能失掉较为逼真的模拟效果。想一想,你会想要把家人或许冤家的声响放进AI里,让它随时陪伴你吗?
黄学东称往年微软到达中文英文翻译超越专业人士的程度。大会上,小米生态链企业香蕉出行展现了魔芋AI翻译机,借助微软认知效劳中的微软翻译打造,可以提供14种言语的实时语音翻译。虽然由于现场混音效果,魔芋AI有几次辨认不出语音指令,但翻译的效果还是不错的,可以说是出游利器。
对话式人工智能
亚马逊Echo智能音箱带动了对话式人工智能的产品落地,如今对话式人工智能曾经进入音箱、电视、车载等多个设备中,是新一代智能使用的中心。对话式人工智能也在不时晋级其对话才能,追求越来越自然、流利的人机交流。
微软有小娜和小冰两个对话式人工智能助手,小娜更倾向于开展智商,而小冰则是面向情商维度开展的人工智能零碎。
微软小冰降生曾经三年,不断以逗贫、插科打诨的聊天作风著称。最近,微软将最新的全双工语音交互技术(Full Duplex)使用在了微软小冰上,同时提升了小冰的智商和情商,具有了以下才能: 一次唤醒之后的延续对话、预测用户接上去的对话内容、 协助用户轻松完成多重担务、内容发明(写诗、写歌、讲故事)。小冰不只是可以执行用户的义务,还能自动提供聊天语聊,陪伴和关怀用户。
这次大会上,微软展现了一段小冰在一次电话聊天完毕后,由于判别出用户心情高涨,以为需求再一次电话沟通,于是又拨打了一通电话,去讯问用户心情能否变好、提示用户早点休息、告知用户今天天气状况。
据理解,2016年8月起,微软(亚洲)互联网工程院经过人类用户自动发起的方式,在明白告知用户小冰并非人类的前提下,已让小冰与人类用户完成了累计超越60万通电话交流。
在内容创作方面,微软展现了小冰写的诗、原创歌曲、有声读物。在有声读物范畴,微软已拥有接近4万集有声童话内容。这些有声读物全部由人工智能技术生成,在与人类主播质量相当的前提下,数量足以陪伴一个孩子从2岁到9岁的全部光阴。6个月来,这些有声读物已顺利投放到占中国市场90%的儿童早教机、故事机和在线播客平台,播放总时长超越400万小时。
往年四月,微软曾经在中国和美国宣布了全双工语音技术,并且有多项产品落地,微软(亚洲)互联网工程院副院长李笛宣布,往年秋天,微软还将向协作同伴和开发者开放“全双工语音技术(Full Duplex)”开发者可以运用这项技术打造本人的对话使用。
雷锋网 (大众号:雷锋网) 猎奇,微软的全双工语音技术开源,这会不会对如今的智能音箱里的“傻萌”的语音助手停止一次洗牌呢?(延伸阅读: 微软发大招:要做智商和情商兼具的语音助手 )
开放平台+根底设备
要促进人工智能的普及,技术开放是必经之路,微软也推出了开放人工智能平台(Open AI)战略及开发工具。
微软可以支持TensorFlow、CNTK等业界主流的深度学习平台,同时,微软还发起了开放神经网络交流(ONNX)项目,旨在推进人工智能研讨的互操作性,让任何深度学习框架在任何芯片与任何设备上都能运转。目前,曾经有15家公司支持ONNX,并且还有更多公司正在参加出去。如今曾经有PyTorch等六种顶级框架支持ONNX,其它框架则可以经过转换器取得支持。
在Build 2018微软全球开发者大会上,微软宣布推出跨平台、开源机器学习框架ML.NET开放预览。ML.NET让任何开发者都能开收回本人的定制化机器学习模型,并将其融入到本人的使用中去——开发者完全无需具有开发和调试机器学习模型的经历。这一框架最后由微软研讨院开发,并且在Windows、Bing、Azure等微软产品上都失掉了成功的使用。经过将这一技术框架开源,微软希望可以为每一位开发者赋予驾驭机器学习的才能。
微软Project Brainwave能应用Azure上最先进的FPGA根底架构完成实时的人工智能处置。用户只需经过实时的单一批数据,就能失掉以往需求多得多的批数据处置才干失掉的功能,真正完成人工智能的实时计算。而且,FPGA运算不只仅只在云端提供——经过协作同伴,也可以经过Azure Stack混合云在本地提供FPGA。如此弱小的实时计算才能不只存在于云端,同时也适用于边缘计算,这将让更多创新成为能够。
AI赋能Office 365
虽然明天我们看到的都是全新的AI技术,但是微软也没有遗忘其桌面时代的中心业务Windows和Office。
AI功用曾经成功与Office 365、Dynamics 365、linkedin等产品和功用融为一体。例如,在发邮件时,微软提供了多种言语的一键翻译。在用Excel时,Excel能更好地猜想用户的行为,提早生成用户能够需求的内容。
在前些天的锤子手机发布会上,罗永浩推出了本人的坚果 TNT 任务站,用人工智能的语音和语义技术晋级Office办公软件,例如,可以用语音指令来做PPT和Excel,用语音指令制造幻灯片,包括调理字体大小、颜色、款式等。
雷锋网发现,很多人评论这些需求或许都是伪需求,我们看到微软也在用人工智能晋级桌面办公零碎,更能直接比照,终究什么样的智本着网络面前人人平等的原则,提倡所有人共同协作,编写一部完整而完善的百科全书,让知识在一定的技术规则和文化脉络下得以不断组合和拓展。 能操作才是我们所需求的。
收费AI课程上线
最会,为了推进全民AI,让每团体都无机会学习人工智能,微软推出在线人工智能学院,目的是一年内培育出10 万余名人工智能人才,将收费提供包括AI根底、中心技术和高阶使用在内的总共250课时的12门人工智能学分课程,掩盖10项使用技艺。完成课程学习的用户,还可请求微软专业学位课程(MPP,Microsoft Professional Program)作为职业技艺认证。 感兴味的冤家可以敲:( https://school.azure.cn/ )
相关文章:
Smartisan R1 是真旗舰,但坚果 TNT 任务站真的是反动性产品吗?
微软 Build 发布会总览:虽然 Windows 10 出席,但亮点仍然很多
微软发大招:要做智商和情商兼具的语音助手
谷歌AI打电话刷屏,微软坐不住了
会打电话的 AI 面前:谷歌 Duplex 技术解析
。