AI 科技评论按:本文作者为阿里巴巴搜索事业部总监欧文武,经阿里巴巴受权发布。
以深度学习为代表的人工智能在图像、语音和 NLP 范畴带来了打破性的停顿,在信息检索和特性化范畴近几年也有不少地下文献,比方 wide & deep 完成了深度模型和浅层模型的结合,dssm 用于计算语义相关性,deepfm 添加了特征组合的才能,deep CF 用深度学习完成协同过滤,rnn recommender 采用行为序列预估完成特性化引荐等。工业级的信息检索或特性化零碎是一个复杂的零碎工程,深度学习的工业级使用需求具有三个条件:弱小的零碎计算才能,优秀的模型设计才能和适宜的使用场景,我们梳理了过来一年多搜索在深度学习方向上的探究,概要的引见了我们在深度学习零碎、深度学习算法和搜索使用落地的停顿和考虑,希望对大家有所启示。
深度学习在搜索的使用概括起来包括 4 个方面:
-
首先是零碎,弱小的深度学习训练平台和在线预测零碎是深度学习使用的必要条件,目前我们的离线深度学习框架、在线深度学习框架和在线预测框架一致到 tf,并完成了日志处置,特征抽取,模型训练和在线效劳部署端到端的流程,极大提升了算法迭代效率;
-
其次是搜索使用,包括智能交互,语义搜索,智能婚配和智能决策四个技术方向,这四个方向的协同创新完成了搜索全链路的深度学习技术晋级,并具有从传统的单场景单目的优化到多场景多目的结合优化的才能;
-
再次是在功能优化上做的任务,包括模型紧缩、量化、低秩分解再到二值网络,少量的技术调研和论证,为将来进步深度模型预测功能和软硬件协同优化做了很好的技术铺垫;
-
最初是排序平台化,完成了 PC 商品搜索、无线商品搜索、店铺内搜索搜索和店铺搜索的搜索效劳一致,经过特征和模型复用,完成了多条业务线技术的疾速晋级。上面我会扼要的概括下在四个方向上获得的次要停顿和面前的考虑。
上面是搜索零碎和算法的简图。零碎包括:
a. 离线数据平台 ODPS,担任离线日志 join、特征抽取和离线模型预估产出排序特征,时效性不强的特征都是经过离线数据平台产出的,比方用户性别标签,商品关键字等;
b. 离线机器学习平台 PAI,底层是主流的 parameter server 和 TF 深度学习框架,平台完成了大局部机器学习算法模型的并行训练和预测,在搜索使用中次要作用是离线模型训练产出离线排序特征模型;
c. 流式计算和在线学习平台 Porsche,流式计算是基于 blink 担任实时日志解析和特征 join 生成实时排序特征,在线学习和离线学习底层框架可以相反,差异次要是依赖数据源和局部优化办法不同,由于用户行为和市场环境变化快,流式计算和在线学习在搜索使用十分普遍,并积聚了不少在线学习和强化学习算法;
d. 在线效劳平台,包括引擎、排序效劳和搜索平台组成,担任在线的效劳分发、索引查询、排序效劳和后果兼并等功用,搜索的排序战略、相关性、特性化等模型次要经过在线预测效劳失效。经过多年开展我们曾经具有了十分完善的商品搜索排序算法体系,包括知识图谱、分词、tagging、类目预测、意图预测、拼写纠错、query 引荐、query 语义改写、相关性、商品标签、商质量量、店铺分层、用户 profile、用户偏好、用户感知、召回战略、特性化模型、多样性战略、异构效劳混排战略、多目的结合优化战略、多场景结合排序战略等,并平台化的方式赋能相关业务团队。
搜索零碎和算法简图
零碎停顿包括机器学习平台和在线预测平台
机器学习平台。搜索训练样本次要来自用户行为,由于用户行为是流式数据,合适做在线深度学习,但当模型参数十分庞大需求海量的样本时在线学习需求很长的工夫才干收敛,这时普通是先做离线预训练再结合增量或在线学习,另外有些模型离线预训练后在线只需求对接近输入层的网络做 fine-tuning。搜索在实践使用的有离线机器学习平台 PAI 和在线机器学习平台 Porsche,两个平台深度学习框架目前都一致到了 tf-pai,tf-pai 对原生 tf 做了一些优化,比方底层通讯,稀疏参数存储、优化办法、GPU 显存优化等,比原生 tf 训练深度有较大的提升,训练上千亿样本和上百亿参数的深度模型毫无压力。虽然 Porsche 和 PAI 都支持 GPU,但在搜索使用中 CPU 仍然是主流,GPU 使用比拟少,缘由次要是特性化绝对图像或语音复杂,特征抽取网络比拟浅,维度绝对较低,GPU 的稀疏矩阵计算才能得不到充沛发扬,同时离在线混布后流量低谷时期腾出了少量的在线效劳闲置 CPU,把暂时闲置的 CPU 应用起来做深度学习训练是一个十分好的思绪。
在线预估 RTP,搜索排序算分效劳。由于每次搜索恳求有上千个商品需求计算排序分数,深度模型使用对 RTP 效劳的压力是十分大的,RTP 经过采用异构计算,计算算子化和模型分片等方式处理了深度模型 inference 计算和存储成绩,深度模型用 GPU,浅层模型用 CPU,往年双 11 时期搜索 RTP 效劳用到了 550 张 GPU 卡。另外,RTP 还完成了离线/在线训练模型/数据和在线预测效劳部署的无缝衔接,算法训练好的模型或数据可以很轻松的部署都在线效劳,提升了算法迭代效率。
算法包括智能交互、语义搜索、智能婚配和搜索战略四个方向
智能交互。商品搜索就是带交互的商品引荐,用户经过关键字输出搜索意图,引擎前往和搜索意图婚配的特性化引荐后果,好的交互技术可以协助到用户更好的运用搜索引擎,目前搜索的交互次要是自动关键字输出和关键字引荐,比方搜索框中的默许查询词和搜索后果中的文字链等,引荐引擎依据用户搜索历史、上下文、行为和形态引荐关键字。
和商品引荐的区别是,关键字引荐是搜索链路的两头环节,关键字引荐的收益除了关键字的点击行为外,还需求思索对整个购物链路的影响,包括在引荐关键字的后续行为中能否有商品点击、加购和成交或跳转到另外一个关键字的后继行为,这是一个典型的强化学习成绩,action 是引荐的关键字候全集合,形态是用户以后搜索关键词、上下文等,收益是搜索引导的成交。除了主动的关键字引荐,我们也在考虑搜索中愈加自动的交互方式,可以做到像导购员一样的双向互动,自动讯问用户需求,挑选特性化的商品和给出特性化的引荐理由,目前阿里搜索团队曾经在做智能导购和智能内容方向的技术原型及论证,智能导购在技术上次要是自创对话零碎,经过引导用户和引擎对话与关键字引荐方式互为补充,包括自然言语了解,对话战略,对话生成,知识推理、知识问答和商品搜索等模块,功用次要包括:
a. 依据用户搜索上下文生成引导用户自动交互的文本,比方搜索「奶粉」时,会生成「您宝宝多大?0~6 个月,6 个月到 1 岁….」引导文案,提示用户细化搜索意图,假如用户输出「3 个月」后,会召回相应段位的奶粉,并在后续的搜索中会记住对话形态「3 个月」宝宝和提示用户「以下是合适 3 个月宝宝的奶粉」。
b. 知识导购,包括进步售前知识问答或知识提示,比方「3 个月宝宝吃什么奶粉」答复「1 段」。目前对话技术正在进步中,尤其是在多轮对话形态跟踪、知识问答和自动评价几个方面,但随着深度学习、强化学习和生成对立学习等技术在 NLP、对话战略、阅读了解等范畴的使用,越来越多的训练数据和使用场景,domain specific 的对话技术将来几年应该会日新月异。智能内容生成,包括生成或辅佐人工生成商品和清单的「卖点」,短标题和文本摘要等,让淘宝商品表达愈加特性化和多元化。
语义搜索。语义搜索次要是处理关键字和商品内容之间的语义鸿沟,比方搜索「2~3 周岁宝宝外套」,假如依照关键字婚配召回后果会远小于实践语义婚配的商品。
语义搜索的范围次要包括:
a. query tagging 和改写,比方新品,年龄,尺码,店铺名,属性,类目等搜索意图辨认和归一化,query tagging 模型是用的经典的序列标注模型 bi-lstm + CRF,而标签分类(归一化)作为模型另外一个义务,将序列标注和分类交融在一同学习。
b. query 改写,次要是计算 query 之间类似度,把一个 query 改写成多个语义类似的 query,通常做法是先用不同改写战略生成改写候选 query 集合,比方词交换、向量化后 top k、点击商品类似度等,然后在用 ltr 对后续集合排序找出适宜的改写集合,模型设计和训练绝对复杂,比拟难的是如何构建高质量的训练样本集合,线上我们用 bandit 的办法探测局部 query 改写后果的优劣,离线则用规则和生成对立网络生成一批质量较高的样本。
c. 商品内容了解和语义标签,经过商品图片,概况页,评价和同义词,上下位词等给商品打标签或扩大商品索引内容,比方用 image tagging 技术生成图片的文本标签丰厚商品内容,或许更进一步用直接用图片向量和文本向量交融,完成富媒体的检索和查询。
d. 语义婚配,经典的 DSSM 模型技术把 query 和商品变成向量,用向量内积表达语义类似度,在问答或阅读了解中少量用到多层 LSTM + attention 做语义婚配,异样高质量样本,特别是高质量负样本很大水平上决议了模型的质量,我们没有采样效率很低的随机负采样,而是基于电商知识图谱,经过生成字面类似但不相关的 query 及相关文档的办法生成负样本。
从下面可以看到 query tagging、query 类似度、语义婚配和语义相关性是多个目的不同但关联水平十分高的义务。下一步方案用一致的语义计算框架支持不同的语义计算义务,详细包括
1. 开发基于商品内容的商品表征学习框架,为商品内容了解,内容生成,商品召回和相关性提供一致的商品表征学习框架,重点包括商品标题,属性,概况页和评价等文本信息抽取,图像特征抽取和多模信号交融。
2. query 表征学习框架,为 query 类目预测,query 改写,query 引荐等提供一致的表征学习框架,重点经过多个 query 类似义务训练一致的 query 表征学习模型。
3. 语义召回,语义相关性等业务使用模型框架。语义搜索除了添加搜索后果相关性,提升用户体验外,也可以一定水平上遏制淘宝商品标题堆砌抢手关键词的成绩。
智能婚配。这里次要是指特性化和排序。内容包括:
a. ibrain (深度用户感知网络),搜索或引荐中特性化的重点是用户的了解与表达,基于淘宝的用户画像静态特征和用户行为静态特征,我们基于 multi-modals learning、multi-task representation learning 以及 LSTM 的相关技术,从海量用户行为日志中直接学惯用户的通用表达,该学习办法擅长「总结经历」、「举一反三」,使失掉的用户表达更根底且更片面,可以直接用于用户行为辨认、偏好预估、特性化召回、特性化排序等义务,在搜索、引荐和广告等特性化业务中有普遍的使用场景,感知网络超越 10B 个参数,曾经学习了几千亿次的用户行为,并且会坚持不连续的增量学习越来越聪明。
b. 多模学习,淘宝商品有文本、图像、标签、id 、品牌、类目、店铺及统计特征,这些特征彼此有一定水平的冗余和互补,我们应用多模学习经过多模结合学习办法把多维度特征交融在一同构成一致的商品规范,并多模结合学习中引入 self-attention 完成特征维度在不同场景下的差别,比方女装下图片特征比拟重要,3C 下文本比拟重要等。
c. deepfm,绝对 wide & deep 模型,deepfm 添加了特征组合才能,基于先验知识的组合特征可以使用到深度学习模型中,提升模型预测精度。
d. 在线深度排序模型,由于行为类型和商品重要性差别,每个样本学习权重不同,经过样本池对大权重样本反复 copy 分批学习,无效的提升了模型学习波动性,同时经过交融用户形态深度 ltr 模型完成了千人千面的排序模型学习。
e. 全局排序,ltr 只对单个文档打分然后依照 ltr 分数和打散规则排序,容易招致搜索后果同质化,影响总页效率,全局排序经过已知排序后果做为上下文预测下一个地位的商品点击概率,无效提升了总页排序效率。
f. 另外工程还完成了基于用户和商品向量的向量召回引擎,绝对倒排索引,向量化召回泛化才能更强,对语义搜索和进步特性化婚配深度是十分有价值的。以上完成了搜索从召回、排序特征、排序模型、特性化和重排的深度学习晋级,在双 11 无线商品搜索中带来超越 10% (AB-Test) 的搜索目标提升。
多智能体协同窗习完成智能决策
搜索中特性化产品都是成交最大化,招致的成绩是搜索后果趋同,糜费曝光,往年做的一个重要任务是应用多智能体协同窗习技术,完成了搜索多个异构场景间的环境感知、场景通讯、独自决策和结合学习,完成结合收益最大化,而不是此消彼长,在往年双 11 中结合优化版本带来的店铺内和无线搜索综合目标提升 12% (AB-Test),比非结合优化版本高 3% (AB-Test)。
功能优化。在深度学习刚起步的时分,我们认识到深度模型 inference 功能会是一个瓶颈,所以在这方面做了少量的调研和实验,包括模型紧缩 (剪枝),低秩分解,量化和二值网络。
经过以上技术,往年双 11 时期在手淘默许搜索、店铺内搜索、店铺搜索等均获得了 10% (AB-Test) 以上的搜索目标提升。
阿里巴巴人工智能搜索使用的将来方案
通用用户表征学习。后面引见的 DUPN 是一个十分不错的用户表征学习模型,但基于 query 的 attention 只合适搜索,同时短少基于日志来源的 attention,难以推行到其他业务,在考虑做一个可以合适多个业务场景的用户表征模型,非搜索业务做些复杂 fine tuning 就能获得比拟好的效果;同时用户购物偏难受时节和周期等影响,工夫跨度十分大,最近 K 个行为序列假定太复杂,我们在考虑可以做 life-long learning 的模型,可以学惯用户过来几年的行为序列;
搜索链路结合优化。从用户进入搜索到分开搜索链路中的全体优化,比方 搜索前的 query 引导(底纹),搜索中的商品和内容排序,搜索后的 query 引荐(锦囊)等场景;
跨场景结合优化。往年搜索外部主搜索和店铺内搜索结合优化获得了很好的后果,将来希望可以拓展在更多大流量场景,进步手淘的全体购物体验;
多目的结合优化。搜索除了成交外,还需求承当卖家多样性,流量公道性,流量商业化等居多平台和卖家的诉求,搜索产品中除了商品搜索外还有「穹顶」,「主题搜索」,「锦囊」,「内容搜索」等非商品搜索内容,不同搜索目的和不同内容(物种)之间的结合优化将来很值得深挖。
智能交互。「搜索排序做的再好搜索也只是一个工具」,如何把搜索从工具做成公家导购助手,可以听懂你的言语,理解你的心情,可以对话和多轮交互,处理售前售后困惑,引荐愈加特性化的商品应该是搜索将来的另外一个次要开展方向。
雷锋网版权文章,未经受权制止转载。概况见。