农企新闻网

浅析 eBay 联盟营销的上下文广告机制

发布者:何原东
导读大众号/AI 火线作者|eBay译者|Sambodhi编辑|NatalieAI 火线导读:上下文广告是与内容婚配的网络广告,比方,用户在网络上阅读信息,假如看到汽车相关的文章,就会看到汽车销售、汽车保险、汽车杂志相关的广告。上下文广告会成为智能广告的前奏。eBay 联盟营销的上下文广告做得相当出色,明天我们就来看看 eBay 是如何将自家的上下文广告做到极致的。eBay 应用各种营销渠道将新客户和

大众号/AI 火线

作者|eBay

译者|Sambodhi

编辑|Natalie

AI 火线导读: 上下文广告是与内容婚配的网络广告,比方,用户在网络上阅读信息,假如看到汽车相关的文章,就会看到汽车销售、汽车保险、汽车杂志相关的广告。上下文广告会成为智能广告的前奏。eBay 联盟营销的上下文广告做得相当出色,明天我们就来看看 eBay 是如何将自家的上下文广告做到极致的。

eBay 应用各种营销渠道将新客户和现有客户聚集到该网站,其中之一就是 eBay 的联盟方案。eBay 还提供工具包来协助发布商 / 分支机构添加佣金。有些工具可在 eBay 网站上购物时创立可跟踪的链接。

浅析 eBay 联盟营销的上下文广告机制

至于更复杂的工具,如我们的 API,可以支持自定义拜访 eBay 的产品列表数据。例如,用户可以创立横幅来添加实时的 eBay 清单到本人的网站。本文讨论了如何依据页面内容在发布商网站停止上下文广告。这种办法的亮点包括:

  • 依据页面内容,经过算法确定如何辨认出页面的标题 / 相关关键词。
  • 疏忽混乱的 HTML 内容,只挑选相关和重要的关键词。
  • 在不丧失引荐关键词的相关性的状况下,随着网址数量的添加停止扩展。
  • 运用经测试并确认无效的 eBay 搜索算法,提供相关的 eBay 条目,在发布者页面上出现。
  • 仅当页面前往积极心情时才触发条目出现算法。我们已依据内容和上下文,为每个 HTML 页面构建了心情预测算法。
联盟营销形式

联盟营销是一个网上引荐项目,商家向发布商领取他们所提到的客户销售的佣金。

AI 火线:Affiliate Marketing,中文可以了解为联盟推行,也叫联盟营销,佣金计算方式是按成交付费,也即是 CPS。本着网络面前人人平等的原则,提倡所有人共同协作,编写一部完整而完善的百科全书,让知识在一定的技术规则和文化脉络下得以不断组合和拓展。 Affiliate Marketing 的优点是佣金往往比拟客观。Affiliate Marketing 是一种由来已久的推行方式,由你向某团体推行某一个产品,当那团体经过你的推行购置了产品时,你就可以取得佣金。佣金的多少取决于你推行的产品。

浅析 eBay 联盟营销的上下文广告机制

有很多办法可以向拜访我们协作同伴网站的客户提供相关广告:

  1. 经过展现用户在过来与 eBay 互动的内容 (也称为重定向广告),我们将其定位为相反、类似或许互补的项目。(已发生兴味,我们尝试经过购置来转话客户。)
  2. 经过提供来自发布商提供的关键词的 eBay 条目。(运用 eBay 搜索效劳提供基于发布商提供的关键词的条目)
  3. 基于用户正在检查的内容,从而煽动他们在 eBay 上停止订阅或购置决议。

AI 火线:所谓重定向广告是效果类广告中的一种精准投放方式。在消费者购物的进程中,经常会由于这样或那样的缘由,最终没有完成转化。重定向广告将商品展现到此类未完成转化的消费者面前,将其带回到相关网页。由于展现的商品往往也是消费者最想要的,所以重定向广告的转化率比普通广告要更高。

在本文中,我们将讨论如何发布就广告内容相关的广告,并讨论一些我们用来完成业务目的的几个算法。

算法 1:基于主题建模和页面标题

浅析 eBay 联盟营销的上下文广告机制

处置流程:

  1. 搜索发布商网站。
  2. 抓取发布商的内容。
  3. 确定内容能否反映正面或中立的心情。
  4. 运用自然言语处置技术来确定感兴味页面中相关的关键词。
  5. 基于关键字,调用 search API 获取该单词的 top 项目,并在发布商的网页上分享。

详细进程:

  1. 搜索发布商网站:运用自制的网络爬虫,搜索发布商的网站。网络爬虫会搜索并前往发布商网址的 HTML 文件。(发布商明白地选择这种定位的方式,因而了解并允许我们抓取他们的网站。)
  2. 抓取发布者内容:抓取由 <p> 描绘的内容标签的 HTML 文件。另外,抓取标签 <div> 下的内容,这样我们就可以取得更多关于页面的细节。该算法将处置页面上不需求的内容。
  3. 辨认页面的心情:

算法:为页面内容生成一大堆单词,对否认词停止惩罚,并对正面单词停止奖励,然后计算整个页面的得分。

  • 一旦页面被抓取,我们经过删除中止字、特殊字符、标点、空格等清算网站内容,以取得文献术语相关矩阵(document Term Matrix,DTM)。DTM 包括页面上的单词列表及其相关的频率计数(通常也成为术语频率)。
  • 然后我们运转三个独自的通用情感词典,如 AFINN、Bing 和 nrc(由 Finn Arup Nielsen、bing Liu 及其协作者 Saif Mohammad、Peter Turney 编纂)。一切这三个词典都是基于一元模型(unigrams),即单个单词。这些词典包括了许多英语单词,这些单词被赋予积极 / 消极心情的分数,也能够是诸如喜欢、愤恨、悲伤等心情。nrc 词典将单词以而二进制方式分类(是 / 否)分为积极、消极、愤恨、等待、延误、恐惧、喜悦、悲伤、诧异和信任。Bing 词典以“二元”方式将单词分为“褒义”“褒义”两类。而 AFINN 词典则给单词打分,分数在 -5 到 5 之间,负分表示消极心情,正分表示积极心情。
  • 该页面必需有三个词典中的两个才干前往正分数,以便将 URL 视为负数。

这种复杂易行的检测心情的办法是弱小而精确的,我们构建了一团体工判别工具来整理算法的效率。完成了误分类率为 16%,这意味着 84% 的工夫,算法预测了页面的实践心情。

4.  确定相关的关键字

  • 基于内容: 我们采用 Gibbs 抽样(Gibbs Sampling)来运转 LDA 主题建模算法,取得两个主题,每个主题有三个关键词,以概率最高的术语被作为页面的关键词。少于一次的单词则从集合中予以删除。
  • 基于页面的标题: 我们拉取页面的标题,停止解析并过滤知名词(单单数)、公用名词(单单数)、外来词和基数词,并依据标题,基于它们在网页上呈现的频率从中抽取前三个关键词。

然后将上述两种办法生成的关键词结合起来,依据页面呈现的频率,从结合中取出前三个独一关键词。

AI 火线:Gibbs 抽样是 Metropolis Hastings 算法的一个特例。MH 算法应用了马尔可夫链的细致均衡,从而取得了结合散布的采样。有了结合散布的采样我们就可以失掉边缘散布,而这在贝叶斯推断中求后验散布有重要作用。

主题建模概念

  • 主题建模是一种无监视的办法,可自动辨认出呈现在文本中的主题,并派生出文本语料库所展示的隐藏形式。粗略地说,一个主题是在词汇表中一组术语的概率散布,可以看做是“在语料库中共同呈现的术语的反复形式”。
  • 主题模型与基于规则的办法不同,它们运用正则表达式或许基于词典的关键词搜索技术。
  • 我们运用隐狄利克雷散布(Latent Dirichlet Allocation,LDA)停止主题建模。它是一种矩阵分解技术,是潜在语义索引(Latent Semantic Indexing,LSI)的概率版本,试图提取数据中的潜在要素,即“主题”。

AI 火线:隐狄利克雷散布,简称 LDA(Latent Dirichlet allocation),是一种主题模型,它可以将文档集中每篇文档的主题依照概率散布的方式给出。同时它是一种无监视学习算法,在训练时不需求手工标注的训练集,需求的仅仅是文档集以及指定主题的数量 k 即可。此外 LDA 的另一个优点则是,关于每一个主题均可找出一些词语来描绘它。LDA 首先由 Blei, David M.、吴恩达和 Jordan, Michael I 于 2003 年提出,目前在文本发掘范畴包括文本主题辨认、文本分类以及文本类似度计算方面都有使用。浅显来说,可以了解为:让计算机给人们揣测剖析网络上各篇文章辨别都写了些啥主题,且各篇文章中各个主题呈现的概率大小(主题散布)是啥。简而言之,就是依据给定的一篇文档,揣测其主题散布。

算法 2:基于页面的标题

浅析 eBay 联盟营销的上下文广告机制

该算法基于页面标题和副标题的词频。

  • 一旦网站被搜索(我们运用 HTML 标签 <div><p> 中的内容),经过移除停用词、特殊字符、标点符号、空格等来肃清站点内容,获取包括单词列表及其相关频率的文档。
  • 然后,我们只抓取页面的标题和副标题 ( <h1h6> ),只过滤名词 (双数和单数)、专有名词 (双数和单数)、外来词,以及标题和副标题上的基数词。
  • 然后,我们在实践页面内容上获取最罕见的三个标题 / 副标题,并将这三个关键字传递给搜索效劳。

5.  调用 eBay search API 来获取关键词——一旦为各网页提供了关键词,就会将其传递到我们的搜索效劳 API 中,以取得条目引荐。

示例

URL: http://mashable.com/2017/10/25/stranger-things-eleven-poster-netflix-art/#Mcar2m5NDiqh

浅析 eBay 联盟营销的上下文广告机制

算法 1 展现了《怪奇物语》(Stranger Things)的留念品,而算法 2 则展现了《怪奇物语》的魔王海报。这是由于算法 1 短少“海报”关键词,这正是本文要讨论的内容。

我们从用户的判别工具中选择了算法 2 和算法 1,并停止比拟,算法 2 的表现优于算法 1。

后果: 这个复杂而无效的算法在搜集少量网址的反应进程中,经过多轮人工判别,我们发现:

  • 触发关键字生成算法的心情算法可以预测页面的正确心情,高达 84%。
  • 与算法 1 相比,针对关键词的算法 2,及之后的 eBay 条目生成失掉了更高的反应分数(在人工判别工具中以 5 分为满分,则大于 3.5 分)。
  • 每个网址都有一个新的 eBay 类别预测算法,假如没有关键词生成算法的后果,则会运用这个算法。
  • 此外,营销数据迷信团队正努力于基于页面上显示的图像生成相似的 eBay 条目列表。另外,该团队正在为发布商页面上呈现的图像构建一个合理的撤回 eBay 条目清单机制。(即假如发布商页面上有平地的图片,那么在为图像出现 eBay 相关条目时,算法不应将这些图片作为种子图像。)
  • 一旦发生这些不同的定位方式,营销数据迷信团队方案树立一个机器学习模型,确定用户层面上如何呼应不同的定位方式(基于上下文相关的关键词、基于由发布商提供的关键词的图像、基于重定向)并依据拜访相反页面的不同客户来停止调整。

总之,假如发布商可以在其页面上提供与上下文相关的 eBay 条目,则无需执行任何操作,只需注册该顺序即可,我们最终会为发布商、买家、卖家和 eBay 提供一个有利的生态零碎。

原文链接: Contextual Advertising for eBay Affiliate Marketing
https://www.ebayinc.com/stories/blogs/tech/contextual-advertising-for-ebay-affiliate-marketing/