关键词: 互联网广告,搜索广告,机器学习
1 介绍
目前购物网站的最重要的广告是搜索广告。所谓搜索广告就是当购物者搜索某个商品(通过关键词以及其他搜索条件)时展示的广告。这种广告的一般流程是:广告商要推广其商品,比如某款运动鞋,他可能会在购物网站竞价购买关键词"耐克鞋"。竞价关键词模型是目前主流购物网站的搜索广告所采用的模型。这种模型的问题在于其不够精确,没有足够的数据支撑等问题(详细局限性参考节1.1)。
整个模型实现包括离线部分和在线部分。离线部分用于设定及训练广告商品相关性;在线部分则会在训练结果中获取相关商品。以下是模型架构示意图:
图1: 基于相关性的搜索广告模型实现架构
1.1两种类型广告的比较
上述传统的广告有很大的局限性:
用户在搜索关键词同时会有其他搜索条件,比如限定价格等。只是基于关键词的广告就可能不精确。例如,如果用户搜素价格在50美元以下的"耐克鞋",那么展示300美元以上的鞋的广告效率就很低;
广告商依靠一些直觉设定一些关键词,并没有数据支持,使得所选的关键词范围窄而且通常不是最优的。虽然购物网站提供关键词推荐,但是由于广告商精力有限,也不能很客观的分析数据,因而效率并不高;
广告商集中在一些热点关键词上,不仅不够精确,而且导致竞价过高;同时一些优质的长尾关键词以及细分搜索无人问津。
而新模型有以下改进:
因为锚定一些商品,而这些商品可能是在搜索某些条件才会出现,这样广告投放就更为精确, CTR更高;
由于不再追逐少量关键词,而是更广谱的相关商品,使得整个广告覆盖面更广,能容纳更多的广告,也使得各种细分的消费者能接触到更多相关广告;
广告商对于相关商品比关键词有更多经验,这便于他们更精确的投放广告;
由于相关商品有更精确的数据,因此可以采用机器学习,能大大节省广告商的精力同时能提高广告效率。
2系统框架
系统结构图可以参考图1,整个流程如下:
离线过程:
广告商对其需要推广的商品直接锚定某个或者某些商品,比如说可以为其某款运动鞋锚定某款"耐克鞋"或者一类运动鞋;
广告商可以把需要推广的商品提交给机器学习引擎,由机器学习引擎会通过学习相似商品数据库以及商品文本/元信息等决定这些商品相关的商品;
以上这些设定最后都存储在相关广告商品数据库中(后面会讨论相关广告商品数据库)。
在线过程:
1.用户输入关键词以及搜索条件;
2.搜索引擎根据关键词及搜索条件生成一个结果商品列表;
3.搜索引擎将这个列表传递给渲染引擎同时也传递给广告引擎;
4.广告引擎根据这个列表在相关广告商品数据库中获取相关的需要做广告的商品;
5.广告引擎经过计算,确定需要展示的广告,将广告也传递给渲染引擎;
6.渲染引擎综合搜索结果和广告,传递给用户。
其中,广告引擎在所有广告候选者中决定最后展示的广告算法较为复杂,除了广告商品相关度,竞价外还包括过去广告投放效果、用户的浏览与购买历史等,在实现上还有很多细节比如处理广告预算和投放时长等,因为这个超出本文范围,不在这里讨论。
3 相关广告商品数据库
4机器学习模型
机器学习引擎包含两部分,一部分是根据用户行为获得的商品相关性,比如用户浏览商品A的同时浏览甚至购买了商品B,这样商品A和商品B相关,这部分可以用在有较多用户行为的商品上; 对于一些较少用户行为的商品,比如新上市的商品(冷启动商品),或者希望拓展相关性的商品,我们可以根据商品文本、分类甚至图片等信息建立相关性。比如,利用word2vec基于文本及分类来拓展商品相关性等。
如果定量的说,就是任意商品和广告商品之间都有相关性(一般的,我们用距离表示):
参考文献
[1] Mikolov, Tomas; et al.
Efficient Estimation of Word Representations in Vector Space,
https://arxiv.org/abs/1301.3781
论文作者:姚宏
论文发表刊物:《科技新时代》2017年12期
论文发表时间:2018/1/29
标签:广告论文; 商品论文; 关键词论文; 相关性论文; 模型论文; 引擎论文; 广告商论文; 《科技新时代》2017年12期论文;