机器学习算法竞赛实战-计算广告

机器学习算法竞赛实战-计算广告

第12章 计算广告

什么是计算广告

计算广告是指借助大数据的分析建模,使得广告能够覆盖广泛区域和实现消费者的多跨度精准曝光,让同一份广告尽可能接触到更多有效的流量和更多对广告感兴趣的人,从而用同样低的成本,让广告的效果尽可能更好,使产品和服务获得更多商业上的成功。

主要问题

如何协调广告主、平台和消费者三方之间的利益

计算广告系统架构

在线投放引擎:

  • 广告检索:Web端发来广告请求时,系统根据该广告位的页面标签或者用户标签从广告索引中查找符合条件的广告。
  • 广告排序:当出现多个广告主抢夺一个广告位的情况时,需要对投放各个广告可能会产生的效益分别进行预估,对广告进行排序

分布式计算平台:

  • 行为定向:挖掘广告投放日志中的用户行为属性
  • 点击率建模:在分布式计算平台上训练并得到点击率模型的参数和相应特征,用以辅助广告投放系统进行决策

流式计算平台:

  • 实时受众定向:将最近一段短时间内发生的用户行为和广告投放日志及时地加工成实时用户标签,用以辅助广告检索模块。
  • 实时点击反馈:实时反馈用户行为和广告投放日志的变化,主要生成实时点击率相关特征,用以辅助广告检索模块。

广告类型

合约广告:包括CPT广告和定向广告。CPT广告指的是按照时间成本计算,广告主以固定的价格买断一段时间内的广告位来展示自己的广告;定向广告指的是广告主选择自己要投放的兴趣标签,然后算法为其匹配相应的受众人群并进行广告投放。

竞价广告:采用“价高者得”的方案来决策每次展示哪个广告,使得媒体主可以实时对不同广告进行比价,从而最大化收益。

程序化交易广告:广告主可以实时地在每一次广告展示中选择自己的目标受众,并且参与竞价。

广告召回

根据用户或商品属性以及页面上下文属性从广告索引中检索符合投放条件的候选广告。

广告召回模块

布尔表达式召回:根据广告主设置的定向标签组合成布尔表达式。

向量检索召回:通过传统的Word2Vec方式获取广告的向量表示,然后通过相似度计算对受众人群进行召回;或者通过深度学习模型获取广告的向量表示。

基于TDM(深度树匹配模型)的召回:基于深度学习的大规模推荐系统算法框架。

目前的找回策略大多是多路召回与权重检索相结合。

DSSM语义召回

为用户侧特征和广告侧特征构建不同的塔,在经过多层全连接后,计算相似度并进行广告检索。

广泛应用于搜索、推荐等领域的召回和排序问题中。

广告排序

对广告召回模块送来的广告候选集计算值,并按照所得值的大小倒排序。

点击率预估:向用户投放一个广告,然后预测用户点击广告的概率

特征处理:特征交叉组合、连续值特征的处理、点击率平滑、向量化表示

常见模型:

  • FM:隐向量学习提升模型表达
  • Wide&Deep:记忆性与泛化性的信息互补
  • DeepFM:在FM基础上引入神经网络隐式高阶交叉信息
  • DIN:融合Attention机制的深度学习模型

广告竞价

在广告竞拍机制中,广告的实际曝光量取决于广告的流量覆盖大小和在竞争广告中的相对竞争力水平,其中前者取决于广告的人群定向(匹配对应特征的用户数量)、广告素材尺寸(匹配的广告位)以及投放时段、预算等设置项;影响后者的因素主要有出价、广告质量、以及对用户体验的控制策略等。

第13章 实战案例

第14章 实战案例


机器学习算法竞赛实战-计算广告
https://zhangzhao219.github.io/2022/09/28/UCAS/machine-learning/machine-learning-competition-advertisement/
作者
Zhang Zhao
发布于
2022年9月28日
许可协议