如何A/B测试响应式搜索广告:分步提示 | 南京·未迟 | Google 出海体验中心

如何A\/B测试响应式搜索广告:分步提示

希望优化效果的广告商长期以来一直使用 A/B 测试来改进他们的广告。众所周知,加大型文字广告 (ETA) 是如何实现这一点的。

但最近,谷歌宣布将取消预计到达时间,从 2022 年 7 月 1 日起,使响应式搜索广告 (RSA) 成为主要文字广告格式。

是时候重新审视我们的广告测试最佳实践了。

什么是 A/B 广告测试?

即使是没有明确广告测试目标的新手 PPC 广告商也可能已经利用向广告组添加多个广告的功能进行了大量的 A/B 广告测试。

这样做是为了让 Google 能够更频繁地展示表现更好的内容。

毕竟,优化轮播是广告轮播的默认设置。

截图来自 Google,2021 年 12 月Google Ads 的广告轮播设置

更先进的广告商通常选择无限期轮换广告的选项,并使用自己的方法来选择赢家和输家。广告主关注的不是点击率,而是转化率。

但仅仅关注转化率会忽略这样一种可能性:高转化率的广告可能会因为点击率低而获得很少的点击次数,从而导致广告商的总转化次数较少。

通过将点击率和转化率合并为一个称为每次展示转化次数(点击率 * 转化率 = 转化/印象)的指标,广告商可以更好地衡量哪个广告最能满足其目标之一(即最大化转化次数)。

在以下示例中,您可以看到 RSA 和 ETA 之间的传统 A/B 测试。

根据 Optmyzr 最近的 RSA 研究(披露:我的公司)的效果数据,与同一广告组中的 ETA 相比,RSA 的平均点击率高 10%,但转化率低 20%。

结合这两个指标,在将展示转化为转化方面,RSA 比 ETA 差 12%。

图片由作者提供,2021 年 12 月比较 RSA 与 ETA 的点击率

这一发现有助于解释为什么一些广告商仍然犹豫是否要全力投入 RSA:按照传统的 A/B 衡量标准,他们的表现似乎更差。

为什么传统的 A/B 测试方法不适用于 RSA

但就像仅凭转化率无法完整描绘出哪个广告效果最好一样,当将 RSA 添加到组合中时,Conv/imp 也无法提供完整的画面。

问题就在这里。RSA 比 ETA 有资格获得更多展示次数。根据我们的研究,RSA 在获得良好的广告评级方面表现得非常好,以至于它们可以显示大约 4 倍的查询。

在其他条件相同的情况下,RSA 获得的展示次数是 ETA 的 4 倍。

RSA 广告获得的展示次数比 ETA 多得多,因为它们针对更多查询获得更好的广告评级。

图片由作者提供,2021 年 12 月ETA 与 RSA 展示次数

“每个广告的展示次数”指标是通过将特定广告类型的展示次数除以该类型的广告数量来计算的。

在研究中,我们分别分析了仅包含 RSA 的广告组、仅包含 ETA 的广告组以及同时包含两种广告类型的广告组。

上表中的数字基于包含这两种广告格式的超过 157,000 个广告组。即使我们查看仅具有一种广告格式的广告组,具有 RSA 的广告组的每个广告组的展示次数也是仅具有 ETA 的广告组的两倍多。

因此,我们以前的假设是,RSA 和 ETA 仅根据广告组中的目标关键字来竞争同一印象池,这是错误的。

由于 RSA 获得的展示次数比 ETA 多得多,即使每次展示转化次数指标的性能稍差,它们仍然更有可能带来更多转化。

RSA A/B 测试必须在分析中包含印象

当 RSA 成为组合的一部分时,确定获胜广告的更准确方法是将展示次数纳入分析中,如下图所示。

图片由作者提供,2021 年 12 月RSA 与带有印象数据的 ETA

包括 RSA 在内的任何 A/B 广告测试都应包含展示数据,以便能够增量测量。

如前所述,与 ETA 相比,RSA 的每次展示率转化率低 12%。我们保守地增加了 RSA 两倍的展示次数,从而使转化次数增加了 76%。

因此,如果您关心获得大量转换,RSA 是真正的赢家。

将 A/B 广告测试从 ETA 转移到 RSA 时,包含展示量至关重要,这样才能了解 RSA 的真正增量。

旁注:转化通常不是广告商的真正目标,因为利润也很重要。由于现在越来越多的广告客户使用自动出价,本文不会介绍如何确保这些额外的转化能够盈利。

这应该通过设置正确的目标并将正确的转化数据输入广告平台来自动处理。

即使您仅对预计到达时间进行 A/B 测试,也要考虑印象。从历史上看,这更多是因为我们希望确保我们正在比较的任何广告都有平等的机会来证明自己。

如果一个广告比另一个广告新得多,它的展示次数就会少得多,从而使测试无效。或者,如果一个广告仅在周末投放,而在其他工作日投放,则展示量也会存在类似的差异,从而导致测试无效。

现在,即使两个 RSA 在同一天运行并且活跃时间相同,它们仍然可能会产生展示次数差异,因为其中一个在获得更多拍卖资格方面比另一个更好。

请务必在所有评估中考虑展示量。

现在我们已经建立了一种更好的方法来衡量结果,让我们看看一些方法,以找到在创建新的广告变体以挑战现有广告时要测试的内容。

广告强度表明您是否遵循最佳实践

当您编写新的 RSA 时,Google 会立即以广告强度指标的形式提供反馈。

广告强度是一项最佳实践得分,可在 RSA 投放之前衡量响应式搜索广告内容的相关性、数量和多样性。

根据 Google 的演示,广告强度每增加一次,点击次数就会增加约 3%。

因此,从“差”到“平均”应该会导致点击量增加约 3%,而从“平均”到“好”则点击量会再增加 3%。

截图来自 Google,2021 年 12 月RSA 的广告强度

广告强度是最佳实践指标,仅应在创建新 RSA 时依赖。但关键的一点是,这是“最佳实践”分数,与实​​际表现无关。

正如使用低质量得分关键字可能会为您的帐户带来有价值的转化一样,您也可以使用广告效果不佳的广告来击败其他得分较高的广告。

尝试遵循 Google 的指南,以便您以最大的获胜机会开始下一次测试。

但不要陷入试图获得满分的困境。实际绩效将反映在您的资产绩效分组标签中,因此接下来让我们看一下这些标签。

资产绩效标签反映您的绩效

一旦您的 RSA 在过去 30 天内在搜索页面顶部积累了大约 5,000 次展示,资产标签就会为您提供指导,告诉您哪些文本表现良好以及哪些文本应该考虑优化。

Google 发布了一个有用的表格,说明了不同性能分组标签的含义:

截图来自 Google,2021 年 12 月资产绩效评级

最重要的是替换带有“低”标签的所有资源,并替换两周以上没有获得任何展示次数的资源。

请记住,您在此资产报告中看到的内容基于实际绩效。基于此进行优化比广告强度得分更重要。

测试想法

许多广告在 30 天的时间内不会积累足够的顶级展示次数来显示效果数据,但如果您遇到这种情况,仍然可以通过一些方法进行优化。

请记住,Google 允许每个广告组最多三个 RSA,并且允许将特定文本片段固定到广告中的各个位置。

这样,您就可以构建一些有用的实验。

截图来自 Google,2021 年 12 月固定 RSA 的不同选项

广告商现在可以将多个资产固定到 RSA 广告中的单个位置。

第一个尝试的实验是基于消息传递。

创建多个 RSA,每个 RSA 具有不同的核心消息。任何广告(无论是 RSA 还是 ETA)的关键信息元素都包括公司名称、独特的价值主张和号召性用语。

价值主张和号召性用语是最好的尝试,因为你的品牌就是你的品牌,对于大多数广告商来说,没有太多的发挥创意的空间。

例如,第一个 RSA 可能更关注您的网站提供的大量选择,而第二个 RSA 可能更关注另一个价值主张,例如过去客户对您的网站的评价有多高。

然后,当您使用 A/B 测试流程时,您会发现哪些消息更能引起共鸣以及哪些会带来更多转化。

第二个实验采用效果良好的消息并在不同位置对其进行测试。

您可以通过将一组资产固定到不同的位置(例如特定的标题或描述)来实现此目的。

Google 现在允许将多个资产固定到一个位置,因此即使您的价值主张有 4 个资产,您也会将所有 4 个资产固定到所需位置。现在,当您运行 A/B 测试时,您可能会发现价值主张在固定到标题 2 位置时效果最佳。

图片由作者提供,2021 年 12 月RSA实验思路

固定

是否固定是 RSA 中最大的争论之一。ETA 取消后,您只能从 2022 年 7 月 1 日开始创建 RSA,广告商可以将一段文本固定到每个位置,以有效地将 RSA 转换为 ETA。

但这可能违背了 RSA 的全部目的,即让机器帮助动态地为每个用户构建最佳的广告,从而使广告更具相关性,从而有资格出现在更多搜索中。

有些行业的固定是法律要求。但除此之外,这里还对固定以及是否有助于(或损害)性能进行了分析。

图片由作者提供,2021 年 12 月固定对 RSA 的影响

固定最终是关于广告商的控制。数据向我们表明,当广告商让算法在不干扰的情况下完成任务时,机器会实现最佳的点击率。在这种情况下,CPC 和 CPA 也较低。

但是,当广告商想要控制时,他们最好为机器的每个固定位置提供至少 2 种文本变体。

将单段文本固定到某个位置对点击率、每次点击费用和每次转化费用的负面影响最大。

固定多个资产似乎可以提供控制和性能的良好平衡。

标题变化

广告强度指标会考虑您为标题和广告描述提供的变体数量。由于提出 15 个标题可能令人畏惧,因此我们分析了是否真的值得为每个 RSA 添加多个标题。

图片由作者提供,2021 年 12 月基于标题的每个广告的转化次数

我们发现,标题变化越多的广告带来的每个广告的转化次数越高。因此,在对 RSA 进行 A/B 测试时,头条新闻确实越多越好。

结论

如果您只记得这篇文章中的一件事,那就是有关广告测试的基本假设必须改变。现在,展示次数也很大程度上取决于广告,而不再仅仅取决于广告组的关键字。

在对 RSA 广告进行 A/B 测试时,考虑到展示次数的潜在差异并尝试找到可带来最大增量的广告至关重要。

随着时间的推移,我们预计 Google 将为 RSA 资产引入更多指标,这将帮助所有广告商进一步利用本文介绍的优化技术。


Scroll to Top

联系我们

=