腾讯控股(00700.HK)

Arch Summit全球架构师峰会在深举办 腾讯安全披露广告黑灰产对抗思路

时间:19-07-15 13:07    来源:中国经济网

“我知道在广告上的投资有一半是无用的,但问题是我不知道是哪一半。”这句20年前的“名言”至今仍然是数字广告业的核心挑战。但一个差别是,20年前广告主担心广告投放是否辐射到了目标用户,20年后广告主的担心变成了看广告的是不是真正的“用户”。

7月12日,聚焦业界领先技术成果的Arch Summit 全球架构师峰会开幕,腾讯安全天御高级研究员邝展豪受邀演讲,揭开了制造虚假流量的广告业黑灰产“面纱”,并就如何构建基于对抗性训练的广告流量反作弊系统,分享了腾讯安全的实践经验。

腾讯安全天御高级研究员邝展豪演讲

全网虚假流量占比近四成,打击流量作弊面临四大痛点

流量作弊并不仅仅存在于某一个平台,在垂直媒体、广告联盟、门户资讯、视频网站,异常同样猖獗。

据《互联网广告异常流量2018年度报告》可知,虚假流量在上述四种媒体类型中的占比皆超过20%,在垂直类媒体的占比更是接近40%。海量的虚假流量不仅给广告主带来了巨大的金钱损失,也助长了网络黑灰产的恶劣发展态势。

据该报告统计,广告市场在2018年因虚假流量造成的损失约为260亿人民币。更令人担忧的是,行业中的黑灰产已经形成了一条完整的产业链,从刷量、账号销售,到工具软件开发,整个链路环环相扣,步步紧逼。

面对猖獗的作弊手法和完整的产业链,网络安全厂商各出奇招,试图识别和阻隔这些虚假流量。而经过多年的实践经验,腾讯安全发现在对抗虚假流量时,存在着四大痛点。

一是不够快。黑灰产具有发达完善的情报、监控体系和合理的软件架构,一旦有新的线上运营活动出现,就能快速制定相应的作弊方案进行刷量。而现存的反作弊系统反应不够及时,当面对新的刷量方式时,无法立刻处理而造成大量“漏杀”。

二是不灵活。目前黑灰产软件的架构已经能做到底层基础服务与上层应用剥离,这意味着黑灰产团伙只需修改上层运用,就可以衍生出不同的刷量方式。而反作弊系统需要从海量的流量数据中快速嗅探出新型的刷量方式,并在短时间内制定出相对应的反拦截策略和对抗模型。这对目前大部分的反作弊系统来说,挑战不可谓不大。

三是反馈难。在作弊场景中,当系统认定的虚假流量被拦截后,业务场景并不能直接反馈出这些流量是否被用户点击和查看、是否被误杀。尤其是在黑灰产使用真机模拟真人行为作假后,安全厂商无法凭借设备、环境维度识别这些虚假流量。这种行为性恶意刷量非常难被捕捉,而且其相关操作的标签无法准确地反馈给系统。

四是难解释。当系统认定的虚假流量被拦截后,业务场景需要黑灰产举证,以解释这次虚假流量。但因为情报的缺乏或数据的不确定性,有时提供一份完整的解释性很强的举证报告,需要耗费大量的资源。

用对抗反制流量作弊,腾讯安全助力广告业高效抵御黑灰产

综合分析了上述四大痛点后,腾讯安全也在大会上带来了打击广告黑灰产的秘诀――对抗。面对广告行业的巨大利益,黑灰产与反作弊系统的对抗只会越来越激烈,要想更准确打击黑灰产,就需要引入更有效的对抗方案。

针对黑灰产衍生攻击和黑灰产演变攻击,腾讯安全天御总结出了两种对抗性训练思路。在黑灰产衍生攻击时:天御流量反作弊对抗性学习系统通过结合机器学习模型和数据挖掘的能力,分析出伪装的虚假流量。具体来说,通过结合无监督学习和有监督学习,对海量样本进行检测,形成“样本-检测-反馈-学习”的完整闭环。而在每种虚假流量只存在少量样本的情况下,天御的少样本学习系统也能够快速学习立即识别。在样本极度缺乏的情况下,通过元学习能够快速学习样本特征并生成相应的对抗模型,从而识别新型虚假流量样本,提升识别能力。

在黑灰产演变攻击时:针对各类数据产生的行为序列问题,天御流量反作弊系统的3D Transformer network 使用深度学习方法不仅关联渠道之间的上下文信息,增强有用的特征、抑制无用的特征。同时,学习序列中的趋势、相关性等特征,利用众多特征作为决策因子去识别虚假流量。

创新性的研究正在成为腾讯安全助力广告主反制流量作弊的有效武器,腾讯安全天御流量反作弊系统融合天御全链路智慧业务安全引擎,以及近10年的黑灰产对抗经验,为广告业提供量身定制的流量风控服务:某公司使用了天御的流量反作弊系统后,过滤掉23.14%的虚假流量,整体活动TA浓度提升11.3%,获客成本得以大大降低。

除此之外,腾讯安全天御还在内容风控、金融风控等领域帮助政府、企业预防欺诈、识别风险,目前,腾讯安全天御已服务超15个行业的2000多个客户,为其业务正常开展保驾护航。