AI背后的临时工:谷歌如何训练AI识别视频质量?

雷锋网按:我们都关注人工智能有多厉害,它们可以在围棋、德州扑克和人脸识别上战胜人类,但人工智能变得聪明,背后是海量数据的支撑,而且这些数据是需要标注的。因而随着人工智能的繁荣,从事数据标注的人也越来越多。Wired的这篇文章就介绍了谷歌如何雇佣人工标注YouTube视频来训练AI。本文由雷锋网编译。

目前,Google 的“广告质量评估员”已广泛存在于全国各地。这些临时雇员通常由外部机构代为聘请,其工作即是为 YouTube 视频过滤暴力、敏感广告信息。这一工作目前单凭电脑本身尚无法完成,Google现在也似乎迫切需要这些人的帮助。

YouTube 每天都会出售数百万条视频广告,广告播出位置会由系统自动分配,所以广告商往往不知道自己的广告具体会在哪条视频后播放。最近,这种“不确定性”令 Google 大为头疼,公司甚至因此受到相关方的审查。

Google 方面则一直积极解释,以防止舆论扩大化。在他们看来,媒体其实夸大了视频广告问题,目前已标记的视频数尚未达总数的千分之一,Google 首席营销官 Philipp Schindler 也表示这个问题根本不足为训。

由于 Google 超过90 %的收入都来源于广告,因此他们也需要快速解决问题来防止广告商撤位。但是,YouTube 每天都有近60万小时的新视频上传量,如此巨大的数量使得采用人工过滤很困难,软件所要处理完成的标记量可谓“前所未有”。但问题是,公司仍然需要投入人力进行 AI 训练。因此,Google 仍然依赖于人工完成广告标记工作,以此构建好AI学习所需的数据。

评估员任务

技术公司会长期雇用内容管理员,这项工作也随着人们上传和分享量的增加而变得越来越重要。有广告评估员说,他们的角色不仅仅在于监控视频,他们会阅读评论,标记用户之间的滥用行为;会检查 Google提供的各种网站,确保符合公司标准;也会按类别进行网站分类,点击广告链接查看状态正常与否。

具体而言,某些情况下评估员们需要在不到两分钟内查看几小时长的影片,这就意味着这份工作更强调数量和速度。此外,他们也不仅只是将视频简单标记为不合适——从标题到内容,他们都需要进行细致的评估并进行分类。存在评估内容与既定已有类别不匹配的情况时,他们会将材料标记为“不可评估类”。

也多名广告评估员说,公司要求他们观看内容震撼的视频,比如有人试图在车上杀自己的狗——视频中的人放火烧了自己的车,然后走出来以一枪结束了自己的生命。此外,还有人会看暴力侵害妇女儿童和动物的视频。其实评价员们并不知道 Google 是如何进行视频任务选取与下达的- 他们只有在开始工作的才能看到视频的标题和缩略图。

总而言之,Google 仍然需要人力来协助处理 YouTube 的广告问题。公司高管和代表们也一再强调,只有机器智能才能解决 YouTube 中的规模化任务问题,但是在 Google 机器或其他任何人都能够自觉识别不宜言论之前,这样的工作仍然需要依赖人去完成。

Google 发言人 Chi Hea Cho 说:“我们一直将技术与人类评论结合进行综合分析已被标记的内容,因为对于视频的理解是很主观的。最近我们也增加人力加快评估速度,这些评论有助于我们完善算法很有帮助。”

评估员来源

据悉,广告质量评估员这一工作开始于 2004年。雇佣机构的始祖是ABE,他们会付给大家每小时 20 美元的薪水,但是 2006 年 WorkForceLogic 收购了 ABE 之后,评估员工作条件就不如从前了。2012 年,一家名为 ZeroChaos 的公司收购 WorkForceLogic,如今则采取合同制方式进行人员雇佣。

广告评估员可以随时随地工作,满足每周 10 小时的最低工作要求即可。只是这项工作不是那么稳定,虽然大多数人都蛮喜欢这份工作,但他们几乎没有机会成为永久的全职员工。

本次调查的广告评估员都是通过 ZeroChaos 聘用的,大家每小时赚取 15 美元,每周最多可以工作 29 个小时。如果每周工作时长达到 25 个小时,则可申请福利,但是想达到这个工作量可以说相当困难。有人说他们会面临毫无预兆就被解雇的情况,公司一封电子邮件,你们的劳务关系就终止了。