粉时代

科技公司越来越好,这群参与创造的人却在变成「工具」

粉时代

如果只是用供需这种单一标准去慰劳这些「困在系统里的人」,是否足够公平?

「人工智能会改变世界,那谁会改变人工智能?」这是 AI 科学家李飞飞的追问。15 年前的 AI 界,普遍信奉更好的算法就能带来更好的决策,但李飞飞意识到了这种思路的局限:即使是最好的算法,如果没有好的、能够反映真实世界的训练数据,也没办法用。于是,李飞飞着手构建大规模的标注良好的图片集 ImageNet。

从今天看,ImageNet 的革命性不言而喻。它的衍生赛事成了筛选算法竞赛中的奥林匹克,各大机构纷纷拿它作为练兵场,测试自家算法优劣。一时间,各种突破纷纷涌现。2012 年,Geoffrey Hinton 基于卷积神经网络的 AlexNet 拔得头筹,深度学习也因此腾飞。十几年来,它全程见证了深度学习在视觉领域的全面兴起。

计算机视觉是当前 AI 发展最好的一个方向,而 ImageNet 是这个领域里经典的数据集,不夸张地说,如果没有它,现在的面部识别都会是一种奢望。但它产生的更重大的意义,是让人们意识到构建优良数据集的工作是 AI 研究的核心,数据和算法一样至关重要。

最早期,ImageNet 需要有人手动查找、标记图像并将其添加到数据集中。李飞飞想雇用本科生,每小时付 10 美元,但经过计算,想到达到她预想的规模,本科生们不吃不喝得做数十年。最终,事情有了转机,她注意到了亚马逊众包平台 Mechanical Turk。在这个平台上,一些科研人员会发布一些琐碎任务,比如给图像加标签、鉴定色情照片等。每个能坐在电脑前的人都可以接活,完成后就能获得金钱回报。

就这样,来自 167 个国家的 49000 人次,花费两年半的时间完成了这项伟大的工程。可以说,ImageNet 因为众包才得以出生,但却鲜少人会关注那群同样参与创造的数据标注员。他们是真人,只不过平台把服务背后的人「抽象化」了,让人感觉这些任务是由计算机自动执行的。他们是真人,点击了无数次「图片里是否有皮艇」和「图片里是否有暹罗猫」。

今天,几乎每个筹备上市的公司都恨不得在招股书上写满「AI +」,产业「言必称人工智能」也就意味着人们对数据有着极大的渴望。数据标注员也因此扩展了好几个数量级。Mechanical Turk 现在稳定的活跃零工有 10 到 20 万,在人力成本低廉的地区,甚至形成了特色「数据标注村」。

但有点反直觉的是,这群「创造者」催生了 ImageNet,让它开启了深度学习乃至人工智能新的篇章,他们最后拿到的钱却低得可怜。最近,几所知名大学发表论文 The Limits of Global Inclusion in AI Development,揭示了一个现实:完成 ImageNet 的数据标注零工们,时薪中位数只有 2 美元左右,只有不到 4% 的标注员拿到了超过 7.25 美元的时薪。作为对比,现在美国一些地区的最低时薪都提高到了 15 美元。但因为这些兼职者不算员工,因此不受最低时薪法律保护。

他们拿着比最低时薪还低的钱,在无数次的点击中,完成了一场开天鸿蒙的革命。这群同样在为 AI 奠基的「隐形人」,应该得到更多人的重视。

有多少智能,就有多少人工

现代 AI 依赖各种算法处理规模达数百万的示例、图像或文本素材。但在此之前,首先需要由人工在图片数据集中手动标记出对象,再将标记完成的大量图像交付给算法以学习模式,掌握如何准确识别对象。

极客公园(ID: GeekPark)早前就记录过一位数据标注女工的工作:小雪正在把一张张快递单或家谱上的手写体上的字母标注出来,告诉机器 i 可以有多种写法。这样的工作并不简单。手写的 i 可能是顶上一点加上一竖,也可能是朝后弯的小勾,更潦草一点就和数字 9 一样……小雪的笔记本上密密麻麻地挤满了这些像字更像图的墨迹。她做的,是一种介于手写录入和图像标记之间的工作。同服务于智能驾驶的街景标记、服务于智能医疗的人体标记、服务于语音交互的声音标记一样,他们共同的行业学名叫做「人工智能数据标注」。

即便技术门槛低,但这份重复性极高的工作,对标注精度有着极高的要求,「95% 以上的准确率是理想情况。」如果用于训练模型的数据精度低于要求,那 AI 就会「指鹿为马」。

AI 行业对数据的渴求,催生出了一批数据标注众包平台,比如前面提到的亚马逊 Mechanical Turk,还有谷歌 Crowdsource,国内的京东众智、百度众测等。而在这个平台上兼职的人,也大多是打零工心态——利用闲暇时间赚点小钱。当然,他们也不全都能意识到自己经手的数据其实是一些科技企业赖以生存的核心资产。

比如,美国创业公司 Sama 专门为 AI 项目提供训练好的数据,其众包平台面向全球开放,上面大多是非洲和东南亚零工。数据显示,这些人平均每天只能赚到 8 美元(约 50 元人民币),而依靠标注好的数据,Sama 在 2019 年拿到的 A 轮融资就接近 1500 万美元,营收超过 1900 万美元,其客户包括谷歌、沃尔玛和福特。

2005 年就启动的 Mechanical Turk,创办初衷就是为了让更多零工参与进来,帮预算不多的科研机构识别海量 AI 无法归类的图片。但随着更多 AI 公司的涌入,零工和任务发布者的关系也在「恶化」。在这个平台上,任务发布者拥有至高无上的权力。他们不仅可以任意调整任务价格(最低至 1 美分),还能拒绝任何已经完成的任务成果,甚至是故意缩短任务建议完成时间,使其大幅低于实际完成时间,以吸引工作者并降低成本。

这类低薪隐形劳动,也走到了「线下」,在中国一些人力成本较低的地区,还发展出了「数据标注工厂」。目前的数据标注工厂,多集中在河北、河南、山东、山西等地区,这同以富士康为代表的传统人力密集企业的选址偏好重合度极高——以更低廉的劳动力成本支撑起聚集在首都的人工智能底层数据需求。

印度也有不少「数据标注村」,他们为欧美 AI 公司服务,Facebook 就曾将部分社交网络上内容标注的工作外包给了一家印度公司。

他们不是工具,是参与创造的人

一项研究显示,Mechanical Turk 上的零工的动机大多是「享受其中」,也有很多人表示是因为当地没有好的工作机会。乍看之下,双方的需求和兴趣互相吻合。但同样不可忽视的是,这类低技术门槛的工作,本质上并不能带来任何技能上的提升。零工们牺牲掉了自己的本可以拿来自我提升的机会成本。

尽管对于非洲和东南亚的工作者来说,8 美元的日薪可能足够维生,但这并不能改变其创造的价值被大大压缩的现实。对于 Sama 这样的公司来说,他们用极低成本拿到的数据,创造了千万美元级别的收益,但这些收益与其背后(一部分)真正的劳动者几乎毫无关系。

在这种境况里,数据标注员更像是价值链条里的「可消耗资源」,是被无尽压缩成一次性工具的角色,鲜有人关注他们个人的留存。

和数据标注员类似的,还有。他们受雇坐在电脑屏幕前,用审判的眼光看着互联网上的帖子。赤裸的色情、嘶鸣的枪响、血腥的暴力都直白地铺在他们的屏幕上,这些图片、视频是被互联网平台用户举报后聚集到审核队列里的。他们在和互联网的黑暗面贴身肉搏,做着算法还不能完全做到的事,就像社交网络中的「人肉盾牌」,网络审查员受到的精神伤害却很少有人关注。

这些审核员的薪水同样低廉。Facebook 正式员工的平均年薪是 24 万美元,但据 The Verge 前年的调查,替 Facebook 做平台审查的外包劳工薪水却只有前者收入的零头——工作时薪仅 15 美元(年薪 2.8 万美元)。

他们都在给「信息行业的富士康」打工,做的是被上层切分得异常细微的工作,这些工作简单、单调、重复,但在用人方看来,这种切分能最大程度保证准确度。但如果只将这群人困在一个异常狭小的工作空间里,那他们是没法脱离「工具」的角色成为「创造者」的。

Sama 也持一词,公司开出的日薪是 9 美元,他们表示希望借此帮助那些日薪低于 2 美元的零工。「我们不会提供可能破坏当地劳动市场的薪酬水平。如果我们给出的薪酬过高,就会给整个社会带来麻烦。比如,可能会对我们员工所生活的社区的住房成本、还有食物成本等带来潜在负面影响。」公司 CEO Leila Janah 说道。

市场供需需要考量,但人的成长也需要被重视。前提是用人方真正把他们当成「人」而非只是「工具」看待。论文提到,解决这个问题的潜在方案是,让更多人参与到 AI 研究的核心环节,尤其是 AI 模型和项目的研发、实现和部署,从而在欠发达国家培养和锻炼更多本土 AI 人才,之后再鼓励他们谋求管理岗位,或者支持其创业。相比之下,做再多数据收集和标注这样的工作,也无法提升他们的能力。

科技越好,他们越没有价值

如果说数据是原油,那数据标注员,这些挖掘数据、标记条目的矿工们,这些在价值链条最前端的创造者,是不该被遗忘的。这群人在帮助 AI 不断成长,但最终他们就并没有真正帮助到自己。越来越好的科技,可能会让他们越来越没有价值。

先抛开微薄的收入,更讽刺的是,这些零工可能会被他们一手训练出来的 AI 歧视。零工们大多来自非洲和亚洲,有色人种居多。但在 AI 训练中,输入的数据却往往是倾向西方语境。这些数据主要来自于西方语境,并带有人类社会的刻板印象,由此得来的模型无法对不同于西方文化的人和物体做出准确判断,还会产生类似人类的性别或种族偏见。

那篇论文的最大意义,就在于让更多人看到那些「困在系统里的人」。这些没有上升空间的零工,乍一看和平台方的需求相吻合,但不知不觉中,前者成为被盘剥的角色。这群人就像外卖员、快递员一样。成长空间狭小,在算法和平台的支配下,这些劳动者都被挤压得喘不过气。

科技公司在享受着 AI 给他们带来的巨大红利的同时,却让这群人成了不可见的「幽灵工作者」。如果只是用供需这种单一标准去慰劳这些「困在系统里的人」,是否足够公平,这是我们都需要思考的。

18 世纪,一架国际象棋机器(The Turk)在欧洲巡回比赛,还曾打败过富兰克林和拿破仑。这台机器曾被誉为人工智能的伟大壮举,但是后来人们发现它根本不是机器,而是一个机械木偶,被藏在棋盘下方的人类象棋高手控制着。有意思的是,21 世纪,亚马逊运营起了机械版 Turk——Mechanical Turk。

改革并非一朝一夕之事,但我们要先看到那些藏在「棋盘」底下的辅助人工智能的人。