炼数成金 门户 商业智能 人工智能 查看内容

人工智能背后的劳工:AmazonMechanical Turk

2017-11-25 13:27| 发布者: 炼数成金_小数| 查看: 21031| 评论: 0|来自: MBH群体智能
摘要: 深度学习和人工智能的不断崛起,让科学界看到了一切事物智能化的可能性。但是目前完成机器的智能化训练,仍然需依靠数量庞大的数据。谷歌开源的Google Open ImageDatasets,Youtube-8M中的标记视频……这些按规则分 ...
管理 工具 机器学习 人工智能 微软
深度学习人工智能的不断崛起,让科学界看到了一切事物智能化的可能性。但是目前完成机器的智能化训练,仍然需依靠数量庞大的数据。谷歌开源的Google Open ImageDatasets,Youtube-8M中的标记视频……这些按规则分类的数据集是无法单纯由设备完成的,只有人的智慧,才可以区分每一个细微的差别,每一个波动的偏差。

那么这些海量的数据由谁来标定?
亚马逊劳务众包平台“Amazon MechanicalTurk”,正是解决这个问题的存在。

他们的工作是训练人工智能系统,就像AI版的富士康流水线工人。

亚马逊劳务众包平台(AMT)源于2005年,搭建的初衷仅仅是为了解决内需——管理库存,将图片和产品分类,翻译文本,将语音或者图片转录成文本,检查拼写错误,验证地理位置,对产品进行评论,让公司能够追踪查看的属于广告的哪一部分……随着时间的推进,平台不断发展,渐渐对外开放。时至今日,AMT注册用户量累计过50万,并将这种众包式的数据标定工作发展成为一个崭新的行业。这些注册用户虽然来自全球各地,但75%都属于美国;他们将自己称作Turker,日复一日重复着相同的事情——无需走出家门,但却可以养活整个家庭。

Turker的工作很简单,在平台领取零星的劳务单,完成以获得相应的酬劳。

一个Turker清晨醒来的第一件事,是打开电脑,登陆AMT平台。他们需要等待电脑提示音响起,因为这个提示音代表平台任务的发布。这份工作的不确定性很多,任务发布的时间永远是未知的。有Turker表示:下一单任务也许会在凌晨3点发布,但早上9点肯定是没活的。

有些人会给自己的手机和电脑设置提醒。如果一份工作在凌晨三点发布,他们也会起床完成。

他们需要以此生活。

AMT的每月活跃的Turker在15 000至20 000人之间。有些人每天工作几分钟,有些人每天工作24小时。

全球大部分Turker出生于80年代到90年代之间。在美国,大多数Turker为女性;而在印度,Turker则多为男性。

Turker的收入会因人而异。有些人每天工作4~5小时,两个月可以赚到700美元,有些人工作8小时却只能赚到25美元。超过一半的Turker是时薪都没有达到美国联邦较低7.25美元的标准。

亚马逊系统有一套自己的评级标准,他们会给一些特定的人员评级。当雇主发布劳务需求时,系统会自动将任务优先分配给“大师级”的用户,而这些用户获得的酬劳也会更高。但如果你不属于这个等级,你的酬劳会少,被分配到任务的机会也一样少很多。

而亚马逊的评级标准,一直未对外界公开。

AMT的酬劳存在极大的不公平性。在美国和印度的Turkers可以拿到现金支付的薪水,而其他国家的用户只能通过亚马逊礼品卡获取报酬。这些获取到礼品卡的用户,以兑换比特币的形式,获取到现金酬劳,但是在兑换的过程中,多少都会有一些折损。

这种通过实例训练机器的方法被称为监督式学习,而应用到的被标记的数据则出自Turkers这样的在线劳工。

智能系统的普及扩大了人工智能的应用范围。这些人工智能系统被利用来处理各类复杂的事情,也许是判断移动路径,也许是理解语音,也许是娱乐下棋……然而这些系统的训练过程需要数十万甚至数百万的数据。ImageNet作为最早的图片数据集目前拥有超过1400万被分类的图片,而这些大部分由AMT上50 000名用户耗时两年完成。

现在,数据的需求量日益提升。这就意味着,要把大量的数据分配给大量的人,才能保证任务的完成。
很多知名的科技公司会雇佣大量人力来完成这样细碎的任务,用以支撑机器学习。亚马逊,苹果,谷歌,微软等等,他们要么拥有自己的劳务众包平台,要么使用第三方服务。AMT则为较大的劳务众包平台之一。

有的公司会通过内部的微型任务发布系统完成大量基础工作,比如微软的UHRS,谷歌的EWOK。UHRS主要是用来为微软的必应搜索以及其他产品服务,每个月需要统筹750万项任务。UHRS和AMT非常相似,多数用在需要众包的工作不在AMT覆盖的范围,或者任务内容比较敏感需要保密的时候。

对比第三方平台AMT,UHRS让微软更具灵活性。微软会利用人工智能自动识别众包人群的优势和弱点,比如专业知识的水平,这反过来可以帮助微软判定哪个工人的结果更可靠。
 
点击式互联网劳务可以追溯至90年代末和20世纪初互联网泡沫的年代。

2001年,亚马逊为了寻求高效的方式管理商店产品,申请了人机混合系统专利。4年之后,亚马逊正式发布AMT平台,对接巨大的在线人力。然而出乎意料的是,这个平台吸引了众多公司的青睐,从零售,到网站,在AMT平台发布任务解决了他们的人力问题,同时也节约了成本。到2015年,平均每天有1278个雇主在AMT平台发布任务。没有人知道发布任务的人是谁,因为雇主通常会使用假名。因此,只有发布者为Turker做评价,Turker却不能为雇主打分。

据统计,AMT和CrowdFlower两大众包平台2013年的收入总额大约为1亿2千万美元,占据在线众包劳务市场5%到10%的份额。 

很多手工劳动也许会被自动化取代,但未来会是人类和人工智能共同合作。因此工作机会并不会减少。
随着机器学习应用到越来越多的领域,将会有越来越多的数据需要被标记。人工智能系统将会使用人工主导、监督学习和无监督学习的混合训练方法。在这个环节中,对人力的需求将会长期存在。

然而,在线劳务众包平台以及人们能够大量在家使用互联网的方式,将重塑世界上的工作。过去的全职工作,可以被分解成为由不同时区、不同地点的人,可以全天候完成的任务。这类微型任务在未来也许会成为一种常见的工作。

欢迎加入本站公开兴趣群
商业智能与数据分析群
兴趣范围包括各种让数据产生价值的办法,实际应用案例分享与讨论,分析工具,ETL工具,数据仓库,数据挖掘工具,报表系统等全方位知识
QQ群:81035754

鲜花

握手

雷人

路过

鸡蛋

相关阅读

最新评论

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

  GMT+8, 2017-12-17 20:02 , Processed in 0.271620 second(s), 26 queries .