尽管大多数Siri要求都是很普通的,但他们仍然会听到的色情化的语音,以及种族歧视或恐同性言论。

苹果表示,只有不到0.2%的Siri请求需要进行人类分析。前任经理将合同工的指控视为夸张。曾带领开发团队的Siri联合创始人Tom Gruber说:“实际上,我们要处理的很多都是噪音,并不是说机器打算录制某些声音,这只是某种意义上的概率问题。”

到2019年,苹果将Siri引入其无线耳机和HomePod扬声器等产品后,每月需要处理150亿条语音命令。0.2%意味着每月,人类合同工需要处理3000万条语音命令,一年下来就会是3.6亿条。Siri团队的前首席研究科学家Mike Bastian说,随机录制的风险随着用例的增加也在不断增长。他提到了Apple Watch的“抬起激活”功能,该功能在检测到佩戴者的手腕被抬起时会自动激活Siri。他说:“这就导致假阳性率很高。”

2016年,亚马逊创建了Frequent Utterance Database(FUD),以帮助Alexa为常见请求添加答案。与FUD合作的前员工表示,渴望更积极挖掘数据的产品团队与负责保护用户信息的安全团队之间存在紧张关系。2017年,亚马逊推出了配备摄像头的Echo Look,该产品被称为AI造型师,可以推荐服装搭配。知情人士说,它的开发者考虑将相机编程为在用户要求Alexa讲笑话时自动开机。他们的想法是录制用户面部的视频并评估用户是否在笑。这些人说,亚马逊最终搁置了这个想法。该公司表示,Alexa目前没有使用面部识别技术。

该公司已在世界各地设立了转录“农场”。今年,它举行了多次面向海外转录员的入门招聘活动。一位花了数十年时间为科技公司开发识别系统的语音技术专家说,最近的招聘规模暗示亚马逊音频数据分析的规模令人震惊。亚马逊表示,它“认真对待客户及其录音的安全性”,并且需要全面了解区域性口音和口语化才能使Alexa走向全球。

微软在今年8月承认,它使用人类帮助审查通过语音识别技术生成的语音数据。宝马、惠普和Humana等企业正在将这一技术集成到自己的产品和服务中。包括阿里巴巴、搜索巨头百度和手机制造商小米在内的中国科技公司每个季度都在收集数百万个智能音箱的语音数据。