智能扬声器制造商可能会记录用户以改善隐私费用的自然语言处理
自然语言处理现在是一个非常热门的话题,因为它允许机器学习算法分析大量数据,以便随着时间的推移改善语音功能和对语音命令的响应。对于机器人来说,识别并能够解释为自然语言并非易事。例如,有很多方法可以提出问题,以及人类言语中的大量不同的口音,声音和其他变量。这就是为什么目前在与语音识别,自然语言识别和自然语言生成相关的领域中需要克服的障碍。后者指的是计算机能够用语音响应命令,该语音将是可理解的并且与最终用户询问的查询相关。它还可以意味着大声朗读文本,用语音或朗读想法来总结报告。然而,这通常需要自然语言理解。
今天提供语音识别和语音响应的基于消费者的语音机器人系统以三种主要消费产品的形式出现:Apple的Siri,Amazon Alexa和Google Assistant(微软最近重新定位的Cortana作为对其他人的免费服务)。这三家公司中的每一家 - 亚马逊,谷歌和苹果 - 都提供自己的智能扬声器以及用户可以通过语音回复的其他产品。它们由机器学习算法提供支持,并不断收集用户数据以改进其基础技术。
收集用户语音数据和与用户如何以各种方式提问的方式相关的数据是改善语音机器人整体服务和自然语言处理的一种方法。我最近遇到了一篇文章,提到了这些公司正在做这件事的一些方法。
根据Buzzfeed News发表的一篇文章,源自彭博社的报道,亚马逊实际上有一个专门的员工团队,至少可以收听Echo用户正在进行的部分对话。Echo记录了它听到的各种语音的部分内容,并将其发送回亚马逊进行进一步分析。然而,这引起争议的原因在于它并不像苹果和谷歌那样匿名。它知道客户,并且知道发往亚马逊的数据来自他们。
洪水民意调查:PLU对青年投票率的投资
“七人被描述为曾在亚马逊的语音评论计划中工作,他告诉彭博社,他们有时每班听多达1,000个录音,录音与客户的名字,设备的序列号和帐号有关。 ,“ 根据这篇文章。
其他员工进一步向Buzzfeed News澄清,只有少量录音被注释。如果这些用户的隐私受到侵犯,这仍然会引发一个问题,因为谁知道确切记录了什么以及何时被记录?例如,在亚马逊总部的员工正在聆听,这可能是我想象的私人时刻。谁真的知道?
对此的正面反应是,由于Alexa存在并记录事件发生,可以阻止或阻止犯罪。此外,如果在Echo附近发生的犯罪期间说出了他们的姓名或其他可识别信息,则可以更容易地识别和逮捕嫌疑人。事实上,Echo已经看到一些潜在的警方调查要么使用它,要么试图用它作为证据来定罪嫌犯。
例如,去年年底,据报道,新罕布什尔州的一名法官已经下令释放Alexa录音,这是在Echo的存在下发生的双重谋杀案件。
像许多技术一样,可以用于良好的东西也可以用于坏事。网络犯罪分子也可以利用扬声器和语音技术。虽然大多数录音或全部录音应该保存在公司服务器而不是实际的扬声器本身,能够实时窥探用户的声音或通过这些设备进行通话,我的图像可能会对最终用户产生负面影响。想象一下公司会议与敏感信息共享,亚马逊员工正在聆听此事,或者在更糟糕的情况下,实际的网络罪犯。
要记住的另一件事是智能扬声器通常连接到智能家居或所有家用电器和各种安全系统的概念由语音控制。因此,如果黑客可以欺骗说话者他们的声音是所有者之一,那么黑客可能会破坏住宅或商业的整个周边。Techworld报告提到了一些与语音助理和智能扬声器有关的问题,特别是与智能家居同步的问题,如果没有正确的保护措施,可能会出现这些问题。
根据Techworld的说法,“黑客只需要一个简短的音频样本来合成或重放人类的声音,足以诱骗人们和安全系统。”另一个危险是公司可以利用人们的声音来个性化广告。
一个好的迹象是,根据亚马逊的设备支持常见问题页面,该公司不会记录和分析其Alexa兼容设备或其Echo扬声器中发生的所有语音。事实上,只有某些词才能触发Alexa可能开始录音。以下是FAQ描述的方式:
Alexa是否记录了我的所有谈话?
否。默认情况下,Echo设备仅用于检测您选择的唤醒字(Alexa,亚马逊,计算机或Echo)。该设备通过识别与唤醒字匹配的声学模式来检测唤醒字。除非设备检测到唤醒字(或按下按钮激活Alexa),否则不会将音频存储或发送到云端。使用Alexa Guard,您还可以配置支持的Echo设备以检测特定声音,例如烟雾报警声,一氧化碳报警和玻璃破碎。
此外,常见问题解答解释说,当录制内容发送到云时会出现可视指示符 - 尽管我不确定这是否与亚马逊在自己的服务器上分析语音或者它在谈论什么云(用户的云帐户)相同或整个云,包括远程服务器上的任何数据存储?)。无论哪种方式,语音识别和智能扬声器都会存在,并且可能加速自然语言处理的整体发展,尽管以牺牲隐私为代价。
标签: