人类语音数据的搜寻

推特
推特
LinkedIn
分享
脸谱网
fb-share-icon

随着声控设备每周的发布,人们可能会认为我们在语音识别技术的使用上正达到一个临界点。然而,彭博社最近的一篇文章认为虽然语音识别在近年来取得了很大的进步,但采取的方法在语音数据采集阻碍了这项技术达到一个临界点,即它将取代目前大多数消费者与设备的交互方式。消费者已经热情地接受了声控设备的概念,但实际体验还有改进的空间。是什么阻碍了这项技术的发展?

更多数据=更好的性能

根据作者的说法,要提高设备更好地理解用户并与用户交流的能力,需要的是tb级的数据人类语言数据代表多种语言、口音和方言,以加深设备的会话理解能力。

语音引擎的最新进展是一种人工智能的结果神经网络在没有精确编程的情况下,可以随着时间学习和改变。这些软件系统以人脑为模型,可以训练自己理解人类世界,在数据量增加时表现得更好。百度的首席科学家Andrew Ng表示,“我们在系统中插入的数据越多,它的性能就越好。这就是为什么演讲是一种资本密集型的活动;没有多少机构有这么多数据。”

包括亚马逊、苹果、百度和微软在内的科技巨头正在全球范围内竞相收集自然语言数据,以提高准确性。来自加州森尼维尔百度人工智能实验室的亚当·科茨表示,“我们的目标是将错误率降低到1%。只有这样,你才能真正相信设备能够理解你在说什么,而这将是革命性的。”

这些公司怎样才能缩放他们的数据采集在确保人类语音数据准确捕捉人类语言细微差别的同时,以一种成本效益高的方式?

这是关于数量和质量

虽然数据的数量很重要,但质量对于优化也很关键机器学习算法。在这个上下文中,“质量”包括数据与用例的匹配程度。例如,如果一个语音识别引擎正在开发用于汽车,为了获得最佳结果,需要在汽车中收集数据,并考虑到引擎可能“听到”的所有典型背景噪声。

虽然我们很容易使用现成的数据,并尝试使用特别的方法收集数据,从长远来看,为最终用途专门收集数据更为有效。

这一原则也适用于构建全球语音识别产品。人类语言数据细致入微、带有口音,而且充满文化偏见。数据收集必须以多种语言、地域、地点和口音进行,以减少错误率和提高性能。

合作伙伴的动作

在Appen,我们继续在自然语言处理和会话理解的发展中发挥关键作用,在过去的20年里,我们与全球顶级技术公司合作,为当今市场上领先的虚拟助手创建语音和自然语言接口。我们有多年的语言数据收集经验,在广泛的环境中,从工作室到户外,使用各种模式。

联系我们在这里讨论您的具体数据收集需求,以及我们如何帮助您实现您的目标。

使用世界级培训数据部署AI的网站bob体育手机下载
语言