与儿童合作:帮助机器理解儿童语言

推特
推特
LinkedIn
分享
脸谱网
fb-share-icon

如果你家里有移动设备、平板电脑、智能家居系统或任何使用自动语音识别的设备,你可能已经经历过这样的情况:这个软件对爸爸妈妈来说很好用,但对孩子就不太好用了。为什么?因为在训练机器理解儿童语言的过程中存在一些细微差别,但这些差别并不总是被很好地理解。

部分原因是,儿童和成人说话的方式非常不同——并不是所有的语音识别设备都能很好地处理这个问题。

儿童语言与成人语言有何不同?
从表面上看,我们都很熟悉孩子们说话的独特方式。让一个成年人说“婴儿话”,他们会给你最好的印象,这个声音是高音,元音发音不正确,辅音混和,可能还有一些虚构的单词或想象的语法。但在其核心,这些关于儿童说话方式的直观观察反映了机器在处理儿童说话时的许多实际问题。

尖锐的声音
从纯生物学的角度来看,儿童的声道不如成人发达。成年女性的声道比成年男性短,这导致女性的声音更高,而年轻人群的声道也更短。儿童的声带(通常称为声带)也比成年男性和女性的声带短。

结果显示,儿童发出的声音的基本频率平均超过300Hz,而成年女性和成年男性的基本频率分别为210Hz和125Hz。语音识别设备经过训练,可以接收到较低频率的声音,但往往会错过孩子说的话。

学习说话
人类的声道是复杂的,学习使用它需要时间。某些声音需要发音器官非常精确的位置(活跃的发音器官如舌头、嘴唇、牙齿等相对于被动的发音器官如上颚和牙槽嵴),这是幼儿尚未掌握的。

这导致“直升机”等词语的发音错误“hewwicopter”,虽然不可否认可爱,会导致混乱的语音识别软件训练一组发音等同于一组单词的词典,它不会承认,替换特定的声音。

作为缺乏经验的演讲者,孩子们也更容易口吃,重复自己的话,或者在句子中间改变方向;所有自动语音识别在解析输入时都会遇到困难。

单词游戏
学习说话的一部分就是实验和玩文字游戏,这是孩子们做得特别好的事情。除了把“hospital”(医院)说成“hospital”这样的复杂单词发错音,孩子们还会在单词层面和句子层面玩文字游戏。

还在熟悉英语形态和屈折变化过程的小孩子可能会把bring的过去式说成brunged,而不是brought,或者把sheep的复数形式说成sheepses。他们可能会因为找不到更好的词而编造新词,比如把带回家的“外卖”(takeaway)换成“take-home”(带回家),甚至只是为了好玩才发明新词!

在很多情况下,这一切都是为了好玩——对孩子来说,语音识别设备和其他任何玩具一样,他们往往会试验和玩它,只是为了看看它下一步会做什么。

动作可以帮助
正如我们在之前的博文中提到的,当语音识别出错时在美国,一切都与数据有关。拥有正确的数据,确保你的系统经过训练,能够应对儿童语言的挑战,这是开发出适合家庭每个成员(无论多小)的语音识别设备的关键。在Appen,我们有收集自发和脚本儿童语言的经验。我们还与熟悉儿童语言的誊写员一起工作,并利用我们的拼写标准化知识来创建尽可能准确的数据。联系我们谈谈你的需求,以及我们能帮上什么忙。

网站部署人工智能与世界级的训练数据bob体育手机下载
语言