全球技术公司扩展到具有增强语音系统的新市场

基于我们在语言、转录和语音识别系统方面的全球行业声誉,这家科技公司向我们寻求帮助。

该公司bob外围怎么样

一家领先的跨国技术公司与我们合作,帮助开发一种自动语音识别(ASR)系bob外围怎么样统,从一开始就专门为儿童应用而设计。

所面临的挑战

你可能不会惊讶于大多数语音识别系统都是为成人设计的。到目前为止,儿童语言的细微差别和特质很少被构建到儿童使用的语音驱动应用程序中,这使得他们无法成功地处理与年轻观众的互动。

对于一家领先的跨国科技公司,这是需要解决的精确情况。bob外围怎么样该业务发现,其最初由成人语音数据培训的演讲识别系统没有考虑到儿童如何发言的所有差异,使其在为儿童设计的应用中使用。

儿童说话的音调通常更高,时间和频谱的变异性更大——不规则、犹豫和发音错误(例如“呃”、“um”和“fwoggy”而不是“froggy”)。

解决方案

该公司通bob外围怎么样过以下方法解决了这一缺口建立一个新的自动语音识别系统专为北美英语而设计,专为儿童应用而设计。

基于我们在语言、转录和语音识别系统方面的全球行业声誉,这家科技公司向我们寻求帮助。客户团队首先要求新项目的指导,然后有助于收集和转录各种人口统计数据的理想儿童语音数据范围。ASR的主要目的是与教育技术应用一起使用。我们通过其高技能语言学家的团队提供帮助和指导,该语言学家开发了针对目标教育相关的讲话需求的脚本。这包括适当的数字,关键词,短语和短语句子。

整个项目范围包括:

  • 招聘和使用400名儿童扬声器
  • 目标是要求的人口统计截面:50%白人,40%非洲裔美国人,10%拉丁裔
  • 数据收集转录
  • 让以美国英语为母语的人讲一系列方言,包括东北、中西部、南方和西部

结果

通过与我们的合作,这家跨国技术公司实现了专门针对儿童语言的ASR的目标——在预期的时间框架和预算范围内。bob外围怎么样

我们成功地收集和记录了105个小时的音频——总共6万句话——这帮助客户设计、建造和交付了将其推向市场所需的ASR。

该公司已bob外围怎么样经能够将声学模型内置到其新的ASR中,并将其应用到一系列专门为儿童设计的北美英语教育娱乐平台和应用程序中。

我们对这个项目的主要建议之一是关注哪个年龄组。客户最初认为,数据收集应该集中在4- 9岁儿童,以最好地满足其在寓教于乐空间的需求。然而,我们的语言学家建议,将重点放在4- 7岁和8- 14岁这两个年龄段,再加上其他人口需求,将确保最佳覆盖率,事实证明这是正确的。

我们也能够在相对较短的时间内为项目招募大量参与者。我们引入了一个附带的“家庭和朋友”网络,包括学校和bob外围怎么样教会团体,以帮助招募有兴趣、愿意让孩子参与该项目的家长。这意味着家长们对我们为收集数据而招募未成年人的尊重和沟通过程感到满意,帮助项目取得了更成功和无缝的最终结果。

最后,我们证明了其在与儿童合作以进行转录目的的经验,这有助于确保在所需的时间范围内更容易的结果。录制儿童,特别是4至9岁的孩子,可能是一个棘手的前景。通过部署用于与儿童合作的主管,使用图像与文本结合使用图像,并保持录音会话简短但高效,我们确保为其全球技术客户提供了成功的交付。

使用世界级培训数据部署AI的网站bob体育手机下载