Appen Gears在Interspeech 2017年的大量存在

2017年8月16日

我们很兴奋地宣布菲尔•霍尔，语言资源部门的高级VP和卢卡Rognoni2018年8月20日至24日在瑞典斯德哥尔摩大学举行的Interspeech 2017大会上，语言产品经理将介绍语音识别、发言者比较和普什图语语音数据的研究。这样Iskra博士欧洲的商业发展副总裁Appen VP将参加演讲科技（YFRSW）高级小组的年轻女性研究人员，在那里她将谈到自己作为演讲界的妇女的研究和经验。

我们也很高兴能够在Interspeech展出，并且很乐意与您见面，讨论您当前的业务计划。请到4号展位来看看最新款的Appen t恤吧!

摘要
演讲
星期一，8月21日，下午12:20 |Aula Magna.
人机英语会话电话语音识别
作者:George Saon, Gakuto Kurata, Tom Sercu, Kartik Audhkhasi，
Samuel Thomas, Dimitrios Dimitriadis, Xiaodong Cui, Bhuvana
Ramabhadran, Michael Picheny, Lynn-Li Lim, Bergul Roomi, Phil Hall

在交换台会话语料库中，自动语音识别的错误率在几年前还是14%，现在已经下降到8.0%，然后是6.6%，最近是5.8%，现在被认为与人类的表现相当。这就引出了两个问题:人类的表现是什么?我们还能将语音识别错误率降低到什么程度?在尝试评估人类性能时，我们在Hub5 2000评估的Switchboard和CallHome子集上执行了一组独立的测量，并发现人类的准确性可能比之前报道的要好得多，这给社区一个明显更难实现的目标。

小组会议
星期二，8月22日，上午10:00 - 下午12:00 |大厅B3
“法证与调查科发言人比较”
应用第三
小组成员:
•Jean-François Bonastre, LIA，阿维尼翁大学，法国
Joseph P. Campbell，麻省理工学院林肯实验室，美国
•Anders Eriksson，斯德哥尔摩大学，瑞典
•迈克尔·杰伦，BKA（联邦刑事警察局），德国
•Reva Schwartz，美国国家标准与技术研究所
•菲尔大厅，Appen，SR.VP - 语言资源部门，澳大利亚

这次特别活动的目的是就法医和调查应用的发言者比较问题进行几次有组织的讨论，许多国际专家将提出他们的观点并参与自由交换意见。在说话人比较中，说话样本由人和/或机器进行比较，用于调查或在法庭上解决法律系统感兴趣的问题。演讲者比较是一个高风险的应用，它可以改变人们的生活，它需要科学提供的最好的东西;然而，方法、过程和实践千差万别。这些变化不一定是更好的，虽然认识到，一般不欣赏和采取行动。以科学为基础的方法、过程和实践对发言者比较的适当应用(和不应用)与各种国际调查和法医应用至关重要。此次活动是继2015年和2016年成功举办的Interspeech特别活动之后举行的。

纸的动作演示
8月22日，星期二，下午2:50 | C6房间
“普通语调模式”
作者:
•Appen Luca Rognoni，语言产品经理
•朱迪思·毕晓普(Judith Bishop)， Appen语言服务总监
•Appen高级语言项目经理Miriam Corris

分析包含自发对话的手动标记的普什语音数据集，以提出普什图文的宗旨。总结了语言中观察到的基本语调模式。简要介绍了对数据集中的每个单词注释的音高重音与演讲（POS）的一部分之间的关系。结果与波斯语中的宗教文学进行比较，更好地描述和与密切相关的语言进行比较。结果表明，Pashto语调模式类似于波斯语，以及反映常见的语调模式，例如陈述语句和WH的下降音调，是/否以上升的基调结束的问题。数据还表明，普什图语中最常用的语调模式是所谓的帽子模式。间距重音的分布在波斯语和普通普通中是非常自由的，但与内容具有比以功能字的典型词语更强大的音调口音关联，正如压力重音语言的典型版本。焦点的语音实现似乎用与波斯语中的相同的声学线索传达，具有更高的俯仰偏移和焦点单词的强调音节的持续时间更长。数据还表明，粉碎后焦点压缩（PFC）存在于Pashto中。

其他你可能喜欢的博客文章

所有博客文章

现成的数据集

机器学习平台之旅

Appen Gears在Interspeech 2017年的大量存在

其他你可能喜欢的博客文章

博客

博客

博客