为先进语言技术提供燃料

推特
推特
LinkedIn
分享
脸谱网
fb-share-icon

我与马克Brayan在最近访问洛杉矶期间,他说:他总结了Appen在先进语言技术中的地位,比如搜索,语音识别自然语言解释(NLI)和翻译为建立和改进这种技术提供了“燃料”。

这句话打动了我。

机器学习技术在许多这些先进的语言技术中使用。当然,它们是依赖于数据的统计方法。并向更先进的模型,如深层神经网络驱动对不断增加的数据量的需求。

利用机器学习开发和改进语音识别需要用语音的文本标记数据。使用机器学习的NLI开发需要用户意图标记的数据。这两种方法都需要高质量的数据;“垃圾输入,垃圾输出”这句老话显然适用。Appen使用熟练的转录员和标签员,由经验丰富的质量控制人员检查,并指导如何始终一致地处理困难的案例。

此外,高级技术通常需要的不仅仅是原始数据。例如,可以通过纠正经常拼写错误的搜索词来改进搜索技术(对于网站或特定网站)。(试图获得足够的数据来有效地“了解”这些拼写错误的术语是等价的,效果要差得多。)Appen开发语言资源等数据库。

你不能在没有原始资源的情况下创造燃料,而Appen的成功之一就是开发人力资源来帮助数据收集的过程。他们可以接触到许多能够支持数据收集和清理任务的承包商。长期的经验导致了有效支持这个过程的过程和软件。在其21年的历史中,该公司为一系列科技公司、汽车制造商bob外围怎么样和政府提供数据和服务,以帮助它们建立和改进其自然语言技术。

随着机器学习和类似的“认知计算”技术随着云服务的普及而日益普及,阻止企业使用这些强大技术的往往不是核心技术。公司经常发现他们的原始数据没有标记,有质量问题,或者仅仅是使用这些云资源的格式不正确。Appen将这种原始资源提炼为“燃料”。

生物:
William Meisel博士是TMA的同事,以及Lui新闻编辑(每月通讯的语言用户界面的商业应用程序),组织者会话交流会议他在2013年出版了一本书软件协会,以及语音和自然语言技术的成熟所创造的市场和产品机会的顾问。他在语音技术方面的经验包括创立并经营一家语音识别公司。bob外围怎么样他的职业生涯始于南加州大学电气工程和计算机科学教授,并出版了第一本关于机器学习的书。

使用世界级的训练数据部署人工智能的网站bob体育手机下载
语言