Appen引领行业创造适合所有人的人工智能

Appen的人工智能项目范围和多样化的全球承包商网络确保公平公正的人工智能项目获得公正的人工智能数据

旧金山- 2021年4月29日- Appen Limited (ASX:APX)是为大规模构建有效人工智能系统的组织提供高质量培训数据的领先供应商,通过一系列项目和伙伴关系,组织能够启动、更bob体育手机下载新和运行公正的人工智能模型。在公司的支持下bob外围怎么样全球观众of data annotation specialists that’s more than a million strong, Appen has developed diverse training data sets for AI models, particularly natural language processing (NLP) initiatives to ensure end users receive the same experience, no matter their language variety, dialect, ethnolect, accent, race or gender.

基于偏见或不完整数据的AI项目不适用于每个人。据A.美国国家科学院院刊发表的一份报告在2020年3月的《美国国家科学院院刊》(Proceedings of the National Academy of Sciences)中,用于虚拟助理、封闭字幕、免提计算等的流行自动语音识别(ASR)系统在性能上表现出了显著的种族差异。该报告总结说,需要更多样化的训练数据集来减少这些性能差异,并确保语音识别技术的bob体育手机下载包容性。语言解释和自然语言处理(NLP)系统面临着相同的挑战,需要相同的解决方案。

“培训数据的质量和多样性直接影响AI模型的表现和偏见,”Apbob体育手机下载pen首席执行官马克·布雷安(Mark Brayan)说。“作为数据合作伙伴,我们可以为许多用例提供完整的培训数据,以确保人工智能模型适用于每个bob体育手机下载人。至关重要的是,我们要让不同的个体群体参与生产、标记和验证数据,以确保所培训的模型不仅是公平的,而且是负责任的。”

Appen语言项目的范围

Appen展示了其为通过各种项目和伙伴关系为每个人创建AI的承诺,专注于语言和方言的多样性。

  • 无国界翻译(TWB)伙伴关系- Appen,与TWB,Amazon,Carnegie Mellon University,Facebook,谷歌,John Hopkins大学,微软和翻译加入了2019冠状病毒病翻译行动该组织支持语言技术的发展,以尽可能多的语言提供COVID-19信息,包括发展中国家的语言,如刚果的斯瓦希里语、Tigrinya和尼日利亚的Fulfulde。
  • Inuktitut翻译项目-与Nunavut的政府合作,微软使用Appen服务,在微软翻译器中增加了Inuktitut(加拿大北极地区使用的北美土著语言)。
  • 加拿大法语翻译项目- Appen与母语顾问协调,以帮助Microsoft将“Canadian French”添加为Microsoft Translator中的语言选项。
  • 非裔美国人方言英语(AAVE)现成数据集-现有ASR、搜索引擎、语音助手bob体育手机下载和情感分析中使用的训练数据集大多不能代表AAVE。为了提供高质量的AAVE数据,Appen正与AAVE讲话者合作,在众多注释者中为OTS数据集收集基于广泛主题对话的数据。

“有偏见的人工智能数据会导致项目无法实现预期的业务结果,并伤害本应受益的个人,”Appen人工智能专家高级总监朱迪思·毕晓普博士(Judith Bishop)说。“人工智能项目的规模和复杂性使得大多数公司不可能在不与人工智能数据专家合作的情况下获得足够公正的高质量数据。Appen致力于开发最多样化和最专业的数据注释者群体,为行业提供了一个明显不同的资源,以构建公平和道德的人工智能项目。”

Appen的领先多元化方法

Appen依赖于来自170多个国bob体育手机下载家的培训数据注释器。语言表示包括235个独特的语言和395方言。多年来,Appen群体的注释已经包括超过30,000个流利的三语演讲者 - 对多样性和专业知识的真实证明。

Appen也提供现成的(OTS)数据集旨在使企业更轻松,更快地获取他们需要加速其AI和机器学习项目所需的高质量培训数据。bob体育手机下载DOTS数据集可用于80种语言和多种方言,包括难以获得的语言,如阿拉伯语,克罗地亚语,希腊语,匈牙利语,泰国等多种品种。

根据这一点联合国经济与社会事务部,“大约97%的世界人口的人口仅仅是其[7000]语言的4%”。4%只有280种语言 - 然而,AI核心技术服务的良好的语言数量是该数字的一小部分。Appen旨在通过这些和未来的项目增加增加该号码。

对有限的动作

Appen收集和标签图像,文本,语音,音频和视频,用于构建和不断改进世界上最具创新性的人工智能系统。With expertise in more than 235 languages, a global crowd of over 1 million skilled contractors, and the industry’s most advanced AI-assisted data annotation platform, Appen solutions provide the quality, security, and speed required by leaders in technology, automotive, financial services, retail, manufacturing, and governments worldwide. Founded in 1996, Appen has customers and offices around the world.

网站与世界级培训数据部署AIbob体育手机下载