Appen的AI项目范围和不同的全球承包商网络确保了公平和公平的AI项目的无偏见AI数据
旧金山 - 2021年4月29日 - Appen Limited(ASX:APX),为按比例构建有效的AI系统的组织的高质量培训数据的领先提供商,正在使组织能够通过范围来启动,更新和操作bob体育手机下载无偏见的AI模型项目与伙伴关系。支持公司的支持bob外围怎么样全球人群of data annotation specialists that’s more than a million strong, Appen has developed diverse training data sets for AI models, particularly natural language processing (NLP) initiatives to ensure end users receive the same experience, no matter their language variety, dialect, ethnolect, accent, race or gender.
基于偏见或不完整数据的AI项目不适用于每个人。根据A.PNA发布的报告2020年3月(国家科学院的诉讼程序),流行的自动演讲识别(ASR)用于虚拟助手,封闭式字幕,无人机计算等等,表现出显着的种族差异。该报告的结论是,需要更多多样化的训练数据集来减少这些性能差异,并确保语音识别技bob体育手机下载术是包容性的。语言解释和自然语言处理(NLP)系统遭受相同的挑战,需要相同的解决方案。
“培训数据的质量和多样性直接影响AI模型中的表现和偏见”,Abob体育手机下载ppen Ceo Mark Brayan表示。“作为数据伙伴,我们可以为许多用例提供完整的培训数据,以确保AI模型为每个人都为工作。bob体育手机下载重要的是,我们从事不同的个人群体来生产,标签和验证数据,以确保培训的模型不仅是公平的,而且也是负责任的。“
Appen语言项目范围
Appen通过各种项目和伙伴关系展示其为每个人创建AI的承诺,专注于语言和方言的多样性。
- 没有边界的翻译人员(TWB)合伙- Appen与TWB,Amazon,Carnegie Mellon University,Facebook,Google,John Hopkins大学,微软和翻译加入了Covid-19的翻译计划(Tico-19)支持语言技术的开发,使Covid-19尽可能多的语言提供的信息,包括刚果斯瓦希里语,Tigrinya和尼日利亚人等发展中国家的语言。
- 这Inuktitut翻译项目- 与Nunavut政府合作,Microsoft在加拿大北极地区北美的土着语言中添加了Inuktitut,使用Appen Services向Microsoft Transporator发布到Microsoft Transporator。
- 这加拿大法国翻译项目- Appen与母语顾问协调,以帮助Microsoft将“Canadian French”添加为Microsoft Translator中的语言选项。
- 非洲裔美国白话英语(AAVE)离职数据集- 在ASR,搜索引擎,语音助理bob体育手机下载和情感分析中使用的大多数现有培训数据集不是AAVE的代表。为了使高质量的AAVE数据可用,Appen正在与Ave AnsaIn扬声器一起使用的注释器中的扬声器,以基于关于广泛主题的对话来收集OTS数据集的数据。
“偏见的AI数据导致项目无法提供他们应该受益的预期业务结果和伤害个人的项目,”Apen AI专家高级主任Judith Bishop博士说。“AI项目的规模和复杂性使大多数公司无法获得足够的无偏见的高质量数据,而不与AI数据专家合作。Appen对开发最多样化和专家的数据注释器的承诺为该行业提供了一个明显差异化的建设公平和道德AI项目的资源。“
Appen是多样性的主要方法
Appen依赖于来自170多个国bob体育手机下载家的培训数据注释器。语言表示包括235个独特的语言和395方言。多年来,Appen群体的注释已经包括超过30,000个流利的三语演讲者 - 这是一个真正的经证,对多样性和专业知识。
Appen也提供离心(OTS)数据集旨在使企业更容易,更快地获取他们需要加速其AI和机器学习项目所需的高质量培训数据。bob体育手机下载DOTS数据集可用于80种语言和多种方言,包括难以获取的语言,如阿拉伯语,克罗地亚语,希腊语,匈牙利语,泰国等多个品种。
根据这一点联合国经济与社会事务部“世界上大约97%的人口的97%只有其[7000]语言的4%”。4%只有280种语言 - 然而,AI核心技术服务的良好的语言数量是该数字的一小部分。Appen旨在通过这些和未来的项目帮助增加该号码。
关于Appen Limited.
Appen收集和标签用于构建和不断改善世界上最具创新性的人工智能系统的映像,文本,语音,音频和视频。With expertise in more than 235 languages, a global crowd of over 1 million skilled contractors, and the industry’s most advanced AI-assisted data annotation platform, Appen solutions provide the quality, security, and speed required by leaders in technology, automotive, financial services, retail, manufacturing, and governments worldwide. Founded in 1996, Appen has customers and offices around the world.