来自Appen的新的现成(OTS)数据集加速AI部署

高质量的数据集包括脚本语音,具有文本,身体运动和人类音频的图像

悉尼和旧金山 - 2月25日,2021年Appen Limited.(ASX:APX)是在规模上建立有效的AI系统的组织的高质量培训数据的领先提供商,今天宣布了新的bob体育手机下载离心(OTS)数据集。这些数据集旨在使企业更轻松,更快地获得加速其人工智能(AI)和机器学习(ML)项目所需的高质量培训数据。bob体育手机下载新的OTS数据集包括人体运动和创新的婴儿哭泣声音,以及具有适合光学字符识别(OCR)的文本的脚本语音和图像,用于高厘姆,但难以获得的语言,例如阿拉伯语,克罗地亚语,希腊语,匈牙利语,泰国等。通过扩展的数据集,Appen的总ETS产品包括超过250个数据集,包括超过11,000小时的音频,超过25,000个图像,超过80种语言和多个方言。

Appen的OTS数据集是一个快速、低成本的工具,可以用一致的高质量训练数据快速启动AI或ML项目。bob体育手机下载扩展AI能力的团队还可以利用OTS数据集有效地提高准确性,开发新的模型技能,并将其他改进纳入他们的AI模型中。例如,一个OTS数据集通常在一周内交付,而一个新的数据集集合和注释项目需要8到12周——甚至更长,这取决于复杂性。所有Appen数据集都采用完全透明、可选择的方法开发,因此人工智能专家可以确保他们的数据是干净和合规的,消除了潜在的负面影响和声誉损害风险。

Appen首席技术官Wilson Pang表示:“全球各地的人工智能团队从事的项目工期紧迫、数据需求灵活,可以从使用现成的数据集中获益。”与传统方法相比,OTS数据集缩短了获取价值的时间,并以更低的总成本提供了对高质量数据的访问。我们Appen采取了必要的措施,以确保所有数据集的来源符合道德和人口均衡,使企业能够通过最小化模型中的偏见,并确保对数据注释者的公平对待,保持负责任的人工智能实践。你总是知道OTS数据集的精确质量,这有助于构建在现实世界中工作的更好的AI。”

MediaInterface已经向德国和欧洲其他地区提供了语言技术解决方案,以超过20年。bob平台app下载当公司正在扩展到法bob外围怎么样国时,它具有完全本地化的软件,但缺乏法国词典数据,尤其是法国名称和地点,通常在患者健康信息中引用。使用Appen OTS数据集,MediaInterface收购大约21,000个法国名字和14,000个地名。MediaInterface产品经理伊内斯·温德勒(Ines Wendler)表示:“来自Appen的关键数据已经被纳入我们的背景词汇中,以成功地在新市场推出产品,这有助于我们为客户建立新的词汇,并加强我们在未来市场推出时的策略。”

最经验丰富的AI专家将DOT数据集与按需数据收集和注释项目相结合,以满足其复杂的AI模型培训数据需求。bob体育手机下载Appen是通过一系列特定数据收集服务提供持续支持的领导者,例如正在进行的数据注释和智能标签,通过AI供电的工具和自动化工作流程来最大限度地提高效率。

“We interact with AI from the moment we wake up to the moment we go to bed – through virtual assistants, chatbots, search engines, social networks, medical devices, smart cars and other applications,” said Judith Bishop, Appen’s senior director of AI specialists, who leads a team of 100 AI linguists and language experts. “Language is often the primary interface for many of these compelling AI use cases, so to guarantee a great experience, the model needs to be trained to work for everyone. Appen’s commitment to high-quality data and responsible, ethical AI development allows companies purchasing our off-the-shelf datasets to accelerate their AI projects with complete confidence in their data.”

加入现有的数百个数据集www.foremanmotors.com,现在可用的Appen OTS新数据集列表包括:

  • 为阿拉伯语(埃及),阿拉伯语(沙特阿拉伯),阿拉伯语(阿拉伯联合酋长国),中央高棉语(柬埔寨),克罗地亚语,希腊语,匈牙利语,波兰语,西班牙语(西班牙)和土耳其语脚本演讲
  • 图像OCR简体中文印刷文本,泰国印刷文本和芬兰印刷文本
    • 包括预先录制的广告牌,外包装,标志,杂志和菜单,用于培训和更新计算机视觉OCR模型
  • 人体运动(中国)
    • 包括注释视频的人移动,跟踪像素级,适合游戏开发,健身应用程序和更多
  • 婴儿哭音频(中国)
    • 包括预先录制和注释的婴儿声音,可用于培训AI模型以识别不同的哭声和警报父母

可用性

有关更多信息和请求Appen OTS数据集示例,请访问//www.foremanmotors.com/off-the-shelf-datasets/

关于Appen Limited.

Appen收集和标签图像,文本,语音,音频,视频和其他数据,用于构建和不断改进世界上最具创新性的人工智能系统。我们的专业知识包括,拥有超过100万多个熟练承包商的全球人群,在超过70,000个地点和170个国家,以及业界最先进的AI辅助数据注释平台。我们可靠的培训数据为技术,bob体育手机下载汽车,金融服务,零售,医疗保健和政府提供了可信度,可以部署世界级AI产品的信心。bob网页版Appen成立于1996年,拥有全球客户和办事处。

使用世界级的训练数据部署人工智能的网站bob体育手机下载
语言