数据资源中心


为世界级AI应用程序的团队创建和策划



图片

现成的数据集



我们的高质量授权数据集,以启动您的人工智能项目

我们提供了一个广泛的“现成”数据集目录,拥有超过250个可用数据集,包括超过11,000小时的音频,超过25,000个图像,超过80种语言和多种方言超过870万字。我们的废弃货架数据集旨在有效提高精度,整体性能,并以特定的AI计划需要在规模上快速提供高质量数据集。在我们的产品中,您将在多种数据类型中找到数据集,包括图像,视频,语音,音频和文本。我们正在不断构建新数据集,以满足我们的全球客户群的需求。


了解更多


图片 图片 图片




图片

开源的公共数据集


从我们的数据科学家为您的AL项目策划建议


机器学习和人工智能应用需要大量的数据进行训练。您可以从我们推荐的资源中搜索可访问、修改、重用和共享的开放数据集。使用这些公开可用的数据集来影响AI和ML应用程序的开发,或者如果您想要一个简单的数据集来对一个解决方案进行基准测试,或者在处理一个真实的数据集之前比较不同的算法。对于访问组织范围之外的数据,这些开放数据集是一个很好的选择。


数据集查找器



图片
使用Kaggle查找数据集,浏览和构建模型,并与其他数据科学家和机器学习工程师一起使用。探索并分析来自骨骼X射线的一切超过50,000个公共数据集的集合,从拳击回合产生。
了解更多
图片
通过一个可搜索的界面,探索加州大学欧文分校机器学习知识库的500多个数据集。数据集涵盖许多主题,大小不一,从少数案例(或“实例”)到超过4300万个,从只有1或2个变量(或“属性”)到超过100万个变量。
了解更多


计算机视觉



计算机视觉通过模拟人类视觉系统的复杂性,使计算机能够以与人类相同的方式识别和处理图像和视频中的物体。在图像应用程序中利用机器学习,如使自动驾驶汽车能够了解周围环境、面部识别应用程序、增强现实和混合现实或在医疗保健领域通过x射线和MRI扫描发现症状的自动化任务。使用丰富的计算机视觉数据集建立一个健壮的计算机视觉模型。


图片
使用1000+高质量开放数据集加速AI开发。从50多个应用场景、30多个注释类型和10多个数据格式中进行选择。
了解更多
图片
这些数据集包括各种各样的主题,从识别物体到重建3D房间,从在视频中找到一个人到在照片中识别一件衬衫。数据集可以按发布日期或主题排序,用户可以用关键字搜索,以定位适合他们需要的图像。
了解更多
图片
使用这些打开的数据集来构建面部识别应用,虚拟现实小工具,感官检测,全息成像等等。
了解更多
图片
超过3000个机器学习数据集。通过任务和方式查找数据集,比较随时间的使用量,浏览基准测试等等。
了解更多
图片
用于计算机视觉机器学习模型的开源数据集跨各种领域 - 动物,棋盘游戏,自动驾驶汽车,医学,热图像,空中无人机图像,甚至综合生成的数据。您可以以任何格式自由下载图像和注释:VOC XML,COCO JSON,YOLOV3平面文本文件,甚至是TFRecords。
了解更多


演讲全集



录制和转录新的语音语料库以创建声学模型和火车语音识别发动机可能是耗时和昂贵的。使用语音音频文件的开放数据库和文本转录,以快速和便宜地建立在各种声学条件下的许多扬声器中的转录演讲Ortan。


图片
作为语音资源的中心,OpenSLR托管语音和语言资源,如语音识别训练语料库和与语音识别相关的软件。
了解更多

Candlewill


用于自动语音识别(ASR)和文本到语音(TTS)的语音语料库集合。
了解更多

Edresson


这个数据集总共有71358个单词,其中有13311个不同的单词,一个人用48Khz录制的大约10小时28分钟的讲话,包含3632个Wave格式的音频文件。音频文件的范围从0.67到50.08秒。
了解更多
图片
旨在为声学-语音知识的获取和自动语音识别系统的开发和评价提供语音数据。包含6300个句子,其中10个句子由来自美国8个主要方言地区的630人每人说。
了解更多

VoxCeleb


音频视觉数据集由人类言语短剪辑组成,从上传到YouTube的访谈视频中提取。此数据集包含7,000 +扬声器,100万+话语和音频和视频的2,000 +小时。
了解更多

msang.


一个推特语料库,目的是代表和分析意大利少数民族群体的仇恨讲话:特别是移民,也是穆斯林和罗马。包含Tweets的ID及其注释。
了解更多

VoxForge


用于语音识别引擎的转录语音;分类并使所有提交的音频文件(语音语料库)和声学模型可用。
了解更多

hom


韩国阅读语音言论团大约120小时的韩国语言(NIKL)。
了解更多

siddelatif.


乌尔都语数据集包含从乌尔都语谈话节目收集的乌尔都语的情感话语。它包含四种基本情绪的400个表达:愤怒、快乐、中立和情绪。38名发言人(27名男性和11名女性)。
了解更多
图片
通用语音数据集是一个开源的语音数据集,目前包含60种语言的7000多个验证小时,包括年龄、性别和口音等人口统计元数据,可以帮助训练语音识别引擎的准确性。数据集中的每个条目由一个唯一的MP3和相应的文本文件组成。
了解更多
图片
有一个大型句子和翻译的数据库,以查看句子的上下文中使用单词的示例。
了解更多
图片
数据集由音频谈话及其转录本组成,包含1495个NIST球体格式的音频谈话(SPH)、1495个STM格式的转录本、带有发音的字典(159,848个条目)和用于语言建模的选定单语数据。
了解更多


图片

数据采集



如果您的特定用例需要更自定义的数据集,我们将数据收集提供为独立服务以及多组件可交付的一部分,例如ASR语音数据库,通常包括音频数据,转录,发音词典,以及特定于语言的文档或注释图像数据集。我们的数据收集服务跨越各种数据类型和集合方法,以获得一系列环境,以最佳符合您的独特数据要求。

了解更多


图片 图片 图片