数据资源中心


为从事世界级人工智能应用的团队创建和策划



图像

现成的数据集



我们的高质量授权数据集,以启动您的AI项目

我们提供“现成”数据集的广泛目录,超过250个授权数据集,包括超过11000小时的音频,超过25000张图像和超过870万单词,跨越80种语言和多种方言。我们的现成数据集旨在有效地提高精度和整体性能,并针对特定AI程序的需求快速提供高质量的大规模数据集。在我们的产品中,您将发现跨越多种数据类型的数据集,包括图像、视频、语音、音频和文本。我们不断建立新的数据集,以满足全球客户的需求。


了解更多


图像 图像 图像




图像

开源的公共数据集


我们的数据科学家为您的Al项目策划的推荐


机器学习和人工智能应用需要大量的数据来训练。您可以搜索开放数据集,以访问、修改、重用和共享我们推荐的资源。使用这些公开可用的数据集来影响AI和ML应用程序的开发,或者如果你想要一个简单的数据集来对解决方案进行基准测试,或者在处理真实数据集之前比较不同的算法。对于访问组织范围之外的数据,这些开放数据集是一个很好的选择。


数据集发现者



图像
使用Kaggle寻找数据集,探索和构建模型,并与其他数据科学家和机器学习工程师合作。探索和分析50000多个公共数据集,从骨骼x光到拳击比赛的结果。
了解更多
图像
通过一个可搜索的界面,探索来自加州大学欧文分校的机器学习知识库的500多个数据集。数据集涵盖了许多主题,大小各不相同,从少数案例(或“实例”)到超过4300万个,从仅1或2个变量(或“属性”)到超过100万个变量。
了解更多


计算机视觉



计算机视觉通过模拟人类视觉系统的复杂性,使计算机能够像人类一样识别和处理图像和视频中的物体。将机器学习应用于图像应用,如让自动驾驶汽车了解周围环境、面部识别应用、增强现实和混合现实,或在医疗领域的x光和MRI扫描中发现症状的自动化任务。利用丰富的计算机视觉数据集建立一个鲁棒的计算机视觉模型。


图像
使用1000+高质量的开放数据集加速AI开发。从50+应用场景、30+注释类型和10+数据格式中进行选择。
了解更多
图像
这些数据集包括各种各样的主题,从识别物体到重建3D房间,从在视频中找到一个人到在照片中识别一件衬衫。数据集可以按发布日期或主题排序,用户可以使用关键字搜索以找到适合自己需要的图像。
了解更多
图像
使用这些开放数据集来构建面部识别应用程序、虚拟现实小工具、感官检测、全息成像等。
了解更多
图像
超过3000个机器学习数据集。按任务和模式查找数据集,比较长期使用情况,浏览基准测试等。
了解更多
图像
计算机视觉机器学习模型的开源数据集涵盖了广泛的领域——动物、桌面游戏、自动驾驶汽车、医学、热图像、无人机图像,甚至是合成数据。您可以免费下载任何格式的图像和注释:VOC XML, COCO JSON, YOLOv3平面文本文件,甚至TFRecords。
了解更多


演讲全集



录制和转录新的语音语料库来创建声学模型和训练语音识别引擎是耗时和昂贵的。使用开放的语音音频文件数据库和文本转录,以快速和廉价地建立转录的语音语料库,其中包含来自不同声学条件下的许多发言者的话语。


图像
作为语音资源的中心位置,OpenSLR托管语音和语言资源,例如用于语音识别的培训语料库,以及与语音识别相关的软件。
了解更多

Candlewill


用于自动语音识别(ASR)和文本到语音(TTS)的语音语料库集合。
了解更多

Edresson


该数据集共有71358个单词,有13311个不同的单词,大约10小时28分钟的讲话从一个扬声器,记录在48Khz,包含总计3632个音频文件的波形格式。音频文件范围从0.67到50.08秒。
了解更多
图像
为语音知识的获取和自动语音识别系统的开发和评估提供语音数据。共包含6300个句子,来自美国8个主要方言地区的630名使用者每人讲10个句子。
了解更多

VoxCeleb


视听数据集,由人类语言的短片段组成,从上传到YouTube的采访视频中提取。这个数据集包含7000 +扬声器,100万+话语和2000 +小时的音频和视频。
了解更多

msang


这是一个Twitter文集,目的是代表和分析针对意大利一些少数群体的仇恨言论:尤其是移民,也包括穆斯林和罗姆人。包含tweet的ID及其注释。
了解更多

VoxForge


用于语音识别引擎的转录语音分类并使所有提交的音频文件(语音语料库)和声学模型可用。
了解更多

homink


一个大约120小时的韩国语阅读语料库,来自国家韩语研究所(NIKL)。
了解更多

siddiquelatif


乌尔都语数据集包含从乌尔都谈话节目中收集的乌尔都语情感话语。它包含了四种基本情绪的400种表达方式:愤怒、快乐、中性和情绪化。讲话者有38人(27男11女)。
了解更多
图像
通用语音数据集是一个开源的声音数据集,目前包含超过7000小时的有效语音,包括60种语言,包括人口统计元数据,如年龄、性别和口音,可以帮助训练语音识别引擎的准确性。数据集中的每个条目由一个惟一的MP3和相应的文本文件组成。
了解更多
图像
一个大型的句子和翻译数据库,可以看到单词在句子上下文中是如何使用的例子。
了解更多
图像
该数据集由音频谈话及其转录组成,包含1495个NIST sphere格式(SPH)音频谈话,1495个STM格式转录本,发音字典(155948条目)和选定的用于语言建模的单语数据。
了解更多


图像

数据收集



如果需要更多的自定义的数据集对于特定的用例,我们提供数据收集作为一个独立的服务等多组分的可交付成果的一部分作为一个ASR语音数据库,通常包括音频数据、转录、发音词典,和一个特定于语言的文档或一个带注释的图像数据集。我们的数据收集服务涵盖了各种数据类型和收集方法,适用于各种环境,以最佳地满足您独特的数据需求。

了解更多


图像 图像 图像