
数据产品目录
澳鹏提供种类丰富的成品数据库,我们的数据产品目录包括250多个可授权的数据集,涵盖80多种语言及方言,适用于各种常见的AI应用场景,例如:TTS, ASR等(参考下面目录表的筛选功能查看更多应用场景)。我们也在不断更新数据库中,2020年将推出30多个全新数据集,联系我们为您一同构建适用于您的项目的数据产品。

快速部署
直接直接数据产品快速您艾与机器学院习

低成本高效益
直接获取经授权的成品数据库比您定制数据采集服务更具成本效益。

专家团队
您将拥有一支在数据采集领域耕耘20多年的专家团队支持

支持所有数据类型
图像,视频,语音,音频,文本

大规模
提供大量、高品质的数据高效地训练您的机器模型

高质量
提高您的机器模型质量并减少数据偏见
数据集名称 | 产品类型 | 常见应用场景 | 录音设备 | 单元 |
---|
数据库名称 | 产品类型 | 常见使用案例 | 录音设备 | 单元 | ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
84 | 音频 | Asr,对话式ai,语音分享 | 移动电话和固定电话 | 5时 | 加加到咨询列表 | SOR_ASR001 | 全球的动作 | 对话录音 | 库尔德语 | 伊朗 | 低背景噪音 | 170 | 2 | 可根据根据要求 | 924年7 | 8. | 法律或wav | 数据集已完全转录并加上时间戳 数据又一次包含所的发出的发作 对于很大比例的电话录音,只有一半的对话被收集和转录 |
K. | |
256. | 音频 | Asr,对话式ai,语音分享 | 移动电话 | 4.5小时 | 加加到咨询列表 | SHANGHAI_ASR002_CN | 中国的动作 | 对话录音 | 上海方向 | 中国 | 低背景噪音(家庭/办公室) | 14 | 1 | NA | NA | 8. | wav | 覆盖地区: 上海黄浦区、徐汇区、长宁区、静安区、普陀区、虹口区、杨浦区、浦东新区八区。注:数据不包含上海郊区口音数据以及未成年人录制数据。单人发音时长约40分钟,单个语音对话20~30分钟之间 内容为2~5人自由对话形式 数据为脱敏数据,编号和录制人信息会打乱。数据库只是语音库,不含有转写文字 | Z. | |
255. | 音频 | Asr,对话式ai,语音分享 | 录音笔/麦克风 | 21小时 | 加加到咨询列表 | 上海_ASR001_CN. | 中国的动作 | 对话录音 | 上海方向 | 中国 | 低背景噪音(家庭/办公室) | 51 | 1 | NA | NA | 16 | wav | 覆盖地区: 上海黄浦区、徐汇区、长宁区、静安区、普陀区、虹口区、杨浦区、浦东新区八区。注:数据不包含上海郊区口音数据以及未成年人录制数据。单人发音时长约40分钟,单个语音对话20~30分钟之间 内容为2~5人自由对话形式 数据为脱敏数据,编号和录制人信息会打乱。数据库只是语音库,不含有转写文字 | Z. | |
277. | 音频 | Asr,对话式ai,语音分享 | 手机麦克风 | 4.1小时 | 加加到咨询列表 | SHANGHAI_ASR003_CN | 中国的动作 | 语料朗读 | 上海 | 中国 | 低背景噪音(家庭/办公室) | 8. | NA | NA | 16 | wav | Z. | |||
257. | 音频 | Asr,对话式ai,语音分享 | 录音笔/麦克风 | 84.6小时 | 加加到咨询列表 | DONGBEI_ASR001_CN | 中国的动作 | 对话录音 | 东北方言 | 中国 | 低背景噪音(家庭/办公室) | 268. | 1 | NA | NA | 16 | wav | 覆盖地区:孙阳和平区,沉河区,皇姑区,大东区,铁西,绿园区,朝阳区,宽城,二道区,南关,道里区,南京,道外区,平台,松北区,香坊区,呼兰区,阿城区,双城区十九个注:数码不动东郊区郊区数码以及成年人录制数码。单人发表时长约40分钟,单位个对话20〜30分钟之间是2〜5人自然对话形式数码,价格,单号和人信会。数码,但是,不知道,不拥有转写文章 | Z. | |
258. | 音频 | Asr,对话式ai,语音分享 | 移动电话 | 75.2小时 | 加加到咨询列表 | DONGBEI_ASR002_CN | 中国的动作 | 对话录音 | 东北方言 | 中国 | 低背景噪音(家庭/办公室) | 185 | 1 | NA | NA | 8. | wav | 覆盖地区:孙阳和平区,沉河区,皇姑区,大东区,铁西,绿园区,朝阳区,宽城,二道区,南关,道里区,南京,道外区,平台,松北区,香坊区,呼兰区,阿城区,双城区十九个注:数码不动东郊区郊区数码以及成年人录制数码。单人发表时长约40分钟,单位个对话20〜30分钟之间是2〜5人自然对话形式数码,价格,单号和人信会。数码,但是,不知道,不拥有转写文章 | Z. | |
276. | 音频 | Asr,对话式ai,语音分享 | 手机麦克风 | 2.72小时 | 加加到咨询列表 | DONGBEI_ASR003_CN | 中国的动作 | 语料朗读 | 东北 | 中国 | 低背景噪音(家庭/办公室) | 8. | NA | NA | 16 | wav | Z. | |||
159 | 文本 | ASR、TTS语言建模 | N/A | 107000个单词 | 加加到咨询列表 | dan_DNK_PHON | 全球的动作 | 发音词典 | 丹麦语 | 丹麦 | N/A | N/A | N/A | N/A | 107 000 | N/A | 文本 | D. | ||
86 | 音频 | ASR、虚拟助手,聊天机器人 | 麦克风 | 53小时 | 加加到咨询列表 | Speecon Danish. | 细微差别 | 有定稿的录音 | 丹麦语 | 丹麦 | 混合(办公室/娱乐场所/车内/公共场所) | 600(550个成年语料提供者及50个儿童语料提供者者 | 4. | 170 000 | 可根据根据要求 | 16 | 当地法律 | 数据集已完全转录为SpeechDAT类型,并附有发音词典和验证报告 每个成年发音人录制290个语料,每个儿童发音人录制210个语料,语料包括数字,自然数,字母串,个人、地点和企业名称,语音丰富的句子和单词,儿童发音人还需要提供关于玩具,手机的指令以及通用指令,成年发音人还需要提供应用词汇,以及自由发挥的语料 |
D. | |
160 | 文本 | ASR、TTS语言建模 | N/A | 100,000个单反装 | 加加到咨询列表 | dan_DNK_POS | 全球的动作 | 词性词典 | 丹麦语 | 丹麦 | N/A | N/A | N/A | N/A | 100 000 | N/A | 文本 | D. | ||
247. | 文本 | ASR、TTS语言建模 | N/A | 5,000个单反装 | 加加到咨询列表 | ukr_UKR_PHON | 全球的动作 | 发音词典 | 乌克兰语 | 乌克兰 | N/A | N/A | N/A | N/A | 5 000. | N/A | 文本 | W. | ||
133 | 文本 | 尼珥,内容分类,搜索引擎 | N/A | 20634个句子 | 加加到咨询列表 | urd_ner001. | 全球的动作 | 尼珥 | 乌尔都语 | 巴基斯坦 | N/A | N/A | N/A | 634 | 可根据根据要求 | N/A | 文本 | W. | ||
101 | 音频 | Asr,对话式ai,语音分享 | 移动电话和固定电话 | 47小时 | 加加到咨询列表 | URD_ASR001 | 全球的动作 | 对话录音 | 乌尔都语 | 印度-巴基斯坦 | 混合 | 1 000 | 2 | 可根据根据要求 | 871 | 8. | wav | 数据集已完全转录并加上时间戳 数据又一次包含所的发出的发作 |
W. | |
248. | 文本 | ASR、TTS语言建模 | N/A | 40000个单词 | 加加到咨询列表 | urd_PAK_PHON | 全球的动作 | 发音词典 | 乌尔都语 | 巴基斯坦 | N/A | N/A | N/A | N/A | 40 000 | N/A | 文本 | W. | ||
249. | 文本 | ASR、TTS语言建模 | N/A | 12,000个单词 | 加加到咨询列表 | urd_PAK_POS | 全球的动作 | 词性词典 | 乌尔都语 | 巴基斯坦 | N/A | N/A | N/A | N/A | 000年12 | N/A | 文本 | W. | ||
265. | 音频 | Asr,对话式ai,语音分享 | 电话录音 | 68.25小时 | 加加到咨询列表 | Tagalo_ASR001_CN | 中国的动作 | 语料朗读 | 他加禄语 | 菲律宾 | 低背景噪音(家庭/办公室) | 84 | 1 | NA | NA | 16 | ulaw,法律 | 覆盖地区:菲律宾单人录制大约4800年代(500个句子),每个句子在3到10秒之间。内容为单人朗读所给语料。以电话录音实现,要求设备的多样化:手机、扬声器、固定电话、耳机。 | T. | |
194 | 文本 | ASR、TTS语言建模 | N/A | 30000个单词 | 加加到咨询列表 | ibo_NGA_PHON | 全球的动作 | 发音词典 | 伊博语 | 奈及利亚 | N/A | N/A | N/A | N/A | 30 000 | N/A | 文本 | y | ||
178 | 文本 | ASR、TTS语言建模 | N/A | 80,000张单词 | 加加到咨询列表 | pes_IRN_PHON | 全球的动作 | 发音词典 | 波斯语 | 伊朗 | N/A | N/A | N/A | N/A | 80 000 | N/A | 文本 | y | ||
179 | 文本 | ASR、TTS语言建模 | N/A | 1400000个单词 | 加加到咨询列表 | pes_IRN_POS | 全球的动作 | 词性词典 | 波斯语 | 伊朗 | N/A | N/A | N/A | N/A | 1 400 000. | N/A | 文本 | y | ||
224. | 文本 | ASR、TTS语言建模 | N/A | 115000个单词 | 加加到咨询列表 | rus_RUS_PHON | 全球的动作 | 发音词典 | 俄语 | 俄国 | N/A | N/A | N/A | N/A | 115 000 | N/A | 文本 | E. | ||
78 | 音频 | Asr,对话式ai,语音分享 | 移动电话和固定电话 | 37小时 | 加加到咨询列表 | RUS_ASR001 | 全球的动作 | 对话录音 | 俄语 | 俄国 | 低背景噪音 | 200. | 2 | 可根据根据要求 | 28 284 | 8. | 法律或wav | 数据集已完全转录并加上时间戳 数据又一次包含所的发出的发作 这个项目记录了200个电话对话 - 是由100个呼入者,各进行2次呼叫(一次使用固定电话,一次使用移动电话)至100个接收者之一 |
E. | |
80 | 音频 | ASR、呼叫中心,虚拟助手 | 仅固定电话 | 180小时 | 加加到咨询列表 | 俄罗斯SpeechDat (E)数据库 | 细微差别 | 有定稿的录音 | 俄语 | 俄国 | 低背景噪音 | 2 500. | 1 | 112 000 | 可根据根据要求 | 8. | 当地法律 | 数据集已完全转录为SpeechDAT类型,并附有发音词典和验证报告 每个发音人录制45个语料,语料包含数字,自然数,字母串,个人、地点和企业名称,确认项(肯定,否定,不置可否的回答),通用指令和特定指令,语音丰富的句子和单词 |
E. | |
79 | 音频 | ASR、虚拟助手,聊天机器人 | 麦克风 | 31小时 | 加加到咨询列表 | RUS_ASR002 | 全球手机 | 有定稿的录音 | 俄语 | 俄国 | 低背景噪音(家庭/办公室) | 115 | 1 | 205年12 | 可根据根据要求 | 16 | wav | 数据集已完全转录,转录文件有原始版本和罗马化版本 每个发音人朗读大量语音丰富的句子,这些句子选自全国性的报纸文章,这些文章可以从网络上找到,覆盖范围广,词汇量大 与卡尔斯鲁厄理工学院(工具包)合作开发 |
E. | |
92 | 音频 | ASR、虚拟助手,聊天机器人 | 麦克风 | 46小时 | 加加到咨询列表 | Speecon俄罗斯数据库 | 细微差别 | 有定稿的录音 | 俄语 | 俄国 | 混合(办公室/娱乐场所/车内/公共场所) | 600(550个成年语料提供者及50个儿童语料提供者者 | 4. | 170 000 | 可根据根据要求 | 16 | 可根据根据要求 | 数据集已完全转录为SpeechDAT类型,并附有发音词典和验证报告 每个成年发音人录制290个语料,每个儿童发音人录制210个语料,语料包括数字,自然数,字母串,个人、地点和企业名称,语音丰富的句子和单词,儿童发音人还需要提供关于玩具,手机的指令以及通用指令,成年发音人还需要提供应用词汇,以及自由发挥的语料 |
E. | |
225. | 文本 | ASR、TTS语言建模 | N/A | 100,000个单反装 | 加加到咨询列表 | rus_RUS_POS | 全球的动作 | 词性词典 | 俄语 | 俄国 | N/A | N/A | N/A | N/A | 100 000 | N/A | 文本 | E. | ||
129 | 文本 | 尼珥,内容分类,搜索引擎 | N/A | 29888个句子 | 加加到咨询列表 | RUS_NER001 | 全球的动作 | 尼珥 | 俄语 | 俄国 | N/A | N/A | N/A | 29日888 | 可根据根据要求 | N/A | 文本 | E. | ||
269. | 音频 | Asr,对话式ai,语音分享 | 手机麦克风 | 30.89小时 | 加加到咨询列表 | RUS_ASR003_CN | 中国的动作 | 自由说 | 俄语(俄国) | 俄国 | 低背景噪音(家庭/办公室) | 32 | 1 | NA | NA | 16 | wav | E. | ||
151 | 文本 | ASR、TTS语言建模 | N/A | 55000个单词 | 加加到咨询列表 | bul_BGR_PHON | 全球的动作 | 发音词典 | 保加利亚语 | 保加利亚 | N/A | N/A | N/A | N/A | 55 000. | N/A | 文本 | B. | ||
6. | 音频 | Asr,对话式ai,语音分享 | 移动电话和固定电话 | 38小时 | 加加到咨询列表 | BUL_ASR001 | 全球的动作 | 对话录音 | 保加利亚语 | 保加利亚 | 低背景噪音(家庭/办公室) | 217. | 2 | 可根据根据要求 | 22 342. | 8. | 当地法律 | 数据集已完全转录并加上时间戳 数据又一次包含所的发出的发作 这个项目记录了200个电话对话 - 是由100个呼入者,各进行2次呼叫(一次使用固定电话,一次使用移动电话)至100个接收者之一 |
B. | |
107 | 音频 | ASR、虚拟助手,聊天机器人 | 麦克风 | 22小时 | 加加到咨询列表 | BUL_ASR002 | 全球手机 | 有定稿的录音 | 保加利亚语 | 保加利亚 | 低背景噪音(家庭/办公室) | 77 | 1 | 8 674. | 可根据根据要求 | 16 | wav | 数据集已完全转录,转录文件有原始版本和罗马化版本 每个发音人朗读大量语音丰富的句子,这些句子选自全国性的报纸文章,这些文章可以从网络上找到,覆盖范围广,词汇量大 与卡尔斯鲁厄理工学院(工具包)合作开发 |
B. | |
157 | 文本 | ASR、TTS语言建模 | N/A | 20,000个单词 | 加加到咨询列表 | hrv_HRV_PHON | 全球的动作 | 发音词典 | 克罗地亚语 | 克罗地亚 | N/A | N/A | N/A | N/A | 000 | N/A | 文本 | K. | ||
8. | 音频 | Asr,对话式ai,语音分享 | 移动电话和固定电话 | 39小时 | 加加到咨询列表 | CRO_ASR001 | 全球的动作 | 对话录音 | 克罗地亚语 | 克罗地亚 | 低背景噪音(家庭/办公室) | 200. | 2 | 可根据根据要求 | 919年23 | 8. | 当地法律 | 数据集已完全转录并加上时间戳 数据又一次包含所的发出的发作 这个项目记录了200个电话对话 - 是由100个呼入者,各进行2次呼叫(一次使用固定电话,一次使用移动电话)至100个接收者之一 |
K. | |
112 | 音频 | ASR、虚拟助手,聊天机器人 | 移动电话 | 263小时 | 加加到咨询列表 | CRO_ASR003_CN | 中国的动作 | 有定稿的录音 | 克罗地亚语 | 克罗地亚 | 低背景噪音(家庭/办公室) | 243. | 1 | 73 467 | 136 140 | 16 | wav | 数量集已完全转录 | K. | |
9. | 音频 | ASR、虚拟助手,聊天机器人 | 麦克风 | 11小时 | 加加到咨询列表 | CRO_ASR002 | 全球手机 | 有定稿的录音 | 克罗地亚语 | 克罗地亚 | 低背景噪音(家庭/办公室) | 94 | 1 | 499年4 | 可根据根据要求 | 16 | wav | 数据集已完全转录,转录文件有原始版本和罗马化版本 每个发音人朗读大量语音丰富的句子,这些句子选自全国性的报纸文章,这些文章可以从网络上找到,覆盖范围广,词汇量大 与卡尔斯鲁厄理工学院(工具包)合作开发 |
K. | |
261. | 音频 | Asr,对话式ai,语音分享 | 移动电话 | 100小时 | 加加到咨询列表 | NMG_ASR001_CN | 中国的动作 | 对话录音 | 内蒙古族语 | 中国 | 低背景噪音(家庭/办公室) | 200. | 1 | NA | NA | 16 | wav | 覆盖地区:通辽 呼和浩特 锡林郭勒盟。单人发音时长约30分钟,内容为2人自由对话形式 数据为脱敏数据,编号和录制人信息会打乱。数据库只是语音库,不含有转写文字 | Z. | |
155 | 文本 | ASR、TTS语言建模 | N/A | 10000个单词 | 加加到咨询列表 | cat_ESP_PHON | 全球的动作 | 发音词典 | 加泰罗尼亚语 | 西班牙 | N/A | N/A | N/A | N/A | 000 | N/A | 文本 | j | ||
193 | 文本 | ASR、TTS语言建模 | N/A | 500个单词 | 加加到咨询列表 | hun_HUN_PHON | 全球的动作 | 发音词典 | 匈牙利语 | 匈牙利 | N/A | N/A | N/A | N/A | 500 | N/A | 文本 | X | ||
115 | 音频 | ASR、虚拟助手,聊天机器人 | 移动电话 | 286小时 | 加加到咨询列表 | HUN_ASR001_CN | 中国的动作 | 有定稿的录音 | 匈牙利语 | 匈牙利 | 低背景噪音(家庭/办公室) | 254. | 1 | 94 031 | 201 921 | 16 | wav | 数量集已完全转录 | X | |
45 | 音频 | ASR、呼叫中心,虚拟助手 | 仅固定电话 | 65小时 | 加加到咨询列表 | 匈牙利语演说(e) | 细微差别 | 有定稿的录音 | 匈牙利语 | 匈牙利 | 低背景噪音 | 1 000 | 1 | 48 000. | 可根据根据要求 | 8. | 可根据根据要求 | 数据集已完全转录为SpeechDAT类型,并附有发音词典和验证报告 每个发音人录制48个语料,语料包含数字,自然数,字母串,个人、地点和企业名称,确认项(肯定,否定,不置可否的回答),通用指令和特定指令,语音丰富的句子和单词 |
X | |
200. | 文本 | ASR、TTS语言建模 | N/A | 35000个单词 | 加加到咨询列表 | kan_IND_PHON | 全球的动作 | 发音词典 | 坎那达语 | 印度 | N/A | N/A | N/A | N/A | 35 000 | N/A | 文本 | K. | ||
54 | 音频 | Asr,对话式ai,语音分享 | 移动电话和固定电话 | 15小时 | 加加到咨询列表 | KAN_ASR001 | 全球的动作 | 对话录音 | 坎那达语 | 印度 | 混合 | 178 | 2 | 可根据根据要求 | 660年15 | 8. | 当地法律 | 数据集已完全转录并加上时间戳 数据又一次包含所的发出的发作 |
K. | |
105 | 音频 | Asr,对话式ai,语音分享 | 移动电话和固定电话 | 57小时 | 加加到咨询列表 | KAN_ASR001A | 全球的动作 | 对话录音 | 坎那达语 | 印度 | 混合 | 1 000 | 2 | 可根据根据要求 | 660年15 | 8. | 当地法律 | 数码梦中大妇25%的会议被转录并加入时间戳,可以提供完整的转录文本 数据库附带一个包含所有转录词的发音词典 |
K. | |
162 | 文本 | ASR、TTS语言建模 | N/A | 20,000个单词 | 加加到咨询列表 | luo_KEN_PHON | 全球的动作 | 发音词典 | 卢奥语 | 肯尼亚 | N/A | N/A | N/A | N/A | 000 | N/A | 文本 | L. | ||
284. | 音频 | Asr,对话式ai,语音分享 | 手机麦克风 | 2.65小时 | 加加到咨询列表 | HINDI_ASR001_CN | 中国的动作 | 自由说 | 印地语 | 印度 | 低背景噪音(家庭/办公室) | 6. | NA | NA | 16 | wav | y | |||
192 | 文本 | ASR、TTS语言建模 | N/A | 35000个单词 | 加加到咨询列表 | hin_IND_PHON | 全球的动作 | 发音词典 | 印地语 | 印度 | N/A | N/A | N/A | N/A | 35 000 | N/A | 文本 | y | ||
44 | 音频 | Asr,对话式ai,语音分享 | 移动电话和固定电话 | 32小时 | 加加到咨询列表 | HIN_ASR002 | 全球的动作 | 对话录音 | 印地语 | 印度 | 混合 | 996 | 2 | 可根据根据要求 | 266年12 | 8. | wav | 数据集已完全转录并加上时间戳 数据又一次包含所的发出的发作 在大多数的通话中,对话双方的说话内容都被收集并转录了,但是对于一小部分的通话,只有一半的对话被收集并转录了 |
y | |
43 | 音频 | ASR、呼叫中心,虚拟助手 | 移动电话 | 224小时 | 加加到咨询列表 | HIN_ASR001 | 全球的动作 | 有定稿的录音 | 印地语 | 印度 | 低背景噪音 | 1 920 | 1 | 96 000. | 853年9 | 8. | 当地法律 | 完全转录为SpeechDAT类型 数据集附带一个包含所有转录词的发音词典[SAMPA] 每个发音人录制50个语料,语料包括数字,自然数,个人、地点和企业名称,网址,确认项(肯定,否定,不置可否的回答),通用指令和特定指令,语音丰富的句子和单词 |
y | |
147 | 文本 | ASR、TTS语言建模 | N/A | 95000个单词 | 加加到咨询列表 | ind_IDN_PHON | 全球的动作 | 发音词典 | 印度尼西亚语 | 印度尼西亚 | N/A | N/A | N/A | N/A | 95 000 | N/A | 文本 | y | ||
148 | 文本 | ASR、TTS语言建模 | N/A | 10000个单词 | 加加到咨询列表 | ind_idn_pos. | 全球的动作 | 词性词典 | 印度尼西亚语 | 印度尼西亚 | N/A | N/A | N/A | N/A | 000 | N/A | 文本 | y | ||
286. | 音频 | Asr,对话式ai,语音分享 | 手机麦克风 | 3.77小时 | 加加到咨询列表 | IND_ASR001_CN | 中国的动作 | 自由说 | 印尼语 | 印尼 | 低背景噪音(家庭/办公室) | 7. | NA | NA | 16 | wav | y | |||
3. | 音频 | Asr,对话式ai,语音分享 | 移动电话和固定电话 | 31小时 | 加加到咨询列表 | BAH_ASR001 | 全球的动作 | 对话录音 | 印度尼西亚语 | 印度尼西亚 | 低背景噪音 | 1 002 | 2 | 可根据根据要求 | 480年11 | 8. | wav | 数据集已完全转录并加上时间戳 数据又一次包含所的发出的发作 对于很大比例的电话录音,只有一半的对话被收集和转录 |
y | |
279. | 音频 | Asr,对话式ai,语音分享 | 手机麦克风 | 3.12小时 | 加加到咨询列表 | TAIWAN_ASR001_CN | 中国的动作 | 自由说 | 台湾 | 中国 | 低背景噪音(家庭/办公室) | 10 | NA | NA | 16 | wav | Z. | |||
251. | 文本 | ASR、TTS语言建模 | N/A | 10000个单词 | 加加到咨询列表 | wuu_CHN_PHON | 全球的动作 | 发音词典 | 吴语 | 中国 | N/A | N/A | N/A | N/A | 000 | N/A | 文本 | W. | ||
201. | 文本 | ASR、TTS语言建模 | N/A | 30000个单词 | 加加到咨询列表 | kaz_KAZ_PHON | 全球的动作 | 发音词典 | 哈萨克语 | 哈萨克斯坦 | N/A | N/A | N/A | N/A | 30 000 | N/A | 文本 | H | ||
283. | 音频 | Asr,对话式ai,语音分享 | 手机麦克风 | 3.86小时 | 加加到咨询列表 | sichuan_asr001_cn. | 中国的动作 | 语料朗读 | 四川 | 中国 | 低背景噪音(家庭/办公室) | 8. | NA | NA | 16 | wav | Z. | |||
245. | 文本 | ASR、TTS语言建模 | N/A | 255000个单词 | 加加到咨询列表 | tur_TUR_PHON | 全球的动作 | 发音词典 | 土耳其语 | 土耳其 | N/A | N/A | N/A | N/A | 255 000 | N/A | 文本 | T. | ||
98 | 音频 | Asr,对话式ai,语音分享 | 移动电话和固定电话 | 41小时 | 加加到咨询列表 | TUR_ASR001 | 全球的动作 | 对话录音 | 土耳其语 | 土耳其 | 低背景噪音 | 200. | 2 | 可根据根据要求 | 386年32 | 8. | 法律或wav | 数据集已完全转录并加上时间戳 数据又一次包含所的发出的发作 这个项目记录了200个电话对话 - 是由100个呼入者,各进行2次呼叫(一次使用固定电话,一次使用移动电话)至100个接收者之一 |
T. | |
117 | 音频 | ASR、虚拟助手,聊天机器人 | 移动电话 | 739小时 | 加加到咨询列表 | TUR_ASR003_CN | 中国的动作 | 有定稿的录音 | 土耳其语 | 土耳其 | 低背景噪音(家庭/办公室) | 664. | 1 | 185 706 | 215 135 | 16 | wav | 数量集已完全转录 | T. | |
65 | 音频 | ASR、呼叫中心,虚拟助手 | 移动电话和固定电话 | 118小时 | 加加到咨询列表 | Orientel土耳其数据库 | 细微差别 | 有定稿的录音 | 土耳其语 | 土耳其 | 低背景噪音 | 1 700. | 1 | 76 500 | 可根据根据要求 | 8. | 可根据根据要求 | 数据集已完全转录为SpeechDAT类型,并附有发音词典和验证报告 每个发音人录制45个语料,语料包含数字,自然数,字母串,个人、地点和企业名称,确认项(肯定,否定,不置可否的回答),通用指令和特定指令,语音丰富的句子和单词 |
T. | |
246. | 文本 | ASR、TTS语言建模 | N/A | 257000个单词 | 加加到咨询列表 | tur_TUR_POS | 全球的动作 | 词性词典 | 土耳其语 | 土耳其 | N/A | N/A | N/A | N/A | 257 000 | N/A | 文本 | T. | ||
99 | 音频 | ASR、虚拟助手,聊天机器人 | 麦克风 | 17小时 | 加加到咨询列表 | TUR_ASR002 | 全球手机 | 有定稿的录音 | 土耳其语 | 土耳其 | 低背景噪音(家庭/办公室) | One hundred. | 1 | 950年6 | 可根据根据要求 | 16 | wav | 数据集已完全转录,转录文件有原始版本和罗马化版本 每个发音人朗读大量语音丰富的句子,这些句子选自全国性的报纸文章,这些文章可以从网络上找到,覆盖范围广,词汇量大 与卡尔斯鲁厄理工学院(工具包)合作开发 |
T. | |
240. | 文本 | ASR、TTS语言建模 | N/A | 30000个单词 | 加加到咨询列表 | tgl_PHL_PHON | 全球的动作 | 发音词典 | 塔加拉族语 | 菲律宾 | N/A | N/A | N/A | N/A | 30 000 | N/A | 文本 | T. | ||
226. | 文本 | ASR、TTS语言建模 | N/A | 15000个单词 | 加加到咨询列表 | srp_SRB_PHON | 全球的动作 | 发音词典 | 塞尔维亚语 | 塞尔达亚 | N/A | N/A | N/A | N/A | 000年15 | N/A | 文本 | S. | ||
239. | 文本 | ASR、TTS语言建模 | N/A | 22000个单词 | 加加到咨询列表 | syl_BGD -IND_PHON | 全球的动作 | 发音词典 | 塞海蒂语 | 孟加拉国-印度 | N/A | N/A | N/A | N/A | 22 000 | N/A | 文本 | S. | ||
264. | 音频 | Asr,对话式ai,语音分享 | 移动电话 | 200小时 | 加加到咨询列表 | 外国人_asr001_cn. | 中国的动作 | 有定稿的录音 | 中文(外国人) | 多国 | 低背景噪音(家庭/办公室) | 200. | NA | NA | 16 | wav | 数据库包含200小时的外国人说中文 人数:200人 覆盖国家: 美国(不含加州和伊利诺伊州),印度,菲律宾,日本,加拿大,泰国,澳大利亚,越南,俄罗斯,土耳其,埃及,印度尼西亚。注:数据不包含韩国,巴西境外数据同时也不包含未成年人录制数据。单人发音时长约1小时,单句时长3 - 10秒之间内容为单人朗读形式采集工具为手机麦克风单声道采样率16赫兹录音环境为家庭/办公室。数据为脱敏数据,编号和录制人信息会打乱。 | Z. | ||
266. | 图像 | 图片标签识别训练 | 手机/照相机 | 680张 | 加加到咨询列表 | img_body_pose_cn. | 中国的动作 | 物体图片 | N/A | 多国 | 多种光线 | NA | NA | NA | NA | NA | jpg | 共680张,多人室内67张,多人户外洋光11张,多人户外光光4张,单人子外光4张,单人室内室内550张,单人室外冬光7张,单人室外冬光41张 | Z. | |
263. | 图像 | 图片标签识别训练 | 手机/照相机 | 2196 张 | 加加到咨询列表 | IMG_TAG_CN | 中国的动作 | 物体图片 | N/A | N/A | 多种光线 | NA | NA | NA | NA | NA | jpg | 共2196张多场景图库照片分别为:KTV:50张,百货商店:55张,办公园:100张;博物群:63张;电器:55张;海洋:191张;张;汽车:50张;手提包:35张;夜景:54张;张;张;便利店:34张;餐厅:54张;车辆风暴:62张;宠物:82张;船50张;动物统称,70张;服装店:53张;海滩 :95张;机场 : 65张;健身房 :47张;景点 :77张;人群 :67张;沙漠 : 73张;沙滩 :68张;山区 :54张;商场 :55张;树 :85张;天空 : 102张;雪景 :71张;雪山 : 53张;夜景 :78张;游乐场 :94张。 | Z. | |
215. | 文本 | ASR、TTS语言建模 | N/A | 15000个单词 | 加加到咨询列表 | ori_IND_PHON | 全球的动作 | 发音词典 | 奥里雅语 | 印度 | N/A | N/A | N/A | N/A | 000年15 | N/A | 文本 | 一种 | ||
120 | 音频 | 婴儿监控器, 安全及其他消费者应用程序 | 移动电话 | 3小时 | 加加到咨询列表 | cry_asr001. | 中国的动作 | 人生 | N/A | 中国 | 低背景噪音(家庭/办公室) | One hundred. | 1 | NA | NA | 16 | wav | 0到3岁婴儿的哭声,每个录音持续2分钟左右 | Z. | |
150 | 文本 | ASR、TTS语言建模 | N/A | 29,000个单词 | 加加到咨询列表 | Ben_ind_Phon. | 全球的动作 | 发音词典 | 孟加拉语 | 印度 | N/A | N/A | N/A | N/A | 29日000 | N/A | 文本 | m | ||
5. | 音频 | Asr,对话式ai,语音分享 | 移动电话和固定电话 | 47小时 | 加加到咨询列表 | BEN_ASR001 | 全球的动作 | 对话录音 | 孟加拉语 | 孟加拉国 | 混合(车内/路边/家庭/办公室) | 1 000 | 2 | 可根据根据要求 | 17 922年 | 8. | 当地法律 | 数据集已完全转录并加上时间戳 数据又一次包含所的发出的发作 |
m | |
156 | 文本 | ASR、TTS语言建模 | N/A | 20,000个单词 | 加加到咨询列表 | ceb_PHL_PHON | 全球的动作 | 发音词典 | 宿雾语 | 菲律宾 | N/A | N/A | N/A | N/A | 000 | N/A | 文本 | S. | ||
149 | 文本 | ASR、TTS语言建模 | N/A | 10000个单词 | 加加到咨询列表 | eus_ESP_PHON | 全球的动作 | 发音词典 | 巴斯克语 | 西班牙 | N/A | N/A | N/A | N/A | 000 | N/A | 文本 | B. | ||
191 | 文本 | ASR、TTS语言建模 | N/A | 31,000个单词 | 加加到咨询列表 | heb_ISR_PHON | 全球的动作 | 发音词典 | 希伯来语 | 以色列 | N/A | N/A | N/A | N/A | 31日000年 | N/A | 文本 | X | ||
42 | 音频 | Asr,对话式ai,语音分享 | 移动电话和固定电话 | 34小时 | 加加到咨询列表 | heb_asr001. | 全球的动作 | 对话录音 | 希伯来语 | 以色列 | 低背景噪音 | 200. | 2 | 可根据根据要求 | 19日250年 | 8. | 法律或wav | 数据集已完全转录并加上时间戳 数据又一次包含所的发出的发作 这个项目记录了200个电话对话 - 是由100个呼入者,各进行2次呼叫(一次使用固定电话,一次使用移动电话)至100个接收者之一 |
X | |
187 | 文本 | ASR、TTS语言建模 | N/A | 5,000个单反装 | 加加到咨询列表 | ell_GRC_PHON | 全球的动作 | 发音词典 | 希腊语 | 希腊 | N/A | N/A | N/A | N/A | 5 000. | N/A | 文本 | X | ||
114 | 音频 | ASR、虚拟助手,聊天机器人 | 移动电话 | 191小时 | 加加到咨询列表 | gre_asr001_cn. | 中国的动作 | 有定稿的录音 | 希腊语 | 希腊 | 低背景噪音(家庭/办公室) | 287. | 1 | 113年54 | 68 271 | 16 | wav | 数量集已完全转录 | X | |
152 | 文本 | ASR、TTS语言建模 | N/A | 37000个单词 | 加加到咨询列表 | yue_CHN_PHON | 全球的动作 | 发音词典 | 广东话 (粤语) | 中国 | N/A | N/A | N/A | N/A | 37 000. | N/A | 文本 | 简体 | G | |
153 | 文本 | ASR、TTS语言建模 | N/A | 40000个单词 | 加加到咨询列表 | yue_CHN_PHON | 全球的动作 | 发音词典 | 广东话 (粤语) | 中国 | N/A | N/A | N/A | N/A | 40 000 | N/A | 文本 | 繁体 | G | |
154 | 文本 | ASR、TTS语言建模 | N/A | 10000个单词 | 加加到咨询列表 | yue_HKG_POS | 全球的动作 | 词性词典 | 广东话 (粤语) | 中国 | N/A | N/A | N/A | N/A | 000 | N/A | 文本 | 繁体 | G | |
278. | 音频 | Asr,对话式ai,语音分享 | 手机麦克风 | 4.06小时 | 加加到咨询列表 | GUANGDONG_ASR001_CN | 中国的动作 | 语料朗读 | 广东 | 中国 | 低背景噪音(家庭/办公室) | 8. | NA | NA | 16 | wav | Z. | |||
204. | 文本 | ASR、TTS语言建模 | N/A | 60000个单词 | 加加到咨询列表 | kur_tur_phon. | 全球的动作 | 发音词典 | 库尔德语 | 土耳其 | N/A | N/A | N/A | N/A | 60 000. | N/A | 文本 | K. | ||
267. | 音频 | Asr,对话式ai,语音分享 | 手机麦克风 | 20.19小时 | 加加到咨询列表 | deu_asr004_cn. | 中国的动作 | 自由说 | 德语 (德国) | 德国 | 低背景噪音(家庭/办公室) | 80 | 1 | NA | NA | 16 | wav | D. | ||
57 | 音频 | ASR、呼叫中心,虚拟助手 | 仅固定电话 | 33小时 | 加加到咨询列表 | 卢森堡人的德语演讲 | 细微差别 | 有定稿的录音 | 德语 | 卢森堡 | 低背景噪音 | 500 | 1 | 26日500 | 可根据根据要求 | 8. | 可根据根据要求 | 数据集已完全转录为SpeechDAT类型,并附有发音词典和验证报告 每每发表人录制53个语料,语料语料数码,自然数,字母串,个人,地点和企业名称,确认项(肯定,否定,不可能的回答),通用指令和特价指令,语音丰富和特点指令,语音丰富的句子和单位 |
D. | |
64 | 音频 | ASR、呼叫中心,虚拟助手 | 移动电话和固定电话 | 31小时 | 加加到咨询列表 | 东方人:土耳其人说德语 | 细微差别 | 有定稿的录音 | 德语 | 土耳其 | 低背景噪音 | 300 | 1 | 600年15 | 可根据根据要求 | 8. | 可根据根据要求 | 数据集已完全转录为SpeechDAT类型,并附有发音词典和验证报告 每个发音人录制52个语料,语料包含数字,自然数,字母串,个人、地点和企业名称,确认项(肯定,否定,不置可否的回答),通用指令和特定指令,语音丰富的句子和单词 |
D. | |
185 | 文本 | ASR、TTS语言建模 | N/A | 146000个单词 | 加加到咨询列表 | deu_DEU_PHON | 全球的动作 | 发音词典 | 德语 | 德国 | N/A | N/A | N/A | N/A | 146 000 | N/A | 文本 | D. | ||
14 | 音频 | ASR、虚拟助手,聊天机器人 | 麦克风 | 16小时 | 加加到咨询列表 | DEU_ASR001 | 全球的动作 | 有定稿的录音 | 德语 | 德国 | 低背景噪音(录音棚) | 127 | 2 | 700年12 | 826年6 | 16 | 当地法律 | 数据集已完全转录并加上时间戳 数据又一次包含所的发出的发作 每个发音人录制100个语料,语料包括数字,自然数,人名,城市名,电话号码,通用指令和特定指令,语音丰富的句子和单词 |
D. | |
15 | 音频 | ASR、虚拟助手,聊天机器人 | 麦克风 | 25小时 | 加加到咨询列表 | DEU_ASR003 | 全球手机 | 有定稿的录音 | 德语 | 德国 | 低背景噪音(家庭/办公室) | 77 | 1 | 085 | 可根据根据要求 | 16 | wav | 数据集已完全转录,转录文件有原始版本和罗马化版本 每个发音人朗读大量语音丰富的句子,这些句子选自全国性的报纸文章,这些文章可以从网络上找到,覆盖范围广,词汇量大 与卡尔斯鲁厄理工学院(工具包)合作开发 |
D. | |
38 | 音频 | ASR、呼叫中心,虚拟助手 | 仅固定电话 | 31小时 | 加加到咨询列表 | (二)FDB-1000 | 细微差别 | 有定稿的录音 | 德语 | 德国 | 低背景噪音(家庭/办公室) | 988 | 1 | 000年43岁 | 可根据根据要求 | 8. | 可根据根据要求 | 数据集已完全转录为SpeechDAT类型,并附有发音词典和验证报告 每个发音人录制44个语料,语料包含数字,自然数,字母串,个人、地点和企业名称,确认项(肯定,否定,不置可否的回答),通用指令和特定指令,语音丰富的句子和单词 |
D. | |
39 | 音频 | ASR、呼叫中心,虚拟助手 | 仅固定电话 | 268小时 | 加加到咨询列表 | 德国语音DAT(ii)FDB-4000 | 细微差别 | 有定稿的录音 | 德语 | 德国 | 低背景噪音(家庭/办公室) | 000年4 | 1 | 160 000 | 可根据根据要求 | 8. | 可根据根据要求 | 数据集已完全转录为SpeechDAT类型,并附有发音词典和验证报告 每个发音人录制40个语料,语料包含数字,自然数,字母串,个人、地点和企业名称,确认项(肯定,否定,不置可否的回答),通用指令和特定指令,语音丰富的句子和单词 |
D. | |
186 | 文本 | ASR、TTS语言建模 | N/A | 15000个单词 | 加加到咨询列表 | deu_CHE_PHON | 全球的动作 | 发音词典 | 德语 | 瑞士 | N/A | N/A | N/A | N/A | 000年15 | N/A | 文本 | D. | ||
90 | 音频 | ASR、虚拟助手,聊天机器人 | 麦克风 | 53小时 | 加加到咨询列表 | speech德语(瑞士)数据库 | 细微差别 | 有定稿的录音 | 德语 | 瑞士 | 混合(办公室/娱乐场所/车内/公共场所) | 600(550个成年语料提供者及50个儿童语料提供者者 | 4. | 170 000 | 可根据根据要求 | 16 | 可根据根据要求 | 数据集已完全转录为SpeechDAT类型,并附有发音词典和验证报告 每个成年发音人录制290个语料,每个儿童发音人录制210个语料,语料包括数字,自然数,字母串,个人、地点和企业名称,语音丰富的句子和单词,儿童发音人还需要提供关于玩具,手机的指令以及通用指令,成年发音人还需要提供应用词汇,以及自由发挥的语料 |
D. | |
195 | 文本 | ASR、TTS语言建模 | N/A | 197000个单词 | 加加到咨询列表 | ita_ITA_PHON | 全球的动作 | 发音词典 | 意大利语 | 意大利 | N/A | N/A | N/A | N/A | 197 000 | N/A | 文本 | y | ||
48 | 音频 | Asr,对话式ai,语音分享 | 移动电话和固定电话 | 36小时 | 加加到咨询列表 | ITA_ASR003 | 全球的动作 | 对话录音 | 意大利语 | 意大利 | 低背景噪音 | 200. | 2 | 可根据根据要求 | 18 974 | 8. | 当地法律 | 数据集已完全转录并加上时间戳 数据又一次包含所的发出的发作 这个项目记录了200个电话对话 - 是由100个呼入者,各进行2次呼叫(一次使用固定电话,一次使用移动电话)至100个接收者之一 |
y | |
46 | 音频 | ASR、虚拟助手,聊天机器人 | 麦克风 | 44小时 | 加加到咨询列表 | ITA_ASR001 | 全球的动作 | 有定稿的录音 | 意大利语 | 意大利 | 混合 | 200. | 4. | 40 000 | 316年7 | 22 | 当地法律 | 完全转录为SpeechDAT类型 数据又一次包含所的发出的发作 每个发音人录制200个语料,语料包括100个命令和特定指令,100个语音丰富的句子 |
y | |
47 | 音频 | ASR、虚拟助手,车载人机界面及娱乐设备 | 麦克风 | 47小时 | 加加到咨询列表 | ITA_ASR002 | 全球的动作 | 有定稿的录音 | 意大利语 | 意大利 | 混合(车内) | 103 | 4. | 35 875. | 366 | 48 | 当地法律 | 完全转录为SpeechDAT类型 数据又一次包含所的发出的发作 每个发音人录制350个语料,语料包括数字,街道名称,通用指令和特定指令,语音丰富的句子和单词 每个发音人录制了1到2段样本,第一段在未熄火的停靠车辆中录制,第二段在以每小时60英里(100 公里 / 小时)的速度行驶的车辆中录制 |
y | |
49 | 音频 | TTS | 麦克风 | 3小时 | 加加到咨询列表 | ITA_TTS001 | 全球的动作 | 有定稿的录音 | 意大利语 | 意大利 | 低背景噪音(录音棚) | 1 | 1 | 3 300 | 可根据根据要求 | 22 | 当地法律 | 数据集随附一个发音词典,其中包含该数据集中所说的所有单词 每个发音人录制3300条语料,包括语音丰富的句子 |
y | |
50 | 音频 | ASR、呼叫中心,虚拟助手 | 仅固定电话 | 38小时 | 加加到咨询列表 | 意大利固定网络语音 | 细微差别 | 有定稿的录音 | 意大利语 | 意大利 | 低背景噪音(家庭/办公室) | 1 000 | 1 | 000年39 | 可根据根据要求 | 8. | 可根据根据要求 | 数据集已完全转录为SpeechDAT类型,并附有发音词典和验证报告 每个发音人录制39个语料,语料包含连续和间隔的数字,自然数,金额,拼写单词,时间和日期短语,是/否问题,常见的应用词汇,在短语中的应用词汇以及语音丰富的句子 |
y | |
51 | 音频 | ASR、呼叫中心,虚拟助手 | 仅固定电话 | 228小时 | 加加到咨询列表 | 意大利SpeechDat (II)身上- 3000 | 细微差别 | 有定稿的录音 | 意大利语 | 意大利 | 低背景噪音(家庭/办公室) | 3 040 | 1 | 134 000. | 可根据根据要求 | 8. | 可根据根据要求 | 数据集已完全转录为SpeechDAT类型,并附有发音词典和验证报告 每个发音人录制44个语料,语料包含数字,自然数,字母串,个人、地点和企业名称,确认项(肯定,否定,不置可否的回答),通用指令和特定指令,语音丰富的句子和单词 |
y | |
52 | 音频 | ASR、呼叫中心,虚拟助手 | 移动电话 | 103小时 | 加加到咨询列表 | 意大利SpeechDat (II) mdb - 250 | 细微差别 | 有定稿的录音 | 意大利语 | 意大利 | 低背景噪音(家庭/办公室) | 375 | 1 | 19日000年 | 可根据根据要求 | 8. | 可根据根据要求 | 数据集已完全转录为SpeechDAT类型,并附有发音词典和验证报告 每个发音人录制51个语料,语料包含数字,自然数,字母串,个人、地点和企业名称,确认项(肯定,否定,不置可否的回答),通用指令和特定指令,语音丰富的句子和单词 |
y | |
85 | 音频 | ASR、呼叫中心,虚拟助手 | 移动电话 | 13小时 | 加加到咨询列表 | SpeemDAT(M)意大利移动网络语音数据库 | 细微差别 | 有定稿的录音 | 意大利语 | 意大利 | 低背景噪音(家庭/办公室) | 342 | 1 | 500年13 | 可根据根据要求 | 8. | 可根据根据要求 | 数据集已完全转录为SpeechDAT类型,并附有发音词典和验证报告 每个发音人录制40个语料,语料包含数字,自然数,字母串,个人、地点和企业名称,确认项(肯定,否定,不置可否的回答),通用指令和特定指令,语音丰富的句子和单词 |
y | |
196 | 文本 | ASR、TTS语言建模 | N/A | 147,000个单词 | 加加到咨询列表 | ita_ITA_POS | 全球的动作 | 词性词典 | 意大利语 | 意大利 | N/A | N/A | N/A | N/A | 147 000. | N/A | 文本 | y | ||
290. | 音频 | Asr,对话式ai,语音分享 | 手机麦克风 | 3.8小时 | 加加到咨询列表 | ITA_ASR001_CN | 中国的动作 | 自由说 | 意大利语 | 意大利 | 低背景噪音(家庭/办公室) | 6. | NA | NA | 16 | wav | y | |||
244. | 文本 | ASR、TTS语言建模 | N/A | 10000个单词 | 加加到咨询列表 | tpi_PNG_PHON | 全球的动作 | 发音词典 | 托克皮辛语 | 巴布亚新几内亚 | N/A | N/A | N/A | N/A | 000 | N/A | 文本 | T. | ||
213. | 文本 | ASR、TTS语言建模 | N/A | 115000个单词 | 加加到咨询列表 | nor_NOR_PHON | 全球的动作 | 发音词典 | 挪威语 | 挪威 | N/A | N/A | N/A | N/A | 115 000 | N/A | 文本 | N | ||
214. | 文本 | ASR、TTS语言建模 | N/A | 3000个单词 | 加加到咨询列表 | nor_NOR_POS | 全球的动作 | 词性词典 | 挪威语 | 挪威 | N/A | N/A | N/A | N/A | 3 000 | N/A | 文本 | N | ||
158 | 文本 | ASR、TTS语言建模 | N/A | 50000个单词 | 加加到咨询列表 | ces_CZE_PHON | 全球的动作 | 发音词典 | 捷克语 | 捷克共和国 | N/A | N/A | N/A | N/A | 50 000 | N/A | 文本 | j | ||
11 | 音频 | ASR、呼叫中心,虚拟助手 | 仅固定电话 | 93小时 | 加加到咨询列表 | 捷克语音DAT(e)数据集 | 细微差别 | 有定稿的录音 | 捷克语 | 捷克共和国 | 低背景噪音 | 1 000 | 1 | 52 000 | 可根据根据要求 | 8. | 当地法律 | 数据集已完全转录为SpeechDAT类型,并附有发音词典和验证报告 每个发音人录制52个语料,语料包括数字,自然数,字母串,个人、地点和企业名称,确认项(肯定,否定,不置可否的回答),通用指令和特定指令,语音丰富的句子和单词 |
j | |
10 | 音频 | ASR、虚拟助手,聊天机器人 | 麦克风 | 31小时 | 加加到咨询列表 | cze_asr001. | 全球手机 | 有定稿的录音 | 捷克语 | 捷克共和国 | 低背景噪音(家庭/办公室) | 102 | 1 | 425年12 | 可根据根据要求 | 16 | wav | 数据集已完全转录,转录文件有原始版本和罗马化版本 每个发音人朗读大量语音丰富的句子,这些句子选自全国性的报纸文章,这些文章可以从网络上找到,覆盖范围广,词汇量大 与卡尔斯鲁厄理工学院(工具包)合作开发 |
j | |
81 | 音频 | ASR、呼叫中心,虚拟助手 | 仅固定电话 | 65小时 | 加加到咨询列表 | Slovak SpeemDAT(e)数据库 | 细微差别 | 有定稿的录音 | 斯洛伐克语 | 斯塔克 | 低背景噪音 | 1 000 | 1 | 48 000. | 可根据根据要求 | 8. | 可根据根据要求 | 数据集已完全转录为SpeechDAT类型,并附有发音词典和验证报告 每个发音人录制48个语料,语料包含数字,自然数,字母串,个人、地点和企业名称,确认项(肯定,否定,不置可否的回答),通用指令和特定指令,语音丰富的句子和单词 |
S. | |
82 | 音频 | ASR、呼叫中心,虚拟助手 | 仅固定电话 | 76小时 | 加加到咨询列表 | 斯洛文尼亚SpeechDat (II)身上- 1000 | 细微差别 | 有定稿的录音 | 斯塔尼亚师 | 斯洛文尼亚 | 低背景噪音(家庭/办公室) | 1 000 | 1 | 40 000 | 可根据根据要求 | 8. | 可根据根据要求 | 数据集已完全转录为SpeechDAT类型,并附有发音词典和验证报告 每个发音人录制大约40个语料,语料包括数字,自然数,字母串,个人、地点和企业名称,确认项(肯定,否定,不置可否的回答),通用指令和特定指令,语音丰富的句子和单词 |
S. | |
236. | 文本 | ASR、TTS语言建模 | N/A | 66000个单词 | 加加到咨询列表 | swa_KEN_PHON | 全球的动作 | 发音词典 | 斯瓦西里语 | 肯尼亚 | N/A | N/A | N/A | N/A | 66 000 | N/A | 文本 | S. | ||
76 | 音频 | Asr,对话式ai,语音分享 | 移动电话和固定电话 | 20小时 | 加加到咨询列表 | PAP_ASR001 | 全球的动作 | 对话录音 | 旁遮普语 | 巴基斯坦 | 低背景噪音 | 205. | 2 | 可根据根据要求 | 298年7 | 8. | 当地法律 | 数码集已完全转录并加入还间空 数据又一次包含所的发出的发作 在71%的对话中,对话双方(呼入者和呼出者)的说话内容都被收集转录了,在剩下的29%的对话中,只有一半的对话被收集并转录了 |
P. | |
132 | 文本 | 尼珥,内容分类,搜索引擎 | N/A | 20629个句子 | 加加到咨询列表 | JPY_NER001 | 全球的动作 | 尼珥 | 日本 | 日本 | N/A | N/A | N/A | 629 | 可根据根据要求 | N/A | 文本 | R. | ||
285. | 音频 | Asr,对话式ai,语音分享 | 手机麦克风 | 3.38小时 | 加加到咨询列表 | JAP_ASR001_CN | 中国的动作 | 自由说 | 日本 | 日本 | 低背景噪音(家庭/办公室) | 6. | NA | NA | 16 | wav | R. | |||
197 | 文本 | ASR、TTS语言建模 | N/A | 262000个单词 | 加加到咨询列表 | jpn_JPN_PHON | 全球的动作 | 发音词典 | 日本 | 日本 | N/A | N/A | N/A | N/A | 262 000. | N/A | 文本 | R. | ||
53 | 音频 | ASR、虚拟助手,聊天机器人 | 麦克风 | 33小时 | 加加到咨询列表 | JPN_ASR001. | 全球手机 | 有定稿的录音 | 日本 | 日本 | 低背景噪音(家庭/办公室) | 144 | 1 | 067年13 | 可根据根据要求 | 16 | wav | 数据集已完全转录,转录文件有原始版本和罗马化版本 每个发音人朗读大量语音丰富的句子,这些句子选自全国性的报纸文章,这些文章可以从网络上找到,覆盖范围广,词汇量大 与卡尔斯鲁厄理工学院(工具包)合作开发 |
R. | |
91 | 音频 | ASR、虚拟助手,聊天机器人 | 麦克风 | 57小时 | 加加到咨询列表 | Speecon日本 | 细微差别 | 有定稿的录音 | 日本 | 日本 | 混合(办公室/娱乐场所/车内/公共场所) | 600(550个成年语料提供者及50个儿童语料提供者者 | 4. | 170 000 | 可根据根据要求 | 16 | 可根据根据要求 | 数据集已完全转录为SpeechDAT类型,并附有发音词典和验证报告 每个成年发音人录制290个语料,每个儿童发音人录制210个语料,语料包括数字,自然数,字母串,个人、地点和企业名称,语音丰富的句子和单词,儿童发音人还需要提供关于玩具,手机的指令以及通用指令,成年发音人还需要提供应用词汇,以及自由发挥的语料 |
R. | |
198 | 文本 | ASR、TTS语言建模 | N/A | 265000个单词 | 加加到咨询列表 | jpn_JPN_POS | 全球的动作 | 词性词典 | 日本 | 日本 | N/A | N/A | N/A | N/A | 265 000 | N/A | 文本 | R. | ||
281. | 音频 | Asr,对话式ai,语音分享 | 手机麦克风 | 2.53小时 | 加加到咨询列表 | KUNMING_ASR001_CN | 中国的动作 | 语料朗读 | 昆明 | 中国 | 低背景噪音(家庭/办公室) | 8. | NA | NA | 16 | wav | Z. | |||
216. | 文本 | ASR、TTS语言建模 | N/A | 65000个单词 | 加加到咨询列表 | pus_AFG_PHON | 全球的动作 | 发音词典 | 普什图 | 阿富汗 | N/A | N/A | N/A | N/A | 65 000 | N/A | 文本 | P. | ||
68 | 音频 | Asr,对话式ai,语音分享 | 移动电话和固定电话 | 55小时 | 加加到咨询列表 | PAS_ASR001 | 全球的动作 | 对话录音 | 普什图 | 阿富汗 | 低背景噪音 | 967 | 2 | 可根据根据要求 | 633年13 | 8. | wav | 数据集已完全转录并加上时间戳 数据又一次包含所的发出的发作 在大多数的通话中,对话双方的说话内容都被收集并转录了,但是对于一小部分的通话,只有一半的对话被收集并转录了 |
P. | |
69 | 音频 | Asr,对话式ai,语音分享 | 麦克风 | 39小时 | 加加到咨询列表 | PAS_ASR002 | 全球的动作 | 对话录音 | 普什图 | 阿富汗 | 低背景噪音 | 40 | 2 | 可根据根据要求 | 480年9 | 16 | wav | 数据集已完全转录并加上时间戳 数据又一次包含所的发出的发作 转录文本可全部被成书成语,作用为什么可以的户外购物 平均通话时间为120分钟,每则通话中由一名发言人担任采访者,另一名发言人担任受访者,模仿类似于TransTAC风格的场景(例如民政事务询问,检查站询问等) 面试官出现在不止一组对话中,但每组对话中的被面试者都是唯一的 |
P. | |
70 | 音频 | ASR、自动字幕,关键字检索 | 麦克风 | 51小时 | 加加到咨询列表 | PAS_BRC001. | 全球的动作 | 广播录音 | 普什图 | 阿富汗 | 低背景噪音(录音棚) | N/A | 1 | 可根据根据要求 | 可根据根据要求 | N/A | wav | 数据集已完全转录并加上时间戳 数据集主要是语音,不包括音乐或广告 数据类型包括:脱口秀,访谈,新闻广播(不包括主持人阅读的新闻) |
P. | |
130 | 文本 | 尼珥,内容分类,搜索引擎 | N/A | 17313个句子 | 加加到咨询列表 | MAC_NER001 | 全球的动作 | 尼珥 | 普通话 | 中国 | N/A | N/A | N/A | 17 313. | 可根据根据要求 | N/A | 文本 | P. | ||
58 | 音频 | ASR、呼叫中心,虚拟助手 | 移动电话和固定电话 | 323小时 | 加加到咨询列表 | MAC_ASR001 | 全球的动作 | 有定稿的录音 | 普通话 | 中国 | 混合 | 2 000年 | 1 | 200 000 | 145年7 | 8. | 当地法律 | 完全转录为SpeechDAT类型 数据集附带一个包含所有转录词的发音词典[SAMPA] 每个发音人录制98个语料,语料包含数字,自然数,字母串,个人、地点和企业名称,确认项(肯定,否定,不置可否的回答),通用指令和特定指令(从215个指令中挑选),语音丰富的句子和单词 |
P. | |
59 | 音频 | ASR、虚拟助手,聊天机器人 | 麦克风 | 26小时 | 加加到咨询列表 | MAC_ASR002 | 全球手机 | 有定稿的录音 | 普通话 | 中国 | 低背景噪音(家庭/办公室) | 132 | 1 | 225 | 可根据根据要求 | 16 | wav | 数据集已完全转录,转录文件有原始版本和罗马化版本 每个发音人朗读大量语音丰富的句子,这些句子选自全国性的报纸文章,这些文章可以从网络上找到,覆盖范围广,词汇量大 与卡尔斯鲁厄理工学院(工具包)合作开发 |
P. | |
209. | 文本 | ASR、TTS语言建模 | N/A | 35000个单词 | 加加到咨询列表 | zho_chn_phon. | 全球的动作 | 发音词典 | 中文(简体) | 中国 | N/A | N/A | N/A | N/A | 35 000 | N/A | 文本 | P. | ||
210. | 文本 | ASR、TTS语言建模 | N/A | 50000个单词 | 加加到咨询列表 | zho_TWN_PHON | 全球的动作 | 发音词典 | 中文(繁体) | 台湾 | N/A | N/A | N/A | N/A | 50 000 | N/A | 文本 | P. | ||
273. | 音频 | Asr,对话式ai,语音分享 | 手机麦克风 | 2.49小时 | 加加到咨询列表 | HANGZHOU_ASR001_CN | 中国的动作 | 语料朗读 | 杭州方言 | 中国 | 低背景噪音(家庭/办公室) | 10 | NA | NA | 16 | wav | Z. | |||
259. | 音频 | Asr,对话式ai,语音分享 | 录音笔/麦克风 | 42.7小时 | 加加到咨询列表 | WUHAN_ASR001_CN | 中国的动作 | 对话录音 | 武汉方言 | 中国 | 低背景噪音(家庭/办公室) | 135 | 1 | NA | NA | 16 | wav | 覆盖地区: 武汉市下辖的江岸、江汉、硚口、汉阳、武昌五区 注:数据不包含东北郊区口音数据以及未成年人录制数据。单人发音时长约40分钟,单个语音对话20~30分钟之间 内容为2~5人自由对话形式 数据为脱敏数据,编号和录制人信息会打乱。数据库只是语音库,不含有转写文字 | Z. | |
260. | 音频 | Asr,对话式ai,语音分享 | 移动电话 | 58.1小时 | 加加到咨询列表 | WUHAN_ASR002_CN | 中国的动作 | 对话录音 | 武汉方言 | 中国 | 低背景噪音(家庭/办公室) | 180 | 1 | NA | NA | 8. | wav | 覆盖地区:武汉市下辖的江岸、江汉、硚口、汉阳、武昌五区 注:数据不包含东北郊区口音数据以及未成年人录制数据。单人发音时长约40分钟,单个语音对话20~30分钟之间 内容为2~5人自由对话形式 数据为脱敏数据,编号和录制人信息会打乱。数据库只是语音库,不含有转写文字 | Z. | |
280. | 音频 | Asr,对话式ai,语音分享 | 手机麦克风 | 3.19小时 | 加加到咨询列表 | WUHAN_ASR003_CN | 中国的动作 | 语料朗读 | 武汉 | 中国 | 低背景噪音(家庭/办公室) | 8. | NA | NA | 16 | wav | Z. | |||
275. | 音频 | Asr,对话式ai,语音分享 | 手机麦克风 | 2.9小时 | 加加到咨询列表 | HENAN_ASR001_CN | 中国的动作 | 语料朗读 | 河南 | 中国 | 低背景噪音(家庭/办公室) | 7. | NA | NA | 16 | wav | Z. | |||
268. | 音频 | Asr,对话式ai,语音分享 | 手机麦克风 | 16.6小时 | 加加到咨询列表 | FRA_ASR004_CN | 中国的动作 | 自由说 | 法律(法国) | 法国 | 低背景噪音(家庭/办公室) | 96 | 1 | NA | NA | 16 | wav | F | ||
182 | 文本 | ASR、TTS语言建模 | N/A | 67000个单词 | 加加到咨询列表 | fra_CAN_PHON | 全球的动作 | 发音词典 | 法语 | 加大大 | N/A | N/A | N/A | N/A | 67 000 | N/A | 文本 | F | ||
32 | 音频 | Asr,对话式ai,语音分享 | 移动电话和固定电话 | 9小时 | 加加到咨询列表 | FRC_ASR003 | 全球的动作 | 对话录音 | 法语 | 加大大 | 混合 | 68 | 2 | 可根据根据要求 | 022年6 | 8. | 当地法律 | 数据集已完全转录并加上时间戳 数据又一次包含所的发出的发作 平均通话时长为10到15分钟 在大多数通话中,只有一半的对话被收集并转录了,但是对于一小部分的通话,对话双方(呼入者和呼出者)的说话内容都被收集并转录了 |
F | |
30. | 音频 | ASR、呼叫中心,虚拟助手 | 移动电话 | 131小时 | 加加到咨询列表 | FRC_ASR001 | 全球的动作 | 有定稿的录音 | 法语 | 加大大 | 混合 | 1 000 | 1 | 100 000 | 697年11 | 8. | 当地法律 | 完全转录为SpeechDAT类型 数据集附带一个包含所有转录词的发音词典[SAMPA] 每个发表人录制100个语料,语料语料数码,自然数,字母串,个人,地点和企业名,确认项(肯定,否定,不可能的回答),通用指令和特价指令,语音丰富句子和单位和单位 |
F | |
31 | 音频 | ASR、虚拟助手,聊天机器人 | 麦克风 | 46小时 | 加加到咨询列表 | FRC_ASR002 | 全球的动作 | 有定稿的录音 | 法语 | 加大大 | 低背景噪音(家庭/办公室) | 150 | 1 | 22 500 | 755 | 16 | 当地法律 | 数据集已完全转录并加上时间戳 数据又一次包含所的发出的发作 每个发音人录制150个语料,语料包含数字,数字串(随机生成的),地址,语音丰富的句子和单词 |
F | |
56 | 音频 | ASR、呼叫中心,虚拟助手 | 仅固定电话 | 45小时 | 加加到咨询列表 | 卢森堡法语演讲 | 细微差别 | 有定稿的录音 | 法语 | 卢森堡 | 低背景噪音 | 614. | 1 | 000年32 | 可根据根据要求 | 8. | 可根据根据要求 | 数据集已完全转录为SpeechDAT类型,并附有发音词典和验证报告 每每发表人录制53个语料,语料语料数码,自然数,字母串,个人,地点和企业名称,确认项(肯定,否定,不可能的回答),通用指令和特价指令,语音丰富和特点指令,语音丰富的句子和单位 |
F | |
4. | 音频 | ASR、呼叫中心,虚拟助手 | 仅固定电话 | 76小时 | 加加到咨询列表 | 比利时法语演讲(II) | 细微差别 | 有定稿的录音 | 法语 | 比利时 | 低背景噪音 | 1 000 | 1 | 53 000 | 可根据根据要求 | 8. | 当地法律 | 数据集已完全转录为SpeechDAT类型,并附有发音词典和验证报告 每个发音人录制53个语料,语料包括数字,自然数,字母串,个人、地点和企业名称,确认项(肯定,否定,不置可否的回答),通用指令和特定指令,语音丰富的句子和单词以及自由发挥的特定指令 |
F | |
183 | 文本 | ASR、TTS语言建模 | N/A | 112000个单词 | 加加到咨询列表 | fra_FRA_PHON | 全球的动作 | 发音词典 | 法语 | 法国 | N/A | N/A | N/A | N/A | 112 000 | N/A | 文本 | F | ||
36 | 音频 | Asr,对话式ai,语音分享 | 移动电话和固定电话 | 25小时 | 加加到咨询列表 | FRF_ASR001 | 全球的动作 | 对话录音 | 法语 | 法国 | 低背景噪音 | 563 | 2 | 可根据根据要求 | 922年11 | 8. | 当地法律 | 数据集已完全转录并加上时间戳 数据又一次包含所的发出的发作 在大多数的通话中,对话双方的说话内容都被收集并转录了,但是对于一小部分的通话,只有一半的对话被收集并转录了 |
F | |
33 | 音频 | ASR、呼叫中心,虚拟助手 | 仅固定电话 | 41小时 | 加加到咨询列表 | 法语演说(ii)FDB-1000 | 细微差别 | 有定稿的录音 | 法语 | 法国 | 低背景噪音(家庭/办公室) | 1 017 | 1 | 48 000. | 可根据根据要求 | 8. | 可根据根据要求 | 数据集已完全转录为SpeechDAT类型,并附有发音词典和验证报告 每个发音人录制48个语料,语料包含数字,自然数,字母串,个人、地点和企业名称,确认项(肯定,否定,不置可否的回答),通用指令和特定指令,语音丰富的句子和单词 |
F | |
34 | 音频 | ASR、呼叫中心,虚拟助手 | 仅固定电话 | 305小时 | 加加到咨询列表 | 法语SpeemDAT(ii)FDB-5000 | 细微差别 | 有定稿的录音 | 法语 | 法国 | 低背景噪音 | 040年5 | 1 | 237 000. | 可根据根据要求 | 8. | 可根据根据要求 | 数据集已完全转录为SpeechDAT类型,并附有发音词典和验证报告 每个发表人录制47个语料,语料语料数码,自然数,字母串,个人,地点和企业名称,确认(肯定,否定,不可能的回答),通用指令和特价指令,语音丰富的句子和单位 |
F | |
37 | 音频 | ASR、虚拟助手,聊天机器人 | 麦克风 | 26小时 | 加加到咨询列表 | FRF_ASR003 | 全球手机 | 有定稿的录音 | 法语 | 法国 | 低背景噪音(家庭/办公室) | 98 | 1 | 273 | 可根据根据要求 | 16 | wav | 数据集已完全转录,转录文件有原始版本和罗马化版本 每个发音人朗读大量语音丰富的句子,这些句子选自全国性的报纸文章,这些文章可以从网络上找到,覆盖范围广,词汇量大 与卡尔斯鲁厄理工学院(工具包)合作开发 |
F | |
184 | 文本 | ASR、TTS语言建模 | N/A | 95000个单词 | 加加到咨询列表 | fra_FRA_POS | 全球的动作 | 词性词典 | 法语 | 法国 | N/A | N/A | N/A | N/A | 95 000 | N/A | 文本 | F | ||
35 | 音频 | ASR、虚拟助手,车载人机界面及娱乐设备 | 麦克风和移动电话 | 加加到咨询列表 | 法国SpeechDat-Car | 细微差别 | 有定稿的录音 | 法语 | 法国 | 混合(车内) | 300 | 5. | 500年37 | 可根据根据要求 | 16和8 | 可根据根据要求 | 数据集已完全转录,并附有发音词典和验证报告 每个发音人录制大约125个语料,语料包含数字,自然数,字母串,个人、地点和企业名称(一些是自由发挥的),通用指令和特定指令,语音丰富的句子和单词以及自由发挥的语料 |
F | ||
141 | 文本 | ASR、TTS语言建模 | N/A | 4000个单词 | 加加到咨询列表 | fra_DZA_PHON | 全球的动作 | 发音词典 | 法语 | 阿尔及利亚 | N/A | N/A | N/A | N/A | 000年4 | N/A | 文本 | 阿拉伯文章 | F | |
217. | 文本 | ASR、TTS语言建模 | N/A | 40000个单词 | 加加到咨询列表 | pol_POL_PHON | 全球的动作 | 发音词典 | 波兰语 | 波兰 | N/A | N/A | N/A | N/A | 40 000 | N/A | 文本 | B. | ||
116 | 音频 | ASR、虚拟助手,聊天机器人 | 移动电话 | 293小时 | 加加到咨询列表 | POL_ASR002_CN | 中国的动作 | 有定稿的录音 | 波兰语 | 波兰 | 低背景噪音(家庭/办公室) | 353 | 1 | 106 674 | 168 544 | 16 | wav | 数量集已完全转录 | B. | |
72 | 音频 | ASR、呼叫中心,虚拟助手 | 仅固定电话 | 78小时 | 加加到咨询列表 | 波兰SpeechDat (E)数据库 | 细微差别 | 有定稿的录音 | 波兰语 | 波兰 | 低背景噪音 | 1 000 | 1 | 48 000. | 可根据根据要求 | 8. | 可根据根据要求 | 数据集已完全转录为SpeechDAT类型,并附有发音词典和验证报告 每个发音人录制48个语料,语料包含数字,自然数,字母串,个人、地点和企业名称,确认项(肯定,否定,不置可否的回答),通用指令和特定指令,语音丰富的句子和单词 |
B. | |
71 | 音频 | ASR、虚拟助手,聊天机器人 | 麦克风 | 25小时 | 加加到咨询列表 | POL_ASR001 | 全球手机 | 有定稿的录音 | 波兰语 | 波兰 | 低背景噪音(家庭/办公室) | 99 | 1 | 130 | 可根据根据要求 | 16 | wav | 数据集已完全转录,转录文件有原始版本和罗马化版本 每个发音人朗读大量语音丰富的句子,这些句子选自全国性的报纸文章,这些文章可以从网络上找到,覆盖范围广,词汇量大 与卡尔斯鲁厄理工学院(工具包)合作开发 |
B. | |
218. | 文本 | ASR、TTS语言建模 | N/A | 4000个单词 | 加加到咨询列表 | pol_POL_POS | 全球的动作 | 词性词典 | 波兰语 | 波兰 | N/A | N/A | N/A | N/A | 000年4 | N/A | 文本 | B. | ||
131 | 文本 | 尼珥,内容分类,搜索引擎 | N/A | 19584个句子 | 加加到咨询列表 | FAR_NER001 | 全球的动作 | 尼珥 | 波斯语 | 伊朗 | N/A | N/A | N/A | 19日584年 | 可根据根据要求 | N/A | 文本 | B. | ||
28 | 音频 | Asr,对话式ai,语音分享 | 移动电话和固定电话 | 30小时 | 加加到咨询列表 | FAR_ASR002 | 全球的动作 | 对话录音 | 波斯语 | 伊朗 | 混合 | 1 000 | 2 | 可根据根据要求 | 358年12 | 8. | wav | 数据集已完全转录并加上时间戳 数据又一次包含所的发出的发作 |
B. | |
27 | 音频 | ASR、呼叫中心,虚拟助手 | 移动电话和固定电话 | 85小时 | 加加到咨询列表 | FAR_ASR001 | 全球的动作 | 有定稿的录音 | 波斯语 | 伊朗 | 混合 | 789 | 1 | 38 400 | 716年8 | 8. | 当地法律 | 完全转录为OrienTel类型 数据集附带一个包含所有转录词的发音词典[SAMPA] 每个发音人录制48个语料,语料包含数字,自然数,字母串,个人、地点和企业名称,确认项(肯定,否定,不置可否的回答),通用指令和特定指令,语音丰富的句子和单词 |
B. | |
241. | 文本 | ASR、TTS语言建模 | N/A | 50000个单词 | 加加到咨询列表 | tel_IND_PHON | 全球的动作 | 发音词典 | 泰卢固语 | 印度 | N/A | N/A | N/A | N/A | 50 000 | N/A | 文本 | T. | ||
242. | 文本 | ASR、TTS语言建模 | N/A | 105000个单词 | 加加到咨询列表 | tam_IND_PHON | 全球的动作 | 发音词典 | 泰米尔语 | 印度 | N/A | N/A | N/A | N/A | 105 000 | N/A | 文本 | T. | ||
271. | 音频 | Asr,对话式ai,语音分享 | 手机麦克风 | 2.95小时 | 加加到咨询列表 | THA_ASR002_CN | 中国的动作 | 自由说 | 泰语(泰国) | 泰国 | 低背景噪音(家庭/办公室) | NA | NA | 17 | wav | T. | ||||
123 | 图像 | 文件处理, 文件搜索 | 照相机 | 1219张图片 | 加加到咨询列表 | IMG_OCR_THA_CN | 中国的动作 | OCR. | 泰语 | 泰国 | 不同光线 | 10 | NA | NA | NA | NA | jpg | 包含文字的图表,例如购物收据,票据,发布,汽车发出票 | T. | |
243. | 文本 | ASR、TTS语言建模 | N/A | 30000个单词 | 加加到咨询列表 | tha_THA_PHON | 全球的动作 | 发音词典 | 泰语 | 泰国 | N/A | N/A | N/A | N/A | 30 000 | N/A | 文本 | T. | ||
97 | 音频 | ASR、虚拟助手,聊天机器人 | 麦克风 | 28小时 | 加加到咨询列表 | THA_ASR001 | 全球手机 | 有定稿的录音 | 泰语 | 泰国 | 低背景噪音(家庭/办公室) | 98 | 1 | 039年14 | 可根据根据要求 | 16 | wav | 数据集已完全转录,转录文件有原始版本和罗马化版本 每个发音人朗读大量语音丰富的句子,这些句子选自全国性的报纸文章,这些文章可以从网络上找到,覆盖范围广,词汇量大 与卡尔斯鲁厄理工学院(工具包)合作开发 |
T. | |
189 | 文本 | ASR、TTS语言建模 | N/A | 15000个单词 | 加加到咨询列表 | hat_HTI_PHON | 全球的动作 | 发音词典 | 海地克里奥尔语 | 海地 | N/A | N/A | N/A | N/A | 000年15 | N/A | 文本 | H | ||
252. | 文本 | ASR、TTS语言建模 | N/A | 10000个单词 | 加加到咨询列表 | hsn_CHN_PHON | 全球的动作 | 发音词典 | 湘语 | 中国 | N/A | N/A | N/A | N/A | 000 | N/A | 文本 | X | ||
199 | 文本 | ASR、TTS语言建模 | N/A | 20,000个单词 | 加加到咨询列表 | jav_idn_phon. | 全球的动作 | 发音词典 | 爪哇语 | 印度尼西亚 | N/A | N/A | N/A | N/A | 000 | N/A | 文本 | G | ||
237. | 文本 | ASR、TTS语言建模 | N/A | 100,000个单反装 | 加加到咨询列表 | swe_swe_phon. | 全球的动作 | 发音词典 | 瑞典语 | 瑞典 | N/A | N/A | N/A | N/A | 100 000 | N/A | 文本 | R. | ||
238. | 文本 | ASR、TTS语言建模 | N/A | 105000个单词 | 加加到咨询列表 | swe_SWE_POS | 全球的动作 | 词性词典 | 瑞典语 | 瑞典 | N/A | N/A | N/A | N/A | 105 000 | N/A | 文本 | R. | ||
94 | 音频 | ASR、虚拟助手,聊天机器人 | 麦克风 | 30小时 | 加加到咨询列表 | SWE_ASR001. | 全球手机 | 有定稿的录音 | 瑞典语 | 瑞典-芬兰 | 低背景噪音(家庭/办公室) | 98 | 1 | 816年11 | 可根据根据要求 | 16 | wav | 数据集已完全转录,转录文件有原始版本和罗马化版本 每个发音人朗读大量语音丰富的句子,这些句子选自全国性的报纸文章,这些文章可以从网络上找到,覆盖范围广,词汇量大 与卡尔斯鲁厄理工学院(工具包)合作开发 |
R. | |
188 | 文本 | ASR、TTS语言建模 | N/A | 35000个单词 | 加加到咨询列表 | grn_PRY_PHON | 全球的动作 | 发音词典 | 瓜拉尼语 | 巴拉圭 | N/A | N/A | N/A | N/A | 35 000 | N/A | 文本 | G | ||
253. | 文本 | ASR、TTS语言建模 | N/A | 75,000个单反装 | 加加到咨询列表 | zul_ZAF_PHON | 全球的动作 | 发音词典 | 祖鲁语 | 南非 | N/A | N/A | N/A | N/A | 75 000 | N/A | 文本 | Z. | ||
206. | 文本 | ASR、TTS语言建模 | N/A | 60000个单词 | 加加到咨询列表 | lit_LTU_PHON | 全球的动作 | 发音词典 | 立陶宛语 | 立陶宛 | N/A | N/A | N/A | N/A | 60 000. | N/A | 文本 | L. | ||
122 | 图像 | 文件处理, 文件搜索 | 照相机 | 200张图画 | 加加到咨询列表 | IMG_OCR_MAC_CN. | 中国的动作 | OCR. | N/A | 中国 | 不同光线 | 30. | NA | NA | NA | NA | jpg | 每张图画中文的文章均被线条边框标记 包含大量中文的图像,例如书籍,出版物,海报,收据,PPT以及印刷品等等 |
Z. | |
228. | 文本 | ASR、TTS语言建模 | N/A | 25000个单词 | 加加到咨询列表 | kur_IRQ_PHON | 全球的动作 | 发音词典 | 索马里克 | 伊拉克 | N/A | N/A | N/A | N/A | 25 000年 | N/A | 文本 | S. | ||
227. | 文本 | ASR、TTS语言建模 | N/A | 76000个单词 | 加加到咨询列表 | som_SOM_PHON | 全球的动作 | 发音词典 | 索马里克 | 索马里 | N/A | N/A | N/A | N/A | 76 000 | N/A | 文本 | S. | ||
83 | 音频 | Asr,对话式ai,语音分享 | 移动电话和固定电话 | 50小时 | 加加到咨询列表 | Som_Asr001. | 全球的动作 | 对话录音 | 索马里克 | 索马里 | 低背景噪音 | 1 000 | 2 | 可根据根据要求 | 217年23 | 8. | 当地法律 | 数据集已完全转录并加上时间戳 数据又一次包含所的发出的发作 |
S. | |
262. | 音频 | Asr,对话式ai,语音分享 | 移动电话 | 122小时 | 加加到咨询列表 | WWE_ASR001_CN | 中国的动作 | 对话录音 | 维吾尔族语 | 中国 | 低背景噪音(家庭/办公室) | 231. | 1 | NA | NA | 16 | wav | 覆盖地区: 和田方言,中央方言。单人发音时长约30分钟,内容为2人自由对话形式 数据为脱敏数据,编号和录制人信息会打乱。数据库只是语音库,不含有转写文字 | Z. | |
274. | 音频 | Asr,对话式ai,语音分享 | 手机麦克风 | 3.9小时 | 加加到咨询列表 | WWE_ASR002_CN | 中国的动作 | 语料朗读 | 维语 | 中国 | 低背景噪音(家庭/办公室) | N/A | NA | NA | 16 | wav | 主题有歌曲,赛事,游戏 | Z. | ||
223. | 文本 | ASR、TTS语言建模 | N/A | 15000个单词 | 加加到咨询列表 | ron_ROU_PHON | 全球的动作 | 发音词典 | 罗马尼亚语 | 罗马尼亚 | N/A | N/A | N/A | N/A | 000年15 | N/A | 文本 | L. | ||
77 | 音频 | Asr,对话式ai,语音分享 | 移动电话和固定电话 | 37小时 | 加加到咨询列表 | ROM_ASR001 | 全球的动作 | 对话录音 | 罗马尼亚语 | 罗马尼亚 | 低背景噪音 | 200. | 2 | 可根据根据要求 | 658年16日 | 8. | 当地法律 | 数据集已完全转录并加上时间戳 数据又一次包含所的发出的发作 这个项目记录了200个电话对话 - 是由100个呼入者,各进行2次呼叫(一次使用固定电话,一次使用移动电话)至100个接收者之一 |
L. | |
205. | 文本 | ASR、TTS语言建模 | N/A | 9000个单词 | 加加到咨询列表 | lao_LAO_PHON | 全球的动作 | 发音词典 | 老挝语 | 老挝 | N/A | N/A | N/A | N/A | 000年9 | N/A | 文本 | L. | ||
124 | 图像 | 文件处理, 文件搜索 | 照相机 | 7293张图片 | 加加到咨询列表 | IMG_OCR_FIN_CN | 中国的动作 | OCR. | 芬兰克 | 芬兰 | 不同光线 | 4. | NA | NA | NA | NA | jpg | 包含文字的图像,例如广告牌,产品外包装,标志牌,杂志以及菜单等等 | F | |
180 | 文本 | ASR、TTS语言建模 | N/A | 85000个单词 | 加加到咨询列表 | fin_FIN_PHON | 全球的动作 | 发音词典 | 芬兰克 | 芬兰 | N/A | N/A | N/A | N/A | 85 000 | N/A | 文本 | F | ||
181 | 文本 | ASR、TTS语言建模 | N/A | 10000个单词 | 加加到咨询列表 | fin_fin_pos. | 全球的动作 | 词性词典 | 芬兰克 | 芬兰 | N/A | N/A | N/A | N/A | 000 | N/A | 文本 | F | ||
272. | 音频 | Asr,对话式ai,语音分享 | 手机麦克风 | 2.84小时 | 加加到咨询列表 | SUZHOU_ASR001_CN | 中国的动作 | 语料朗读 | 苏州方言 | 中国 | 低背景噪音(家庭/办公室) | 8. | NA | NA | 16 | wav | Z. | |||
166 | 文本 | ASR、TTS语言建模 | N/A | 50000个单词 | 加加到咨询列表 | eng_can_phon. | 全球的动作 | 发音词典 | 英语 | 加大大 | N/A | N/A | N/A | N/A | 50 000 | N/A | 文本 | y | ||
19 | 音频 | ASR、呼叫中心,虚拟助手 | 移动电话和固定电话 | 144小时 | 加加到咨询列表 | ENC_ASR001 | 全球的动作 | 有定稿的录音 | 英语 | 加大大 | 混合 | 1 000 | 1 | 99 000 | 483年12 | 8. | 法律或wav | 完全转录为萨拉II / SpeechDAT类型 数据又一次包含所的发出的发作 每每发表人录制99个语料,语料语料数码,自然数,字母串,个人,地点和企业名称,确认(肯定,否定,不可能的回答),通用指令和特价指令,语音丰富的句子和单位 |
y | |
167 | 文本 | ASR、TTS语言建模 | N/A | 3000个单词 | 加加到咨询列表 | eng_CAN_POS | 全球的动作 | 词性词典 | 英语 | 加大大 | N/A | N/A | N/A | N/A | 3 000 | N/A | 文本 | y | ||
170 | 文本 | ASR、TTS语言建模 | N/A | 60000个单词 | 加加到咨询列表 | eng_IND_PHON | 全球的动作 | 发音词典 | 英语 | 印度 | N/A | N/A | N/A | N/A | 60 000. | N/A | 文本 | y | ||
22 | 音频 | Asr,对话式ai,语音分享 | 移动电话和固定电话 | 67小时 | 加加到咨询列表 | ENI_ASR002. | 全球的动作 | 对话录音 | 英语 | 印度 | 低背景噪音 | 540 | 2 | 77 565. | 646年11 | 8. | 当地法律 | 数据集已完全转录并加上时间戳 数据又一次包含所的发出的发作 这个项目记录了271个电阻对话 |
y | |
21 | 音频 | ASR、呼叫中心,虚拟助手 | 移动电话和固定电话 | 217小时 | 加加到咨询列表 | ENI_ASR001. | 全球的动作 | 有定稿的录音 | 英语 | 印度 | 混合 | 2 358年 | 1 | 117 900 | 190年9 | 8. | 当地法律 | 完全转录为SpeechDAT类型 数据集附带一个包含所有转录词的发音词典[SAMPA] 每个发表人录制49个语料,语料语料数码,自然数,字母串,个人,地点和企业名称,确认项(肯定,否定,不可能的回答),通用指令和特价指令,语音丰富的句子和单位 |
y | |
171 | 文本 | ASR、TTS语言建模 | N/A | 13000个单词 | 加加到咨询列表 | eng_IND_POS | 全球的动作 | 词性词典 | 英语 | 印度 | N/A | N/A | N/A | N/A | 000年13 | N/A | 文本 | y | ||
168 | 文本 | ASR、TTS语言建模 | N/A | 5,000个单反装 | 加加到咨询列表 | eng_phl_phon. | 全球的动作 | 发音词典 | 英语 | 菲律宾 | N/A | N/A | N/A | N/A | 5 000. | N/A | 文本 | y | ||
20. | 音频 | Asr,对话式ai,语音分享 | 移动电话和固定电话 | 53小时 | 加加到咨询列表 | ENF_ASR001. | 全球的动作 | 对话录音 | 英语 | 菲律宾 | 低背景噪音 | 450 | 2 | 41 602 | 272年7 | 8. | 法律或wav | 数据集已完全转录并加上时间戳 数据又一次包含所的发出的发作 平均通话时长为10到15分钟 |
y | |
18 | 音频 | Asr,对话式ai,语音分享 | 移动电话和固定电话 | 28小时 | 加加到咨询列表 | ENA_ASR001 | 全球的动作 | 对话录音 | 英语 | 埃及 | 低背景噪音 | 250. | 2 | 可根据根据要求 | 619年5 | 8. | 当地法律 | 数据集已完全转录并加上时间戳 数据又一次包含所的发出的发作 平均通话时长为10到15分钟 |
y | |
127 | 文本 | 尼珥,内容分类,搜索引擎 | N/A | 22768个句子 | 加加到咨询列表 | ENG_NER001 | 全球的动作 | 尼珥 | 英语 | N/A | N/A | N/A | N/A | 22 768 | 可根据根据要求 | N/A | 文本 | y | ||
165 | 文本 | ASR、TTS语言建模 | N/A | 157000个单词 | 加加到咨询列表 | eng_AUS_PHON | 全球的动作 | 发音词典 | 英语 | 澳大利亚 | N/A | N/A | N/A | N/A | 157 000 | N/A | 文本 | y | ||
1 | 音频 | ASR、呼叫中心,虚拟助手 | 移动电话和固定电话 | 92小时 | 加加到咨询列表 | AUS_ASR001 | 全球的动作 | 有定稿的录音 | 英语 | 澳大利亚 | 低背景噪音(家庭/办公室) | 500 | 1 | 82 500. | 35 137 | 8. | 当地法律 | 完全转录为SpeechDAT类型 数据又一次包含所的发出的发作 每个发音人录制162个朗读录音,录音包含数字,自然数,字母串,个人、地点和企业名称,确认项(肯定,否定,不置可否的回答),通用指令和特定指令(从215个指令中挑选),语音丰富的句子和单词 |
E. | |
2 | 音频 | ASR、呼叫中心,虚拟助手 | 移动电话和固定电话 | 118小时 | 加加到咨询列表 | AUS_ASR002 | 全球的动作 | 有定稿的录音 | 英语 | 澳大利亚 | 混合 | 1 000 | 1 | 75 000 | 19 | 8. | 当地法律 | 完全转录为SpeechDAT类型 数据又一次包含所的发出的发作 每个发音人录制75个语料,语料包括数字,自然数,字母串,个人、地点和企业名称,确认项(肯定,否定,不置可否的回答),通用指令和特定指令,语音丰富的句子和单词 语料包含了有定稿的录音和自由发挥的录音,其中每个稿子包含了5条自由发挥的录音 |
E. | |
172 | 文本 | ASR、TTS语言建模 | N/A | 12,000个单词 | 加加到咨询列表 | eng_IRL_PHON | 全球的动作 | 发音词典 | 英语 | 爱尔兰 | N/A | N/A | N/A | N/A | 000年12 | N/A | 文本 | y | ||
173 | 文本 | ASR、TTS语言建模 | N/A | 50000个单词 | 加加到咨询列表 | eng_NZL_PHON | 全球的动作 | 发音词典 | 英语 | 纽西兰 | N/A | N/A | N/A | N/A | 50 000 | N/A | 文本 | y | ||
176 | 文本 | ASR、TTS语言建模 | N/A | 330000个单词 | 加加到咨询列表 | eng_USA_PHON | 全球的动作 | 发音词典 | 英语 | 美国 | N/A | N/A | N/A | N/A | 330 000. | N/A | 文本 | y | ||
103 | 音频 | Asr,对话式ai,语音分享 | 移动电话 | 1000小时 | 加加到咨询列表 | USE_ASR003 | 全球的动作 | 对话录音 | 英语 | 美国 | 低背景噪音 | 2 000年 | 1 | 500 000 | 52 586 | 16 | wav | 数据集已完全转录并加上时间戳 数据又一次包含所的发出的发作 对话涵盖了各种主题,包括学习/专业/工作,家乡,生活安排,天气和季节,准时,电视节目/电影 |
y | |
89 | 音频 | ASR、虚拟助手,聊天机器人 | 麦克风 | 53小时 | 加加到咨询列表 | SPEECON英语(美国)数据库 | 细微差别 | 有定稿的录音 | 英语 | 美国 | 混合(办公室/娱乐场所/车内/公共场所) | 600(550个成年语料提供者及50个儿童语料提供者者 | 4. | 170 000 | 可根据根据要求 | 16 | 可根据根据要求 | 数据集已完全转录为SpeechDAT类型,并附有发音词典和验证报告 每个成年发音人录制290个语料,每个儿童发音人录制210个语料,语料包括数字,自然数,字母串,个人、地点和企业名称,语音丰富的句子和单词,儿童发音人还需要提供关于玩具,手机的指令以及通用指令,成年发音人还需要提供应用词汇,以及自由发挥的语料 |
y | |
102 | 音频 | ASR、虚拟助手,聊天机器人 | 麦克风 | 62小时 | 加加到咨询列表 | USE_ASR001 | 全球的动作 | 有定稿的录音 | 英语 | 美国 | 低背景噪音(录音棚) | 200. | 2 | 80 000 | 18 318 | 48 | 当地法律 | 数据集已完全转录并加上时间戳 数据又一次包含所的发出的发作 每个发音人录制400个语料,语料包括数字,自然数,人名,城市名,电话号码,通用指令和特定指令,语音丰富的句子和单词 |
y | |
177 | 文本 | ASR、TTS语言建模 | N/A | 263000个单词 | 加加到咨询列表 | eng_USA_POS | 全球的动作 | 词性词典 | 英语 | 美国 | N/A | N/A | N/A | N/A | 263 000 | N/A | 文本 | y | ||
95 | 音频 | TTS | 头戴式麦克风 | 11小时 | 加加到咨询列表 | TC-STAR女性基线声音劳拉 | 细微差别 | 有定稿的录音 | 英语 | 英国 | 低背景噪音(录音棚) | 1 | 1 | 可根据根据要求 | 可根据根据要求 | 96 | 可根据根据要求 | 数据集包括人工正字法转录的转录文件,自动分割的音素,自动生成的音高标记(已手动检查了一定比例的语音段和音高标记) 数码有一个一茎词性,词元和音标的发出者 |
y | |
96 | 音频 | TTS | 头戴式麦克风 | 7小时 | 加加到咨询列表 | TC-STAR男性基线声音Ian | 细微差别 | 有定稿的录音 | 英语 | 英国 | 低背景噪音(录音棚) | 1 | 1 | 可根据根据要求 | 可根据根据要求 | 96 | 可根据根据要求 | 数据集包括人工正字法转录的转录文件,自动分割的音素,自动生成的音高标记(已手动检查了一定比例的语音段和音高标记) 数码有一个一茎词性,词元和音标的发出者 |
y | |
174 | 文本 | ASR、TTS语言建模 | N/A | 195000个单词 | 加加到咨询列表 | eng_GBR_PHON | 全球的动作 | 发音词典 | 英语 | 英国 | N/A | N/A | N/A | N/A | 195 000 | N/A | 文本 | y | ||
One hundred. | 音频 | Asr,对话式ai,语音分享 | 移动电话和固定电话 | 150小时 | 加加到咨询列表 | UKE_ASR001 | 全球的动作 | 对话录音 | 英语 | 英国 | 低背景噪音 | 1 150 | 2 | 298 562 | 24日193年 | 8. | wav | 数据集已完全转录并加上时间戳 数据又一次包含所的发出的发作 |
y | |
254. | 音频 | Asr,对话式ai,语音分享 | 移动电话和固定电话 | 50小时 | 加加到咨询列表 | UKE_ASR001B | 全球的动作 | 对话录音 | 英语 | 英国 | 低背景噪音 | 1 150 | 2 | 可根据根据要求 | 192年13 | 8. | wav | 数据集已完全转录并加上时间戳 数据又一次包含所的发出的发作 |
y | |
175 | 文本 | ASR、TTS语言建模 | N/A | 155,000个单反装 | 加加到咨询列表 | eng_GBR_POS | 全球的动作 | 词性词典 | 英语 | 英国 | N/A | N/A | N/A | N/A | 155 000 | N/A | 文本 | y | ||
164 | 文本 | ASR、TTS语言建模 | N/A | 5,000个单反装 | 加加到咨询列表 | eng_ARE_PHON | 全球的动作 | 发音词典 | 英语 | 阿拉伯联合酋长国 | N/A | N/A | N/A | N/A | 5 000. | N/A | 文本 | y | ||
63 | 音频 | ASR、呼叫中心,虚拟助手 | 移动电话和固定电话 | 33小时 | 加加到咨询列表 | Orientel英语在阿拉伯联合酋长国说 | 细微差别 | 有定稿的录音 | 英语 | 阿拉伯联合酋长国 | 低背景噪音 | 500 | 1 | 25 500年 | 可根据根据要求 | 8. | 当地法律 | 数据集已完全转录为SpeechDAT类型,并附有发音词典和验证报告 每个发音人录制51个语料,语料包括数字,自然数,字母串,个人、地点和企业名称,确认项(肯定,否定,不置可否的回答),通用指令和特定指令,语音丰富的句子和单词以及自由发挥的特定指令 |
y | |
169 | 文本 | ASR、TTS语言建模 | N/A | 18,000个单反装 | 加加到咨询列表 | eng_HKG_PHON | 全球的动作 | 发音词典 | 英语 | 香港 | N/A | N/A | N/A | N/A | 18 000 | N/A | 文本 | y | ||
29 | 音频 | ASR、呼叫中心,虚拟助手 | 麦克风 | 80小时 | 加加到咨询列表 | 佛兰芒语演讲 | 细微差别 | 有定稿的录音 | 荷兰语 | 比利时 | 低背景噪音 | 1 000 | 1 | 52 000 | 可根据根据要求 | 8. | 当地法律 | 数据集已完全转录为SpeechDAT类型,并附有发音词典和验证报告 每个发表人录制52个语料,语料语料数码,自然数,字母串,个人,地点和企业名,确认项(肯定,否定,不可能的回答,通用指令和特价指令,语音丰富的句子和单位自然发作的特价 |
H | |
87 | 音频 | ASR、虚拟助手,聊天机器人 | 麦克风 | 47小时 | 加加到咨询列表 | 荷兰语,来自比利时 | 细微差别 | 有定稿的录音 | 荷兰语 | 比利时 | 混合(办公室/娱乐场所/车内/公共场所) | 600(550个成年语料提供者及50个儿童语料提供者者 | 4. | 170 000 | 可根据根据要求 | 16 | 当地法律 | 数据集已完全转录为SpeechDAT类型,并附有发音词典和验证报告 每个成年发音人录制290个语料,每个儿童发音人录制210个语料,语料包括数字,自然数,字母串,个人、地点和企业名称,语音丰富的句子和单词,儿童发音人还需要提供关于玩具,手机的指令以及通用指令,成年发音人还需要提供应用词汇,以及自由发挥的语料 |
H | |
16 | 音频 | ASR、虚拟助手,车载人机界面及娱乐设备 | 麦克风和移动电话 | 27小时 | 加加到咨询列表 | 荷兰语和佛兰德语的SpeechDat-Car | 细微差别 | 有定稿的录音 | 荷兰语 | 荷兰-比利时 | 混合(车内) | 302 | 5. | 100年15 | 可根据根据要求 | 16和8 | 当地法律 | 数据集已完全转录,并附有发音词典和验证报告 每个成年发表人录制125个语料,语料语料数码,自然数,字母串,个人,地面和企业名称(一道是自然发布的),通用指令和特点,语音丰富的句子和单身及自发发作 |
H | |
163 | 文本 | ASR、TTS语言建模 | N/A | 45,000个单词 | 加加到咨询列表 | nld_nld_phon. | 全球的动作 | 发音词典 | 荷兰语 | 荷兰 | N/A | N/A | N/A | N/A | 45 000 | N/A | 文本 | H | ||
62 | 音频 | Asr,对话式ai,语音分享 | 移动电话和固定电话 | 36小时 | 加加到咨询列表 | NLD_ASR001 | 全球的动作 | 对话录音 | 荷兰语 | 荷兰 | 低背景噪音 | 200. | 2 | 可根据根据要求 | 964年14 | 8. | 当地法律 | 数据集已完全转录并加上时间戳 数据又一次包含所的发出的发作 这个项目记录了200个电话对话 - 是由100个呼入者,各进行2次呼叫(一次使用固定电话,一次使用移动电话)至100个接收者之一 |
H | |
88 | 音频 | ASR、虚拟助手,聊天机器人 | 麦克风 | 68小时 | 加加到咨询列表 | 来自荷兰的Speecon荷兰语 | 细微差别 | 有定稿的录音 | 荷兰语 | 荷兰 | 混合(办公室/娱乐场所/车内/公共场所) | 600(550个成年语料提供者及50个儿童语料提供者者 | 4. | 170 000 | 可根据根据要求 | 16 | 当地法律 | 数据集已完全转录为SpeechDAT类型,并附有发音词典和验证报告 每个成年发音人录制290个语料,每个儿童发音人录制210个语料,语料包括数字,自然数,字母串,个人、地点和企业名称,语音丰富的句子和单词,儿童发音人还需要提供关于玩具,手机的指令以及通用指令,成年发音人还需要提供应用词汇,以及自由发挥的语料 |
H | |
291. | 音频 | Asr,对话式ai,语音分享 | 手机麦克风 | 2.88小时 | 加加到咨询列表 | POR_EUR_ASR001_CN | 中国的动作 | 自由说 | 葡萄牙语(欧洲) | 葡萄牙 | 低背景噪音(家庭/办公室) | 8. | NA | NA | 16 | wav | P. | |||
219. | 文本 | ASR、TTS语言建模 | N/A | 102000个单词 | 加加到咨询列表 | por_BRA_PHON | 全球的动作 | 发音词典 | 葡萄牙语 | 巴西 | N/A | N/A | N/A | N/A | 102 000 | N/A | 文本 | P. | ||
74 | 音频 | Asr,对话式ai,语音分享 | 移动电话和固定电话 | 33小时 | 加加到咨询列表 | PTB_ASR002 | 全球的动作 | 对话录音 | 葡萄牙语 | 巴西 | 低背景噪音 | 200. | 2 | 可根据根据要求 | 287年11 | 8. | 当地法律 | 数据集已完全转录并加上时间戳 数据又一次包含所的发出的发作 |
P. | |
220. | 文本 | ASR、TTS语言建模 | N/A | 100,000个单反装 | 加加到咨询列表 | por_BRA_POS | 全球的动作 | 词性词典 | 葡萄牙语 | 巴西 | N/A | N/A | N/A | N/A | 100 000 | N/A | 文本 | P. | ||
73 | 音频 | ASR、虚拟助手,聊天机器人 | 麦克风 | 26小时 | 加加到咨询列表 | PTB_ASR001 | 全球手机 | 有定稿的录音 | 葡萄牙语 | 巴西 | 低背景噪音(家庭/办公室) | 102 | 1 | 417 | 可根据根据要求 | 16 | wav | 数据集已完全转录,转录文件有原始版本和罗马化版本 每个发音人朗读大量语音丰富的句子,这些句子选自全国性的报纸文章,这些文章可以从网络上找到,覆盖范围广,词汇量大 与卡尔斯鲁厄理工学院(工具包)合作开发 |
P. | |
221. | 文本 | ASR、TTS语言建模 | N/A | 112000个单词 | 加加到咨询列表 | por_PRT_PHON | 全球的动作 | 发音词典 | 葡萄牙语 | 葡萄牙 | N/A | N/A | N/A | N/A | 112 000 | N/A | 文本 | P. | ||
75 | 音频 | Asr,对话式ai,语音分享 | 移动电话和固定电话 | 36小时 | 加加到咨询列表 | ptp_asr001. | 全球的动作 | 对话录音 | 葡萄牙语 | 葡萄牙 | 低背景噪音 | 200. | 2 | 可根据根据要求 | 339年16日 | 8. | 当地法律 | 数据集已完全转录并加上时间戳 数据又一次包含所的发出的发作 这个项目记录了200个电话对话 - 是由100个呼入者,各进行2次呼叫(一次使用固定电话,一次使用移动电话)至100个接收者之一 |
P. | |
222. | 文本 | ASR、TTS语言建模 | N/A | 100,000个单反装 | 加加到咨询列表 | por_prt_pos. | 全球的动作 | 词性词典 | 葡萄牙语 | 葡萄牙 | N/A | N/A | N/A | N/A | 100 000 | N/A | 文本 | P. | ||
212. | 文本 | ASR、TTS语言建模 | N/A | 30000个单词 | 加加到咨询列表 | mon_MNG_PHON | 全球的动作 | 发音词典 | 蒙古语 | 蒙古 | N/A | N/A | N/A | N/A | 30 000 | N/A | 文本 | m | ||
232. | 文本 | ASR、TTS语言建模 | N/A | 15000个单词 | 加加到咨询列表 | spa_COL_PHON | 全球的动作 | 发音词典 | 西班牙语 | 哥伦比亚 | N/A | N/A | N/A | N/A | 000年15 | N/A | 文本 | X | ||
235. | 文本 | ASR、TTS语言建模 | N/A | 15000个单词 | 加加到咨询列表 | spa_VEN_PHON | 全球的动作 | 发音词典 | 西班牙语 | 委内瑞拉 | N/A | N/A | N/A | N/A | 000年15 | N/A | 文本 | X | ||
231. | 文本 | ASR、TTS语言建模 | N/A | 15000个单词 | 加加到咨询列表 | spa_CHL_PHON | 全球的动作 | 发音词典 | 西班牙语 | 智利 | N/A | N/A | N/A | N/A | 000年15 | N/A | 文本 | X | ||
230. | 文本 | ASR、TTS语言建模 | N/A | 100,000个单反装 | 加加到咨询列表 | spa_ESP_PHON | 全球的动作 | 发音词典 | 西班牙语 | 西班牙 | N/A | N/A | N/A | N/A | 100 000 | N/A | 文本 | X | ||
113 | 音频 | ASR、虚拟助手,聊天机器人 | 移动电话 | 540小时 | 加加到咨询列表 | ESP_ASR002_CN | 中国的动作 | 有定稿的录音 | 西班牙语 | 西班牙 | 低背景噪音(家庭/办公室) | 347 | 1 | 258 395. | 134 939 | 16 | wav | 数量集已完全转录 | X | |
25 | 音频 | ASR、虚拟助手,聊天机器人 | 麦克风 | 39小时 | 加加到咨询列表 | ESP_ASR001 | 全球的动作 | 有定稿的录音 | 西班牙语 | 西班牙 | 混合 | 200. | 4. | 40 000 | 367年6 | 22 | 当地法律 | 完全转录为SpeechDAT类型 数据又一次包含所的发出的发作 每个发音人录制200个语料,语料包括100个命令和特定指令,100个语音丰富的句子 |
X | |
26 | 音频 | TTS | 麦克风 | 1小时 | 加加到咨询列表 | ESP_TTS001 | 全球的动作 | 有定稿的录音 | 西班牙语 | 西班牙 | 低背景噪音(录音棚) | 1 | 1 | 1 787 | 3 614 | 22 | 当地法律 | 数据集随附一个发音词典,其中包含该数据集中所说的所有单词 每个演讲者提供1787条语料,包括语音丰富的句子 |
X | |
93 | 音频 | ASR、虚拟助手,聊天机器人 | 麦克风 | 46小时 | 加加到咨询列表 | Speecon西班牙数据库 | 细微差别 | 有定稿的录音 | 西班牙语 | 西班牙 | 混合(办公室/娱乐场所/车内/公共场所) | 600(550个成年语料提供者及50个儿童语料提供者者 | 4. | 170 000 | 可根据根据要求 | 16 | 可根据根据要求 | 数据集已完全转录为SpeechDAT类型,并附有发音词典和验证报告 每个成年发音人录制290个语料,每个儿童发音人录制210个语料,语料包括数字,自然数,字母串,个人、地点和企业名称,语音丰富的句子和单词,儿童发音人还需要提供关于玩具,手机的指令以及通用指令,成年发音人还需要提供应用词汇,以及自由发挥的语料 |
X | |
270. | 音频 | Asr,对话式ai,语音分享 | 手机麦克风 | 2小时 | 加加到咨询列表 | ESP_ASR002_CN | 中国的动作 | 自由说 | 西班牙语 | 西班牙 | 低背景噪音(家庭/办公室) | N/A | NA | NA | 16 | wav | X | |||
24 | 音频 | Asr,对话式ai,语音分享 | 移动电话和固定电话 | 22小时 | 加加到咨询列表 | ESL_ASR002 | 全球的动作 | 对话录音 | 西班牙语 | 智利-哥伦比亚 | 混合 | 84 | 2 | 可根据根据要求 | 可根据根据要求 | 8. | wav | 数据集已完全转录并加了时间戳 银行和电信领域的呼叫中心风格的对话(由64个客户和14个代理商提供的),主要使用移动电话 |
X | |
23 | 音频 | ASR、虚拟助手,聊天机器人 | 麦克风 | 17小时 | 加加到咨询列表 | ESL_ASR001 | 全球手机 | 有定稿的录音 | 西班牙语 | 哥斯达黎加 | 低背景噪音(家庭/办公室) | One hundred. | 1 | 898年6 | 可根据根据要求 | 16 | wav | 数据集已完全转录,转录文件有原始版本和罗马化版本 每个发音人朗读大量语音丰富的句子,这些句子选自全国性的报纸文章,这些文章可以从网络上找到,覆盖范围广,词汇量大 与卡尔斯鲁厄理工学院(工具包)合作开发 |
X | |
233. | 文本 | ASR、TTS语言建模 | N/A | 15000个单词 | 加加到咨询列表 | spa_PER_PHON | 全球的动作 | 发音词典 | 西班牙语 | 秘鲁 | N/A | N/A | N/A | N/A | 000年15 | N/A | 文本 | X | ||
234. | 文本 | ASR、TTS语言建模 | N/A | 90000个单词 | 加加到咨询列表 | spa_usa_phon. | 全球的动作 | 发音词典 | 西班牙语 | 美国 | N/A | N/A | N/A | N/A | 90 000 | N/A | 文本 | X | ||
229. | 文本 | ASR、TTS语言建模 | N/A | 15000个单词 | 加加到咨询列表 | spa_arg_phon. | 全球的动作 | 发音词典 | 西班牙语 | 阿根廷 | N/A | N/A | N/A | N/A | 000年15 | N/A | 文本 | X | ||
40 | 音频 | ASR、虚拟助手,聊天机器人 | 麦克风 | 20小时 | 加加到咨询列表 | HAU_ASR001 | 全球手机 | 有定稿的录音 | 豪萨语 | 多国 | 低背景噪音(家庭/办公室) | 103 | 1 | 895年7 | 可根据根据要求 | 16 | wav | 数据集已完全转录,转录文件有原始版本和罗马化版本 每个发音人朗读大量语音丰富的句子,这些句子选自全国性的报纸文章,这些文章可以从网络上找到,覆盖范围广,词汇量大 与卡尔斯鲁厄理工学院(工具包)合作开发 |
H | |
190 | 文本 | ASR、TTS语言建模 | N/A | 11000个单词 | 加加到咨询列表 | hau_NGA_PHON | 全球的动作 | 发音词典 | 豪萨语 | 奈及利亚 | N/A | N/A | N/A | N/A | 000年11 | N/A | 文本 | H | ||
41 | 音频 | Asr,对话式ai,语音分享 | 移动电话 | 33小时 | 加加到咨询列表 | HAU_ASR002 | 全球的动作 | 对话录音 | 豪萨语 | 奈及利亚 | 低背景噪音 | 200. | 2 | 可根据根据要求 | 949年7 | 8. | 当地法律 | 数据集已完全转录并加上时间戳 数据又一次包含所的发出的发作 这个项目记录了200个电话对话 - 是由100个呼入者,各进行2次呼叫(一次使用固定电话,一次使用移动电话)至100个接收者之一 |
H | |
288. | 音频 | Asr,对话式ai,语音分享 | 手机麦克风 | 2.61小时 | 加加到咨询列表 | VIE_ASR001_CN | 中国的动作 | 自由说 | 越南语 | 越南 | 低背景噪音(家庭/办公室) | 7. | NA | NA | 16 | wav | y | |||
250. | 文本 | ASR、TTS语言建模 | N/A | 8,000个单反装 | 加加到咨询列表 | vie_VNM_PHON | 全球的动作 | 发音词典 | 越南语 | 越南 | N/A | N/A | N/A | N/A | 000年8 | N/A | 文本 | y | ||
104 | 音频 | ASR、虚拟助手,聊天机器人 | 麦克风 | 47小时 | 加加到咨询列表 | vie_asr001. | 全球手机 | 有定稿的录音 | 越南语 | 越南 | 低背景噪音(家庭/办公室) | 129 | 1 | 18 842 | 可根据根据要求 | 16 | wav | 数据集已完全转录,转录文件有原始版本和罗马化版本 每个发音人朗读大量语音丰富的句子,这些句子选自全国性的报纸文章,这些文章可以从网络上找到,覆盖范围广,词汇量大 与卡尔斯鲁厄理工学院(工具包)合作开发 |
y | |
125 | 视频 | 健身应用, 行为识别, 手势识别 | 移动电话 | 2000个视频 | 加加到咨询列表 | ved_human_body_cn. | 中国的动作 | 人体 | N/A | 中国 | 不同背景及光线 | 1000 | NA | NA | NA | NA | mp4 | 每个视频片段长约10至20秒 | Z. | |
161 | 文本 | ASR、TTS语言建模 | N/A | 30000个单词 | 加加到咨询列表 | prs_afg_phon. | 全球的动作 | 发音词典 | 达里语 | 阿富汗 | N/A | N/A | N/A | N/A | 30 000 | N/A | 文本 | D. | ||
12 | 音频 | Asr,对话式ai,语音分享 | 移动电话和固定电话 | 40小时 | 加加到咨询列表 | DAR_ASR001 | 全球的动作 | 对话录音 | 达里语 | 阿富汗 | 低背景噪音 | 500 | 2 | 可根据根据要求 | 168年11 | 8. | 当地法律 | 数据集已完全转录并加上时间戳 数据集主要是语音,不包括音乐或广告 |
D. | |
13 | 音频 | ASR、自动字幕,关键字检索 | 麦克风 | 51小时 | 加加到咨询列表 | dar_brc001 | 全球的动作 | 广播录音 | 达里语 | 阿富汗 | 低背景噪音(录音棚) | N/A | 1 | 可根据根据要求 | 可根据根据要求 | N/A | wav | 数据集已完全转录并加上时间戳 数据集主要是语音,不包括音乐或广告 数据类型包括:脱口秀,访谈,新闻广播(不包括主持人阅读的新闻) |
D. | |
282. | 音频 | Asr,对话式ai,语音分享 | 手机麦克风 | 2.18小时 | 加加到咨询列表 | changsha_asr001_cn. | 中国的动作 | 语料朗读 | 长沙 | 中国 | 低背景噪音(家庭/办公室) | 10 | NA | NA | 16 | wav | Z. | |||
135 | 文本 | ASR、TTS语言建模 | N/A | 45,000个单词 | 加加到咨询列表 | amh_ETH_PHON | 全球的动作 | 发音词典 | 阿姆哈拉语 | 埃塞俄比亚 | N/A | N/A | N/A | N/A | 45 000 | N/A | 文本 | 一种 | ||
134 | 文本 | ASR、TTS语言建模 | N/A | 12,000个单词 | 加加到咨询列表 | sqi_ALB_PHON | 全球的动作 | 发音词典 | 阿尔巴尼亚语 | 阿尔巴尼亚 | N/A | N/A | N/A | N/A | 000年12 | N/A | 文本 | 一种 | ||
126 | 文本 | 尼珥,内容分类,搜索引擎 | N/A | 20774个句子 | 加加到咨询列表 | ARB_NER001 | 全球的动作 | 尼珥 | 阿拉芬 | N/A | N/A | N/A | N/A | 20 774. | 可根据根据要求 | N/A | 文本 | 一种 | ||
143 | 文本 | ASR、TTS语言建模 | N/A | 40000个单词 | 加加到咨询列表 | arb_N / A_PHON | 全球的动作 | 发音词典 | 阿拉芬 | N/A | N/A | N/A | N/A | N/A | 40 000 | N/A | 文本 | 一种 | ||
137 | 文本 | ASR、TTS语言建模 | N/A | 15000个单词 | 加加到咨询列表 | ara_IRQ_PHON | 全球的动作 | 发音词典 | 阿拉芬 | 伊拉克 | N/A | N/A | N/A | N/A | 000年15 | N/A | 文本 | 人名 | 一种 | |
138 | 文本 | ASR、TTS语言建模 | N/A | 13000个单词 | 加加到咨询列表 | ara_IRQ_POS | 全球的动作 | 词性词典 | 阿拉芬 | 伊拉克 | N/A | N/A | N/A | N/A | 000年13 | N/A | 文本 | 一种 | ||
139 | 文本 | ASR、TTS语言建模 | N/A | 48000个单词 | 加加到咨询列表 | ara_LBY_PHON | 全球的动作 | 发音词典 | 阿拉芬 | 利比亚 | N/A | N/A | N/A | N/A | 48 000. | N/A | 文本 | 一种 | ||
136 | 文本 | ASR、TTS语言建模 | N/A | 40000个单词 | 加加到咨询列表 | ara_egy_phon. | 全球的动作 | 发音词典 | 阿拉芬 | 埃及 | N/A | N/A | N/A | N/A | 40 000 | N/A | 文本 | 一种 | ||
110 | 音频 | ASR、虚拟助手,聊天机器人 | 移动电话 | 352小时 | 加加到咨询列表 | ARE_ASR001_CN | 中国的动作 | 有定稿的录音 | 阿拉芬 | 埃及 | 低背景噪音(家庭/办公室) | 627. | 1 | 128 908 | 207 576 | 16 | wav | 数量集已完全转录 | 一种 | |
142 | 文本 | ASR、TTS语言建模 | N/A | 60000个单词 | 加加到咨询列表 | ara_MAR_PHON | 全球的动作 | 发音词典 | 阿拉芬 | 摩洛哥 | N/A | N/A | N/A | N/A | 60 000. | N/A | 文本 | 一种 | ||
109 | 文本 | Mt,聊天机器人,对话式ai | N/A | 80544个发音 | 加加到咨询列表 | ary_mt001 | 全球的动作 | 对话翻译 | 阿拉芬 | 摩洛哥 | N/A | 180 | N/A | 80 430. | 844年23 | N/A | 文本 | 相应的音频,转录文本,完全可逆的罗马化的转录文本及发音词典见数据集ARY_ASR001和ARY_ASRMT001 | 一种 | |
108 | 音频 | Asr,对话式ai,语音分享 | 移动电话和固定电话 | 33小时 | 加加到咨询列表 | ARY_ASR001 | 全球的动作 | 对话录音 | 阿拉芬 | 摩洛哥 | 低背景噪音 | 180 | 2 | 80 544 | 836年23 | 8. | 当地法律 | 每个发音人参与了1至4个对话,每个发音人由一个记录在人口统计文件中的唯一的4位数的演讲者ID来识别 此转录文件有原始版本和完全可逆的罗马化版本,并附带发音词典 产品转录的英文翻译见数据集ARY_MT001和ARY_ASRMT001 |
一种 | |
111 | 音频 | ASR、虚拟助手,聊天机器人 | 移动电话 | 322小时 | 加加到咨询列表 | ARS_ASR001_CN. | 中国的动作 | 有定稿的录音 | 阿拉芬 | 沙特阿拉伯 | 低背景噪音(家庭/办公室) | 227. | 1 | 104 574. | 156 282 | 16 | wav | 数量集已完全转录 | 一种 | |
61 | 音频 | ASR、虚拟助手,聊天机器人 | 麦克风 | 12小时 | 加加到咨询列表 | MSA_ASR001 | 全球手机 | 有定稿的录音 | 阿拉芬 | 突尼斯 | 低背景噪音(家庭/办公室) | 78 | 1 | 908年4 | 可根据根据要求 | 16 | wav | 数据集已完全转录,转录文件有原始版本和罗马化版本 每个发音人朗读大量语音丰富的句子,这些句子选自全国性的报纸文章,这些文章可以从网络上找到,覆盖范围广,词汇量大 与卡尔斯鲁厄理工学院(工具包)合作开发 |
一种 | |
145 | 文本 | ASR、TTS语言建模 | N/A | 17000个单词 | 加加到咨询列表 | ara_SDN_PHON | 全球的动作 | 发音词典 | 阿拉芬 | 苏丹 | N/A | N/A | N/A | N/A | 17 000年 | N/A | 文本 | 一种 | ||
17 | 音频 | Asr,对话式ai,语音分享 | 移动电话和固定电话 | 29小时 | 加加到咨询列表 | EAR_ASR001. | 全球的动作 | 对话录音 | 阿拉芬 | 阿尔及利亚 | 低背景噪音(家庭/办公室) | 496 | 2 | 可根据根据要求 | 11 327. | 8. | 当地法律 | 数据集已完全转录并加上时间戳 数据又一次包含所的发出的发作 在大多数通讯中,对话双方(呼入者和和呼出者)的说话内容都被并转录了,但有一小分子的通知,只有一定的对话内容被并并转录 |
一种 | |
140 | 文本 | ASR、TTS语言建模 | N/A | 11000个单词 | 加加到咨询列表 | ARA_DZA_PHON. | 全球的动作 | 发音词典 | 阿拉芬 | 阿尔及利亚 | N/A | N/A | N/A | N/A | 000年11 | N/A | 文本 | 一种 | ||
7. | 音频 | ASR、虚拟助手,聊天机器人 | 麦克风 | 86小时 | 加加到咨询列表 | CGA_ASR001 | 全球的动作 | 有定稿的录音 | 阿拉芬 | 阿拉伯综合韩国 - 沙特阿拉姆 | 低背景噪音(家庭/办公室) | 150 | 4. | 42 000 | 19日245年 | 16 | 当地法律 | 语音文件内容已完全转录,精确到单词 所有录音均使用了衍生于SpeechDATmodel的方法进行标记 所有转录文件已被加注元音标识 每个发音人录制280个语料,语料包括15个人的名字和姓氏(共计30个),10个分开朗读的数字(0-10),随机生成的数字序列(每个序列包含8个数字),200个语音平衡的句子,30个语音平衡单词串(每个单词串包含10个单词) |
一种 | |
144 | 文本 | ASR、TTS语言建模 | N/A | 75,000个单反装 | 加加到咨询列表 | ara_ARE_PHON | 全球的动作 | 发音词典 | 阿拉芬 | 阿拉伯联合酋长国 | N/A | N/A | N/A | N/A | 75 000 | N/A | 文本 | 一种 | ||
118 | 音频 | ASR、虚拟助手,聊天机器人 | 移动电话 | 170小时 | 加加到咨询列表 | ARU_ASR001_CN | 中国的动作 | 有定稿的录音 | 阿拉芬 | 阿拉伯联合酋长国 | 低背景噪音(家庭/办公室) | 133 | 1 | 42 352 | 85 775 | 16 | wav | 数量集已完全转录 | 一种 | |
66 | 音频 | ASR、呼叫中心,虚拟助手 | 移动电话和固定电话 | 48小时 | 加加到咨询列表 | Orientel United Arab Emirates MCA(现代口语阿拉伯语) | 细微差别 | 有定稿的录音 | 阿拉芬 | 阿拉伯联合酋长国 | 低背景噪音 | 880 | 1 | 000年43岁 | 可根据根据要求 | 8. | 当地法律 | 数据集已完全转录为SpeechDAT类型,并附有发音词典和验证报告 每个发音人录制49个语料,语料包括数字,自然数,字母串,个人、地点和企业名称,确认项(肯定,否定,不置可否的回答),通用指令和特定指令,语音丰富的句子和单词以及自由发挥的特定指令 |
一种 | |
67 | 音频 | ASR、呼叫中心,虚拟助手 | 移动电话和固定电话 | 31小时 | 加加到咨询列表 | 阿拉伯联合酋长国东方电信(现代标准阿拉伯语) | 细微差别 | 有定稿的录音 | 阿拉芬 | 阿拉伯联合酋长国 | 低背景噪音 | 500 | 1 | 24日500年 | 可根据根据要求 | 8. | 当地法律 | 数据集已完全转录为SpeechDAT类型,并附有发音词典和验证报告 每个发音人录制49个语料,语料包括数字,自然数,字母串,个人、地点和企业名称,确认项(肯定,否定,不置可否的回答),通用指令和特定指令,语音丰富的句子和单词以及自由发挥的特定指令 |
一种 | |
146 | 文本 | ASR、TTS语言建模 | N/A | 40000个单词 | 加加到咨询列表 | asm_IND_PHON | 全球的动作 | 发音词典 | 阿萨姆语 | 印度 | N/A | N/A | N/A | N/A | 40 000 | N/A | 文本 | 一种 | ||
202. | 文本 | ASR、TTS语言建模 | N/A | 100,000个单反装 | 加加到咨询列表 | kor_KOR_PHON | 全球的动作 | 发音词典 | 韩语 | 韩国 | N/A | N/A | N/A | N/A | 100 000 | N/A | 文本 | H | ||
55 | 音频 | ASR、虚拟助手,聊天机器人 | 麦克风 | 20小时 | 加加到咨询列表 | KOR_ASR001 | 全球手机 | 有定稿的录音 | 韩语 | 韩国 | 低背景噪音(家庭/办公室) | One hundred. | 1 | 107年8 | 可根据根据要求 | 16 | wav | 数据集已完全转录,转录文件有原始版本和罗马化版本 每个发音人朗读大量语音丰富的句子,这些句子选自全国性的报纸文章,这些文章可以从网络上找到,覆盖范围广,词汇量大 与卡尔斯鲁厄理工学院(工具包)合作开发 |
H | |
203. | 文本 | ASR、TTS语言建模 | N/A | 100,000个单反装 | 加加到咨询列表 | kor_KOR_POS | 全球的动作 | 词性词典 | 韩语 | 韩国 | N/A | N/A | N/A | N/A | 100 000 | N/A | 文本 | H | ||
128 | 文本 | 尼珥,内容分类,搜索引擎 | N/A | 25830个句子 | 加加到咨询列表 | KOR_NER001 | 全球的动作 | 尼珥 | 韩语 | 韩国 | N/A | N/A | N/A | 25 830年 | 可根据根据要求 | N/A | 文本 | H | ||
289. | 音频 | Asr,对话式ai,语音分享 | 手机麦克风 | 3.35小时 | 加加到咨询列表 | KOR_ASR001_CN | 中国的动作 | 自由说 | 韩语 | 韩国 | 低背景噪音(家庭/办公室) | 4. | NA | NA | 16 | wav | H | |||
211. | 文本 | ASR、TTS语言建模 | N/A | 30000个单词 | 加加到咨询列表 | mar_IND_PHON | 全球的动作 | 发音词典 | 马拉地语 | 印度 | N/A | N/A | N/A | N/A | 30 000 | N/A | 文本 | m | ||
60 | 音频 | Asr,对话式ai,语音分享 | 移动电话和固定电话 | 15小时 | 加加到咨询列表 | MAR_ASR001 | 全球的动作 | 对话录音 | 马拉地语 | 印度 | 混合 | 180 | 2 | 可根据根据要求 | 908年11 | 8. | 当地法律 | 数据集中大约29%的会话被转录并加盖了时间戳,可以提供完整的转录文本 数据又一次包含所的发出的发作 |
m | |
106 | 音频 | Asr,对话式ai,语音分享 | 移动电话和固定电话 | 52小时 | 加加到咨询列表 | MAR_ASR001A | 全球的动作 | 对话录音 | 马拉地语 | 印度 | 混合 | 1 000 | 2 | 可根据根据要求 | 908年11 | 8. | 当地法律 | 数据集的部分会话被转录并加盖了时间戳,可以提供完整的转录文本 数据又一次包含所的发出的发作 |
m | |
207. | 文本 | ASR、TTS语言建模 | N/A | 4000个单词 | 加加到咨询列表 | mal_IND_PHON | 全球的动作 | 发音词典 | 玛拉雅拉姆语 | 印度 | N/A | N/A | N/A | N/A | 000年4 | N/A | 文本 | m | ||
208. | 文本 | ASR、TTS语言建模 | N/A | 10000个单词 | 加加到咨询列表 | msa_MYS_PHON | 全球的动作 | 发音词典 | 马来克 | 马来西亚 | N/A | N/A | N/A | N/A | 000 | N/A | 文本 | m | ||
287. | 音频 | Asr,对话式ai,语音分享 | 手机麦克风 | 3.01小时 | 加加到咨询列表 | MAL_ASR001_CN | 中国的动作 | 自由说 | 马来克 | 马来西亚 | 低背景噪音(家庭/办公室) | 9. | NA | NA | 16 | wav | m | |||
119 | 音频 | ASR、虚拟助手,聊天机器人 | 移动电话 | 90小时 | 加加到咨询列表 | KHM_ASR001_CN | 中国的动作 | 有定稿的录音 | 高棉语 | 柬埔寨 | 低背景噪音(家庭/办公室) | 94 | 1 | 24日618年 | 52 157 | 16 | wav | 数量集已完全转录 | G | |
121 | 图像 | 面部识别 | 照相机 | 13500张图片 | 加加到咨询列表 | IMG_FACE_KEN_CN | 中国的动作 | 人脸 | N/A | 肯尼亚 | 不同背景及光线 | One hundred. | NA | NA | NA | NA | jpg | K. |
应用场景
无论您是在开发舞义合成系统,语音识别系统还是其他依赖自我,高度量的授权语音和语言数码都能您您更地进入市场,触达更多的地方进入
最新资讯和资源

新闻资讯
“智”能基石:人工智能数据标注与训练,是决定智能时代的第一步
阅读更多
博客文章
AI文本标注的概念,类型和方法
阅读更多
博客文章
2021年,音频摘录和自动语音识别 | 你应该了解的信息提取方法
阅读更多
博客文章
1分钟了解音频,语音数据和自然语言原理的关键词
阅读更多
博客文章
必读人工智能数据管理的要点!
阅读更多
博客文章
AI数据采集与管理典范
阅读更多
博客文章
人工智能背后的人工,数据标注背后的众包
阅读更多
博客文章
主动学习如何解决数据标注的难题?主动学习和弱监督学习有何区别?
阅读更多
博客文章
人工智能数据训练机器学习算法的秘密技术:主动学习与弱监督学习
阅读更多
博客文章
Ai读心术:情感分类和数码标注的奥秘
阅读更多
博客文章
医疗语音识别技术的应用案例,你需要知道的医疗语音数据现状!
阅读更多
博客文章
提高广播新闻自动语音识别模型的准确性
阅读更多
博客文章
计算机视觉领域的前景与挑战-数据增强
阅读更多
博客文章
计算机视觉和机器视觉有什么区别?
阅读更多
博客文章
数据标注外包公司如何选择?你需要知道的几点!
阅读更多