
产品目录
虽然开放数据或公共数据集很方便,但我们提供了一个广泛的“现成的”目录,涵盖80种语言、多种方言的250多个可授权数据集,适用于各种常见的人工智能用例。我们很高兴地宣布30多个新的数据集,为我们的客户提供即时的价值。在我们的产品中,您可以找到语音识别数据集,机器学习算法的学习数据集,所有这些都是用最先进的可用数据科学创建的。

速度
可立即支持您的AI/ML项目今天

成本效益
授权数据集比自定义数据收集更经济

专业知识
20年以上的数据收集经验

支持所有数据类型
图像、视频、语音、音频和文本

规模
提供正确数量的数据来有效地训练您的模型

质量
提高AI模型的质量并最小化偏差
数据集名称 | 产品类型 | 常见用例 | 记录装置 | 单位 |
---|
数据集名称 | 产品类型 | 常见用例 | 记录装置 | 单位 | ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
138 | 文本 | ASR, TTS,语言建模 | 不适用 | 12000个单词 | 添加引用 | sqi_ALB_PHON | 阿彭环球 | 发音字典 | 阿尔巴尼亚 | 阿尔巴尼亚 | 不适用 | 不适用 | 不适用 | 不适用 | 12000年 | 不适用 | 文本 | 阿尔巴尼亚语(阿尔巴尼亚)发音字典 | ||
139 | 文本 | ASR, TTS,语言建模 | 不适用 | 45000个单词 | 添加引用 | amh_ETH_PHON | 阿彭环球 | 发音字典 | 阿姆哈拉语 | 埃塞俄比亚 | 不适用 | 不适用 | 不适用 | 不适用 | 45,000 | 不适用 | 文本 | 阿姆哈拉语(埃塞俄比亚)发音词典 | ||
144 | 文本 | ASR, TTS,语言建模 | 不适用 | 11000个单词 | 添加引用 | ara_DZA_PHON | 阿彭环球 | 发音字典 | 阿拉伯语 | 阿尔及利亚 | 不适用 | 不适用 | 不适用 | 不适用 | 11000年 | 不适用 | 文本 | 阿拉伯语(阿尔及利亚)发音词典 | ||
20. | 音频 | ASR、会话人工智能、语音分析 | 移动电话和固定电话 | 29个小时 | 添加引用 | EAR_ASR001 | 阿彭环球 | 会话演讲 | 阿拉伯语 | 阿尔及利亚 | 低背景噪音(家庭/办公室) | 496 | 2 | 可根据要求提供 | 11,327 | 8 | 当地法律 | 数据集已完全转录并加上时间戳 数据集配有包含所有转录词的发音词典 在大多数电话中,两位发言人(内联/外联)都被接话和录音,但在少数电话中,只有一半的通话被接话和录音 |
阿拉伯语(阿尔及利亚东部)会话电话 | |
140 | 文本 | ASR, TTS,语言建模 | 不适用 | 40000个单词 | 添加引用 | ara_EGY_PHON | 阿彭环球 | 发音字典 | 阿拉伯语 | 埃及 | 不适用 | 不适用 | 不适用 | 不适用 | 40,000 | 不适用 | 文本 | 阿拉伯语(埃及)发音词典 | ||
114 | 音频 | ASR,虚拟助理,聊天机器人 | 移动电话 | 352小时 | 添加引用 | ARE_ASR001_CN | 中国的动作 | 脚本化的演讲 | 阿拉伯语 | 埃及 | 低背景噪音(家庭/办公室) | 627 | 1 | 128908年 | 207576年 | 16 | wav | 数据集完全转录 | 阿拉伯语(埃及)脚本智能手机 | |
142 | 文本 | ASR, TTS,语言建模 | 不适用 | 13000个单词 | 添加引用 | ara_IRQ_POS | 阿彭环球 | 语音词典的一部分 | 阿拉伯语 | 伊拉克 | 不适用 | 不适用 | 不适用 | 不适用 | 13000年 | 不适用 | 文本 | 阿拉伯语(伊拉克)语音词典的一部分 | ||
141 | 文本 | ASR, TTS,语言建模 | 不适用 | 15000个单词 | 添加引用 | ara_IRQ_PHON | 阿彭环球 | 发音字典 | 阿拉伯语 | 伊拉克 | 不适用 | 不适用 | 不适用 | 不适用 | 15,000 | 不适用 | 文本 | 人的名字 | 阿拉伯语(伊拉克)发音词典 | |
143 | 文本 | ASR, TTS,语言建模 | 不适用 | 48000个单词 | 添加引用 | 阿拉比丰酒店 | 阿彭环球 | 发音字典 | 阿拉伯语 | 利比亚 | 不适用 | 不适用 | 不适用 | 不适用 | 48000年 | 不适用 | 文本 | 阿拉伯语(利比亚)发音词典 | ||
65 | 音频 | ASR,虚拟助理,聊天机器人 | 麦克风 | 12个小时 | 添加引用 | MSA_ASR001 | 全球电话 | 脚本化的演讲 | 阿拉伯语 | 突尼斯 | 低背景噪音(家庭/办公室) | 78 | 1 | 4908年 | 可根据要求提供 | 16 | wav | 数据集是完全转录和转录是可用的原始脚本和罗马化形式 每个演讲者都会从网络上的全国性报纸文章中选择一些语音丰富的句子,以覆盖广泛的领域和大量的词汇 与卡尔斯鲁厄理工学院(KIT)合作开发 |
阿拉伯语(现代标准阿拉伯语)脚本麦克风 | |
112 | 音频 | ASR、会话人工智能、语音分析 | 移动电话和固定电话 | 33小时 | 添加引用 | ARY_ASR001 | 阿彭环球 | 会话演讲 | 阿拉伯语 | 摩洛哥 | 低背景噪音 | 180 | 2 | 80,544 | 23836年 | 8 | 当地法律 | 每位演讲者参与1至4次对话。扬声器由一个独特的4位扬声器ID识别,该ID记录在人口统计文件中 抄本有原始脚本和完全可逆的罗马版本,并附有发音词典bob外围怎么样 有产品转录的英文翻译(ARY_MT001, ARY_ASRMT001) |
阿拉伯语(摩洛哥)会话电话 | |
113 | 文本 | 机器翻译,聊天机器人,会话人工智能 | 不适用 | 80544年的话语 | 添加引用 | ARY_MT001 | 阿彭环球 | 对话翻译 | 阿拉伯语 | 摩洛哥 | 不适用 | 180 | 不适用 | 80430年 | 23844年 | 不适用 | 文本 | 相应的音频、转录、完全可逆的罗马化转录和发音词典数据可用(ARY_ASR001, ARY_ASRMT001) | 阿拉伯语(摩洛哥)会话电话翻译 | |
146 | 文本 | ASR, TTS,语言建模 | 不适用 | 六万字 | 添加引用 | ara_MAR_PHON | 阿彭环球 | 发音字典 | 阿拉伯语 | 摩洛哥 | 不适用 | 不适用 | 不适用 | 不适用 | 60,000 | 不适用 | 文本 | 阿拉伯语(摩洛哥)发音词典 | ||
147 | 文本 | ASR, TTS,语言建模 | 不适用 | 40000个单词 | 添加引用 | arb_N / A_PHON | 阿彭环球 | 发音字典 | 阿拉伯语 | 不适用 | 不适用 | 不适用 | 不适用 | 不适用 | 40,000 | 不适用 | 文本 | 阿拉伯语(N/A)发音字典 | ||
115 | 音频 | ASR,虚拟助理,聊天机器人 | 移动电话 | 322小时 | 添加引用 | ARS_ASR001_CN | 中国的动作 | 脚本化的演讲 | 阿拉伯语 | 沙特阿拉伯 | 低背景噪音(家庭/办公室) | 227 | 1 | 104574年 | 156282年 | 16 | wav | 数据集完全转录 | 阿拉伯语(沙特阿拉伯)脚本智能手机 | |
149 | 文本 | ASR, TTS,语言建模 | 不适用 | 17000个单词 | 添加引用 | ara_SDN_PHON | 阿彭环球 | 发音字典 | 阿拉伯语 | 苏丹 | 不适用 | 不适用 | 不适用 | 不适用 | 17,000 | 不适用 | 文本 | 阿拉伯语(苏丹语)发音词典 | ||
148 | 文本 | ASR, TTS,语言建模 | 不适用 | 75000个单词 | 添加引用 | ara_ARE_PHON | 阿彭环球 | 发音字典 | 阿拉伯语 | 阿拉伯联合酋长国 | 不适用 | 不适用 | 不适用 | 不适用 | 75000年 | 不适用 | 文本 | 阿拉伯语(阿拉伯联合酋长国)发音词典 | ||
122 | 音频 | ASR,虚拟助理,聊天机器人 | 移动电话 | 170小时 | 添加引用 | ARU_ASR001_CN | 中国的动作 | 脚本化的演讲 | 阿拉伯语 | 阿拉伯联合酋长国 | 低背景噪音(家庭/办公室) | 133 | 1 | 42352年 | 85775年 | 16 | wav | 数据集完全转录 | 阿拉伯(阿拉伯联合酋长国)脚本智能手机 | |
70 | 音频 | 呼叫中心,虚拟助理 | 移动电话和固定电话 | 48小时 | 添加引用 | 阿拉伯联合酋长国MCA(现代阿拉伯口语) | 细微差别 | 脚本化的演讲 | 阿拉伯语 | 阿拉伯联合酋长国 | 低背景噪音 | 880 | 1 | 43000年 | 可根据要求提供 | 8 | 当地法律 | 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告 每个发言者49个提示,包括数字,自然数字,字母串,个人,地点和业务名称,确认项目(是,不是+模糊),通用的命令和控制项目,语音丰富的句子和单词,自发项目的控制 |
阿拉伯语(阿拉伯联合酋长国)脚本电话 | |
71 | 音频 | 呼叫中心,虚拟助理 | 移动电话和固定电话 | 31小时 | 添加引用 | 阿拉伯联合酋长国东方电信(现代标准阿拉伯语) | 细微差别 | 脚本化的演讲 | 阿拉伯语 | 阿拉伯联合酋长国 | 低背景噪音 | 500 | 1 | 24,500 | 可根据要求提供 | 8 | 当地法律 | 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告 每个发言者49个提示,包括数字,自然数字,字母串,个人,地点和业务名称,确认项目(是,不是+模糊),通用的命令和控制项目,语音丰富的句子和单词,自发项目的控制 |
阿拉伯语(阿拉伯联合酋长国)脚本电话 | |
9 | 音频 | ASR,虚拟助理,聊天机器人 | 麦克风 | 86小时 | 添加引用 | CGA_ASR001 | 阿彭环球 | 脚本化的演讲 | 阿拉伯语 | 阿拉伯联合酋长国;沙特阿拉伯 | 低背景噪音(家庭/办公室) | 150 | 4 | 42000年 | 19245年 | 16 | 当地法律 | 在一个词的水平上完整的演讲文件的内容的转录 所有的声音事件都使用来自于SpeechDATmodel的约定进行了标记 所有的抄本都是完全元音化的 每个讲话者有280个提示,包括从15个集合中选出的30个人名(名和姓),10个独立的数字0-10,8位数字序列(随机生成),200个语音平衡的句子,30 x 10个单词的语音平衡的单词串 |
阿拉伯语(阿拉伯联合酋长国/沙特阿拉伯)脚本麦克风 | |
130 | 文本 | 内容分类,搜索引擎 | 不适用 | 20774句 | 添加引用 | ARB_NER001 | 阿彭环球 | 新闻尼珥 | 标准阿拉伯语 | 不适用 | 不适用 | 不适用 | 不适用 | 20774年 | 可根据要求提供 | 不适用 | 文本 | 阿拉伯语新闻文本 | ||
150 | 文本 | ASR, TTS,语言建模 | 不适用 | 40000个单词 | 添加引用 | asm_IND_PHON | 阿彭环球 | 发音字典 | 阿萨姆人的 | 印度 | 不适用 | 不适用 | 不适用 | 不适用 | 40,000 | 不适用 | 文本 | 阿萨姆(印度)发音词典 | ||
124 | 音频 | 婴儿监视器,安全及其他消费者应用 | 移动电话 | 3个小时 | 添加引用 | CRY_ASR001 | 中国的动作 | 人类的声音 | 不适用 | 中国 | 低背景噪音(家庭/办公室) | One hundred. | 1 | NA | NA | 16 | wav | 0-3岁婴儿的哭声,每次持续约2分钟。 | 婴儿哭泣的声音 | |
4 | 音频 | ASR、会话人工智能、语音分析 | 移动电话和固定电话 | 31小时 | 添加引用 | BAH_ASR001 | 阿彭环球 | 会话演讲 | 印尼 | 印尼 | 低背景噪音 | 1002年 | 2 | 可根据要求提供 | 11480年 | 8 | wav | 数据集已完全转录并加上时间戳 数据集配有包含所有转录词的发音词典 在很大一部分电话中,只有一半的通话被收集和记录下来 |
印尼语会话电话 | |
153 | 文本 | ASR, TTS,语言建模 | 不适用 | 10000个单词 | 添加引用 | eus_ESP_PHON | 阿彭环球 | 发音字典 | 巴斯克 | 西班牙 | 不适用 | 不适用 | 不适用 | 不适用 | 10,000 | 不适用 | 文本 | 巴斯克(西班牙)发音词典 | ||
6 | 音频 | ASR、会话人工智能、语音分析 | 移动电话和固定电话 | 47个小时 | 添加引用 | BEN_ASR001 | 阿彭环球 | 会话演讲 | 孟加拉语 | 孟加拉国 | 混合(车内、路边、家庭/办公室) | 1,000 | 2 | 可根据要求提供 | 17922年 | 8 | 当地法律 | 数据集已完全转录并加上时间戳 数据集配有包含所有转录词的发音词典 |
孟加拉语(孟加拉国)会话式电话 | |
154 | 文本 | ASR, TTS,语言建模 | 不适用 | 29000字 | 添加引用 | ben_IND_PHON | 阿彭环球 | 发音字典 | 孟加拉语 | 印度 | 不适用 | 不适用 | 不适用 | 不适用 | 29000年 | 不适用 | 文本 | 孟加拉语(印度)发音词典 | ||
7 | 音频 | ASR、会话人工智能、语音分析 | 移动电话和固定电话 | 38小时 | 添加引用 | BUL_ASR001 | 阿彭环球 | 会话演讲 | 保加利亚 | 保加利亚 | 低背景噪音(家庭/办公室) | 217 | 2 | 可根据要求提供 | 22342年 | 8 | 当地法律 | 数据集已完全转录并加上时间戳 数据集配有包含所有转录词的发音词典 该项目记录了200个电话对话-100名演讲者向100个呼叫接收器分别拨打2个电话(1个来自固定电话,1个来自移动电话) |
保加利亚会话式电话 | |
155 | 文本 | ASR, TTS,语言建模 | 不适用 | 55000个单词 | 添加引用 | bul_BGR_PHON | 阿彭环球 | 发音字典 | 保加利亚 | 保加利亚 | 不适用 | 不适用 | 不适用 | 不适用 | 55,000 | 不适用 | 文本 | 保加利亚语发音词典 | ||
111 | 音频 | ASR,虚拟助理,聊天机器人 | 麦克风 | 22小时 | 添加引用 | BUL_ASR002 | 全球电话 | 脚本化的演讲 | 保加利亚 | 保加利亚 | 低背景噪音(家庭/办公室) | 77 | 1 | 8674年 | 可根据要求提供 | 16 | wav | 数据集是完全转录和转录是可用的原始脚本和罗马化形式 每个演讲者都会从网络上的全国性报纸文章中选择一些语音丰富的句子,以覆盖广泛的领域和大量的词汇 与卡尔斯鲁厄理工学院(KIT)合作开发 |
保加利亚(保加利亚)脚本麦克风 | |
158 | 文本 | ASR, TTS,语言建模 | 不适用 | 10000个单词 | 添加引用 | 裕港邮政 | 阿彭环球 | 语音词典的一部分 | 广东话 | 中国 | 不适用 | 不适用 | 不适用 | 不适用 | 10,000 | 不适用 | 文本 | 传统的 | 粤语(中国)词性词典 | |
156 | 文本 | ASR, TTS,语言建模 | 不适用 | 37000个单词 | 添加引用 | yue_CHN_PHON | 阿彭环球 | 发音字典 | 广东话 | 中国 | 不适用 | 不适用 | 不适用 | 不适用 | 37000年 | 不适用 | 文本 | 简化 | 广东话(中国)发音词典 | |
157 | 文本 | ASR, TTS,语言建模 | 不适用 | 40000个单词 | 添加引用 | yue_CHN_PHON | 阿彭环球 | 发音字典 | 广东话 | 中国 | 不适用 | 不适用 | 不适用 | 不适用 | 40,000 | 不适用 | 文本 | 传统的 | 广东话(中国)发音词典 | |
159 | 文本 | ASR, TTS,语言建模 | 不适用 | 10000个单词 | 添加引用 | cat_ESP_PHON | 阿彭环球 | 发音字典 | 加泰罗尼亚语的 | 西班牙 | 不适用 | 不适用 | 不适用 | 不适用 | 10,000 | 不适用 | 文本 | 加泰罗尼亚(西班牙)发音词典 | ||
160 | 文本 | ASR, TTS,语言建模 | 不适用 | 20000个单词 | 添加引用 | ceb_PHL_PHON | 阿彭环球 | 发音字典 | 宿务语 | 菲律宾 | 不适用 | 不适用 | 不适用 | 不适用 | 20,000 | 不适用 | 文本 | Cebuano(菲律宾)发音词典 | ||
10 | 音频 | ASR、会话人工智能、语音分析 | 移动电话和固定电话 | 39个小时 | 添加引用 | CRO_ASR001 | 阿彭环球 | 会话演讲 | 克罗地亚 | 克罗地亚 | 低背景噪音(家庭/办公室) | 200 | 2 | 可根据要求提供 | 23919年 | 8 | 当地法律 | 数据集已完全转录并加上时间戳 数据集配有包含所有转录词的发音词典 该项目记录了200个电话对话-100名演讲者向100个呼叫接收器分别拨打2个电话(1个来自固定电话,1个来自移动电话) |
克罗地亚(克罗地亚)会话电话 | |
161 | 文本 | ASR, TTS,语言建模 | 不适用 | 20000个单词 | 添加引用 | hrv_HRV_PHON | 阿彭环球 | 发音字典 | 克罗地亚 | 克罗地亚 | 不适用 | 不适用 | 不适用 | 不适用 | 20,000 | 不适用 | 文本 | 克罗地亚语(克罗地亚)发音词典 | ||
11 | 音频 | ASR,虚拟助理,聊天机器人 | 麦克风 | 11个小时 | 添加引用 | CRO_ASR002 | 全球电话 | 脚本化的演讲 | 克罗地亚 | 克罗地亚 | 低背景噪音(家庭/办公室) | 94 | 1 | 4499年 | 可根据要求提供 | 16 | wav | 数据集是完全转录和转录是可用的原始脚本和罗马化形式 每个演讲者都会从网络上的全国性报纸文章中选择一些语音丰富的句子,以覆盖广泛的领域和大量的词汇 与卡尔斯鲁厄理工学院(KIT)合作开发 |
克罗地亚(克罗地亚)脚本麦克风 | |
116 | 音频 | ASR,虚拟助理,聊天机器人 | 移动电话 | 263小时 | 添加引用 | CRO_ASR003_CN | 中国的动作 | 脚本化的演讲 | 克罗地亚 | 克罗地亚 | 低背景噪音(家庭/办公室) | 243 | 1 | 73467年 | 136140年 | 16 | wav | 数据集完全转录 | 克罗地亚(克罗地亚)脚本智能手机 | |
162 | 文本 | ASR, TTS,语言建模 | 不适用 | 50000个单词 | 添加引用 | ces_CZE_PHON | 阿彭环球 | 发音字典 | 捷克 | 捷克共和国 | 不适用 | 不适用 | 不适用 | 不适用 | 50000年 | 不适用 | 文本 | 捷克(捷克共和国)发音字典 | ||
12 | 音频 | ASR,虚拟助理,聊天机器人 | 麦克风 | 31小时 | 添加引用 | CZE_ASR001 | 全球电话 | 脚本化的演讲 | 捷克 | 捷克共和国 | 低背景噪音(家庭/办公室) | 102 | 1 | 12425年 | 可根据要求提供 | 16 | wav | 数据集是完全转录和转录是可用的原始脚本和罗马化形式 每个演讲者都会从网络上的全国性报纸文章中选择一些语音丰富的句子,以覆盖广泛的领域和大量的词汇 与卡尔斯鲁厄理工学院(KIT)合作开发 |
捷克语(捷克共和国)脚本麦克风 | |
13 | 音频 | 呼叫中心,虚拟助理 | 固定电话只 | 93小时 | 添加引用 | 捷克SpeechDat (E)的数据集 | 细微差别 | 脚本化的演讲 | 捷克 | 捷克共和国 | 低背景噪音 | 1,000 | 1 | 52000年 | 可根据要求提供 | 8 | 当地法律 | 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告 52个提示,包括数字,自然数字,字母串,个人,地点和业务名称,确认项目(是,否+模糊),通用的命令和控制项目,语音丰富的单词和句子 |
捷克(捷克共和国)脚本电话 | |
164 | 文本 | ASR, TTS,语言建模 | 不适用 | 100000个单词 | 添加引用 | dan_DNK_POS | 阿彭环球 | 语音词典的一部分 | 丹麦 | 丹麦 | 不适用 | 不适用 | 不适用 | 不适用 | 100,000 | 不适用 | 文本 | 丹麦语(丹麦语)语音词典的一部分 | ||
163 | 文本 | ASR, TTS,语言建模 | 不适用 | 107000个单词 | 添加引用 | 丹昆 | 阿彭环球 | 发音字典 | 丹麦 | 丹麦 | 不适用 | 不适用 | 不适用 | 不适用 | 107000年 | 不适用 | 文本 | 丹麦语(丹麦)发音词典 | ||
90 | 音频 | ASR,虚拟助理,聊天机器人 | 麦克风 | 53小时 | 添加引用 | Speecon丹麦 | 细微差别 | 脚本化的演讲 | 丹麦 | 丹麦 | 混合(办公、娱乐、汽车、公共场所) | 600人(550名成人及50名儿童) | 4 | 170000年 | 可根据要求提供 | 16 | 当地法律 | 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告 每名成人和每名儿童分别有290个和210个提示,包括数字、自然数字、字母串、个人、地点和业务名称、成人使用的应用词汇、儿童使用的命令(玩具、电话和通用)、发音丰富的单词和句子,以及成人使用的自由和自发的反应 |
丹麦(丹麦)脚本麦克风 | |
15 | 音频 | ASR,自动字幕,关键字识别 | 麦克风 | 51小时 | 添加引用 | DAR_BRC001 | 阿彭环球 | 广播讲话 | 达里语 | 阿富汗 | 低背景噪音(演播室) | 不适用 | 1 | 可根据要求提供 | 可根据要求提供 | 不适用 | wav | 数据集已完全转录并加上时间戳 数据集主要是语音,不包括音乐或广告 数据类型包括:脱口秀、访谈、新闻广播(不包括主持人阅读新闻) |
达里语(阿富汗)广播数据 | |
14 | 音频 | ASR、会话人工智能、语音分析 | 移动电话和固定电话 | 40小时 | 添加引用 | DAR_ASR001 | 阿彭环球 | 会话演讲 | 达里语 | 阿富汗 | 低背景噪音 | 500 | 2 | 可根据要求提供 | 11168年 | 8 | 当地法律 | 数据集已完全转录并加上时间戳 数据集主要是语音,不包括音乐或广告 |
达里语(阿富汗)会话电话 | |
165 | 文本 | ASR, TTS,语言建模 | 不适用 | 30000个单词 | 添加引用 | prs_AFG_PHON | 阿彭环球 | 发音字典 | 达里语 | 阿富汗 | 不适用 | 不适用 | 不适用 | 不适用 | 30,000 | 不适用 | 文本 | 达里(阿富汗)发音词典 | ||
166 | 文本 | ASR, TTS,语言建模 | 不适用 | 20000个单词 | 添加引用 | luo_KEN_PHON | 阿彭环球 | 发音字典 | Dholuo | 肯尼亚 | 不适用 | 不适用 | 不适用 | 不适用 | 20,000 | 不适用 | 文本 | Dholuo(肯尼亚)发音词典 | ||
91 | 音频 | ASR,虚拟助理,聊天机器人 | 麦克风 | 47个小时 | 添加引用 | 荷兰语,来自比利时 | 细微差别 | 脚本化的演讲 | 荷兰 | 比利时 | 混合(办公、娱乐、汽车、公共场所) | 600人(550名成人及50名儿童) | 4 | 170000年 | 可根据要求提供 | 16 | 当地法律 | 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告 每名成人和每名儿童分别有290个和210个提示,包括数字、自然数字、字母串、个人、地点和业务名称、成人使用的应用词汇、儿童使用的命令(玩具、电话和通用)、发音丰富的单词和句子,以及成人使用的自由和自发的反应 |
荷兰(比利时)脚本麦克风 | |
33 | 音频 | 呼叫中心,虚拟助理 | 麦克风 | 80小时 | 添加引用 | 佛兰芒语演讲 | 细微差别 | 脚本化的演讲 | 荷兰 | 比利时 | 低背景噪音 | 1,000 | 1 | 52000年 | 可根据要求提供 | 8 | 当地法律 | 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告 52个提示,包括数字,自然数字,字母串,个人,地点和业务名称,确认项目(是,不是+模糊),通用的命令和控制项目,语音丰富的句子和单词,自发项目的控制 |
荷兰(比利时)脚本电话 | |
19 | 音频 | ASR,虚拟助理,汽车人机界面和娱乐 | 麦克风和手机 | 27小时 | 添加引用 | 荷兰语和佛兰德语的SpeechDat-Car | 细微差别 | 脚本化的演讲 | 荷兰 | 荷兰;比利时 | 混合(车内) | 302 | 5 | 15100年 | 可根据要求提供 | 16 - 8 | 当地法律 | 数据集完全转录,并伴有发音词典和验证报告 每位成人演讲者125个提示,包括数字、自然数字、字母串、个人、地点和公司名称(有些是自发的)、通用的命令和控制项目、语音丰富的单词和句子以及自发的讲话提示 |
荷兰语(荷兰和比利时)编写在车内 | |
66 | 音频 | ASR、会话人工智能、语音分析 | 移动电话和固定电话 | 36个小时 | 添加引用 | 全国民主联盟ASR001 | 阿彭环球 | 会话演讲 | 荷兰 | 荷兰 | 低背景噪音 | 200 | 2 | 可根据要求提供 | 14964年 | 8 | 当地法律 | 数据集已完全转录并加上时间戳 数据集配有包含所有转录词的发音词典 该项目记录了200个电话对话-100名演讲者向100个呼叫接收器分别拨打2个电话(1个来自固定电话,1个来自移动电话) |
荷兰(荷兰)对话电话 | |
167 | 文本 | ASR, TTS,语言建模 | 不适用 | 45000个单词 | 添加引用 | nld_NLD_PHON | 阿彭环球 | 发音字典 | 荷兰 | 荷兰 | 不适用 | 不适用 | 不适用 | 不适用 | 45,000 | 不适用 | 文本 | 荷兰语(荷兰)发音词典 | ||
92 | 音频 | ASR,虚拟助理,聊天机器人 | 麦克风 | 68小时 | 添加引用 | 荷兰语来自荷兰 | 细微差别 | 脚本化的演讲 | 荷兰 | 荷兰 | 混合(办公、娱乐、汽车、公共场所) | 600人(550名成人及50名儿童) | 4 | 170000年 | 可根据要求提供 | 16 | 当地法律 | 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告 每名成人和每名儿童分别有290个和210个提示,包括数字、自然数字、字母串、个人、地点和业务名称、成人使用的应用词汇、儿童使用的命令(玩具、电话和通用)、发音丰富的单词和句子,以及成人使用的自由和自发的反应 |
荷兰(荷兰)脚本麦克风 | |
125 | 图像 | 面部识别 | 相机 | 13500张图片 | 添加引用 | IMG_FACE_KEN_CN | 中国的动作 | 人类的脸 | 不适用 | 肯尼亚 | 混合背景和照明条件 | One hundred. | NA | NA | NA | NA | jpg | 东非面部图像 | ||
21 | 音频 | ASR、会话人工智能、语音分析 | 移动电话和固定电话 | 28小时 | 添加引用 | ENA_ASR001 | 阿彭环球 | 会话演讲 | 英语 | 埃及 | 低背景噪音 | 250 | 2 | 可根据要求提供 | 5,619 | 8 | 当地法律 | 数据集已完全转录并加上时间戳 数据集配有包含所有转录词的发音词典 平均通话时长:10-15分钟 |
英语(阿拉伯语-黎凡特/埃及)会话电话 | |
169 | 文本 | ASR, TTS,语言建模 | 不适用 | 157000个单词 | 添加引用 | eng_AUS_PHON | 阿彭环球 | 发音字典 | 英语 | 澳大利亚 | 不适用 | 不适用 | 不适用 | 不适用 | 157000年 | 不适用 | 文本 | 英语(澳大利亚)发音词典 | ||
2 | 音频 | 呼叫中心,虚拟助理 | 移动电话和固定电话 | 92小时 | 添加引用 | AUS_ASR001 | 阿彭环球 | 脚本化的演讲 | 英语 | 澳大利亚 | 低背景噪音(家庭/办公室) | 500 | 1 | 82500年 | 35137年 | 8 | 当地法律 | 完全转录到speech hdat类型约定 数据集配有包含所有转录词的发音词典 每个演讲者有162个提示(阅读演讲),包括数字,自然数字,字母串,个人,地点,公司名称,确认项目(是,否+模糊),通用的命令和控制项目(从215个),语音丰富的句子和单词 |
英语(澳大利亚)脚本电话 | |
3. | 音频 | 呼叫中心,虚拟助理 | 移动电话和固定电话 | 118小时 | 添加引用 | AUS_ASR002 | 阿彭环球 | 脚本化的演讲 | 英语 | 澳大利亚 | 混合 | 1,000 | 1 | 75000年 | 19 | 8 | 当地法律 | 完全转录到speech hdat类型约定 数据集配有包含所有转录词的发音词典 每位演讲者有75个提示,包括数字,自然数字,字母串,个人,地点和公司名称,确认项目(是,否+模糊),通用的命令和控制项目,语音丰富的句子和单词 提示是"阅读"和"引出"的组合每个脚本有5个提示是"自发的言论自由" |
英语(澳大利亚)脚本电话 | |
171 | 文本 | ASR, TTS,语言建模 | 不适用 | 3000个单词 | 添加引用 | eng_CAN_POS | 阿彭环球 | 语音词典的一部分 | 英语 | 加拿大 | 不适用 | 不适用 | 不适用 | 不适用 | 3,000 | 不适用 | 文本 | 英语(加拿大)语音词典的一部分 | ||
170 | 文本 | ASR, TTS,语言建模 | 不适用 | 50000个单词 | 添加引用 | eng_CAN_PHON | 阿彭环球 | 发音字典 | 英语 | 加拿大 | 不适用 | 不适用 | 不适用 | 不适用 | 50000年 | 不适用 | 文本 | 英语(加拿大)发音词典 | ||
22 | 音频 | 呼叫中心,虚拟助理 | 移动电话和固定电话 | 144小时 | 添加引用 | ENC_ASR001 | 阿彭环球 | 脚本化的演讲 | 英语 | 加拿大 | 混合 | 1,000 | 1 | 99000年 | 12483年 | 8 | 法律或wav | 完全转录到SALA II/ speech hdat类型约定 数据集配有包含所有转录词的发音词典 每位演讲者提供99个提示,包括数字、自然数字、字母串、个人、地点和企业名称、确认项目(是、否+模糊)、通用的命令和控制项目、语音丰富的句子和单词 |
英语(加拿大)脚本电话 | |
173 | 文本 | ASR, TTS,语言建模 | 不适用 | 18000个单词 | 添加引用 | eng_HKG_PHON | 阿彭环球 | 发音字典 | 英语 | 香港 | 不适用 | 不适用 | 不适用 | 不适用 | 18000年 | 不适用 | 文本 | 英文(香港)发音字典 | ||
25 | 音频 | ASR、会话人工智能、语音分析 | 移动电话和固定电话 | 67小时 | 添加引用 | ENI_ASR002 | 阿彭环球 | 会话演讲 | 英语 | 印度 | 低背景噪音 | 540 | 2 | 77565年 | 11646年 | 8 | 当地法律 | 数据集已完全转录并加上时间戳 数据集配有包含所有转录词的发音词典 271个电话对话被记录在这个项目中 |
英语(印度)会话电话 | |
175 | 文本 | ASR, TTS,语言建模 | 不适用 | 13000个单词 | 添加引用 | eng_IND_POS | 阿彭环球 | 语音词典的一部分 | 英语 | 印度 | 不适用 | 不适用 | 不适用 | 不适用 | 13000年 | 不适用 | 文本 | 英语(印度)语音词典的一部分 | ||
174 | 文本 | ASR, TTS,语言建模 | 不适用 | 六万字 | 添加引用 | eng_IND_PHON | 阿彭环球 | 发音字典 | 英语 | 印度 | 不适用 | 不适用 | 不适用 | 不适用 | 60,000 | 不适用 | 文本 | 英语(印度)发音词典 | ||
24 | 音频 | 呼叫中心,虚拟助理 | 移动电话和固定电话 | 217小时 | 添加引用 | ENI_ASR001 | 阿彭环球 | 脚本化的演讲 | 英语 | 印度 | 混合 | 2358年 | 1 | 117900年 | 9190年 | 8 | 当地法律 | 完全转录到speech hdat类型约定。 数据集附带一个包含所有转录词的发音词典[SAMPA] 每个演讲者有49个提示,包括数字,自然数字,字母串,个人,地点和公司名称,确认项目(是,否+模糊),通用的命令和控制项目,语音丰富的句子和单词 |
英语(印度)脚本电话 | |
176 | 文本 | ASR, TTS,语言建模 | 不适用 | 12000个单词 | 添加引用 | 英吉利丰 | 阿彭环球 | 发音字典 | 英语 | 爱尔兰 | 不适用 | 不适用 | 不适用 | 不适用 | 12000年 | 不适用 | 文本 | 英语(爱尔兰)发音词典 | ||
177 | 文本 | ASR, TTS,语言建模 | 不适用 | 50000个单词 | 添加引用 | eng_NZL_PHON | 阿彭环球 | 发音字典 | 英语 | 新西兰 | 不适用 | 不适用 | 不适用 | 不适用 | 50000年 | 不适用 | 文本 | 英语(新西兰)发音字典 | ||
23 | 音频 | ASR、会话人工智能、语音分析 | 移动电话和固定电话 | 53小时 | 添加引用 | ENF_ASR001 | 阿彭环球 | 会话演讲 | 英语 | 菲律宾 | 低背景噪音 | 450 | 2 | 41,602 | 7,272 | 8 | 法律或wav | 数据集已全部转录并打上时间戳 数据集配有包含所有转录词的发音词典 平均通话时长:10-15分钟 |
英语(菲律宾)会话电话 | |
172 | 文本 | ASR, TTS,语言建模 | 不适用 | 5000个单词 | 添加引用 | eng_PHL_PHON | 阿彭环球 | 发音字典 | 英语 | 菲律宾 | 不适用 | 不适用 | 不适用 | 不适用 | 5,000 | 不适用 | 文本 | 英语(菲律宾)发音字典 | ||
168 | 文本 | ASR, TTS,语言建模 | 不适用 | 5000个单词 | 添加引用 | 英格瑞丰 | 阿彭环球 | 发音字典 | 英语 | 阿拉伯联合酋长国 | 不适用 | 不适用 | 不适用 | 不适用 | 5,000 | 不适用 | 文本 | 英语(阿拉伯联合酋长国)发音词典 | ||
67 | 音频 | 呼叫中心,虚拟助理 | 移动电话和固定电话 | 33小时 | 添加引用 | 阿拉伯联合酋长国所说的东方英语 | 细微差别 | 脚本化的演讲 | 英语 | 阿拉伯联合酋长国 | 低背景噪音 | 500 | 1 | 25500年 | 可根据要求提供 | 8 | 当地法律 | 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告 每个说话人51个提示,包括数字、自然数、字母串、个人、地名和企业名称、确认项(是、否+模糊)、通用命令和控制项、语音丰富的句子和单词以及自动控制项 |
英语(阿拉伯联合酋长国)脚本电话 | |
99 | 音频 | TTS | 耳机麦克风 | 10个小时 | 添加引用 | TC-STAR女性基线声音劳拉 | 细微差别 | 脚本化的演讲 | 英语 | 大不列颠联合王国 | 低背景噪音(演播室) | 1 | 1 | 可根据要求提供 | 可根据要求提供 | 96 | 可根据要求提供 | 数据集包括手动正字法转录、自动音素分割、自动生成音高标记(其中一定百分比的音高段和音高标记已被手动检查) 数据集配有一个语音词典与POS,引理和音标 |
英语(英国) | |
One hundred. | 音频 | TTS | 耳机麦克风 | 10个小时 | 添加引用 | TC-STAR男性基线声音Ian | 细微差别 | 脚本化的演讲 | 英语 | 大不列颠联合王国 | 低背景噪音(演播室) | 1 | 1 | 可根据要求提供 | 可根据要求提供 | 96 | 可根据要求提供 | 数据集包括手动正字法转录、自动音素分割、自动生成音高标记(其中一定百分比的音高段和音高标记已被手动检查) 数据集配有一个语音词典与POS,引理和音标 |
英语(英国) | |
259 | 音频 | ASR、会话人工智能、语音分析 | 移动电话和固定电话 | 50个小时 | 添加引用 | UKE_ASR001B | 阿彭环球 | 会话演讲 | 英语 | 大不列颠联合王国 | 低背景噪音 | 1,150 | 2 | 可根据要求提供 | 13192年 | 8 | wav | 数据集已完全转录并加上时间戳 数据集配有包含所有转录词的发音词典 |
英语(英国)会话电话 | |
104 | 音频 | ASR、会话人工智能、语音分析 | 移动电话和固定电话 | 150小时 | 添加引用 | UKE_ASR001 | 阿彭环球 | 会话演讲 | 英语 | 大不列颠联合王国 | 低背景噪音 | 1,150 | 2 | 298562年 | 24193年 | 8 | wav | 数据集已完全转录并加上时间戳 数据集配有包含所有转录词的发音词典 |
英语(英国)会话电话 | |
179 | 文本 | ASR, TTS,语言建模 | 不适用 | 155000个单词 | 添加引用 | eng_GBR_POS | 阿彭环球 | 语音词典的一部分 | 英语 | 大不列颠联合王国 | 不适用 | 不适用 | 不适用 | 不适用 | 155000年 | 不适用 | 文本 | 英语(英国)语音词典的一部分 | ||
178 | 文本 | ASR, TTS,语言建模 | 不适用 | 195000个单词 | 添加引用 | 英格博丰酒店 | 阿彭环球 | 发音字典 | 英语 | 大不列颠联合王国 | 不适用 | 不适用 | 不适用 | 不适用 | 195000年 | 不适用 | 文本 | 英语(联合王国)发音词典 | ||
107 | 音频 | ASR、会话人工智能、语音分析 | 移动电话 | 1000小时 | 添加引用 | USE_ASR003 | 阿彭环球 | 会话演讲 | 英语 | 美国 | 低背景噪音 | 2,000 | 1 | 500,000 | 52586年 | 16 | wav | 数据集已完全转录并加上时间戳 数据集配有包含所有转录词的发音词典 对话涵盖了各种各样的话题,包括:学习/专业/工作、家乡、生活安排、天气和季节、守时、电视节目/电影) |
英语(美国)会话智能手机 | |
181 | 文本 | ASR, TTS,语言建模 | 不适用 | 263000个单词 | 添加引用 | eng_USA_POS | 阿彭环球 | 语音词典的一部分 | 英语 | 美国 | 不适用 | 不适用 | 不适用 | 不适用 | 263000年 | 不适用 | 文本 | 英语(美国)语音词典的一部分 | ||
180 | 文本 | ASR, TTS,语言建模 | 不适用 | 330000个单词 | 添加引用 | eng_USA_PHON | 阿彭环球 | 发音字典 | 英语 | 美国 | 不适用 | 不适用 | 不适用 | 不适用 | 330,000 | 不适用 | 文本 | 英语(美国)发音词典 | ||
93 | 音频 | ASR,虚拟助理,聊天机器人 | 麦克风 | 53小时 | 添加引用 | 美国speech English数据库 | 细微差别 | 脚本化的演讲 | 英语 | 美国 | 混合(办公、娱乐、汽车、公共场所) | 600人(550名成人及50名儿童) | 4 | 170000年 | 可根据要求提供 | 16 | 可根据要求提供 | 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告 每名成人和每名儿童分别有290个和210个提示,包括数字、自然数字、字母串、个人、地点和业务名称、成人使用的应用词汇、儿童使用的命令(玩具、电话和通用)、发音丰富的单词和句子,以及成人使用的自由和自发的反应 |
英语(美国)脚本话筒 | |
106 | 音频 | ASR,虚拟助理,聊天机器人 | 麦克风 | 62小时 | 添加引用 | USE_ASR001 | 阿彭环球 | 脚本化的演讲 | 英语 | 美国 | 低背景噪音(演播室) | 200 | 2 | 80000年 | 18318年 | 48 | 当地法律 | 数据集已完全转录并加上时间戳 数据集配有包含所有转录词的发音词典 每位演讲者要阅读400个提示,包括数字、自然数字、人名和城市名、电话号码、通用的指挥和控制项目、语音丰富的句子和单词 |
英语(美国)脚本话筒 | |
131 | 文本 | 内容分类,搜索引擎 | 不适用 | 22768句 | 添加引用 | 工程师NER001 | 阿彭环球 | 新闻尼珥 | 英语 | 不适用 | 不适用 | 不适用 | 不适用 | 22768年 | 可根据要求提供 | 不适用 | 文本 | 英语新闻文本 | ||
32 | 音频 | ASR、会话人工智能、语音分析 | 移动电话和固定电话 | 30个小时 | 添加引用 | FAR_ASR002 | 阿彭环球 | 会话演讲 | 伊朗波斯 | 伊朗 | 混合 | 1,000 | 2 | 可根据要求提供 | 12358年 | 8 | wav | 数据集已全部转录并打上时间戳 数据集配有包含所有转录词的发音词典 |
波斯语/波斯语(伊朗)会话电话 | |
31 | 音频 | 呼叫中心,虚拟助理 | 移动电话和固定电话 | 85小时 | 添加引用 | FAR_ASR001 | 阿彭环球 | 脚本化的演讲 | 伊朗波斯 | 伊朗 | 混合 | 789 | 1 | 38400年 | 8716年 | 8 | 当地法律 | 完全转录到东方网类型约定 数据集附带一个包含所有转录词的发音词典[SAMPA] 48个提示,包括数字,自然数字,字母串,个人,地点和业务名称,确认项目(是,否+模糊),通用的命令和控制项目,语音丰富的句子和单词 |
波斯语/波斯语(伊朗)脚本电话 | |
135 | 文本 | 内容分类,搜索引擎 | 不适用 | 19584句 | 添加引用 | FAR_NER001 | 阿彭环球 | 新闻尼珥 | 伊朗波斯 | 伊朗 | 不适用 | 不适用 | 不适用 | 19584年 | 可根据要求提供 | 不适用 | 文本 | 波斯语/波斯语新闻文本 | ||
185 | 文本 | ASR, TTS,语言建模 | 不适用 | 10000个单词 | 添加引用 | fin_FIN_POS | 阿彭环球 | 语音词典的一部分 | 芬兰 | 芬兰 | 不适用 | 不适用 | 不适用 | 不适用 | 10,000 | 不适用 | 文本 | 芬兰语(芬兰)语音词典的一部分 | ||
128 | 图像 | 文档处理,文档搜索 | 相机 | 7293张图片 | 添加引用 | IMG_OCR_FIN_CN | 中国的动作 | 文档OCR | 芬兰 | 芬兰 | 混合照明条件 | 4 | NA | NA | NA | NA | jpg | 包含文本的图像,如广告牌/外包装/标识/杂志/菜单等。 | 芬兰语(芬兰)印刷文本OCR | |
184 | 文本 | ASR, TTS,语言建模 | 不适用 | 八万五千字 | 添加引用 | 芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬 | 阿彭环球 | 发音字典 | 芬兰 | 芬兰 | 不适用 | 不适用 | 不适用 | 不适用 | 85000年 | 不适用 | 文本 | 芬兰语发音词典 | ||
145 | 文本 | ASR, TTS,语言建模 | 不适用 | 4000个单词 | 添加引用 | fra_DZA_PHON | 阿彭环球 | 发音字典 | 法国 | 阿尔及利亚 | 不适用 | 不适用 | 不适用 | 不适用 | 4,000 | 不适用 | 文本 | 阿拉伯语字母 | 法语(阿尔及利亚)发音词典 | |
5 | 音频 | 呼叫中心,虚拟助理 | 固定电话只 | 76小时 | 添加引用 | 比利时法语演讲(II)FDB-1000(固定1BF) | 细微差别 | 脚本化的演讲 | 法国 | 比利时 | 低背景噪音 | 1,000 | 1 | 53000年 | 可根据要求提供 | 8 | 当地法律 | 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告 53个提示,包括数字,自然数字,字母串,个人,地点和业务名称,确认项目(是,不是+模糊),通用的命令和控制项目,语音丰富的句子和单词,自发项目的控制 |
法语(比利时)脚本电话 | |
36 | 音频 | ASR、会话人工智能、语音分析 | 移动电话和固定电话 | 9小时 | 添加引用 | FRC_ASR003 | 阿彭环球 | 会话演讲 | 法国 | 加拿大 | 混合 | 68 | 2 | 可根据要求提供 | 6022年 | 8 | 当地法律 | 数据集已全部转录并打上时间戳 数据集配有包含所有转录词的发音词典 平均通话时长:10-15分钟 在大多数电话中,只有一半的通话内容被接话并记录下来,但在少数电话中,两个通话者(在线/离线)都被接话并记录下来 |
法语(加拿大)会话电话 | |
186 | 文本 | ASR, TTS,语言建模 | 不适用 | 67000个单词 | 添加引用 | fra_CAN_PHON | 阿彭环球 | 发音字典 | 法国 | 加拿大 | 不适用 | 不适用 | 不适用 | 不适用 | 67000年 | 不适用 | 文本 | 法语(加拿大)发音词典 | ||
35 | 音频 | ASR,虚拟助理,聊天机器人 | 麦克风 | 46小时 | 添加引用 | FRC_ASR002 | 阿彭环球 | 脚本化的演讲 | 法国 | 加拿大 | 低背景噪音(家庭/办公室) | 150 | 1 | 22,500 | 10755年 | 16 | 当地法律 | 数据集已完全转录并加上时间戳 数据集配有包含所有转录词的发音词典 每个演讲者有150个提示,包括数字,数字串(随机生成),地址和语音丰富的句子和单词 |
法语(加拿大)脚本麦克风 | |
34 | 音频 | 呼叫中心,虚拟助理 | 移动电话 | 131小时 | 添加引用 | FRC_ASR001 | 阿彭环球 | 脚本化的演讲 | 法国 | 加拿大 | 混合 | 1,000 | 1 | 100,000 | 11697年 | 8 | 当地法律 | 完全转录到speech hdat类型约定 数据集附带一个包含所有转录词的发音词典[SAMPA] 每位演讲者提供100个提示,包括数字、自然数字、字母串、个人、地点和企业名称、确认项目(是、否+模糊)、通用的命令和控制项目、语音丰富的句子和单词 |
法语(加拿大)脚本电话 | |
40 | 音频 | ASR、会话人工智能、语音分析 | 移动电话和固定电话 | 25小时 | 添加引用 | FRF_ASR001 | 阿彭环球 | 会话演讲 | 法国 | 法国 | 低背景噪音 | 563 | 2 | 可根据要求提供 | 11922年 | 8 | 当地法律 | 数据集已全部转录并打上时间戳 数据集配有包含所有转录词的发音词典 在大多数电话中,两位发言人(内联/外联)都被接话和录音,但在少数电话中,只有一半的通话被接话和录音 |
法语(法国)会话式电话 | |
39 | 音频 | ASR,虚拟助理,汽车人机界面和娱乐 | 麦克风和手机 | 添加引用 | 法语演讲车 | 细微差别 | 脚本化的演讲 | 法国 | 法国 | 混合(车内) | 300 | 5 | 37,500 | 可根据要求提供 | 16 - 8 | 可根据要求提供 | 数据集完全转录,并伴有发音词典和验证报告 每个演讲者大约需要125个提示,包括数字、自然数字、字母串、个人、地点和公司名称(有些是自发的)、通用的命令和控制项目、语音丰富的单词和句子以及自发的讲话提示 |
法国(法国)车内 | ||
188 | 文本 | ASR, TTS,语言建模 | 不适用 | 95000字 | 添加引用 | fra_FRA_POS | 阿彭环球 | 语音词典的一部分 | 法国 | 法国 | 不适用 | 不适用 | 不适用 | 不适用 | 95000年 | 不适用 | 文本 | 法语(法国)语音词典的一部分 | ||
187 | 文本 | ASR, TTS,语言建模 | 不适用 | 112000个单词 | 添加引用 | 弗劳弗劳丰酒店 | 阿彭环球 | 发音字典 | 法国 | 法国 | 不适用 | 不适用 | 不适用 | 不适用 | 112000年 | 不适用 | 文本 | 法语(法国)发音词典 | ||
41 | 音频 | ASR,虚拟助理,聊天机器人 | 麦克风 | 26小时 | 添加引用 | FRF_ASR003 | 全球电话 | 脚本化的演讲 | 法国 | 法国 | 低背景噪音(家庭/办公室) | 98 | 1 | 10273年 | 可根据要求提供 | 16 | wav | 数据集是完全转录和转录是可用的原始脚本和罗马化形式 每个演讲者都会从网络上的全国性报纸文章中选择一些语音丰富的句子,以覆盖广泛的领域和大量的词汇 与卡尔斯鲁厄理工学院(KIT)合作开发 |
法国(法国)脚本麦克风 | |
37 | 音频 | 呼叫中心,虚拟助理 | 固定电话只 | 41小时 | 添加引用 | 法国SpeechDat (II)身上- 1000 | 细微差别 | 脚本化的演讲 | 法国 | 法国 | 低背景噪音(家庭/办公室) | 1017年 | 1 | 48000年 | 可根据要求提供 | 8 | 可根据要求提供 | 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告 48个提示,包括数字,自然数字,字母串,个人,地点和业务名称,确认项目(是,否+模糊),通用的命令和控制项目,语音丰富的句子和单词 |
法语(法国)脚本电话 | |
38 | 音频 | 呼叫中心,虚拟助理 | 固定电话只 | 305小时 | 添加引用 | 法国SpeechDat (II)身上- 5000 | 细微差别 | 脚本化的演讲 | 法国 | 法国 | 低背景噪音 | 5,040 | 1 | 237000年 | 可根据要求提供 | 8 | 可根据要求提供 | 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告 47个提示,包括数字,自然数字,字母串,个人,地点和业务名称,确认项目(是,否+模糊),通用的命令和控制项目,语音丰富的句子和单词 |
法语(法国)脚本电话 | |
60 | 音频 | 呼叫中心,虚拟助理 | 固定电话只 | 45小时 | 添加引用 | 卢森堡法语演讲(II)FDB-500(固定1LF) | 细微差别 | 脚本化的演讲 | 法国 | 卢森堡 | 低背景噪音 | 614 | 1 | 32000年 | 可根据要求提供 | 8 | 可根据要求提供 | 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告 53个提示,包括数字,自然数字,字母串,个人,地点和业务名称,确认项目(是,否+模糊),通用的命令和控制项目,语音丰富的句子和单词 |
法国(卢森堡)电话 | |
189 | 文本 | ASR, TTS,语言建模 | 不适用 | 146000字 | 添加引用 | deu_DEU_PHON | 阿彭环球 | 发音字典 | 德国 | 德国 | 不适用 | 不适用 | 不适用 | 不适用 | 146,000 | 不适用 | 文本 | 德语发音词典 | ||
16 | 音频 | ASR,虚拟助理,聊天机器人 | 麦克风 | 16个小时 | 添加引用 | DEU_ASR001 | 阿彭环球 | 脚本化的演讲 | 德国 | 德国 | 低背景噪音(演播室) | 127 | 2 | 12700年 | 6826年 | 16 | 当地法律 | 数据集已完全转录并加上时间戳 数据集配有包含所有转录词的发音词典 每位演讲者要阅读100个提示,包括数字、自然数字、人名和城市名、电话号码、通用的指挥和控制项目、语音丰富的句子和单词 |
德国(德国)脚本麦克风 | |
18 | 音频 | ASR,虚拟助理,聊天机器人 | 麦克风 | 25小时 | 添加引用 | DEU_ASR003 | 全球电话 | 脚本化的演讲 | 德国 | 德国 | 低背景噪音(家庭/办公室) | 77 | 1 | 10,085 | 可根据要求提供 | 16 | wav | 数据集是完全转录和转录是可用的原始脚本和罗马化形式 每个演讲者都会从网络上的全国性报纸文章中选择一些语音丰富的句子,以覆盖广泛的领域和大量的词汇 与卡尔斯鲁厄理工学院(KIT)合作开发 |
德国(德国)脚本麦克风 | |
42 | 音频 | 呼叫中心,虚拟助理 | 固定电话只 | 31小时 | 添加引用 | (二)FDB-1000 | 细微差别 | 脚本化的演讲 | 德国 | 德国 | 低背景噪音(家庭/办公室) | 988 | 1 | 43000年 | 可根据要求提供 | 8 | 可根据要求提供 | 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告 44个提示,包括数字,自然数字,字母串,个人,地点和业务名称,确认项目(是,否+模糊),通用的命令和控制项目,语音丰富的句子和单词 |
德国(德国)电话 | |
43 | 音频 | 呼叫中心,虚拟助理 | 固定电话只 | 268小时 | 添加引用 | 德国SpeechDat (II)身上- 4000 | 细微差别 | 脚本化的演讲 | 德国 | 德国 | 低背景噪音(家庭/办公室) | 4,000 | 1 | 160000年 | 可根据要求提供 | 8 | 可根据要求提供 | 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告 每个演讲者需要40个提示,包括数字,自然数字,字母串,个人,地点和公司名称,确认项目(是,否+模糊),通用的命令和控制项目,语音丰富的句子和单词 |
德国(德国)电话 | |
61 | 音频 | 呼叫中心,虚拟助理 | 固定电话只 | 33小时 | 添加引用 | 卢森堡人的德语演讲 | 细微差别 | 脚本化的演讲 | 德国 | 卢森堡 | 低背景噪音 | 500 | 1 | 26500年 | 可根据要求提供 | 8 | 可根据要求提供 | 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告 53个提示,包括数字,自然数字,字母串,个人,地点和业务名称,确认项目(是,否+模糊),通用的命令和控制项目,语音丰富的句子和单词 |
德国(卢森堡)电话 | |
190 | 文本 | ASR, TTS,语言建模 | 不适用 | 15000个单词 | 添加引用 | deu_CHE_PHON | 阿彭环球 | 发音字典 | 德国 | 瑞士 | 不适用 | 不适用 | 不适用 | 不适用 | 15,000 | 不适用 | 文本 | 德语(瑞士)发音词典 | ||
94 | 音频 | ASR,虚拟助理,聊天机器人 | 麦克风 | 53小时 | 添加引用 | speech德语(瑞士)数据库 | 细微差别 | 脚本化的演讲 | 德国 | 瑞士 | 混合(办公、娱乐、汽车、公共场所) | 600人(550名成人及50名儿童) | 4 | 170000年 | 可根据要求提供 | 16 | 可根据要求提供 | 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告 每名成人和每名儿童分别有290个和210个提示,包括数字、自然数字、字母串、个人、地点和业务名称、成人使用的应用词汇、儿童使用的命令(玩具、电话和通用)、发音丰富的单词和句子,以及成人使用的自由和自发的反应 |
德国(瑞士)脚本麦克风 | |
68 | 音频 | 呼叫中心,虚拟助理 | 移动电话和固定电话 | 31小时 | 添加引用 | 东方人:土耳其人说德语 | 细微差别 | 脚本化的演讲 | 德国 | 火鸡 | 低背景噪音 | 300 | 1 | 15600年 | 可根据要求提供 | 8 | 可根据要求提供 | 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告 52个提示,包括数字,自然数字,字母串,个人,地点和业务名称,确认项目(是,否+模糊),通用的命令和控制项目,语音丰富的句子和单词 |
德国(土耳其)电话 | |
191 | 文本 | ASR, TTS,语言建模 | 不适用 | 5000个单词 | 添加引用 | ell_GRC_PHON | 阿彭环球 | 发音字典 | 希腊人 | 希腊 | 不适用 | 不适用 | 不适用 | 不适用 | 5,000 | 不适用 | 文本 | 希腊(希腊)发音词典 | ||
118 | 音频 | ASR,虚拟助理,聊天机器人 | 移动电话 | 191小时 | 添加引用 | GRE_ASR001_CN | 中国的动作 | 脚本化的演讲 | 希腊人 | 希腊 | 低背景噪音(家庭/办公室) | 287 | 1 | 54113年 | 68271年 | 16 | wav | 数据集完全转录 | 希腊(希腊)脚本智能手机 | |
192 | 文本 | ASR, TTS,语言建模 | 不适用 | 35000个单词 | 添加引用 | grn_PRY_PHON | 阿彭环球 | 发音字典 | 瓜拉尼 | 巴拉圭 | 不适用 | 不适用 | 不适用 | 不适用 | 35000年 | 不适用 | 文本 | 瓜拉尼(巴拉圭)发音词典 | ||
194 | 文本 | ASR, TTS,语言建模 | 不适用 | 15000个单词 | 添加引用 | hat_HTI_PHON | 阿彭环球 | 发音字典 | 海地克里奥尔语 | 海地 | 不适用 | 不适用 | 不适用 | 不适用 | 15,000 | 不适用 | 文本 | 海地克里奥尔语(海地)发音词典 | ||
45 | 音频 | ASR、会话人工智能、语音分析 | 移动电话 | 33小时 | 添加引用 | HAU_ASR002 | 阿彭环球 | 会话演讲 | 豪萨语 | 尼日利亚 | 低背景噪音 | 200 | 2 | 可根据要求提供 | 7,949 | 8 | 当地法律 | 数据集已完全转录并加上时间戳 数据集配有包含所有转录词的发音词典 该项目记录了200个电话对话-100名演讲者向100个呼叫接收器分别拨打2个电话(1个来自固定电话,1个来自移动电话) |
豪萨(尼日利亚)会话式电话 | |
195 | 文本 | ASR, TTS,语言建模 | 不适用 | 11000个单词 | 添加引用 | hau_NGA_PHON | 阿彭环球 | 发音字典 | 豪萨语 | 尼日利亚 | 不适用 | 不适用 | 不适用 | 不适用 | 11000年 | 不适用 | 文本 | 豪萨(尼日利亚)发音词典 | ||
44 | 音频 | ASR,虚拟助理,聊天机器人 | 麦克风 | 20小时 | 添加引用 | HAU_ASR001 | 全球电话 | 脚本化的演讲 | 豪萨语 | 多个 | 低背景噪音(家庭/办公室) | 103 | 1 | 7895年 | 可根据要求提供 | 16 | wav | 数据集是完全转录和转录是可用的原始脚本和罗马化形式 每个演讲者都会从网络上的全国性报纸文章中选择一些语音丰富的句子,以覆盖广泛的领域和大量的词汇 与卡尔斯鲁厄理工学院(KIT)合作开发 |
豪萨脚本话筒 | |
46 | 音频 | ASR、会话人工智能、语音分析 | 移动电话和固定电话 | 34个小时 | 添加引用 | HEB_ASR001 | 阿彭环球 | 会话演讲 | 希伯来语 | 以色列 | 低背景噪音 | 200 | 2 | 可根据要求提供 | 19250年 | 8 | 法律或wav | 数据集已完全转录并加上时间戳 数据集配有包含所有转录词的发音词典 该项目记录了200个电话对话-100名演讲者向100个呼叫接收器分别拨打2个电话(1个来自固定电话,1个来自移动电话) |
希伯来语(以色列)会话电话 | |
196 | 文本 | ASR, TTS,语言建模 | 不适用 | 31000字 | 添加引用 | heb_ISR_PHON | 阿彭环球 | 发音字典 | 希伯来语 | 以色列 | 不适用 | 不适用 | 不适用 | 不适用 | 31000年 | 不适用 | 文本 | 希伯来语(以色列)发音词典 | ||
48 | 音频 | ASR、会话人工智能、语音分析 | 移动电话和固定电话 | 32小时 | 添加引用 | HIN_ASR002 | 阿彭环球 | 会话演讲 | 北印度语 | 印度 | 混合 | 996 | 2 | 可根据要求提供 | 12266年 | 8 | wav | 数据集已完全转录并加上时间戳 数据集配有包含所有转录词的发音词典 在大多数电话中,两位发言人(内联/外联)都被接话和录音,但在少数电话中,只有一半的通话被接话和录音 |
印地语(印度)会话式电话 | |
197 | 文本 | ASR, TTS,语言建模 | 不适用 | 35000个单词 | 添加引用 | hin_IND_PHON | 阿彭环球 | 发音字典 | 北印度语 | 印度 | 不适用 | 不适用 | 不适用 | 不适用 | 35000年 | 不适用 | 文本 | 印地语(印度)发音字典 | ||
47 | 音频 | 呼叫中心,虚拟助理 | 移动电话 | 224小时 | 添加引用 | HIN_ASR001 | 阿彭环球 | 脚本化的演讲 | 北印度语 | 印度 | 低背景噪音 | 1920年 | 1 | 96000年 | 9853年 | 8 | 当地法律 | 完全转录到speech hdat类型约定 数据集附带一个包含所有转录词的发音词典[SAMPA] 每个发言者50次提示,包括数字、自然数字、个人、企业和地名、网址、确认项目(是、否+模糊)、通用命令和控制项目、语音丰富的句子和单词 |
印地语(印度)脚本电话 | |
129 | 视频 | 健身应用,动作分类,手势识别 | 移动电话 | 2000个视频 | 添加引用 | VED_HUMAN_BODY_CN | 中国的动作 | 人体 | 不适用 | 中国 | 混合背景和照明条件 | 1000 | NA | NA | NA | NA | mp4 | 视频剪辑大约有10-20秒长 | 人体运动 | |
198 | 文本 | ASR, TTS,语言建模 | 不适用 | 500字 | 添加引用 | 洪峰洪峰 | 阿彭环球 | 发音字典 | 匈牙利 | 匈牙利 | 不适用 | 不适用 | 不适用 | 不适用 | 500 | 不适用 | 文本 | 匈牙利语(匈牙利)发音字典 | ||
119 | 音频 | ASR,虚拟助理,聊天机器人 | 移动电话 | 286小时 | 添加引用 | 匈牙利ASR001中国 | 中国的动作 | 脚本化的演讲 | 匈牙利 | 匈牙利 | 低背景噪音(家庭/办公室) | 254 | 1 | 94031年 | 201921年 | 16 | wav | 数据集完全转录 | 匈牙利(匈牙利)脚本智能手机 | |
49 | 音频 | 呼叫中心,虚拟助理 | 固定电话只 | 65小时 | 添加引用 | 匈牙利SpeechDat (E) | 细微差别 | 脚本化的演讲 | 匈牙利 | 匈牙利 | 低背景噪音 | 1,000 | 1 | 48000年 | 可根据要求提供 | 8 | 可根据要求提供 | 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告 48个提示,包括数字,自然数字,字母串,个人,地点和业务名称,确认项目(是,否+模糊),通用的命令和控制项目,语音丰富的句子和单词 |
匈牙利(匈牙利)脚本电话 | |
199 | 文本 | ASR, TTS,语言建模 | 不适用 | 30000个单词 | 添加引用 | ibo_NGA_PHON | 阿彭环球 | 发音字典 | 伊博人 | 尼日利亚 | 不适用 | 不适用 | 不适用 | 不适用 | 30,000 | 不适用 | 文本 | 伊博语(尼日利亚)发音词典 | ||
152 | 文本 | ASR, TTS,语言建模 | 不适用 | 10000个单词 | 添加引用 | ind_IDN_POS | 阿彭环球 | 语音词典的一部分 | 印尼 | 印尼 | 不适用 | 不适用 | 不适用 | 不适用 | 10,000 | 不适用 | 文本 | 印度尼西亚语(印度尼西亚语)是语言词典的一部分 | ||
151 | 文本 | ASR, TTS,语言建模 | 不适用 | 95000字 | 添加引用 | ind_IDN_PHON | 阿彭环球 | 发音字典 | 印尼 | 印尼 | 不适用 | 不适用 | 不适用 | 不适用 | 95000年 | 不适用 | 文本 | 印度尼西亚发音词典 | ||
183 | 文本 | ASR, TTS,语言建模 | 不适用 | 140万字 | 添加引用 | pes_IRN_POS | 阿彭环球 | 语音词典的一部分 | 伊朗波斯 | 伊朗 | 不适用 | 不适用 | 不适用 | 不适用 | 1400000年 | 不适用 | 文本 | 伊朗语波斯语(伊朗)语言词典的一部分 | ||
182 | 文本 | ASR, TTS,语言建模 | 不适用 | 80000个单词 | 添加引用 | pes_IRN_PHON | 阿彭环球 | 发音字典 | 伊朗波斯 | 伊朗 | 不适用 | 不适用 | 不适用 | 不适用 | 80000年 | 不适用 | 文本 | 伊朗波斯语(伊朗)发音词典 | ||
52 | 音频 | ASR、会话人工智能、语音分析 | 移动电话和固定电话 | 36个小时 | 添加引用 | ITA_ASR003 | 阿彭环球 | 会话演讲 | 意大利 | 意大利 | 低背景噪音 | 200 | 2 | 可根据要求提供 | 18974年 | 8 | 当地法律 | 数据集已完全转录并加上时间戳 数据集配有包含所有转录词的发音词典 该项目记录了200个电话对话-100名演讲者向100个呼叫接收器分别拨打2个电话(1个来自固定电话,1个来自移动电话) |
意大利(意大利)会话电话 | |
201 | 文本 | ASR, TTS,语言建模 | 不适用 | 147000个单词 | 添加引用 | ita_ITA_POS | 阿彭环球 | 语音词典的一部分 | 意大利 | 意大利 | 不适用 | 不适用 | 不适用 | 不适用 | 147000年 | 不适用 | 文本 | 意大利语(意大利)语音词典的一部分 | ||
200 | 文本 | ASR, TTS,语言建模 | 不适用 | 197000个单词 | 添加引用 | ita_ITA_PHON | 阿彭环球 | 发音字典 | 意大利 | 意大利 | 不适用 | 不适用 | 不适用 | 不适用 | 197000年 | 不适用 | 文本 | 意大利语(意大利)发音词典 | ||
50 | 音频 | ASR,虚拟助理,聊天机器人 | 麦克风 | 44小时 | 添加引用 | ITA_ASR001 | 阿彭环球 | 脚本化的演讲 | 意大利 | 意大利 | 混合 | 200 | 4 | 40,000 | 7316年 | 22 | 当地法律 | 完全转录到speech hdat类型约定 数据集配有包含所有转录词的发音词典 每个演讲者有200个提示,包括100个命令和控制类型项目和100个语音丰富的句子 |
意大利(意大利)脚本麦克风 | |
51 | 音频 | ASR,虚拟助理,汽车人机界面和娱乐 | 麦克风 | 47个小时 | 添加引用 | ITA_ASR002 | 阿彭环球 | 脚本化的演讲 | 意大利 | 意大利 | 混合(车内) | 103 | 4 | 35875年 | 10366年 | 48 | 当地法律 | 完全转录到speech hdat类型约定 数据集配有包含所有转录词的发音词典 每个演讲者有350个提示,包括数字,街道名称,通用的指挥和控制项目,语音丰富的句子和单词 每个演讲者录制了一到两段录音,包括第一次录音是在一辆停着的汽车里,发动机还在运转;第二次录音是在一辆以60英里/小时(100公里/小时)的速度行驶的汽车里。 |
意大利(意大利)脚本麦克风 | |
53 | 音频 | TTS | 麦克风 | 3个小时 | 添加引用 | ITA_TTS001 | 阿彭环球 | 脚本化的演讲 | 意大利 | 意大利 | 低背景噪音(演播室) | 1 | 1 | 3300年 | 可根据要求提供 | 22 | 当地法律 | 数据集附带一个发音词汇表,其中包含数据集中说出的所有单词 每个演讲者有3300个提示,包括语音丰富的句子 |
意大利(意大利)脚本麦克风 | |
54 | 音频 | 呼叫中心,虚拟助理 | 固定电话只 | 38小时 | 添加引用 | 意大利固定网络语音 | 细微差别 | 脚本化的演讲 | 意大利 | 意大利 | 低背景噪音(家庭/办公室) | 1,000 | 1 | 39000年 | 可根据要求提供 | 8 | 可根据要求提供 | 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告 每个人39个提示,包括独立和连接的数字,自然数,金额,拼写单词,时间和日期短语,是/不是问题,城市名称,常见的应用单词,短语中的应用单词和语音丰富的句子 |
意大利(意大利)电话 | |
55 | 音频 | 呼叫中心,虚拟助理 | 固定电话只 | 228小时 | 添加引用 | 意大利SpeechDat (II)身上- 3000 | 细微差别 | 脚本化的演讲 | 意大利 | 意大利 | 低背景噪音(家庭/办公室) | 3,040 | 1 | 134000年 | 可根据要求提供 | 8 | 可根据要求提供 | 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告 44个提示,包括数字,自然数字,字母串,个人,地点和业务名称,确认项目(是,否+模糊),通用的命令和控制项目,语音丰富的句子和单词 |
意大利(意大利)电话 | |
56 | 音频 | 呼叫中心,虚拟助理 | 移动电话 | 103小时 | 添加引用 | 意大利语演讲(二)MDB-250 | 细微差别 | 脚本化的演讲 | 意大利 | 意大利 | 低背景噪音(家庭/办公室) | 375 | 1 | 19,000 | 可根据要求提供 | 8 | 可根据要求提供 | 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告 51个提示,包括数字,自然数字,字母串,个人,地点和业务名称,确认项目(是,否+模糊),通用的命令和控制项目,语音丰富的句子和单词 |
意大利(意大利)电话 | |
89 | 音频 | 呼叫中心,虚拟助理 | 移动电话 | 13个小时 | 添加引用 | 意大利移动网络语音数据库 | 细微差别 | 脚本化的演讲 | 意大利 | 意大利 | 低背景噪音(家庭/办公室) | 342 | 1 | 13500年 | 可根据要求提供 | 8 | 可根据要求提供 | 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告 每个演讲者需要40个提示,包括数字,自然数字,字母串,个人,地点和公司名称,确认项目(是,否+模糊),通用的命令和控制项目,语音丰富的句子和单词 |
意大利(意大利)电话 | |
203 | 文本 | ASR, TTS,语言建模 | 不适用 | 265000字 | 添加引用 | jpn_jpn_POS | 阿彭环球 | 语音词典的一部分 | 日本 | 日本 | 不适用 | 不适用 | 不适用 | 不适用 | 265000年 | 不适用 | 文本 | 日语(日语)语音词典的一部分 | ||
202 | 文本 | ASR, TTS,语言建模 | 不适用 | 262000个单词 | 添加引用 | jpn_jpn_PHON | 阿彭环球 | 发音字典 | 日本 | 日本 | 不适用 | 不适用 | 不适用 | 不适用 | 262000年 | 不适用 | 文本 | 日语(日本)发音词典 | ||
57 | 音频 | ASR,虚拟助理,聊天机器人 | 麦克风 | 33小时 | 添加引用 | JPN_ASR001 | 全球电话 | 脚本化的演讲 | 日本 | 日本 | 低背景噪音(家庭/办公室) | 144 | 1 | 13067年 | 可根据要求提供 | 16 | wav | 数据集是完全转录和转录是可用的原始脚本和罗马化形式 每个演讲者都会从网络上的全国性报纸文章中选择一些语音丰富的句子,以覆盖广泛的领域和大量的词汇 与卡尔斯鲁厄理工学院(KIT)合作开发 |
日语(日本)脚本麦克风 | |
95 | 音频 | ASR,虚拟助理,聊天机器人 | 麦克风 | 57小时 | 添加引用 | Speecon日本 | 细微差别 | 脚本化的演讲 | 日本 | 日本 | 混合(办公、娱乐、汽车、公共场所) | 600人(550名成人及50名儿童) | 4 | 170000年 | 可根据要求提供 | 16 | 可根据要求提供 | 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告 每名成人和每名儿童分别有290个和210个提示,包括数字、自然数字、字母串、个人、地点和业务名称、成人使用的应用词汇、儿童使用的命令(玩具、电话和通用)、发音丰富的单词和句子,以及成人使用的自由和自发的反应 |
日语(日本)脚本麦克风 | |
136 | 文本 | 内容分类,搜索引擎 | 不适用 | 20629句 | 添加引用 | JPY_NER001 | 阿彭环球 | 新闻尼珥 | 日本 | 日本 | 不适用 | 不适用 | 不适用 | 20629年 | 可根据要求提供 | 不适用 | 文本 | 日本东北新闻社 | ||
204 | 文本 | ASR, TTS,语言建模 | 不适用 | 20000个单词 | 添加引用 | jav_IDN_PHON | 阿彭环球 | 发音字典 | 爪哇人 | 印尼 | 不适用 | 不适用 | 不适用 | 不适用 | 20,000 | 不适用 | 文本 | 爪哇语(印度尼西亚)发音字典 | ||
58 | 音频 | ASR、会话人工智能、语音分析 | 移动电话和固定电话 | 15个小时 | 添加引用 | KAN_ASR001 | 阿彭环球 | 会话演讲 | 埃纳德语 | 印度 | 混合 | 178 | 2 | 可根据要求提供 | 15660年 | 8 | 当地法律 | 数据集已完全转录并加上时间戳 数据集配有包含所有转录词的发音词典 |
卡纳达(印度)对话电话 | |
109 | 音频 | ASR、会话人工智能、语音分析 | 移动电话和固定电话 | 57小时 | 添加引用 | KAN_ASR001A | 阿彭环球 | 会话演讲 | 埃纳德语 | 印度 | 混合 | 1,000 | 2 | 可根据要求提供 | 15660年 | 8 | 当地法律 | 大约25%的数据集会话被转录,并有时间戳——完整的记录可以提供 数据库是伴随着一个发音词典,包含所有转录词 |
卡纳达(印度)对话电话 | |
205 | 文本 | ASR, TTS,语言建模 | 不适用 | 35000个单词 | 添加引用 | kan_IND_PHON | 阿彭环球 | 发音字典 | 埃纳德语 | 印度 | 不适用 | 不适用 | 不适用 | 不适用 | 35000年 | 不适用 | 文本 | 卡纳达(印度)发音词典 | ||
206 | 文本 | ASR, TTS,语言建模 | 不适用 | 30000个单词 | 添加引用 | kaz_KAZ_PHON | 阿彭环球 | 发音字典 | 哈萨克斯坦 | 哈萨克斯坦 | 不适用 | 不适用 | 不适用 | 不适用 | 30,000 | 不适用 | 文本 | 哈萨克(哈萨克斯坦)发音词典 | ||
123 | 音频 | ASR,虚拟助理,聊天机器人 | 移动电话 | 90小时 | 添加引用 | KHM_ASR001_中国 | 中国的动作 | 脚本化的演讲 | 高棉语 | 柬埔寨 | 低背景噪音(家庭/办公室) | 94 | 1 | 24618年 | 52157年 | 16 | wav | 数据集完全转录 | 高棉(柬埔寨)脚本智能手机 | |
208 | 文本 | ASR, TTS,语言建模 | 不适用 | 100000个单词 | 添加引用 | kor_KOR_POS | 阿彭环球 | 语音词典的一部分 | 朝鲜文 | 韩国 | 不适用 | 不适用 | 不适用 | 不适用 | 100,000 | 不适用 | 文本 | 韩语(韩国)词性词典 | ||
207 | 文本 | ASR, TTS,语言建模 | 不适用 | 100000个单词 | 添加引用 | kor_KOR_PHON | 阿彭环球 | 发音字典 | 朝鲜文 | 韩国 | 不适用 | 不适用 | 不适用 | 不适用 | 100,000 | 不适用 | 文本 | 韩语(韩国)发音词典 | ||
59 | 音频 | ASR,虚拟助理,聊天机器人 | 麦克风 | 20小时 | 添加引用 | KOR_ASR001 | 全球电话 | 脚本化的演讲 | 朝鲜文 | 韩国 | 低背景噪音(家庭/办公室) | One hundred. | 1 | 8107年 | 可根据要求提供 | 16 | wav | 数据集是完全转录和转录是可用的原始脚本和罗马化形式 每个演讲者都会从网络上的全国性报纸文章中选择一些语音丰富的句子,以覆盖广泛的领域和大量的词汇 与卡尔斯鲁厄理工学院(KIT)合作开发 |
韩国(韩国)脚本麦克风 | |
132 | 文本 | 内容分类,搜索引擎 | 不适用 | 25830句 | 添加引用 | 科鲁内尔001 | 阿彭环球 | 新闻尼珥 | 朝鲜文 | 韩国 | 不适用 | 不适用 | 不适用 | 25830年 | 可根据要求提供 | 不适用 | 文本 | 韩国NER新闻文本 | ||
209 | 文本 | ASR, TTS,语言建模 | 不适用 | 六万字 | 添加引用 | kur_TUR_PHON | 阿彭环球 | 发音字典 | Kurmanji | 火鸡 | 不适用 | 不适用 | 不适用 | 不适用 | 60,000 | 不适用 | 文本 | Kurmanji(土耳其)发音词典 | ||
210 | 文本 | ASR, TTS,语言建模 | 不适用 | 9000个单词 | 添加引用 | lao_LAO_PHON | 阿彭环球 | 发音字典 | 老挝 | 老挝 | 不适用 | 不适用 | 不适用 | 不适用 | 9000年 | 不适用 | 文本 | 老挝语发音词典 | ||
211 | 文本 | ASR, TTS,语言建模 | 不适用 | 六万字 | 添加引用 | lit_LTU_PHON | 阿彭环球 | 发音字典 | 立陶宛 | 立陶宛 | 不适用 | 不适用 | 不适用 | 不适用 | 60,000 | 不适用 | 文本 | 立陶宛语发音词典 | ||
212 | 文本 | ASR, TTS,语言建模 | 不适用 | 4000个单词 | 添加引用 | mal_IND_PHON | 阿彭环球 | 发音字典 | 马拉雅拉姆语 | 印度 | 不适用 | 不适用 | 不适用 | 不适用 | 4,000 | 不适用 | 文本 | 马来语(印度)发音词典 | ||
213 | 文本 | ASR, TTS,语言建模 | 不适用 | 10000个单词 | 添加引用 | msa_MYS_PHON | 阿彭环球 | 发音字典 | 马来西亚 | 马来西亚 | 不适用 | 不适用 | 不适用 | 不适用 | 10,000 | 不适用 | 文本 | 马来西亚(马来西亚)发音字典 | ||
214 | 文本 | ASR, TTS,语言建模 | 不适用 | 35000个单词 | 添加引用 | zho_CHN_PHON | 阿彭环球 | 发音字典 | 中文(简体) | 中国 | 不适用 | 不适用 | 不适用 | 不适用 | 35000年 | 不适用 | 文本 | 普通话(简体)(中国)发音词典 | ||
215 | 文本 | ASR, TTS,语言建模 | 不适用 | 50000个单词 | 添加引用 | zho_TWN_PHON | 阿彭环球 | 发音字典 | 中文(繁体) | 台湾 | 不适用 | 不适用 | 不适用 | 不适用 | 50000年 | 不适用 | 文本 | 普通话(传统)(台湾)发音词典 | ||
63 | 音频 | ASR,虚拟助理,聊天机器人 | 麦克风 | 26小时 | 添加引用 | MAC_ASR002 | 全球电话 | 脚本化的演讲 | 普通话 | 中国 | 低背景噪音(家庭/办公室) | 132 | 1 | 10225年 | 可根据要求提供 | 16 | wav | 数据集是完全转录和转录是可用的原始脚本和罗马化形式 每个演讲者都会从网络上的全国性报纸文章中选择一些语音丰富的句子,以覆盖广泛的领域和大量的词汇 与卡尔斯鲁厄理工学院(KIT)合作开发 |
普通话(中国)脚本话筒 | |
62 | 音频 | 呼叫中心,虚拟助理 | 移动电话和固定电话 | 323小时 | 添加引用 | MAC_ASR001 | 阿彭环球 | 脚本化的演讲 | 普通话 | 中国 | 混合 | 2,000 | 1 | 200,000 | 7145年 | 8 | 当地法律 | 完全转录到speech hdat类型约定 数据集附带一个包含所有转录词的发音词典[SAMPA] 98个提示,包括数字,自然数字,字母串,个人,地点和业务名称,确认项目(是,否+模糊),通用的命令和控制项目(从215个),语音丰富的句子和单词 |
普通话(中国)脚本电话 | |
134 | 文本 | 内容分类,搜索引擎 | 不适用 | 17313句 | 添加引用 | MAC_NER001 | 阿彭环球 | 新闻尼珥 | 普通话 | 中国 | 不适用 | 不适用 | 不适用 | 17313年 | 可根据要求提供 | 不适用 | 文本 | 中国话 | ||
64 | 音频 | ASR、会话人工智能、语音分析 | 移动电话和固定电话 | 15个小时 | 添加引用 | MAR_ASR001 | 阿彭环球 | 会话演讲 | 马拉地语 | 印度 | 混合 | 180 | 2 | 可根据要求提供 | 11908年 | 8 | 当地法律 | 大约29%的数据集会话被转录,并带有时间戳——完整的记录可以提供 数据集配有包含所有转录词的发音词典 |
马拉地语(印度)会话电话 | |
110 | 音频 | ASR、会话人工智能、语音分析 | 移动电话和固定电话 | 52小时 | 添加引用 | MAR_ASR001A | 阿彭环球 | 会话演讲 | 马拉地语 | 印度 | 混合 | 1,000 | 2 | 可根据要求提供 | 11908年 | 8 | 当地法律 | 数据集会话的一部分被转录并带有时间戳——完整的记录可以提供 数据集配有包含所有转录词的发音词典 |
马拉地语(印度)会话电话 | |
216 | 文本 | ASR, TTS,语言建模 | 不适用 | 30000个单词 | 添加引用 | mar_IND_PHON | 阿彭环球 | 发音字典 | 马拉地语 | 印度 | 不适用 | 不适用 | 不适用 | 不适用 | 30,000 | 不适用 | 文本 | 马拉地语(印度)发音词典 | ||
217 | 文本 | ASR, TTS,语言建模 | 不适用 | 30000个单词 | 添加引用 | mon_MNG_PHON | 阿彭环球 | 发音字典 | 蒙古 | 蒙古 | 不适用 | 不适用 | 不适用 | 不适用 | 30,000 | 不适用 | 文本 | 蒙古语发音词典 | ||
219 | 文本 | ASR, TTS,语言建模 | 不适用 | 3000个单词 | 添加引用 | nor_NOR_POS | 阿彭环球 | 语音词典的一部分 | 挪威语 | 挪威 | 不适用 | 不适用 | 不适用 | 不适用 | 3,000 | 不适用 | 文本 | 挪威语(挪威)语音词典的一部分 | ||
218 | 文本 | ASR, TTS,语言建模 | 不适用 | 115000个单词 | 添加引用 | nor_NOR_PHON | 阿彭环球 | 发音字典 | 挪威语 | 挪威 | 不适用 | 不适用 | 不适用 | 不适用 | 115000年 | 不适用 | 文本 | 挪威语(挪威)发音词典 | ||
220 | 文本 | ASR, TTS,语言建模 | 不适用 | 15000个单词 | 添加引用 | ori_IND_PHON | 阿彭环球 | 发音字典 | 奥里萨邦 | 印度 | 不适用 | 不适用 | 不适用 | 不适用 | 15,000 | 不适用 | 文本 | 奥里亚(印度)发音词典 | ||
80 | 音频 | ASR、会话人工智能、语音分析 | 移动电话和固定电话 | 20小时 | 添加引用 | PAP_ASR001 | 阿彭环球 | 会话演讲 | 旁遮普语 | 巴基斯坦 | 低背景噪音 | 205 | 2 | 可根据要求提供 | 7,298 | 8 | 当地法律 | 数据集已完全转录并带有时间戳 数据集配有包含所有转录词的发音词典 71%的电话,两个发言人(内线/外线)都被收集和转录,然而,29%的电话,只有一半的谈话被收集和转录 |
旁遮普(巴基斯坦)会话电话 | |
74 | 音频 | ASR,自动字幕,关键字识别 | 麦克风 | 51小时 | 添加引用 | PAS_BRC001 | 阿彭环球 | 广播讲话 | 北普什图语;南普什图语 | 阿富汗 | 低背景噪音(演播室) | 不适用 | 1 | 可根据要求提供 | 可根据要求提供 | 不适用 | wav | 数据集已完全转录并加上时间戳 数据集主要是语音,不包括音乐或广告 数据类型包括:脱口秀、访谈、新闻广播(不包括主持人阅读新闻) |
普什图语(阿富汗)播出 | |
73 | 音频 | ASR、会话人工智能、语音分析 | 麦克风 | 39个小时 | 添加引用 | PAS_ASR002 | 阿彭环球 | 会话演讲 | 北普什图语;南普什图语 | 阿富汗 | 低背景噪音 | 40 | 2 | 可根据要求提供 | 9480年 | 16 | wav | 数据集已全部转录并打上时间戳 数据集配有包含所有转录词的发音词典 作为可选的额外购买,还可提供法语成绩单的完整翻译 平均通话时长:120分钟,其中一人作为采访者,另一人作为被采访者,场景类似于TransTAC风格(如民事、检查点等)。 面试官出现在不止一组对话中,但每一组对话中的受访者都是独特的 |
普什图语(阿富汗语)对话麦克风 | |
72 | 音频 | ASR、会话人工智能、语音分析 | 移动电话和固定电话 | 55个小时 | 添加引用 | PAS_ASR001 | 阿彭环球 | 会话演讲 | 北普什图语;南普什图语 | 阿富汗 | 低背景噪音 | 967 | 2 | 可根据要求提供 | 13633年 | 8 | wav | 数据集已全部转录并打上时间戳 数据集配有包含所有转录词的发音词典 在大多数电话中,两位发言人(内联/外联)都被接话和录音,但在少数电话中,只有一半的通话被接话和录音 |
普什图语(阿富汗)会话电话 | |
221 | 文本 | ASR, TTS,语言建模 | 不适用 | 65000个单词 | 添加引用 | pus_AFG_PHON | 阿彭环球 | 发音字典 | 普什图语 | 阿富汗 | 不适用 | 不适用 | 不适用 | 不适用 | 65000年 | 不适用 | 文本 | 普什图语(阿富汗)发音词典 | ||
223 | 文本 | ASR, TTS,语言建模 | 不适用 | 4000个单词 | 添加引用 | pol_POL_POS | 阿彭环球 | 语音词典的一部分 | 波兰的 | 波兰 | 不适用 | 不适用 | 不适用 | 不适用 | 4,000 | 不适用 | 文本 | 波兰语(波兰)语言词典的一部分 | ||
222 | 文本 | ASR, TTS,语言建模 | 不适用 | 40000个单词 | 添加引用 | pol_POL_PHON | 阿彭环球 | 发音字典 | 波兰的 | 波兰 | 不适用 | 不适用 | 不适用 | 不适用 | 40,000 | 不适用 | 文本 | 波兰语(波兰)发音词典 | ||
75 | 音频 | ASR,虚拟助理,聊天机器人 | 麦克风 | 25小时 | 添加引用 | POL_ASR001 | 全球电话 | 脚本化的演讲 | 波兰的 | 波兰 | 低背景噪音(家庭/办公室) | 99 | 1 | 10,130 | 可根据要求提供 | 16 | wav | 数据集是完全转录和转录是可用的原始脚本和罗马化形式 每个演讲者都会从网络上的全国性报纸文章中选择一些语音丰富的句子,以覆盖广泛的领域和大量的词汇 与卡尔斯鲁厄理工学院(KIT)合作开发 |
波兰(波兰)脚本麦克风 | |
120 | 音频 | ASR,虚拟助理,聊天机器人 | 移动电话 | 293小时 | 添加引用 | POL_ASR002_CN | 中国的动作 | 脚本化的演讲 | 波兰的 | 波兰 | 低背景噪音(家庭/办公室) | 353 | 1 | 106674年 | 168544年 | 16 | wav | 数据集完全转录 | 波兰(波兰)脚本智能手机 | |
76 | 音频 | 呼叫中心,虚拟助理 | 固定电话只 | 78小时 | 添加引用 | 波兰SpeechDat (E)数据库 | 细微差别 | 脚本化的演讲 | 波兰的 | 波兰 | 低背景噪音 | 1,000 | 1 | 48000年 | 可根据要求提供 | 8 | 可根据要求提供 | 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告 48个提示,包括数字,自然数字,字母串,个人,地点和业务名称,确认项目(是,否+模糊),通用的命令和控制项目,语音丰富的句子和单词 |
波兰(波兰)脚本电话 | |
78 | 音频 | ASR、会话人工智能、语音分析 | 移动电话和固定电话 | 33小时 | 添加引用 | PTB_ASR002 | 阿彭环球 | 会话演讲 | 葡萄牙语 | 巴西 | 低背景噪音 | 200 | 2 | 可根据要求提供 | 11287年 | 8 | 当地法律 | 数据集已全部转录并打上时间戳 数据集配有包含所有转录词的发音词典 |
葡萄牙语(巴西)会话式电话 | |
77 | 音频 | ASR,虚拟助理,聊天机器人 | 麦克风 | 26小时 | 添加引用 | PTB_ASR001 | 全球电话 | 脚本化的演讲 | 葡萄牙语 | 巴西 | 低背景噪音(家庭/办公室) | 102 | 1 | 10417年 | 可根据要求提供 | 16 | wav | 数据集是完全转录和转录是可用的原始脚本和罗马化形式 每个演讲者都会从网络上的全国性报纸文章中选择一些语音丰富的句子,以覆盖广泛的领域和大量的词汇 与卡尔斯鲁厄理工学院(KIT)合作开发 |
葡萄牙语(巴西)麦克风 | |
225 | 文本 | ASR, TTS,语言建模 | 不适用 | 100000个单词 | 添加引用 | por_BRA_POS | 阿彭环球 | 语音词典的一部分 | 葡萄牙语 | 巴西 | 不适用 | 不适用 | 不适用 | 不适用 | 100,000 | 不适用 | 文本 | 葡萄牙语(巴西)语音词典的一部分 | ||
224 | 文本 | ASR, TTS,语言建模 | 不适用 | 102000个单词 | 添加引用 | por_BRA_PHON | 阿彭环球 | 发音字典 | 葡萄牙语 | 巴西 | 不适用 | 不适用 | 不适用 | 不适用 | 102000年 | 不适用 | 文本 | 葡萄牙语(巴西)发音词典 | ||
79 | 音频 | ASR、会话人工智能、语音分析 | 移动电话和固定电话 | 36个小时 | 添加引用 | PTP_ASR001 | 阿彭环球 | 会话演讲 | 葡萄牙语 | 葡萄牙 | 低背景噪音 | 200 | 2 | 可根据要求提供 | 16339年 | 8 | 当地法律 | 数据集已完全转录并加上时间戳 数据集配有包含所有转录词的发音词典 该项目记录了200个电话对话-100名演讲者向100个呼叫接收器分别拨打2个电话(1个来自固定电话,1个来自移动电话) |
葡萄牙语(葡萄牙)会话式电话 | |
227 | 文本 | ASR, TTS,语言建模 | 不适用 | 100000个单词 | 添加引用 | por_PRT_POS | 阿彭环球 | 语音词典的一部分 | 葡萄牙语 | 葡萄牙 | 不适用 | 不适用 | 不适用 | 不适用 | 100,000 | 不适用 | 文本 | 葡萄牙语(葡萄牙语)语音词典的一部分 | ||
226 | 文本 | ASR, TTS,语言建模 | 不适用 | 112000个单词 | 添加引用 | por_PRT_PHON | 阿彭环球 | 发音字典 | 葡萄牙语 | 葡萄牙 | 不适用 | 不适用 | 不适用 | 不适用 | 112000年 | 不适用 | 文本 | 葡萄牙语发音词典 | ||
81 | 音频 | ASR、会话人工智能、语音分析 | 移动电话和固定电话 | 37小时 | 添加引用 | ROM_ASR001 | 阿彭环球 | 会话演讲 | 罗马尼亚 | 罗马尼亚 | 低背景噪音 | 200 | 2 | 可根据要求提供 | 16,658 | 8 | 当地法律 | 数据集已完全转录并加上时间戳 数据集配有包含所有转录词的发音词典 该项目记录了200个电话对话-100名演讲者向100个呼叫接收器分别拨打2个电话(1个来自固定电话,1个来自移动电话) |
罗马尼亚(罗马尼亚)对话电话 | |
228 | 文本 | ASR, TTS,语言建模 | 不适用 | 15000个单词 | 添加引用 | ron_ROU_PHON | 阿彭环球 | 发音字典 | 罗马尼亚 | 罗马尼亚 | 不适用 | 不适用 | 不适用 | 不适用 | 15,000 | 不适用 | 文本 | 罗马尼亚语发音词典 | ||
82 | 音频 | ASR、会话人工智能、语音分析 | 移动电话和固定电话 | 37小时 | 添加引用 | RUS_ASR001 | 阿彭环球 | 会话演讲 | 俄罗斯 | 俄罗斯 | 低背景噪音 | 200 | 2 | 可根据要求提供 | 28284年 | 8 | 法律或wav | 数据集已完全转录并加上时间戳 数据集配有包含所有转录词的发音词典 该项目记录了200个电话对话-100名演讲者向100个呼叫接收器分别拨打2个电话(1个来自固定电话,1个来自移动电话) |
俄语会话式电话 | |
230 | 文本 | ASR, TTS,语言建模 | 不适用 | 100000个单词 | 添加引用 | rus_RUS_POS | 阿彭环球 | 语音词典的一部分 | 俄罗斯 | 俄罗斯 | 不适用 | 不适用 | 不适用 | 不适用 | 100,000 | 不适用 | 文本 | 俄语(俄罗斯)词性词典 | ||
229 | 文本 | ASR, TTS,语言建模 | 不适用 | 115000个单词 | 添加引用 | 鲁苏鲁苏丰 | 阿彭环球 | 发音字典 | 俄罗斯 | 俄罗斯 | 不适用 | 不适用 | 不适用 | 不适用 | 115000年 | 不适用 | 文本 | 俄语(俄罗斯)发音字典 | ||
83 | 音频 | ASR,虚拟助理,聊天机器人 | 麦克风 | 31小时 | 添加引用 | RUS_ASR002 | 全球电话 | 脚本化的演讲 | 俄罗斯 | 俄罗斯 | 低背景噪音(家庭/办公室) | 115 | 1 | 12205年 | 可根据要求提供 | 16 | wav | 数据集是完全转录和转录是可用的原始脚本和罗马化形式 每个演讲者都会从网络上的全国性报纸文章中选择一些语音丰富的句子,以覆盖广泛的领域和大量的词汇 与卡尔斯鲁厄理工学院(KIT)合作开发 |
俄罗斯(俄罗斯)脚本麦克风 | |
96 | 音频 | ASR,虚拟助理,聊天机器人 | 麦克风 | 46小时 | 添加引用 | Speecon俄罗斯数据库 | 细微差别 | 脚本化的演讲 | 俄罗斯 | 俄罗斯 | 混合(办公、娱乐、汽车、公共场所) | 600人(550名成人及50名儿童) | 4 | 170000年 | 可根据要求提供 | 16 | 可根据要求提供 | 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告 每名成人和每名儿童分别有290个和210个提示,包括数字、自然数字、字母串、个人、地点和业务名称、成人使用的应用词汇、儿童使用的命令(玩具、电话和通用)、发音丰富的单词和句子,以及成人使用的自由和自发的反应 |
俄罗斯(俄罗斯)脚本麦克风 | |
84 | 音频 | 呼叫中心,虚拟助理 | 固定电话只 | 180小时 | 添加引用 | 俄罗斯SpeechDat (E)数据库 | 细微差别 | 脚本化的演讲 | 俄罗斯 | 俄罗斯 | 低背景噪音 | 2,500 | 1 | 112000年 | 可根据要求提供 | 8 | 当地法律 | 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告 每个演讲者需要45个提示,包括数字,自然数字,字母串,个人,地点和公司名称,确认项目(是,否+模糊),通用的命令和控制项目,语音丰富的句子和单词 |
俄罗斯脚本电话 | |
133 | 文本 | 内容分类,搜索引擎 | 不适用 | 29888句 | 添加引用 | RUS_NER001 | 阿彭环球 | 新闻尼珥 | 俄罗斯 | 俄罗斯 | 不适用 | 不适用 | 不适用 | 29,888 | 可根据要求提供 | 不适用 | 文本 | 俄罗斯NER新闻文本 | ||
231 | 文本 | ASR, TTS,语言建模 | 不适用 | 15000个单词 | 添加引用 | srp_SRB_PHON | 阿彭环球 | 发音字典 | 塞尔维亚 | 塞尔维亚 | 不适用 | 不适用 | 不适用 | 不适用 | 15,000 | 不适用 | 文本 | 塞尔维亚语发音词典 | ||
126 | 图像 | 文档处理,文档搜索 | 相机 | 200张图片 | 添加引用 | IMG_OCR_MAC_CN | 中国的动作 | 文档OCR | 不适用 | 中国 | 混合照明条件 | 30. | NA | NA | NA | NA | jpg | 每个图像中的文本都用线条标记了边框 图片包含厚重的中文文本,包括书籍、出版物、海报、收据、PPT、印刷纸张等。 |
简体中文打印文本OCR | |
85 | 音频 | 呼叫中心,虚拟助理 | 固定电话只 | 65小时 | 添加引用 | 斯洛伐克SpeechDat (E)数据库 | 细微差别 | 脚本化的演讲 | 斯洛伐克语 | 斯洛伐克 | 低背景噪音 | 1,000 | 1 | 48000年 | 可根据要求提供 | 8 | 可根据要求提供 | 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告 48个提示,包括数字,自然数字,字母串,个人,地点和业务名称,确认项目(是,否+模糊),通用的命令和控制项目,语音丰富的句子和单词 |
斯洛伐克(斯洛伐克)脚本电话 | |
86 | 音频 | 呼叫中心,虚拟助理 | 固定电话只 | 76小时 | 添加引用 | 斯洛文尼亚SpeechDat (II)身上- 1000 | 细微差别 | 脚本化的演讲 | 斯洛维尼亚语 | 斯洛文尼亚 | 低背景噪音(家庭/办公室) | 1,000 | 1 | 40,000 | 可根据要求提供 | 8 | 可根据要求提供 | 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告 每位演讲者大约需要40个提示,包括数字、自然数字、字母串、个人、地点和公司名称、确认项目(是、否+模糊)、通用的命令和控制项目以及语音丰富的句子和单词 |
斯洛文尼亚(斯洛文尼亚)电话 | |
87 | 音频 | ASR、会话人工智能、语音分析 | 移动电话和固定电话 | 50个小时 | 添加引用 | SOM_ASR001 | 阿彭环球 | 会话演讲 | 索马里 | 索马里 | 低背景噪音 | 1,000 | 2 | 可根据要求提供 | 23217年 | 8 | 当地法律 | 数据集已全部转录并打上时间戳 数据集配有包含所有转录词的发音词典 |
索马里语会话电话 | |
232 | 文本 | ASR, TTS,语言建模 | 不适用 | 76000个单词 | 添加引用 | som_SOM_PHON | 阿彭环球 | 发音字典 | 索马里 | 索马里 | 不适用 | 不适用 | 不适用 | 不适用 | 76000年 | 不适用 | 文本 | 索马里语发音词典 | ||
233 |