现成的数据集


我们的授权数据集来启动你的人工智能项目



图像

产品目录



虽然开放数据或公共数据集很方便,但我们提供了一个广泛的“现成的”目录,涵盖80种语言、多种方言的250多个可授权数据集,适用于各种常见的人工智能用例。我们很高兴地宣布30多个新的数据集,为我们的客户提供即时的价值。在我们的产品中,您可以找到语音识别数据集,机器学习算法的学习数据集,所有这些都是用最先进的可用数据科学创建的。




图像

速度



可立即支持您的AI/ML项目今天


图像

成本效益



授权数据集比自定义数据收集更经济


图像

专业知识



20年以上的数据收集经验


图像

支持所有数据类型



图像、视频、语音、音频和文本


图像

规模



提供正确数量的数据来有效地训练您的模型

图像

质量



提高AI模型的质量并最小化偏差






数据集名称 产品类型 常见用例 记录装置 单位
数据集名称 产品类型 常见用例 记录装置 单位
138
向下箭头 产品类型ots-text 阿尔巴尼亚语(阿尔巴尼亚)发音字典
文本 ASR, TTS,语言建模 不适用 12000个单词 添加引用 sqi_ALB_PHON 阿彭环球 发音字典 阿尔巴尼亚 阿尔巴尼亚 不适用 不适用 不适用 不适用 12000年 不适用 文本 阿尔巴尼亚语(阿尔巴尼亚)发音字典
139
向下箭头 产品类型ots-text 阿姆哈拉语(埃塞俄比亚)发音词典
文本 ASR, TTS,语言建模 不适用 45000个单词 添加引用 amh_ETH_PHON 阿彭环球 发音字典 阿姆哈拉语 埃塞俄比亚 不适用 不适用 不适用 不适用 45,000 不适用 文本 阿姆哈拉语(埃塞俄比亚)发音词典
144
向下箭头 产品类型ots-text 阿拉伯语(阿尔及利亚)发音词典
文本 ASR, TTS,语言建模 不适用 11000个单词 添加引用 ara_DZA_PHON 阿彭环球 发音字典 阿拉伯语 阿尔及利亚 不适用 不适用 不适用 不适用 11000年 不适用 文本 阿拉伯语(阿尔及利亚)发音词典
20.
向下箭头 产品类型ots-sound 阿拉伯语(阿尔及利亚东部)会话电话
音频 ASR、会话人工智能、语音分析 移动电话和固定电话 29个小时 添加引用 EAR_ASR001 阿彭环球 会话演讲 阿拉伯语 阿尔及利亚 低背景噪音(家庭/办公室) 496 2 可根据要求提供 11,327 8 当地法律 数据集已完全转录并加上时间戳
数据集配有包含所有转录词的发音词典
在大多数电话中,两位发言人(内联/外联)都被接话和录音,但在少数电话中,只有一半的通话被接话和录音
阿拉伯语(阿尔及利亚东部)会话电话
140
向下箭头 产品类型ots-text 阿拉伯语(埃及)发音词典
文本 ASR, TTS,语言建模 不适用 40000个单词 添加引用 ara_EGY_PHON 阿彭环球 发音字典 阿拉伯语 埃及 不适用 不适用 不适用 不适用 40,000 不适用 文本 阿拉伯语(埃及)发音词典
114
向下箭头 产品类型ots-sound 阿拉伯语(埃及)脚本智能手机
音频 ASR,虚拟助理,聊天机器人 移动电话 352小时 添加引用 ARE_ASR001_CN 中国的动作 脚本化的演讲 阿拉伯语 埃及 低背景噪音(家庭/办公室) 627 1 128908年 207576年 16 wav 数据集完全转录 阿拉伯语(埃及)脚本智能手机
142
向下箭头 产品类型ots-text 阿拉伯语(伊拉克)语音词典的一部分
文本 ASR, TTS,语言建模 不适用 13000个单词 添加引用 ara_IRQ_POS 阿彭环球 语音词典的一部分 阿拉伯语 伊拉克 不适用 不适用 不适用 不适用 13000年 不适用 文本 阿拉伯语(伊拉克)语音词典的一部分
141
向下箭头 产品类型ots-text 阿拉伯语(伊拉克)发音词典
文本 ASR, TTS,语言建模 不适用 15000个单词 添加引用 ara_IRQ_PHON 阿彭环球 发音字典 阿拉伯语 伊拉克 不适用 不适用 不适用 不适用 15,000 不适用 文本 人的名字 阿拉伯语(伊拉克)发音词典
143
向下箭头 产品类型ots-text 阿拉伯语(利比亚)发音词典
文本 ASR, TTS,语言建模 不适用 48000个单词 添加引用 阿拉比丰酒店 阿彭环球 发音字典 阿拉伯语 利比亚 不适用 不适用 不适用 不适用 48000年 不适用 文本 阿拉伯语(利比亚)发音词典
65
向下箭头 产品类型ots-sound 阿拉伯语(现代标准阿拉伯语)脚本麦克风
音频 ASR,虚拟助理,聊天机器人 麦克风 12个小时 添加引用 MSA_ASR001 全球电话 脚本化的演讲 阿拉伯语 突尼斯 低背景噪音(家庭/办公室) 78 1 4908年 可根据要求提供 16 wav 数据集是完全转录和转录是可用的原始脚本和罗马化形式
每个演讲者都会从网络上的全国性报纸文章中选择一些语音丰富的句子,以覆盖广泛的领域和大量的词汇
与卡尔斯鲁厄理工学院(KIT)合作开发
阿拉伯语(现代标准阿拉伯语)脚本麦克风
112
向下箭头 产品类型ots-sound 阿拉伯语(摩洛哥)会话电话
音频 ASR、会话人工智能、语音分析 移动电话和固定电话 33小时 添加引用 ARY_ASR001 阿彭环球 会话演讲 阿拉伯语 摩洛哥 低背景噪音 180 2 80,544 23836年 8 当地法律 每位演讲者参与1至4次对话。扬声器由一个独特的4位扬声器ID识别,该ID记录在人口统计文件中
抄本有原始脚本和完全可逆的罗马版本,并附有发音词典bob外围怎么样
有产品转录的英文翻译(ARY_MT001, ARY_ASRMT001)
阿拉伯语(摩洛哥)会话电话
113
向下箭头 产品类型ots-text 阿拉伯语(摩洛哥)会话电话翻译
文本 机器翻译,聊天机器人,会话人工智能 不适用 80544年的话语 添加引用 ARY_MT001 阿彭环球 对话翻译 阿拉伯语 摩洛哥 不适用 180 不适用 80430年 23844年 不适用 文本 相应的音频、转录、完全可逆的罗马化转录和发音词典数据可用(ARY_ASR001, ARY_ASRMT001) 阿拉伯语(摩洛哥)会话电话翻译
146
向下箭头 产品类型ots-text 阿拉伯语(摩洛哥)发音词典
文本 ASR, TTS,语言建模 不适用 六万字 添加引用 ara_MAR_PHON 阿彭环球 发音字典 阿拉伯语 摩洛哥 不适用 不适用 不适用 不适用 60,000 不适用 文本 阿拉伯语(摩洛哥)发音词典
147
向下箭头 产品类型ots-text 阿拉伯语(N/A)发音字典
文本 ASR, TTS,语言建模 不适用 40000个单词 添加引用 arb_N / A_PHON 阿彭环球 发音字典 阿拉伯语 不适用 不适用 不适用 不适用 不适用 40,000 不适用 文本 阿拉伯语(N/A)发音字典
115
向下箭头 产品类型ots-sound 阿拉伯语(沙特阿拉伯)脚本智能手机
音频 ASR,虚拟助理,聊天机器人 移动电话 322小时 添加引用 ARS_ASR001_CN 中国的动作 脚本化的演讲 阿拉伯语 沙特阿拉伯 低背景噪音(家庭/办公室) 227 1 104574年 156282年 16 wav 数据集完全转录 阿拉伯语(沙特阿拉伯)脚本智能手机
149
向下箭头 产品类型ots-text 阿拉伯语(苏丹语)发音词典
文本 ASR, TTS,语言建模 不适用 17000个单词 添加引用 ara_SDN_PHON 阿彭环球 发音字典 阿拉伯语 苏丹 不适用 不适用 不适用 不适用 17,000 不适用 文本 阿拉伯语(苏丹语)发音词典
148
向下箭头 产品类型ots-text 阿拉伯语(阿拉伯联合酋长国)发音词典
文本 ASR, TTS,语言建模 不适用 75000个单词 添加引用 ara_ARE_PHON 阿彭环球 发音字典 阿拉伯语 阿拉伯联合酋长国 不适用 不适用 不适用 不适用 75000年 不适用 文本 阿拉伯语(阿拉伯联合酋长国)发音词典
122
向下箭头 产品类型ots-sound 阿拉伯(阿拉伯联合酋长国)脚本智能手机
音频 ASR,虚拟助理,聊天机器人 移动电话 170小时 添加引用 ARU_ASR001_CN 中国的动作 脚本化的演讲 阿拉伯语 阿拉伯联合酋长国 低背景噪音(家庭/办公室) 133 1 42352年 85775年 16 wav 数据集完全转录 阿拉伯(阿拉伯联合酋长国)脚本智能手机
70
向下箭头 产品类型ots-sound 阿拉伯语(阿拉伯联合酋长国)脚本电话
音频 呼叫中心,虚拟助理 移动电话和固定电话 48小时 添加引用 阿拉伯联合酋长国MCA(现代阿拉伯口语) 细微差别 脚本化的演讲 阿拉伯语 阿拉伯联合酋长国 低背景噪音 880 1 43000年 可根据要求提供 8 当地法律 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告
每个发言者49个提示,包括数字,自然数字,字母串,个人,地点和业务名称,确认项目(是,不是+模糊),通用的命令和控制项目,语音丰富的句子和单词,自发项目的控制
阿拉伯语(阿拉伯联合酋长国)脚本电话
71
向下箭头 产品类型ots-sound 阿拉伯语(阿拉伯联合酋长国)脚本电话
音频 呼叫中心,虚拟助理 移动电话和固定电话 31小时 添加引用 阿拉伯联合酋长国东方电信(现代标准阿拉伯语) 细微差别 脚本化的演讲 阿拉伯语 阿拉伯联合酋长国 低背景噪音 500 1 24,500 可根据要求提供 8 当地法律 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告
每个发言者49个提示,包括数字,自然数字,字母串,个人,地点和业务名称,确认项目(是,不是+模糊),通用的命令和控制项目,语音丰富的句子和单词,自发项目的控制
阿拉伯语(阿拉伯联合酋长国)脚本电话
9
向下箭头 产品类型ots-sound 阿拉伯语(阿拉伯联合酋长国/沙特阿拉伯)脚本麦克风
音频 ASR,虚拟助理,聊天机器人 麦克风 86小时 添加引用 CGA_ASR001 阿彭环球 脚本化的演讲 阿拉伯语 阿拉伯联合酋长国;沙特阿拉伯 低背景噪音(家庭/办公室) 150 4 42000年 19245年 16 当地法律 在一个词的水平上完整的演讲文件的内容的转录
所有的声音事件都使用来自于SpeechDATmodel的约定进行了标记
所有的抄本都是完全元音化的
每个讲话者有280个提示,包括从15个集合中选出的30个人名(名和姓),10个独立的数字0-10,8位数字序列(随机生成),200个语音平衡的句子,30 x 10个单词的语音平衡的单词串
阿拉伯语(阿拉伯联合酋长国/沙特阿拉伯)脚本麦克风
130
向下箭头 产品类型ots-text 阿拉伯语新闻文本
文本 内容分类,搜索引擎 不适用 20774句 添加引用 ARB_NER001 阿彭环球 新闻尼珥 标准阿拉伯语 不适用 不适用 不适用 不适用 20774年 可根据要求提供 不适用 文本 阿拉伯语新闻文本
150
向下箭头 产品类型ots-text 阿萨姆(印度)发音词典
文本 ASR, TTS,语言建模 不适用 40000个单词 添加引用 asm_IND_PHON 阿彭环球 发音字典 阿萨姆人的 印度 不适用 不适用 不适用 不适用 40,000 不适用 文本 阿萨姆(印度)发音词典
124
向下箭头 产品类型ots-sound 婴儿哭泣的声音
音频 婴儿监视器,安全及其他消费者应用 移动电话 3个小时 添加引用 CRY_ASR001 中国的动作 人类的声音 不适用 中国 低背景噪音(家庭/办公室) One hundred. 1 NA NA 16 wav 0-3岁婴儿的哭声,每次持续约2分钟。 婴儿哭泣的声音
4
向下箭头 产品类型ots-sound 印尼语会话电话
音频 ASR、会话人工智能、语音分析 移动电话和固定电话 31小时 添加引用 BAH_ASR001 阿彭环球 会话演讲 印尼 印尼 低背景噪音 1002年 2 可根据要求提供 11480年 8 wav 数据集已完全转录并加上时间戳
数据集配有包含所有转录词的发音词典
在很大一部分电话中,只有一半的通话被收集和记录下来
印尼语会话电话
153
向下箭头 产品类型ots-text 巴斯克(西班牙)发音词典
文本 ASR, TTS,语言建模 不适用 10000个单词 添加引用 eus_ESP_PHON 阿彭环球 发音字典 巴斯克 西班牙 不适用 不适用 不适用 不适用 10,000 不适用 文本 巴斯克(西班牙)发音词典
6
向下箭头 产品类型ots-sound 孟加拉语(孟加拉国)会话式电话
音频 ASR、会话人工智能、语音分析 移动电话和固定电话 47个小时 添加引用 BEN_ASR001 阿彭环球 会话演讲 孟加拉语 孟加拉国 混合(车内、路边、家庭/办公室) 1,000 2 可根据要求提供 17922年 8 当地法律 数据集已完全转录并加上时间戳
数据集配有包含所有转录词的发音词典
孟加拉语(孟加拉国)会话式电话
154
向下箭头 产品类型ots-text 孟加拉语(印度)发音词典
文本 ASR, TTS,语言建模 不适用 29000字 添加引用 ben_IND_PHON 阿彭环球 发音字典 孟加拉语 印度 不适用 不适用 不适用 不适用 29000年 不适用 文本 孟加拉语(印度)发音词典
7
向下箭头 产品类型ots-sound 保加利亚会话式电话
音频 ASR、会话人工智能、语音分析 移动电话和固定电话 38小时 添加引用 BUL_ASR001 阿彭环球 会话演讲 保加利亚 保加利亚 低背景噪音(家庭/办公室) 217 2 可根据要求提供 22342年 8 当地法律 数据集已完全转录并加上时间戳
数据集配有包含所有转录词的发音词典
该项目记录了200个电话对话-100名演讲者向100个呼叫接收器分别拨打2个电话(1个来自固定电话,1个来自移动电话)
保加利亚会话式电话
155
向下箭头 产品类型ots-text 保加利亚语发音词典
文本 ASR, TTS,语言建模 不适用 55000个单词 添加引用 bul_BGR_PHON 阿彭环球 发音字典 保加利亚 保加利亚 不适用 不适用 不适用 不适用 55,000 不适用 文本 保加利亚语发音词典
111
向下箭头 产品类型ots-sound 保加利亚(保加利亚)脚本麦克风
音频 ASR,虚拟助理,聊天机器人 麦克风 22小时 添加引用 BUL_ASR002 全球电话 脚本化的演讲 保加利亚 保加利亚 低背景噪音(家庭/办公室) 77 1 8674年 可根据要求提供 16 wav 数据集是完全转录和转录是可用的原始脚本和罗马化形式
每个演讲者都会从网络上的全国性报纸文章中选择一些语音丰富的句子,以覆盖广泛的领域和大量的词汇
与卡尔斯鲁厄理工学院(KIT)合作开发
保加利亚(保加利亚)脚本麦克风
158
向下箭头 产品类型ots-text 粤语(中国)词性词典
文本 ASR, TTS,语言建模 不适用 10000个单词 添加引用 裕港邮政 阿彭环球 语音词典的一部分 广东话 中国 不适用 不适用 不适用 不适用 10,000 不适用 文本 传统的 粤语(中国)词性词典
156
向下箭头 产品类型ots-text 广东话(中国)发音词典
文本 ASR, TTS,语言建模 不适用 37000个单词 添加引用 yue_CHN_PHON 阿彭环球 发音字典 广东话 中国 不适用 不适用 不适用 不适用 37000年 不适用 文本 简化 广东话(中国)发音词典
157
向下箭头 产品类型ots-text 广东话(中国)发音词典
文本 ASR, TTS,语言建模 不适用 40000个单词 添加引用 yue_CHN_PHON 阿彭环球 发音字典 广东话 中国 不适用 不适用 不适用 不适用 40,000 不适用 文本 传统的 广东话(中国)发音词典
159
向下箭头 产品类型ots-text 加泰罗尼亚(西班牙)发音词典
文本 ASR, TTS,语言建模 不适用 10000个单词 添加引用 cat_ESP_PHON 阿彭环球 发音字典 加泰罗尼亚语的 西班牙 不适用 不适用 不适用 不适用 10,000 不适用 文本 加泰罗尼亚(西班牙)发音词典
160
向下箭头 产品类型ots-text Cebuano(菲律宾)发音词典
文本 ASR, TTS,语言建模 不适用 20000个单词 添加引用 ceb_PHL_PHON 阿彭环球 发音字典 宿务语 菲律宾 不适用 不适用 不适用 不适用 20,000 不适用 文本 Cebuano(菲律宾)发音词典
10
向下箭头 产品类型ots-sound 克罗地亚(克罗地亚)会话电话
音频 ASR、会话人工智能、语音分析 移动电话和固定电话 39个小时 添加引用 CRO_ASR001 阿彭环球 会话演讲 克罗地亚 克罗地亚 低背景噪音(家庭/办公室) 200 2 可根据要求提供 23919年 8 当地法律 数据集已完全转录并加上时间戳
数据集配有包含所有转录词的发音词典
该项目记录了200个电话对话-100名演讲者向100个呼叫接收器分别拨打2个电话(1个来自固定电话,1个来自移动电话)
克罗地亚(克罗地亚)会话电话
161
向下箭头 产品类型ots-text 克罗地亚语(克罗地亚)发音词典
文本 ASR, TTS,语言建模 不适用 20000个单词 添加引用 hrv_HRV_PHON 阿彭环球 发音字典 克罗地亚 克罗地亚 不适用 不适用 不适用 不适用 20,000 不适用 文本 克罗地亚语(克罗地亚)发音词典
11
向下箭头 产品类型ots-sound 克罗地亚(克罗地亚)脚本麦克风
音频 ASR,虚拟助理,聊天机器人 麦克风 11个小时 添加引用 CRO_ASR002 全球电话 脚本化的演讲 克罗地亚 克罗地亚 低背景噪音(家庭/办公室) 94 1 4499年 可根据要求提供 16 wav 数据集是完全转录和转录是可用的原始脚本和罗马化形式
每个演讲者都会从网络上的全国性报纸文章中选择一些语音丰富的句子,以覆盖广泛的领域和大量的词汇
与卡尔斯鲁厄理工学院(KIT)合作开发
克罗地亚(克罗地亚)脚本麦克风
116
向下箭头 产品类型ots-sound 克罗地亚(克罗地亚)脚本智能手机
音频 ASR,虚拟助理,聊天机器人 移动电话 263小时 添加引用 CRO_ASR003_CN 中国的动作 脚本化的演讲 克罗地亚 克罗地亚 低背景噪音(家庭/办公室) 243 1 73467年 136140年 16 wav 数据集完全转录 克罗地亚(克罗地亚)脚本智能手机
162
向下箭头 产品类型ots-text 捷克(捷克共和国)发音字典
文本 ASR, TTS,语言建模 不适用 50000个单词 添加引用 ces_CZE_PHON 阿彭环球 发音字典 捷克 捷克共和国 不适用 不适用 不适用 不适用 50000年 不适用 文本 捷克(捷克共和国)发音字典
12
向下箭头 产品类型ots-sound 捷克语(捷克共和国)脚本麦克风
音频 ASR,虚拟助理,聊天机器人 麦克风 31小时 添加引用 CZE_ASR001 全球电话 脚本化的演讲 捷克 捷克共和国 低背景噪音(家庭/办公室) 102 1 12425年 可根据要求提供 16 wav 数据集是完全转录和转录是可用的原始脚本和罗马化形式
每个演讲者都会从网络上的全国性报纸文章中选择一些语音丰富的句子,以覆盖广泛的领域和大量的词汇
与卡尔斯鲁厄理工学院(KIT)合作开发
捷克语(捷克共和国)脚本麦克风
13
向下箭头 产品类型ots-sound 捷克(捷克共和国)脚本电话
音频 呼叫中心,虚拟助理 固定电话只 93小时 添加引用 捷克SpeechDat (E)的数据集 细微差别 脚本化的演讲 捷克 捷克共和国 低背景噪音 1,000 1 52000年 可根据要求提供 8 当地法律 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告
52个提示,包括数字,自然数字,字母串,个人,地点和业务名称,确认项目(是,否+模糊),通用的命令和控制项目,语音丰富的单词和句子
捷克(捷克共和国)脚本电话
164
向下箭头 产品类型ots-text 丹麦语(丹麦语)语音词典的一部分
文本 ASR, TTS,语言建模 不适用 100000个单词 添加引用 dan_DNK_POS 阿彭环球 语音词典的一部分 丹麦 丹麦 不适用 不适用 不适用 不适用 100,000 不适用 文本 丹麦语(丹麦语)语音词典的一部分
163
向下箭头 产品类型ots-text 丹麦语(丹麦)发音词典
文本 ASR, TTS,语言建模 不适用 107000个单词 添加引用 丹昆 阿彭环球 发音字典 丹麦 丹麦 不适用 不适用 不适用 不适用 107000年 不适用 文本 丹麦语(丹麦)发音词典
90
向下箭头 产品类型ots-sound 丹麦(丹麦)脚本麦克风
音频 ASR,虚拟助理,聊天机器人 麦克风 53小时 添加引用 Speecon丹麦 细微差别 脚本化的演讲 丹麦 丹麦 混合(办公、娱乐、汽车、公共场所) 600人(550名成人及50名儿童) 4 170000年 可根据要求提供 16 当地法律 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告
每名成人和每名儿童分别有290个和210个提示,包括数字、自然数字、字母串、个人、地点和业务名称、成人使用的应用词汇、儿童使用的命令(玩具、电话和通用)、发音丰富的单词和句子,以及成人使用的自由和自发的反应
丹麦(丹麦)脚本麦克风
15
向下箭头 产品类型ots-sound 达里语(阿富汗)广播数据
音频 ASR,自动字幕,关键字识别 麦克风 51小时 添加引用 DAR_BRC001 阿彭环球 广播讲话 达里语 阿富汗 低背景噪音(演播室) 不适用 1 可根据要求提供 可根据要求提供 不适用 wav 数据集已完全转录并加上时间戳
数据集主要是语音,不包括音乐或广告
数据类型包括:脱口秀、访谈、新闻广播(不包括主持人阅读新闻)
达里语(阿富汗)广播数据
14
向下箭头 产品类型ots-sound 达里语(阿富汗)会话电话
音频 ASR、会话人工智能、语音分析 移动电话和固定电话 40小时 添加引用 DAR_ASR001 阿彭环球 会话演讲 达里语 阿富汗 低背景噪音 500 2 可根据要求提供 11168年 8 当地法律 数据集已完全转录并加上时间戳
数据集主要是语音,不包括音乐或广告
达里语(阿富汗)会话电话
165
向下箭头 产品类型ots-text 达里(阿富汗)发音词典
文本 ASR, TTS,语言建模 不适用 30000个单词 添加引用 prs_AFG_PHON 阿彭环球 发音字典 达里语 阿富汗 不适用 不适用 不适用 不适用 30,000 不适用 文本 达里(阿富汗)发音词典
166
向下箭头 产品类型ots-text Dholuo(肯尼亚)发音词典
文本 ASR, TTS,语言建模 不适用 20000个单词 添加引用 luo_KEN_PHON 阿彭环球 发音字典 Dholuo 肯尼亚 不适用 不适用 不适用 不适用 20,000 不适用 文本 Dholuo(肯尼亚)发音词典
91
向下箭头 产品类型ots-sound 荷兰(比利时)脚本麦克风
音频 ASR,虚拟助理,聊天机器人 麦克风 47个小时 添加引用 荷兰语,来自比利时 细微差别 脚本化的演讲 荷兰 比利时 混合(办公、娱乐、汽车、公共场所) 600人(550名成人及50名儿童) 4 170000年 可根据要求提供 16 当地法律 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告
每名成人和每名儿童分别有290个和210个提示,包括数字、自然数字、字母串、个人、地点和业务名称、成人使用的应用词汇、儿童使用的命令(玩具、电话和通用)、发音丰富的单词和句子,以及成人使用的自由和自发的反应
荷兰(比利时)脚本麦克风
33
向下箭头 产品类型ots-sound 荷兰(比利时)脚本电话
音频 呼叫中心,虚拟助理 麦克风 80小时 添加引用 佛兰芒语演讲 细微差别 脚本化的演讲 荷兰 比利时 低背景噪音 1,000 1 52000年 可根据要求提供 8 当地法律 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告
52个提示,包括数字,自然数字,字母串,个人,地点和业务名称,确认项目(是,不是+模糊),通用的命令和控制项目,语音丰富的句子和单词,自发项目的控制
荷兰(比利时)脚本电话
19
向下箭头 产品类型ots-sound 荷兰语(荷兰和比利时)编写在车内
音频 ASR,虚拟助理,汽车人机界面和娱乐 麦克风和手机 27小时 添加引用 荷兰语和佛兰德语的SpeechDat-Car 细微差别 脚本化的演讲 荷兰 荷兰;比利时 混合(车内) 302 5 15100年 可根据要求提供 16 - 8 当地法律 数据集完全转录,并伴有发音词典和验证报告
每位成人演讲者125个提示,包括数字、自然数字、字母串、个人、地点和公司名称(有些是自发的)、通用的命令和控制项目、语音丰富的单词和句子以及自发的讲话提示
荷兰语(荷兰和比利时)编写在车内
66
向下箭头 产品类型ots-sound 荷兰(荷兰)对话电话
音频 ASR、会话人工智能、语音分析 移动电话和固定电话 36个小时 添加引用 全国民主联盟ASR001 阿彭环球 会话演讲 荷兰 荷兰 低背景噪音 200 2 可根据要求提供 14964年 8 当地法律 数据集已完全转录并加上时间戳
数据集配有包含所有转录词的发音词典
该项目记录了200个电话对话-100名演讲者向100个呼叫接收器分别拨打2个电话(1个来自固定电话,1个来自移动电话)
荷兰(荷兰)对话电话
167
向下箭头 产品类型ots-text 荷兰语(荷兰)发音词典
文本 ASR, TTS,语言建模 不适用 45000个单词 添加引用 nld_NLD_PHON 阿彭环球 发音字典 荷兰 荷兰 不适用 不适用 不适用 不适用 45,000 不适用 文本 荷兰语(荷兰)发音词典
92
向下箭头 产品类型ots-sound 荷兰(荷兰)脚本麦克风
音频 ASR,虚拟助理,聊天机器人 麦克风 68小时 添加引用 荷兰语来自荷兰 细微差别 脚本化的演讲 荷兰 荷兰 混合(办公、娱乐、汽车、公共场所) 600人(550名成人及50名儿童) 4 170000年 可根据要求提供 16 当地法律 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告
每名成人和每名儿童分别有290个和210个提示,包括数字、自然数字、字母串、个人、地点和业务名称、成人使用的应用词汇、儿童使用的命令(玩具、电话和通用)、发音丰富的单词和句子,以及成人使用的自由和自发的反应
荷兰(荷兰)脚本麦克风
125
向下箭头 产品类型ots-image 东非面部图像
图像 面部识别 相机 13500张图片 添加引用 IMG_FACE_KEN_CN 中国的动作 人类的脸 不适用 肯尼亚 混合背景和照明条件 One hundred. NA NA NA NA jpg 东非面部图像
21
向下箭头 产品类型ots-sound 英语(阿拉伯语-黎凡特/埃及)会话电话
音频 ASR、会话人工智能、语音分析 移动电话和固定电话 28小时 添加引用 ENA_ASR001 阿彭环球 会话演讲 英语 埃及 低背景噪音 250 2 可根据要求提供 5,619 8 当地法律 数据集已完全转录并加上时间戳
数据集配有包含所有转录词的发音词典
平均通话时长:10-15分钟
英语(阿拉伯语-黎凡特/埃及)会话电话
169
向下箭头 产品类型ots-text 英语(澳大利亚)发音词典
文本 ASR, TTS,语言建模 不适用 157000个单词 添加引用 eng_AUS_PHON 阿彭环球 发音字典 英语 澳大利亚 不适用 不适用 不适用 不适用 157000年 不适用 文本 英语(澳大利亚)发音词典
2
向下箭头 产品类型ots-sound 英语(澳大利亚)脚本电话
音频 呼叫中心,虚拟助理 移动电话和固定电话 92小时 添加引用 AUS_ASR001 阿彭环球 脚本化的演讲 英语 澳大利亚 低背景噪音(家庭/办公室) 500 1 82500年 35137年 8 当地法律 完全转录到speech hdat类型约定
数据集配有包含所有转录词的发音词典
每个演讲者有162个提示(阅读演讲),包括数字,自然数字,字母串,个人,地点,公司名称,确认项目(是,否+模糊),通用的命令和控制项目(从215个),语音丰富的句子和单词
英语(澳大利亚)脚本电话
3.
向下箭头 产品类型ots-sound 英语(澳大利亚)脚本电话
音频 呼叫中心,虚拟助理 移动电话和固定电话 118小时 添加引用 AUS_ASR002 阿彭环球 脚本化的演讲 英语 澳大利亚 混合 1,000 1 75000年 19 8 当地法律 完全转录到speech hdat类型约定
数据集配有包含所有转录词的发音词典
每位演讲者有75个提示,包括数字,自然数字,字母串,个人,地点和公司名称,确认项目(是,否+模糊),通用的命令和控制项目,语音丰富的句子和单词
提示是"阅读"和"引出"的组合每个脚本有5个提示是"自发的言论自由"
英语(澳大利亚)脚本电话
171
向下箭头 产品类型ots-text 英语(加拿大)语音词典的一部分
文本 ASR, TTS,语言建模 不适用 3000个单词 添加引用 eng_CAN_POS 阿彭环球 语音词典的一部分 英语 加拿大 不适用 不适用 不适用 不适用 3,000 不适用 文本 英语(加拿大)语音词典的一部分
170
向下箭头 产品类型ots-text 英语(加拿大)发音词典
文本 ASR, TTS,语言建模 不适用 50000个单词 添加引用 eng_CAN_PHON 阿彭环球 发音字典 英语 加拿大 不适用 不适用 不适用 不适用 50000年 不适用 文本 英语(加拿大)发音词典
22
向下箭头 产品类型ots-sound 英语(加拿大)脚本电话
音频 呼叫中心,虚拟助理 移动电话和固定电话 144小时 添加引用 ENC_ASR001 阿彭环球 脚本化的演讲 英语 加拿大 混合 1,000 1 99000年 12483年 8 法律或wav 完全转录到SALA II/ speech hdat类型约定
数据集配有包含所有转录词的发音词典
每位演讲者提供99个提示,包括数字、自然数字、字母串、个人、地点和企业名称、确认项目(是、否+模糊)、通用的命令和控制项目、语音丰富的句子和单词
英语(加拿大)脚本电话
173
向下箭头 产品类型ots-text 英文(香港)发音字典
文本 ASR, TTS,语言建模 不适用 18000个单词 添加引用 eng_HKG_PHON 阿彭环球 发音字典 英语 香港 不适用 不适用 不适用 不适用 18000年 不适用 文本 英文(香港)发音字典
25
向下箭头 产品类型ots-sound 英语(印度)会话电话
音频 ASR、会话人工智能、语音分析 移动电话和固定电话 67小时 添加引用 ENI_ASR002 阿彭环球 会话演讲 英语 印度 低背景噪音 540 2 77565年 11646年 8 当地法律 数据集已完全转录并加上时间戳
数据集配有包含所有转录词的发音词典
271个电话对话被记录在这个项目中
英语(印度)会话电话
175
向下箭头 产品类型ots-text 英语(印度)语音词典的一部分
文本 ASR, TTS,语言建模 不适用 13000个单词 添加引用 eng_IND_POS 阿彭环球 语音词典的一部分 英语 印度 不适用 不适用 不适用 不适用 13000年 不适用 文本 英语(印度)语音词典的一部分
174
向下箭头 产品类型ots-text 英语(印度)发音词典
文本 ASR, TTS,语言建模 不适用 六万字 添加引用 eng_IND_PHON 阿彭环球 发音字典 英语 印度 不适用 不适用 不适用 不适用 60,000 不适用 文本 英语(印度)发音词典
24
向下箭头 产品类型ots-sound 英语(印度)脚本电话
音频 呼叫中心,虚拟助理 移动电话和固定电话 217小时 添加引用 ENI_ASR001 阿彭环球 脚本化的演讲 英语 印度 混合 2358年 1 117900年 9190年 8 当地法律 完全转录到speech hdat类型约定。
数据集附带一个包含所有转录词的发音词典[SAMPA]
每个演讲者有49个提示,包括数字,自然数字,字母串,个人,地点和公司名称,确认项目(是,否+模糊),通用的命令和控制项目,语音丰富的句子和单词
英语(印度)脚本电话
176
向下箭头 产品类型ots-text 英语(爱尔兰)发音词典
文本 ASR, TTS,语言建模 不适用 12000个单词 添加引用 英吉利丰 阿彭环球 发音字典 英语 爱尔兰 不适用 不适用 不适用 不适用 12000年 不适用 文本 英语(爱尔兰)发音词典
177
向下箭头 产品类型ots-text 英语(新西兰)发音字典
文本 ASR, TTS,语言建模 不适用 50000个单词 添加引用 eng_NZL_PHON 阿彭环球 发音字典 英语 新西兰 不适用 不适用 不适用 不适用 50000年 不适用 文本 英语(新西兰)发音字典
23
向下箭头 产品类型ots-sound 英语(菲律宾)会话电话
音频 ASR、会话人工智能、语音分析 移动电话和固定电话 53小时 添加引用 ENF_ASR001 阿彭环球 会话演讲 英语 菲律宾 低背景噪音 450 2 41,602 7,272 8 法律或wav 数据集已全部转录并打上时间戳
数据集配有包含所有转录词的发音词典
平均通话时长:10-15分钟
英语(菲律宾)会话电话
172
向下箭头 产品类型ots-text 英语(菲律宾)发音字典
文本 ASR, TTS,语言建模 不适用 5000个单词 添加引用 eng_PHL_PHON 阿彭环球 发音字典 英语 菲律宾 不适用 不适用 不适用 不适用 5,000 不适用 文本 英语(菲律宾)发音字典
168
向下箭头 产品类型ots-text 英语(阿拉伯联合酋长国)发音词典
文本 ASR, TTS,语言建模 不适用 5000个单词 添加引用 英格瑞丰 阿彭环球 发音字典 英语 阿拉伯联合酋长国 不适用 不适用 不适用 不适用 5,000 不适用 文本 英语(阿拉伯联合酋长国)发音词典
67
向下箭头 产品类型ots-sound 英语(阿拉伯联合酋长国)脚本电话
音频 呼叫中心,虚拟助理 移动电话和固定电话 33小时 添加引用 阿拉伯联合酋长国所说的东方英语 细微差别 脚本化的演讲 英语 阿拉伯联合酋长国 低背景噪音 500 1 25500年 可根据要求提供 8 当地法律 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告
每个说话人51个提示,包括数字、自然数、字母串、个人、地名和企业名称、确认项(是、否+模糊)、通用命令和控制项、语音丰富的句子和单词以及自动控制项
英语(阿拉伯联合酋长国)脚本电话
99
向下箭头 产品类型ots-sound 英语(英国)
音频 TTS 耳机麦克风 10个小时 添加引用 TC-STAR女性基线声音劳拉 细微差别 脚本化的演讲 英语 大不列颠联合王国 低背景噪音(演播室) 1 1 可根据要求提供 可根据要求提供 96 可根据要求提供 数据集包括手动正字法转录、自动音素分割、自动生成音高标记(其中一定百分比的音高段和音高标记已被手动检查)
数据集配有一个语音词典与POS,引理和音标
英语(英国)
One hundred.
向下箭头 产品类型ots-sound 英语(英国)
音频 TTS 耳机麦克风 10个小时 添加引用 TC-STAR男性基线声音Ian 细微差别 脚本化的演讲 英语 大不列颠联合王国 低背景噪音(演播室) 1 1 可根据要求提供 可根据要求提供 96 可根据要求提供 数据集包括手动正字法转录、自动音素分割、自动生成音高标记(其中一定百分比的音高段和音高标记已被手动检查)
数据集配有一个语音词典与POS,引理和音标
英语(英国)
259
向下箭头 产品类型ots-sound 英语(英国)会话电话
音频 ASR、会话人工智能、语音分析 移动电话和固定电话 50个小时 添加引用 UKE_ASR001B 阿彭环球 会话演讲 英语 大不列颠联合王国 低背景噪音 1,150 2 可根据要求提供 13192年 8 wav 数据集已完全转录并加上时间戳
数据集配有包含所有转录词的发音词典
英语(英国)会话电话
104
向下箭头 产品类型ots-sound 英语(英国)会话电话
音频 ASR、会话人工智能、语音分析 移动电话和固定电话 150小时 添加引用 UKE_ASR001 阿彭环球 会话演讲 英语 大不列颠联合王国 低背景噪音 1,150 2 298562年 24193年 8 wav 数据集已完全转录并加上时间戳
数据集配有包含所有转录词的发音词典
英语(英国)会话电话
179
向下箭头 产品类型ots-text 英语(英国)语音词典的一部分
文本 ASR, TTS,语言建模 不适用 155000个单词 添加引用 eng_GBR_POS 阿彭环球 语音词典的一部分 英语 大不列颠联合王国 不适用 不适用 不适用 不适用 155000年 不适用 文本 英语(英国)语音词典的一部分
178
向下箭头 产品类型ots-text 英语(联合王国)发音词典
文本 ASR, TTS,语言建模 不适用 195000个单词 添加引用 英格博丰酒店 阿彭环球 发音字典 英语 大不列颠联合王国 不适用 不适用 不适用 不适用 195000年 不适用 文本 英语(联合王国)发音词典
107
向下箭头 产品类型ots-sound 英语(美国)会话智能手机
音频 ASR、会话人工智能、语音分析 移动电话 1000小时 添加引用 USE_ASR003 阿彭环球 会话演讲 英语 美国 低背景噪音 2,000 1 500,000 52586年 16 wav 数据集已完全转录并加上时间戳
数据集配有包含所有转录词的发音词典
对话涵盖了各种各样的话题,包括:学习/专业/工作、家乡、生活安排、天气和季节、守时、电视节目/电影)
英语(美国)会话智能手机
181
向下箭头 产品类型ots-text 英语(美国)语音词典的一部分
文本 ASR, TTS,语言建模 不适用 263000个单词 添加引用 eng_USA_POS 阿彭环球 语音词典的一部分 英语 美国 不适用 不适用 不适用 不适用 263000年 不适用 文本 英语(美国)语音词典的一部分
180
向下箭头 产品类型ots-text 英语(美国)发音词典
文本 ASR, TTS,语言建模 不适用 330000个单词 添加引用 eng_USA_PHON 阿彭环球 发音字典 英语 美国 不适用 不适用 不适用 不适用 330,000 不适用 文本 英语(美国)发音词典
93
向下箭头 产品类型ots-sound 英语(美国)脚本话筒
音频 ASR,虚拟助理,聊天机器人 麦克风 53小时 添加引用 美国speech English数据库 细微差别 脚本化的演讲 英语 美国 混合(办公、娱乐、汽车、公共场所) 600人(550名成人及50名儿童) 4 170000年 可根据要求提供 16 可根据要求提供 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告
每名成人和每名儿童分别有290个和210个提示,包括数字、自然数字、字母串、个人、地点和业务名称、成人使用的应用词汇、儿童使用的命令(玩具、电话和通用)、发音丰富的单词和句子,以及成人使用的自由和自发的反应
英语(美国)脚本话筒
106
向下箭头 产品类型ots-sound 英语(美国)脚本话筒
音频 ASR,虚拟助理,聊天机器人 麦克风 62小时 添加引用 USE_ASR001 阿彭环球 脚本化的演讲 英语 美国 低背景噪音(演播室) 200 2 80000年 18318年 48 当地法律 数据集已完全转录并加上时间戳
数据集配有包含所有转录词的发音词典
每位演讲者要阅读400个提示,包括数字、自然数字、人名和城市名、电话号码、通用的指挥和控制项目、语音丰富的句子和单词
英语(美国)脚本话筒
131
向下箭头 产品类型ots-text 英语新闻文本
文本 内容分类,搜索引擎 不适用 22768句 添加引用 工程师NER001 阿彭环球 新闻尼珥 英语 不适用 不适用 不适用 不适用 22768年 可根据要求提供 不适用 文本 英语新闻文本
32
向下箭头 产品类型ots-sound 波斯语/波斯语(伊朗)会话电话
音频 ASR、会话人工智能、语音分析 移动电话和固定电话 30个小时 添加引用 FAR_ASR002 阿彭环球 会话演讲 伊朗波斯 伊朗 混合 1,000 2 可根据要求提供 12358年 8 wav 数据集已全部转录并打上时间戳
数据集配有包含所有转录词的发音词典
波斯语/波斯语(伊朗)会话电话
31
向下箭头 产品类型ots-sound 波斯语/波斯语(伊朗)脚本电话
音频 呼叫中心,虚拟助理 移动电话和固定电话 85小时 添加引用 FAR_ASR001 阿彭环球 脚本化的演讲 伊朗波斯 伊朗 混合 789 1 38400年 8716年 8 当地法律 完全转录到东方网类型约定
数据集附带一个包含所有转录词的发音词典[SAMPA]
48个提示,包括数字,自然数字,字母串,个人,地点和业务名称,确认项目(是,否+模糊),通用的命令和控制项目,语音丰富的句子和单词
波斯语/波斯语(伊朗)脚本电话
135
向下箭头 产品类型ots-text 波斯语/波斯语新闻文本
文本 内容分类,搜索引擎 不适用 19584句 添加引用 FAR_NER001 阿彭环球 新闻尼珥 伊朗波斯 伊朗 不适用 不适用 不适用 19584年 可根据要求提供 不适用 文本 波斯语/波斯语新闻文本
185
向下箭头 产品类型ots-text 芬兰语(芬兰)语音词典的一部分
文本 ASR, TTS,语言建模 不适用 10000个单词 添加引用 fin_FIN_POS 阿彭环球 语音词典的一部分 芬兰 芬兰 不适用 不适用 不适用 不适用 10,000 不适用 文本 芬兰语(芬兰)语音词典的一部分
128
向下箭头 产品类型ots-image 芬兰语(芬兰)印刷文本OCR
图像 文档处理,文档搜索 相机 7293张图片 添加引用 IMG_OCR_FIN_CN 中国的动作 文档OCR 芬兰 芬兰 混合照明条件 4 NA NA NA NA jpg 包含文本的图像,如广告牌/外包装/标识/杂志/菜单等。 芬兰语(芬兰)印刷文本OCR
184
向下箭头 产品类型ots-text 芬兰语发音词典
文本 ASR, TTS,语言建模 不适用 八万五千字 添加引用 芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬芬 阿彭环球 发音字典 芬兰 芬兰 不适用 不适用 不适用 不适用 85000年 不适用 文本 芬兰语发音词典
145
向下箭头 产品类型ots-text 法语(阿尔及利亚)发音词典
文本 ASR, TTS,语言建模 不适用 4000个单词 添加引用 fra_DZA_PHON 阿彭环球 发音字典 法国 阿尔及利亚 不适用 不适用 不适用 不适用 4,000 不适用 文本 阿拉伯语字母 法语(阿尔及利亚)发音词典
5
向下箭头 产品类型ots-sound 法语(比利时)脚本电话
音频 呼叫中心,虚拟助理 固定电话只 76小时 添加引用 比利时法语演讲(II)FDB-1000(固定1BF) 细微差别 脚本化的演讲 法国 比利时 低背景噪音 1,000 1 53000年 可根据要求提供 8 当地法律 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告
53个提示,包括数字,自然数字,字母串,个人,地点和业务名称,确认项目(是,不是+模糊),通用的命令和控制项目,语音丰富的句子和单词,自发项目的控制
法语(比利时)脚本电话
36
向下箭头 产品类型ots-sound 法语(加拿大)会话电话
音频 ASR、会话人工智能、语音分析 移动电话和固定电话 9小时 添加引用 FRC_ASR003 阿彭环球 会话演讲 法国 加拿大 混合 68 2 可根据要求提供 6022年 8 当地法律 数据集已全部转录并打上时间戳
数据集配有包含所有转录词的发音词典
平均通话时长:10-15分钟
在大多数电话中,只有一半的通话内容被接话并记录下来,但在少数电话中,两个通话者(在线/离线)都被接话并记录下来
法语(加拿大)会话电话
186
向下箭头 产品类型ots-text 法语(加拿大)发音词典
文本 ASR, TTS,语言建模 不适用 67000个单词 添加引用 fra_CAN_PHON 阿彭环球 发音字典 法国 加拿大 不适用 不适用 不适用 不适用 67000年 不适用 文本 法语(加拿大)发音词典
35
向下箭头 产品类型ots-sound 法语(加拿大)脚本麦克风
音频 ASR,虚拟助理,聊天机器人 麦克风 46小时 添加引用 FRC_ASR002 阿彭环球 脚本化的演讲 法国 加拿大 低背景噪音(家庭/办公室) 150 1 22,500 10755年 16 当地法律 数据集已完全转录并加上时间戳
数据集配有包含所有转录词的发音词典
每个演讲者有150个提示,包括数字,数字串(随机生成),地址和语音丰富的句子和单词
法语(加拿大)脚本麦克风
34
向下箭头 产品类型ots-sound 法语(加拿大)脚本电话
音频 呼叫中心,虚拟助理 移动电话 131小时 添加引用 FRC_ASR001 阿彭环球 脚本化的演讲 法国 加拿大 混合 1,000 1 100,000 11697年 8 当地法律 完全转录到speech hdat类型约定
数据集附带一个包含所有转录词的发音词典[SAMPA]
每位演讲者提供100个提示,包括数字、自然数字、字母串、个人、地点和企业名称、确认项目(是、否+模糊)、通用的命令和控制项目、语音丰富的句子和单词
法语(加拿大)脚本电话
40
向下箭头 产品类型ots-sound 法语(法国)会话式电话
音频 ASR、会话人工智能、语音分析 移动电话和固定电话 25小时 添加引用 FRF_ASR001 阿彭环球 会话演讲 法国 法国 低背景噪音 563 2 可根据要求提供 11922年 8 当地法律 数据集已全部转录并打上时间戳
数据集配有包含所有转录词的发音词典
在大多数电话中,两位发言人(内联/外联)都被接话和录音,但在少数电话中,只有一半的通话被接话和录音
法语(法国)会话式电话
39
向下箭头 产品类型ots-sound 法国(法国)车内
音频 ASR,虚拟助理,汽车人机界面和娱乐 麦克风和手机 添加引用 法语演讲车 细微差别 脚本化的演讲 法国 法国 混合(车内) 300 5 37,500 可根据要求提供 16 - 8 可根据要求提供 数据集完全转录,并伴有发音词典和验证报告
每个演讲者大约需要125个提示,包括数字、自然数字、字母串、个人、地点和公司名称(有些是自发的)、通用的命令和控制项目、语音丰富的单词和句子以及自发的讲话提示
法国(法国)车内
188
向下箭头 产品类型ots-text 法语(法国)语音词典的一部分
文本 ASR, TTS,语言建模 不适用 95000字 添加引用 fra_FRA_POS 阿彭环球 语音词典的一部分 法国 法国 不适用 不适用 不适用 不适用 95000年 不适用 文本 法语(法国)语音词典的一部分
187
向下箭头 产品类型ots-text 法语(法国)发音词典
文本 ASR, TTS,语言建模 不适用 112000个单词 添加引用 弗劳弗劳丰酒店 阿彭环球 发音字典 法国 法国 不适用 不适用 不适用 不适用 112000年 不适用 文本 法语(法国)发音词典
41
向下箭头 产品类型ots-sound 法国(法国)脚本麦克风
音频 ASR,虚拟助理,聊天机器人 麦克风 26小时 添加引用 FRF_ASR003 全球电话 脚本化的演讲 法国 法国 低背景噪音(家庭/办公室) 98 1 10273年 可根据要求提供 16 wav 数据集是完全转录和转录是可用的原始脚本和罗马化形式
每个演讲者都会从网络上的全国性报纸文章中选择一些语音丰富的句子,以覆盖广泛的领域和大量的词汇
与卡尔斯鲁厄理工学院(KIT)合作开发
法国(法国)脚本麦克风
37
向下箭头 产品类型ots-sound 法语(法国)脚本电话
音频 呼叫中心,虚拟助理 固定电话只 41小时 添加引用 法国SpeechDat (II)身上- 1000 细微差别 脚本化的演讲 法国 法国 低背景噪音(家庭/办公室) 1017年 1 48000年 可根据要求提供 8 可根据要求提供 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告
48个提示,包括数字,自然数字,字母串,个人,地点和业务名称,确认项目(是,否+模糊),通用的命令和控制项目,语音丰富的句子和单词
法语(法国)脚本电话
38
向下箭头 产品类型ots-sound 法语(法国)脚本电话
音频 呼叫中心,虚拟助理 固定电话只 305小时 添加引用 法国SpeechDat (II)身上- 5000 细微差别 脚本化的演讲 法国 法国 低背景噪音 5,040 1 237000年 可根据要求提供 8 可根据要求提供 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告
47个提示,包括数字,自然数字,字母串,个人,地点和业务名称,确认项目(是,否+模糊),通用的命令和控制项目,语音丰富的句子和单词
法语(法国)脚本电话
60
向下箭头 产品类型ots-sound 法国(卢森堡)电话
音频 呼叫中心,虚拟助理 固定电话只 45小时 添加引用 卢森堡法语演讲(II)FDB-500(固定1LF) 细微差别 脚本化的演讲 法国 卢森堡 低背景噪音 614 1 32000年 可根据要求提供 8 可根据要求提供 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告
53个提示,包括数字,自然数字,字母串,个人,地点和业务名称,确认项目(是,否+模糊),通用的命令和控制项目,语音丰富的句子和单词
法国(卢森堡)电话
189
向下箭头 产品类型ots-text 德语发音词典
文本 ASR, TTS,语言建模 不适用 146000字 添加引用 deu_DEU_PHON 阿彭环球 发音字典 德国 德国 不适用 不适用 不适用 不适用 146,000 不适用 文本 德语发音词典
16
向下箭头 产品类型ots-sound 德国(德国)脚本麦克风
音频 ASR,虚拟助理,聊天机器人 麦克风 16个小时 添加引用 DEU_ASR001 阿彭环球 脚本化的演讲 德国 德国 低背景噪音(演播室) 127 2 12700年 6826年 16 当地法律 数据集已完全转录并加上时间戳
数据集配有包含所有转录词的发音词典
每位演讲者要阅读100个提示,包括数字、自然数字、人名和城市名、电话号码、通用的指挥和控制项目、语音丰富的句子和单词
德国(德国)脚本麦克风
18
向下箭头 产品类型ots-sound 德国(德国)脚本麦克风
音频 ASR,虚拟助理,聊天机器人 麦克风 25小时 添加引用 DEU_ASR003 全球电话 脚本化的演讲 德国 德国 低背景噪音(家庭/办公室) 77 1 10,085 可根据要求提供 16 wav 数据集是完全转录和转录是可用的原始脚本和罗马化形式
每个演讲者都会从网络上的全国性报纸文章中选择一些语音丰富的句子,以覆盖广泛的领域和大量的词汇
与卡尔斯鲁厄理工学院(KIT)合作开发
德国(德国)脚本麦克风
42
向下箭头 产品类型ots-sound 德国(德国)电话
音频 呼叫中心,虚拟助理 固定电话只 31小时 添加引用 (二)FDB-1000 细微差别 脚本化的演讲 德国 德国 低背景噪音(家庭/办公室) 988 1 43000年 可根据要求提供 8 可根据要求提供 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告
44个提示,包括数字,自然数字,字母串,个人,地点和业务名称,确认项目(是,否+模糊),通用的命令和控制项目,语音丰富的句子和单词
德国(德国)电话
43
向下箭头 产品类型ots-sound 德国(德国)电话
音频 呼叫中心,虚拟助理 固定电话只 268小时 添加引用 德国SpeechDat (II)身上- 4000 细微差别 脚本化的演讲 德国 德国 低背景噪音(家庭/办公室) 4,000 1 160000年 可根据要求提供 8 可根据要求提供 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告
每个演讲者需要40个提示,包括数字,自然数字,字母串,个人,地点和公司名称,确认项目(是,否+模糊),通用的命令和控制项目,语音丰富的句子和单词
德国(德国)电话
61
向下箭头 产品类型ots-sound 德国(卢森堡)电话
音频 呼叫中心,虚拟助理 固定电话只 33小时 添加引用 卢森堡人的德语演讲 细微差别 脚本化的演讲 德国 卢森堡 低背景噪音 500 1 26500年 可根据要求提供 8 可根据要求提供 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告
53个提示,包括数字,自然数字,字母串,个人,地点和业务名称,确认项目(是,否+模糊),通用的命令和控制项目,语音丰富的句子和单词
德国(卢森堡)电话
190
向下箭头 产品类型ots-text 德语(瑞士)发音词典
文本 ASR, TTS,语言建模 不适用 15000个单词 添加引用 deu_CHE_PHON 阿彭环球 发音字典 德国 瑞士 不适用 不适用 不适用 不适用 15,000 不适用 文本 德语(瑞士)发音词典
94
向下箭头 产品类型ots-sound 德国(瑞士)脚本麦克风
音频 ASR,虚拟助理,聊天机器人 麦克风 53小时 添加引用 speech德语(瑞士)数据库 细微差别 脚本化的演讲 德国 瑞士 混合(办公、娱乐、汽车、公共场所) 600人(550名成人及50名儿童) 4 170000年 可根据要求提供 16 可根据要求提供 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告
每名成人和每名儿童分别有290个和210个提示,包括数字、自然数字、字母串、个人、地点和业务名称、成人使用的应用词汇、儿童使用的命令(玩具、电话和通用)、发音丰富的单词和句子,以及成人使用的自由和自发的反应
德国(瑞士)脚本麦克风
68
向下箭头 产品类型ots-sound 德国(土耳其)电话
音频 呼叫中心,虚拟助理 移动电话和固定电话 31小时 添加引用 东方人:土耳其人说德语 细微差别 脚本化的演讲 德国 火鸡 低背景噪音 300 1 15600年 可根据要求提供 8 可根据要求提供 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告
52个提示,包括数字,自然数字,字母串,个人,地点和业务名称,确认项目(是,否+模糊),通用的命令和控制项目,语音丰富的句子和单词
德国(土耳其)电话
191
向下箭头 产品类型ots-text 希腊(希腊)发音词典
文本 ASR, TTS,语言建模 不适用 5000个单词 添加引用 ell_GRC_PHON 阿彭环球 发音字典 希腊人 希腊 不适用 不适用 不适用 不适用 5,000 不适用 文本 希腊(希腊)发音词典
118
向下箭头 产品类型ots-sound 希腊(希腊)脚本智能手机
音频 ASR,虚拟助理,聊天机器人 移动电话 191小时 添加引用 GRE_ASR001_CN 中国的动作 脚本化的演讲 希腊人 希腊 低背景噪音(家庭/办公室) 287 1 54113年 68271年 16 wav 数据集完全转录 希腊(希腊)脚本智能手机
192
向下箭头 产品类型ots-text 瓜拉尼(巴拉圭)发音词典
文本 ASR, TTS,语言建模 不适用 35000个单词 添加引用 grn_PRY_PHON 阿彭环球 发音字典 瓜拉尼 巴拉圭 不适用 不适用 不适用 不适用 35000年 不适用 文本 瓜拉尼(巴拉圭)发音词典
194
向下箭头 产品类型ots-text 海地克里奥尔语(海地)发音词典
文本 ASR, TTS,语言建模 不适用 15000个单词 添加引用 hat_HTI_PHON 阿彭环球 发音字典 海地克里奥尔语 海地 不适用 不适用 不适用 不适用 15,000 不适用 文本 海地克里奥尔语(海地)发音词典
45
向下箭头 产品类型ots-sound 豪萨(尼日利亚)会话式电话
音频 ASR、会话人工智能、语音分析 移动电话 33小时 添加引用 HAU_ASR002 阿彭环球 会话演讲 豪萨语 尼日利亚 低背景噪音 200 2 可根据要求提供 7,949 8 当地法律 数据集已完全转录并加上时间戳
数据集配有包含所有转录词的发音词典
该项目记录了200个电话对话-100名演讲者向100个呼叫接收器分别拨打2个电话(1个来自固定电话,1个来自移动电话)
豪萨(尼日利亚)会话式电话
195
向下箭头 产品类型ots-text 豪萨(尼日利亚)发音词典
文本 ASR, TTS,语言建模 不适用 11000个单词 添加引用 hau_NGA_PHON 阿彭环球 发音字典 豪萨语 尼日利亚 不适用 不适用 不适用 不适用 11000年 不适用 文本 豪萨(尼日利亚)发音词典
44
向下箭头 产品类型ots-sound 豪萨脚本话筒
音频 ASR,虚拟助理,聊天机器人 麦克风 20小时 添加引用 HAU_ASR001 全球电话 脚本化的演讲 豪萨语 多个 低背景噪音(家庭/办公室) 103 1 7895年 可根据要求提供 16 wav 数据集是完全转录和转录是可用的原始脚本和罗马化形式
每个演讲者都会从网络上的全国性报纸文章中选择一些语音丰富的句子,以覆盖广泛的领域和大量的词汇
与卡尔斯鲁厄理工学院(KIT)合作开发
豪萨脚本话筒
46
向下箭头 产品类型ots-sound 希伯来语(以色列)会话电话
音频 ASR、会话人工智能、语音分析 移动电话和固定电话 34个小时 添加引用 HEB_ASR001 阿彭环球 会话演讲 希伯来语 以色列 低背景噪音 200 2 可根据要求提供 19250年 8 法律或wav 数据集已完全转录并加上时间戳
数据集配有包含所有转录词的发音词典
该项目记录了200个电话对话-100名演讲者向100个呼叫接收器分别拨打2个电话(1个来自固定电话,1个来自移动电话)
希伯来语(以色列)会话电话
196
向下箭头 产品类型ots-text 希伯来语(以色列)发音词典
文本 ASR, TTS,语言建模 不适用 31000字 添加引用 heb_ISR_PHON 阿彭环球 发音字典 希伯来语 以色列 不适用 不适用 不适用 不适用 31000年 不适用 文本 希伯来语(以色列)发音词典
48
向下箭头 产品类型ots-sound 印地语(印度)会话式电话
音频 ASR、会话人工智能、语音分析 移动电话和固定电话 32小时 添加引用 HIN_ASR002 阿彭环球 会话演讲 北印度语 印度 混合 996 2 可根据要求提供 12266年 8 wav 数据集已完全转录并加上时间戳
数据集配有包含所有转录词的发音词典
在大多数电话中,两位发言人(内联/外联)都被接话和录音,但在少数电话中,只有一半的通话被接话和录音
印地语(印度)会话式电话
197
向下箭头 产品类型ots-text 印地语(印度)发音字典
文本 ASR, TTS,语言建模 不适用 35000个单词 添加引用 hin_IND_PHON 阿彭环球 发音字典 北印度语 印度 不适用 不适用 不适用 不适用 35000年 不适用 文本 印地语(印度)发音字典
47
向下箭头 产品类型ots-sound 印地语(印度)脚本电话
音频 呼叫中心,虚拟助理 移动电话 224小时 添加引用 HIN_ASR001 阿彭环球 脚本化的演讲 北印度语 印度 低背景噪音 1920年 1 96000年 9853年 8 当地法律 完全转录到speech hdat类型约定
数据集附带一个包含所有转录词的发音词典[SAMPA]
每个发言者50次提示,包括数字、自然数字、个人、企业和地名、网址、确认项目(是、否+模糊)、通用命令和控制项目、语音丰富的句子和单词
印地语(印度)脚本电话
129
向下箭头 产品类型ots-video 人体运动
视频 健身应用,动作分类,手势识别 移动电话 2000个视频 添加引用 VED_HUMAN_BODY_CN 中国的动作 人体 不适用 中国 混合背景和照明条件 1000 NA NA NA NA mp4 视频剪辑大约有10-20秒长 人体运动
198
向下箭头 产品类型ots-text 匈牙利语(匈牙利)发音字典
文本 ASR, TTS,语言建模 不适用 500字 添加引用 洪峰洪峰 阿彭环球 发音字典 匈牙利 匈牙利 不适用 不适用 不适用 不适用 500 不适用 文本 匈牙利语(匈牙利)发音字典
119
向下箭头 产品类型ots-sound 匈牙利(匈牙利)脚本智能手机
音频 ASR,虚拟助理,聊天机器人 移动电话 286小时 添加引用 匈牙利ASR001中国 中国的动作 脚本化的演讲 匈牙利 匈牙利 低背景噪音(家庭/办公室) 254 1 94031年 201921年 16 wav 数据集完全转录 匈牙利(匈牙利)脚本智能手机
49
向下箭头 产品类型ots-sound 匈牙利(匈牙利)脚本电话
音频 呼叫中心,虚拟助理 固定电话只 65小时 添加引用 匈牙利SpeechDat (E) 细微差别 脚本化的演讲 匈牙利 匈牙利 低背景噪音 1,000 1 48000年 可根据要求提供 8 可根据要求提供 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告
48个提示,包括数字,自然数字,字母串,个人,地点和业务名称,确认项目(是,否+模糊),通用的命令和控制项目,语音丰富的句子和单词
匈牙利(匈牙利)脚本电话
199
向下箭头 产品类型ots-text 伊博语(尼日利亚)发音词典
文本 ASR, TTS,语言建模 不适用 30000个单词 添加引用 ibo_NGA_PHON 阿彭环球 发音字典 伊博人 尼日利亚 不适用 不适用 不适用 不适用 30,000 不适用 文本 伊博语(尼日利亚)发音词典
152
向下箭头 产品类型ots-text 印度尼西亚语(印度尼西亚语)是语言词典的一部分
文本 ASR, TTS,语言建模 不适用 10000个单词 添加引用 ind_IDN_POS 阿彭环球 语音词典的一部分 印尼 印尼 不适用 不适用 不适用 不适用 10,000 不适用 文本 印度尼西亚语(印度尼西亚语)是语言词典的一部分
151
向下箭头 产品类型ots-text 印度尼西亚发音词典
文本 ASR, TTS,语言建模 不适用 95000字 添加引用 ind_IDN_PHON 阿彭环球 发音字典 印尼 印尼 不适用 不适用 不适用 不适用 95000年 不适用 文本 印度尼西亚发音词典
183
向下箭头 产品类型ots-text 伊朗语波斯语(伊朗)语言词典的一部分
文本 ASR, TTS,语言建模 不适用 140万字 添加引用 pes_IRN_POS 阿彭环球 语音词典的一部分 伊朗波斯 伊朗 不适用 不适用 不适用 不适用 1400000年 不适用 文本 伊朗语波斯语(伊朗)语言词典的一部分
182
向下箭头 产品类型ots-text 伊朗波斯语(伊朗)发音词典
文本 ASR, TTS,语言建模 不适用 80000个单词 添加引用 pes_IRN_PHON 阿彭环球 发音字典 伊朗波斯 伊朗 不适用 不适用 不适用 不适用 80000年 不适用 文本 伊朗波斯语(伊朗)发音词典
52
向下箭头 产品类型ots-sound 意大利(意大利)会话电话
音频 ASR、会话人工智能、语音分析 移动电话和固定电话 36个小时 添加引用 ITA_ASR003 阿彭环球 会话演讲 意大利 意大利 低背景噪音 200 2 可根据要求提供 18974年 8 当地法律 数据集已完全转录并加上时间戳
数据集配有包含所有转录词的发音词典
该项目记录了200个电话对话-100名演讲者向100个呼叫接收器分别拨打2个电话(1个来自固定电话,1个来自移动电话)
意大利(意大利)会话电话
201
向下箭头 产品类型ots-text 意大利语(意大利)语音词典的一部分
文本 ASR, TTS,语言建模 不适用 147000个单词 添加引用 ita_ITA_POS 阿彭环球 语音词典的一部分 意大利 意大利 不适用 不适用 不适用 不适用 147000年 不适用 文本 意大利语(意大利)语音词典的一部分
200
向下箭头 产品类型ots-text 意大利语(意大利)发音词典
文本 ASR, TTS,语言建模 不适用 197000个单词 添加引用 ita_ITA_PHON 阿彭环球 发音字典 意大利 意大利 不适用 不适用 不适用 不适用 197000年 不适用 文本 意大利语(意大利)发音词典
50
向下箭头 产品类型ots-sound 意大利(意大利)脚本麦克风
音频 ASR,虚拟助理,聊天机器人 麦克风 44小时 添加引用 ITA_ASR001 阿彭环球 脚本化的演讲 意大利 意大利 混合 200 4 40,000 7316年 22 当地法律 完全转录到speech hdat类型约定
数据集配有包含所有转录词的发音词典
每个演讲者有200个提示,包括100个命令和控制类型项目和100个语音丰富的句子
意大利(意大利)脚本麦克风
51
向下箭头 产品类型ots-sound 意大利(意大利)脚本麦克风
音频 ASR,虚拟助理,汽车人机界面和娱乐 麦克风 47个小时 添加引用 ITA_ASR002 阿彭环球 脚本化的演讲 意大利 意大利 混合(车内) 103 4 35875年 10366年 48 当地法律 完全转录到speech hdat类型约定
数据集配有包含所有转录词的发音词典
每个演讲者有350个提示,包括数字,街道名称,通用的指挥和控制项目,语音丰富的句子和单词
每个演讲者录制了一到两段录音,包括第一次录音是在一辆停着的汽车里,发动机还在运转;第二次录音是在一辆以60英里/小时(100公里/小时)的速度行驶的汽车里。
意大利(意大利)脚本麦克风
53
向下箭头 产品类型ots-sound 意大利(意大利)脚本麦克风
音频 TTS 麦克风 3个小时 添加引用 ITA_TTS001 阿彭环球 脚本化的演讲 意大利 意大利 低背景噪音(演播室) 1 1 3300年 可根据要求提供 22 当地法律 数据集附带一个发音词汇表,其中包含数据集中说出的所有单词
每个演讲者有3300个提示,包括语音丰富的句子
意大利(意大利)脚本麦克风
54
向下箭头 产品类型ots-sound 意大利(意大利)电话
音频 呼叫中心,虚拟助理 固定电话只 38小时 添加引用 意大利固定网络语音 细微差别 脚本化的演讲 意大利 意大利 低背景噪音(家庭/办公室) 1,000 1 39000年 可根据要求提供 8 可根据要求提供 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告
每个人39个提示,包括独立和连接的数字,自然数,金额,拼写单词,时间和日期短语,是/不是问题,城市名称,常见的应用单词,短语中的应用单词和语音丰富的句子
意大利(意大利)电话
55
向下箭头 产品类型ots-sound 意大利(意大利)电话
音频 呼叫中心,虚拟助理 固定电话只 228小时 添加引用 意大利SpeechDat (II)身上- 3000 细微差别 脚本化的演讲 意大利 意大利 低背景噪音(家庭/办公室) 3,040 1 134000年 可根据要求提供 8 可根据要求提供 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告
44个提示,包括数字,自然数字,字母串,个人,地点和业务名称,确认项目(是,否+模糊),通用的命令和控制项目,语音丰富的句子和单词
意大利(意大利)电话
56
向下箭头 产品类型ots-sound 意大利(意大利)电话
音频 呼叫中心,虚拟助理 移动电话 103小时 添加引用 意大利语演讲(二)MDB-250 细微差别 脚本化的演讲 意大利 意大利 低背景噪音(家庭/办公室) 375 1 19,000 可根据要求提供 8 可根据要求提供 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告
51个提示,包括数字,自然数字,字母串,个人,地点和业务名称,确认项目(是,否+模糊),通用的命令和控制项目,语音丰富的句子和单词
意大利(意大利)电话
89
向下箭头 产品类型ots-sound 意大利(意大利)电话
音频 呼叫中心,虚拟助理 移动电话 13个小时 添加引用 意大利移动网络语音数据库 细微差别 脚本化的演讲 意大利 意大利 低背景噪音(家庭/办公室) 342 1 13500年 可根据要求提供 8 可根据要求提供 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告
每个演讲者需要40个提示,包括数字,自然数字,字母串,个人,地点和公司名称,确认项目(是,否+模糊),通用的命令和控制项目,语音丰富的句子和单词
意大利(意大利)电话
203
向下箭头 产品类型ots-text 日语(日语)语音词典的一部分
文本 ASR, TTS,语言建模 不适用 265000字 添加引用 jpn_jpn_POS 阿彭环球 语音词典的一部分 日本 日本 不适用 不适用 不适用 不适用 265000年 不适用 文本 日语(日语)语音词典的一部分
202
向下箭头 产品类型ots-text 日语(日本)发音词典
文本 ASR, TTS,语言建模 不适用 262000个单词 添加引用 jpn_jpn_PHON 阿彭环球 发音字典 日本 日本 不适用 不适用 不适用 不适用 262000年 不适用 文本 日语(日本)发音词典
57
向下箭头 产品类型ots-sound 日语(日本)脚本麦克风
音频 ASR,虚拟助理,聊天机器人 麦克风 33小时 添加引用 JPN_ASR001 全球电话 脚本化的演讲 日本 日本 低背景噪音(家庭/办公室) 144 1 13067年 可根据要求提供 16 wav 数据集是完全转录和转录是可用的原始脚本和罗马化形式
每个演讲者都会从网络上的全国性报纸文章中选择一些语音丰富的句子,以覆盖广泛的领域和大量的词汇
与卡尔斯鲁厄理工学院(KIT)合作开发
日语(日本)脚本麦克风
95
向下箭头 产品类型ots-sound 日语(日本)脚本麦克风
音频 ASR,虚拟助理,聊天机器人 麦克风 57小时 添加引用 Speecon日本 细微差别 脚本化的演讲 日本 日本 混合(办公、娱乐、汽车、公共场所) 600人(550名成人及50名儿童) 4 170000年 可根据要求提供 16 可根据要求提供 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告
每名成人和每名儿童分别有290个和210个提示,包括数字、自然数字、字母串、个人、地点和业务名称、成人使用的应用词汇、儿童使用的命令(玩具、电话和通用)、发音丰富的单词和句子,以及成人使用的自由和自发的反应
日语(日本)脚本麦克风
136
向下箭头 产品类型ots-text 日本东北新闻社
文本 内容分类,搜索引擎 不适用 20629句 添加引用 JPY_NER001 阿彭环球 新闻尼珥 日本 日本 不适用 不适用 不适用 20629年 可根据要求提供 不适用 文本 日本东北新闻社
204
向下箭头 产品类型ots-text 爪哇语(印度尼西亚)发音字典
文本 ASR, TTS,语言建模 不适用 20000个单词 添加引用 jav_IDN_PHON 阿彭环球 发音字典 爪哇人 印尼 不适用 不适用 不适用 不适用 20,000 不适用 文本 爪哇语(印度尼西亚)发音字典
58
向下箭头 产品类型ots-sound 卡纳达(印度)对话电话
音频 ASR、会话人工智能、语音分析 移动电话和固定电话 15个小时 添加引用 KAN_ASR001 阿彭环球 会话演讲 埃纳德语 印度 混合 178 2 可根据要求提供 15660年 8 当地法律 数据集已完全转录并加上时间戳
数据集配有包含所有转录词的发音词典
卡纳达(印度)对话电话
109
向下箭头 产品类型ots-sound 卡纳达(印度)对话电话
音频 ASR、会话人工智能、语音分析 移动电话和固定电话 57小时 添加引用 KAN_ASR001A 阿彭环球 会话演讲 埃纳德语 印度 混合 1,000 2 可根据要求提供 15660年 8 当地法律 大约25%的数据集会话被转录,并有时间戳——完整的记录可以提供
数据库是伴随着一个发音词典,包含所有转录词
卡纳达(印度)对话电话
205
向下箭头 产品类型ots-text 卡纳达(印度)发音词典
文本 ASR, TTS,语言建模 不适用 35000个单词 添加引用 kan_IND_PHON 阿彭环球 发音字典 埃纳德语 印度 不适用 不适用 不适用 不适用 35000年 不适用 文本 卡纳达(印度)发音词典
206
向下箭头 产品类型ots-text 哈萨克(哈萨克斯坦)发音词典
文本 ASR, TTS,语言建模 不适用 30000个单词 添加引用 kaz_KAZ_PHON 阿彭环球 发音字典 哈萨克斯坦 哈萨克斯坦 不适用 不适用 不适用 不适用 30,000 不适用 文本 哈萨克(哈萨克斯坦)发音词典
123
向下箭头 产品类型ots-sound 高棉(柬埔寨)脚本智能手机
音频 ASR,虚拟助理,聊天机器人 移动电话 90小时 添加引用 KHM_ASR001_中国 中国的动作 脚本化的演讲 高棉语 柬埔寨 低背景噪音(家庭/办公室) 94 1 24618年 52157年 16 wav 数据集完全转录 高棉(柬埔寨)脚本智能手机
208
向下箭头 产品类型ots-text 韩语(韩国)词性词典
文本 ASR, TTS,语言建模 不适用 100000个单词 添加引用 kor_KOR_POS 阿彭环球 语音词典的一部分 朝鲜文 韩国 不适用 不适用 不适用 不适用 100,000 不适用 文本 韩语(韩国)词性词典
207
向下箭头 产品类型ots-text 韩语(韩国)发音词典
文本 ASR, TTS,语言建模 不适用 100000个单词 添加引用 kor_KOR_PHON 阿彭环球 发音字典 朝鲜文 韩国 不适用 不适用 不适用 不适用 100,000 不适用 文本 韩语(韩国)发音词典
59
向下箭头 产品类型ots-sound 韩国(韩国)脚本麦克风
音频 ASR,虚拟助理,聊天机器人 麦克风 20小时 添加引用 KOR_ASR001 全球电话 脚本化的演讲 朝鲜文 韩国 低背景噪音(家庭/办公室) One hundred. 1 8107年 可根据要求提供 16 wav 数据集是完全转录和转录是可用的原始脚本和罗马化形式
每个演讲者都会从网络上的全国性报纸文章中选择一些语音丰富的句子,以覆盖广泛的领域和大量的词汇
与卡尔斯鲁厄理工学院(KIT)合作开发
韩国(韩国)脚本麦克风
132
向下箭头 产品类型ots-text 韩国NER新闻文本
文本 内容分类,搜索引擎 不适用 25830句 添加引用 科鲁内尔001 阿彭环球 新闻尼珥 朝鲜文 韩国 不适用 不适用 不适用 25830年 可根据要求提供 不适用 文本 韩国NER新闻文本
209
向下箭头 产品类型ots-text Kurmanji(土耳其)发音词典
文本 ASR, TTS,语言建模 不适用 六万字 添加引用 kur_TUR_PHON 阿彭环球 发音字典 Kurmanji 火鸡 不适用 不适用 不适用 不适用 60,000 不适用 文本 Kurmanji(土耳其)发音词典
210
向下箭头 产品类型ots-text 老挝语发音词典
文本 ASR, TTS,语言建模 不适用 9000个单词 添加引用 lao_LAO_PHON 阿彭环球 发音字典 老挝 老挝 不适用 不适用 不适用 不适用 9000年 不适用 文本 老挝语发音词典
211
向下箭头 产品类型ots-text 立陶宛语发音词典
文本 ASR, TTS,语言建模 不适用 六万字 添加引用 lit_LTU_PHON 阿彭环球 发音字典 立陶宛 立陶宛 不适用 不适用 不适用 不适用 60,000 不适用 文本 立陶宛语发音词典
212
向下箭头 产品类型ots-text 马来语(印度)发音词典
文本 ASR, TTS,语言建模 不适用 4000个单词 添加引用 mal_IND_PHON 阿彭环球 发音字典 马拉雅拉姆语 印度 不适用 不适用 不适用 不适用 4,000 不适用 文本 马来语(印度)发音词典
213
向下箭头 产品类型ots-text 马来西亚(马来西亚)发音字典
文本 ASR, TTS,语言建模 不适用 10000个单词 添加引用 msa_MYS_PHON 阿彭环球 发音字典 马来西亚 马来西亚 不适用 不适用 不适用 不适用 10,000 不适用 文本 马来西亚(马来西亚)发音字典
214
向下箭头 产品类型ots-text 普通话(简体)(中国)发音词典
文本 ASR, TTS,语言建模 不适用 35000个单词 添加引用 zho_CHN_PHON 阿彭环球 发音字典 中文(简体) 中国 不适用 不适用 不适用 不适用 35000年 不适用 文本 普通话(简体)(中国)发音词典
215
向下箭头 产品类型ots-text 普通话(传统)(台湾)发音词典
文本 ASR, TTS,语言建模 不适用 50000个单词 添加引用 zho_TWN_PHON 阿彭环球 发音字典 中文(繁体) 台湾 不适用 不适用 不适用 不适用 50000年 不适用 文本 普通话(传统)(台湾)发音词典
63
向下箭头 产品类型ots-sound 普通话(中国)脚本话筒
音频 ASR,虚拟助理,聊天机器人 麦克风 26小时 添加引用 MAC_ASR002 全球电话 脚本化的演讲 普通话 中国 低背景噪音(家庭/办公室) 132 1 10225年 可根据要求提供 16 wav 数据集是完全转录和转录是可用的原始脚本和罗马化形式
每个演讲者都会从网络上的全国性报纸文章中选择一些语音丰富的句子,以覆盖广泛的领域和大量的词汇
与卡尔斯鲁厄理工学院(KIT)合作开发
普通话(中国)脚本话筒
62
向下箭头 产品类型ots-sound 普通话(中国)脚本电话
音频 呼叫中心,虚拟助理 移动电话和固定电话 323小时 添加引用 MAC_ASR001 阿彭环球 脚本化的演讲 普通话 中国 混合 2,000 1 200,000 7145年 8 当地法律 完全转录到speech hdat类型约定
数据集附带一个包含所有转录词的发音词典[SAMPA]
98个提示,包括数字,自然数字,字母串,个人,地点和业务名称,确认项目(是,否+模糊),通用的命令和控制项目(从215个),语音丰富的句子和单词
普通话(中国)脚本电话
134
向下箭头 产品类型ots-text 中国话
文本 内容分类,搜索引擎 不适用 17313句 添加引用 MAC_NER001 阿彭环球 新闻尼珥 普通话 中国 不适用 不适用 不适用 17313年 可根据要求提供 不适用 文本 中国话
64
向下箭头 产品类型ots-sound 马拉地语(印度)会话电话
音频 ASR、会话人工智能、语音分析 移动电话和固定电话 15个小时 添加引用 MAR_ASR001 阿彭环球 会话演讲 马拉地语 印度 混合 180 2 可根据要求提供 11908年 8 当地法律 大约29%的数据集会话被转录,并带有时间戳——完整的记录可以提供
数据集配有包含所有转录词的发音词典
马拉地语(印度)会话电话
110
向下箭头 产品类型ots-sound 马拉地语(印度)会话电话
音频 ASR、会话人工智能、语音分析 移动电话和固定电话 52小时 添加引用 MAR_ASR001A 阿彭环球 会话演讲 马拉地语 印度 混合 1,000 2 可根据要求提供 11908年 8 当地法律 数据集会话的一部分被转录并带有时间戳——完整的记录可以提供
数据集配有包含所有转录词的发音词典
马拉地语(印度)会话电话
216
向下箭头 产品类型ots-text 马拉地语(印度)发音词典
文本 ASR, TTS,语言建模 不适用 30000个单词 添加引用 mar_IND_PHON 阿彭环球 发音字典 马拉地语 印度 不适用 不适用 不适用 不适用 30,000 不适用 文本 马拉地语(印度)发音词典
217
向下箭头 产品类型ots-text 蒙古语发音词典
文本 ASR, TTS,语言建模 不适用 30000个单词 添加引用 mon_MNG_PHON 阿彭环球 发音字典 蒙古 蒙古 不适用 不适用 不适用 不适用 30,000 不适用 文本 蒙古语发音词典
219
向下箭头 产品类型ots-text 挪威语(挪威)语音词典的一部分
文本 ASR, TTS,语言建模 不适用 3000个单词 添加引用 nor_NOR_POS 阿彭环球 语音词典的一部分 挪威语 挪威 不适用 不适用 不适用 不适用 3,000 不适用 文本 挪威语(挪威)语音词典的一部分
218
向下箭头 产品类型ots-text 挪威语(挪威)发音词典
文本 ASR, TTS,语言建模 不适用 115000个单词 添加引用 nor_NOR_PHON 阿彭环球 发音字典 挪威语 挪威 不适用 不适用 不适用 不适用 115000年 不适用 文本 挪威语(挪威)发音词典
220
向下箭头 产品类型ots-text 奥里亚(印度)发音词典
文本 ASR, TTS,语言建模 不适用 15000个单词 添加引用 ori_IND_PHON 阿彭环球 发音字典 奥里萨邦 印度 不适用 不适用 不适用 不适用 15,000 不适用 文本 奥里亚(印度)发音词典
80
向下箭头 产品类型ots-sound 旁遮普(巴基斯坦)会话电话
音频 ASR、会话人工智能、语音分析 移动电话和固定电话 20小时 添加引用 PAP_ASR001 阿彭环球 会话演讲 旁遮普语 巴基斯坦 低背景噪音 205 2 可根据要求提供 7,298 8 当地法律 数据集已完全转录并带有时间戳
数据集配有包含所有转录词的发音词典
71%的电话,两个发言人(内线/外线)都被收集和转录,然而,29%的电话,只有一半的谈话被收集和转录
旁遮普(巴基斯坦)会话电话
74
向下箭头 产品类型ots-sound 普什图语(阿富汗)播出
音频 ASR,自动字幕,关键字识别 麦克风 51小时 添加引用 PAS_BRC001 阿彭环球 广播讲话 北普什图语;南普什图语 阿富汗 低背景噪音(演播室) 不适用 1 可根据要求提供 可根据要求提供 不适用 wav 数据集已完全转录并加上时间戳
数据集主要是语音,不包括音乐或广告
数据类型包括:脱口秀、访谈、新闻广播(不包括主持人阅读新闻)
普什图语(阿富汗)播出
73
向下箭头 产品类型ots-sound 普什图语(阿富汗语)对话麦克风
音频 ASR、会话人工智能、语音分析 麦克风 39个小时 添加引用 PAS_ASR002 阿彭环球 会话演讲 北普什图语;南普什图语 阿富汗 低背景噪音 40 2 可根据要求提供 9480年 16 wav 数据集已全部转录并打上时间戳
数据集配有包含所有转录词的发音词典
作为可选的额外购买,还可提供法语成绩单的完整翻译
平均通话时长:120分钟,其中一人作为采访者,另一人作为被采访者,场景类似于TransTAC风格(如民事、检查点等)。
面试官出现在不止一组对话中,但每一组对话中的受访者都是独特的
普什图语(阿富汗语)对话麦克风
72
向下箭头 产品类型ots-sound 普什图语(阿富汗)会话电话
音频 ASR、会话人工智能、语音分析 移动电话和固定电话 55个小时 添加引用 PAS_ASR001 阿彭环球 会话演讲 北普什图语;南普什图语 阿富汗 低背景噪音 967 2 可根据要求提供 13633年 8 wav 数据集已全部转录并打上时间戳
数据集配有包含所有转录词的发音词典
在大多数电话中,两位发言人(内联/外联)都被接话和录音,但在少数电话中,只有一半的通话被接话和录音
普什图语(阿富汗)会话电话
221
向下箭头 产品类型ots-text 普什图语(阿富汗)发音词典
文本 ASR, TTS,语言建模 不适用 65000个单词 添加引用 pus_AFG_PHON 阿彭环球 发音字典 普什图语 阿富汗 不适用 不适用 不适用 不适用 65000年 不适用 文本 普什图语(阿富汗)发音词典
223
向下箭头 产品类型ots-text 波兰语(波兰)语言词典的一部分
文本 ASR, TTS,语言建模 不适用 4000个单词 添加引用 pol_POL_POS 阿彭环球 语音词典的一部分 波兰的 波兰 不适用 不适用 不适用 不适用 4,000 不适用 文本 波兰语(波兰)语言词典的一部分
222
向下箭头 产品类型ots-text 波兰语(波兰)发音词典
文本 ASR, TTS,语言建模 不适用 40000个单词 添加引用 pol_POL_PHON 阿彭环球 发音字典 波兰的 波兰 不适用 不适用 不适用 不适用 40,000 不适用 文本 波兰语(波兰)发音词典
75
向下箭头 产品类型ots-sound 波兰(波兰)脚本麦克风
音频 ASR,虚拟助理,聊天机器人 麦克风 25小时 添加引用 POL_ASR001 全球电话 脚本化的演讲 波兰的 波兰 低背景噪音(家庭/办公室) 99 1 10,130 可根据要求提供 16 wav 数据集是完全转录和转录是可用的原始脚本和罗马化形式
每个演讲者都会从网络上的全国性报纸文章中选择一些语音丰富的句子,以覆盖广泛的领域和大量的词汇
与卡尔斯鲁厄理工学院(KIT)合作开发
波兰(波兰)脚本麦克风
120
向下箭头 产品类型ots-sound 波兰(波兰)脚本智能手机
音频 ASR,虚拟助理,聊天机器人 移动电话 293小时 添加引用 POL_ASR002_CN 中国的动作 脚本化的演讲 波兰的 波兰 低背景噪音(家庭/办公室) 353 1 106674年 168544年 16 wav 数据集完全转录 波兰(波兰)脚本智能手机
76
向下箭头 产品类型ots-sound 波兰(波兰)脚本电话
音频 呼叫中心,虚拟助理 固定电话只 78小时 添加引用 波兰SpeechDat (E)数据库 细微差别 脚本化的演讲 波兰的 波兰 低背景噪音 1,000 1 48000年 可根据要求提供 8 可根据要求提供 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告
48个提示,包括数字,自然数字,字母串,个人,地点和业务名称,确认项目(是,否+模糊),通用的命令和控制项目,语音丰富的句子和单词
波兰(波兰)脚本电话
78
向下箭头 产品类型ots-sound 葡萄牙语(巴西)会话式电话
音频 ASR、会话人工智能、语音分析 移动电话和固定电话 33小时 添加引用 PTB_ASR002 阿彭环球 会话演讲 葡萄牙语 巴西 低背景噪音 200 2 可根据要求提供 11287年 8 当地法律 数据集已全部转录并打上时间戳
数据集配有包含所有转录词的发音词典
葡萄牙语(巴西)会话式电话
77
向下箭头 产品类型ots-sound 葡萄牙语(巴西)麦克风
音频 ASR,虚拟助理,聊天机器人 麦克风 26小时 添加引用 PTB_ASR001 全球电话 脚本化的演讲 葡萄牙语 巴西 低背景噪音(家庭/办公室) 102 1 10417年 可根据要求提供 16 wav 数据集是完全转录和转录是可用的原始脚本和罗马化形式
每个演讲者都会从网络上的全国性报纸文章中选择一些语音丰富的句子,以覆盖广泛的领域和大量的词汇
与卡尔斯鲁厄理工学院(KIT)合作开发
葡萄牙语(巴西)麦克风
225
向下箭头 产品类型ots-text 葡萄牙语(巴西)语音词典的一部分
文本 ASR, TTS,语言建模 不适用 100000个单词 添加引用 por_BRA_POS 阿彭环球 语音词典的一部分 葡萄牙语 巴西 不适用 不适用 不适用 不适用 100,000 不适用 文本 葡萄牙语(巴西)语音词典的一部分
224
向下箭头 产品类型ots-text 葡萄牙语(巴西)发音词典
文本 ASR, TTS,语言建模 不适用 102000个单词 添加引用 por_BRA_PHON 阿彭环球 发音字典 葡萄牙语 巴西 不适用 不适用 不适用 不适用 102000年 不适用 文本 葡萄牙语(巴西)发音词典
79
向下箭头 产品类型ots-sound 葡萄牙语(葡萄牙)会话式电话
音频 ASR、会话人工智能、语音分析 移动电话和固定电话 36个小时 添加引用 PTP_ASR001 阿彭环球 会话演讲 葡萄牙语 葡萄牙 低背景噪音 200 2 可根据要求提供 16339年 8 当地法律 数据集已完全转录并加上时间戳
数据集配有包含所有转录词的发音词典
该项目记录了200个电话对话-100名演讲者向100个呼叫接收器分别拨打2个电话(1个来自固定电话,1个来自移动电话)
葡萄牙语(葡萄牙)会话式电话
227
向下箭头 产品类型ots-text 葡萄牙语(葡萄牙语)语音词典的一部分
文本 ASR, TTS,语言建模 不适用 100000个单词 添加引用 por_PRT_POS 阿彭环球 语音词典的一部分 葡萄牙语 葡萄牙 不适用 不适用 不适用 不适用 100,000 不适用 文本 葡萄牙语(葡萄牙语)语音词典的一部分
226
向下箭头 产品类型ots-text 葡萄牙语发音词典
文本 ASR, TTS,语言建模 不适用 112000个单词 添加引用 por_PRT_PHON 阿彭环球 发音字典 葡萄牙语 葡萄牙 不适用 不适用 不适用 不适用 112000年 不适用 文本 葡萄牙语发音词典
81
向下箭头 产品类型ots-sound 罗马尼亚(罗马尼亚)对话电话
音频 ASR、会话人工智能、语音分析 移动电话和固定电话 37小时 添加引用 ROM_ASR001 阿彭环球 会话演讲 罗马尼亚 罗马尼亚 低背景噪音 200 2 可根据要求提供 16,658 8 当地法律 数据集已完全转录并加上时间戳
数据集配有包含所有转录词的发音词典
该项目记录了200个电话对话-100名演讲者向100个呼叫接收器分别拨打2个电话(1个来自固定电话,1个来自移动电话)
罗马尼亚(罗马尼亚)对话电话
228
向下箭头 产品类型ots-text 罗马尼亚语发音词典
文本 ASR, TTS,语言建模 不适用 15000个单词 添加引用 ron_ROU_PHON 阿彭环球 发音字典 罗马尼亚 罗马尼亚 不适用 不适用 不适用 不适用 15,000 不适用 文本 罗马尼亚语发音词典
82
向下箭头 产品类型ots-sound 俄语会话式电话
音频 ASR、会话人工智能、语音分析 移动电话和固定电话 37小时 添加引用 RUS_ASR001 阿彭环球 会话演讲 俄罗斯 俄罗斯 低背景噪音 200 2 可根据要求提供 28284年 8 法律或wav 数据集已完全转录并加上时间戳
数据集配有包含所有转录词的发音词典
该项目记录了200个电话对话-100名演讲者向100个呼叫接收器分别拨打2个电话(1个来自固定电话,1个来自移动电话)
俄语会话式电话
230
向下箭头 产品类型ots-text 俄语(俄罗斯)词性词典
文本 ASR, TTS,语言建模 不适用 100000个单词 添加引用 rus_RUS_POS 阿彭环球 语音词典的一部分 俄罗斯 俄罗斯 不适用 不适用 不适用 不适用 100,000 不适用 文本 俄语(俄罗斯)词性词典
229
向下箭头 产品类型ots-text 俄语(俄罗斯)发音字典
文本 ASR, TTS,语言建模 不适用 115000个单词 添加引用 鲁苏鲁苏丰 阿彭环球 发音字典 俄罗斯 俄罗斯 不适用 不适用 不适用 不适用 115000年 不适用 文本 俄语(俄罗斯)发音字典
83
向下箭头 产品类型ots-sound 俄罗斯(俄罗斯)脚本麦克风
音频 ASR,虚拟助理,聊天机器人 麦克风 31小时 添加引用 RUS_ASR002 全球电话 脚本化的演讲 俄罗斯 俄罗斯 低背景噪音(家庭/办公室) 115 1 12205年 可根据要求提供 16 wav 数据集是完全转录和转录是可用的原始脚本和罗马化形式
每个演讲者都会从网络上的全国性报纸文章中选择一些语音丰富的句子,以覆盖广泛的领域和大量的词汇
与卡尔斯鲁厄理工学院(KIT)合作开发
俄罗斯(俄罗斯)脚本麦克风
96
向下箭头 产品类型ots-sound 俄罗斯(俄罗斯)脚本麦克风
音频 ASR,虚拟助理,聊天机器人 麦克风 46小时 添加引用 Speecon俄罗斯数据库 细微差别 脚本化的演讲 俄罗斯 俄罗斯 混合(办公、娱乐、汽车、公共场所) 600人(550名成人及50名儿童) 4 170000年 可根据要求提供 16 可根据要求提供 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告
每名成人和每名儿童分别有290个和210个提示,包括数字、自然数字、字母串、个人、地点和业务名称、成人使用的应用词汇、儿童使用的命令(玩具、电话和通用)、发音丰富的单词和句子,以及成人使用的自由和自发的反应
俄罗斯(俄罗斯)脚本麦克风
84
向下箭头 产品类型ots-sound 俄罗斯脚本电话
音频 呼叫中心,虚拟助理 固定电话只 180小时 添加引用 俄罗斯SpeechDat (E)数据库 细微差别 脚本化的演讲 俄罗斯 俄罗斯 低背景噪音 2,500 1 112000年 可根据要求提供 8 当地法律 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告
每个演讲者需要45个提示,包括数字,自然数字,字母串,个人,地点和公司名称,确认项目(是,否+模糊),通用的命令和控制项目,语音丰富的句子和单词
俄罗斯脚本电话
133
向下箭头 产品类型ots-text 俄罗斯NER新闻文本
文本 内容分类,搜索引擎 不适用 29888句 添加引用 RUS_NER001 阿彭环球 新闻尼珥 俄罗斯 俄罗斯 不适用 不适用 不适用 29,888 可根据要求提供 不适用 文本 俄罗斯NER新闻文本
231
向下箭头 产品类型ots-text 塞尔维亚语发音词典
文本 ASR, TTS,语言建模 不适用 15000个单词 添加引用 srp_SRB_PHON 阿彭环球 发音字典 塞尔维亚 塞尔维亚 不适用 不适用 不适用 不适用 15,000 不适用 文本 塞尔维亚语发音词典
126
向下箭头 产品类型ots-image 简体中文打印文本OCR
图像 文档处理,文档搜索 相机 200张图片 添加引用 IMG_OCR_MAC_CN 中国的动作 文档OCR 不适用 中国 混合照明条件 30. NA NA NA NA jpg 每个图像中的文本都用线条标记了边框
图片包含厚重的中文文本,包括书籍、出版物、海报、收据、PPT、印刷纸张等。
简体中文打印文本OCR
85
向下箭头 产品类型ots-sound 斯洛伐克(斯洛伐克)脚本电话
音频 呼叫中心,虚拟助理 固定电话只 65小时 添加引用 斯洛伐克SpeechDat (E)数据库 细微差别 脚本化的演讲 斯洛伐克语 斯洛伐克 低背景噪音 1,000 1 48000年 可根据要求提供 8 可根据要求提供 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告
48个提示,包括数字,自然数字,字母串,个人,地点和业务名称,确认项目(是,否+模糊),通用的命令和控制项目,语音丰富的句子和单词
斯洛伐克(斯洛伐克)脚本电话
86
向下箭头 产品类型ots-sound 斯洛文尼亚(斯洛文尼亚)电话
音频 呼叫中心,虚拟助理 固定电话只 76小时 添加引用 斯洛文尼亚SpeechDat (II)身上- 1000 细微差别 脚本化的演讲 斯洛维尼亚语 斯洛文尼亚 低背景噪音(家庭/办公室) 1,000 1 40,000 可根据要求提供 8 可根据要求提供 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告
每位演讲者大约需要40个提示,包括数字、自然数字、字母串、个人、地点和公司名称、确认项目(是、否+模糊)、通用的命令和控制项目以及语音丰富的句子和单词
斯洛文尼亚(斯洛文尼亚)电话
87
向下箭头 产品类型ots-sound 索马里语会话电话
音频 ASR、会话人工智能、语音分析 移动电话和固定电话 50个小时 添加引用 SOM_ASR001 阿彭环球 会话演讲 索马里 索马里 低背景噪音 1,000 2 可根据要求提供 23217年 8 当地法律 数据集已全部转录并打上时间戳
数据集配有包含所有转录词的发音词典
索马里语会话电话
232
向下箭头 产品类型ots-text 索马里语发音词典
文本 ASR, TTS,语言建模 不适用 76000个单词 添加引用 som_SOM_PHON 阿彭环球 发音字典 索马里 索马里 不适用 不适用 不适用 不适用 76000年 不适用 文本 索马里语发音词典
233
向下箭头 产品类型ots-text Sorani(伊拉克)发音词典
文本 ASR, TTS,语言建模 不适用 25000个单词 添加引用 kur_IRQ_PHON 阿彭环球 发音字典 索拉尼 伊拉克 不适用 不适用 不适用 不适用 25,000 不适用 文本 Sorani(伊拉克)发音词典
88
向下箭头 产品类型ots-sound 索拉尼(库尔德语)会话电话
音频 ASR、会话人工智能、语音分析 移动电话和固定电话 5个小时 添加引用 SOR_ASR001 阿彭环球 会话演讲 中央库尔德人(伊朗) 伊朗 低背景噪音 170 2 可根据要求提供 7,924 8 法律或wav 数据集已全部转录并打上时间戳
数据集配有包含所有转录词的发音词典
在很大一部分电话中,只有一半的通话被收集和记录下来
索拉尼(库尔德语)会话电话
234
向下箭头 产品类型ots-text 西班牙语(阿根廷)发音词典
文本 ASR, TTS,语言建模 不适用 15000个单词 添加引用 spa_ARG_PHON 阿彭环球 发音字典 西班牙语 阿根廷 不适用 不适用 不适用 不适用 15,000 不适用 文本 西班牙语(阿根廷)发音词典
236
向下箭头 产品类型ots-text 西班牙语(智利)发音词典
文本 ASR, TTS,语言建模 不适用 15000个单词 添加引用 spa_CHL_PHON 阿彭环球 发音字典 西班牙语 智利 不适用 不适用 不适用 不适用 15,000 不适用 文本 西班牙语(智利)发音词典
237
向下箭头 产品类型ots-text 西班牙语(哥伦比亚)发音词典
文本 ASR, TTS,语言建模 不适用 15000个单词 添加引用 spa_COL_PHON 阿彭环球 发音字典 西班牙语 哥伦比亚 不适用 不适用 不适用 不适用 15,000 不适用 文本 西班牙语(哥伦比亚)发音词典
27
向下箭头 产品类型ots-sound 西班牙语(拉丁美洲-智利和哥伦比亚)会话电话
音频 ASR、会话人工智能、语音分析 移动电话和固定电话 22小时 添加引用 ESL_ASR002 阿彭环球 会话演讲 西班牙语 智利;哥伦比亚 混合 84 2 可根据要求提供 可根据要求提供 8 wav 数据集已完全转录并带有时间戳
银行和电信领域的呼叫中心式对话(由64名客户、14名代理人进行),主要使用手机
西班牙语(拉丁美洲-智利和哥伦比亚)会话电话
26
向下箭头 产品类型ots-sound 西班牙语(拉丁美洲)脚本麦克风
音频 ASR,虚拟助理,聊天机器人 麦克风 17个小时 添加引用 ESL_ASR001 全球电话 脚本化的演讲 西班牙语 哥斯达黎加 低背景噪音(家庭/办公室) One hundred. 1 6898年 可根据要求提供 16 wav 数据集是完全转录和转录是可用的原始脚本和罗马化形式
每个演讲者都会从网络上的全国性报纸文章中选择一些语音丰富的句子,以覆盖广泛的领域和大量的词汇
与卡尔斯鲁厄理工学院(KIT)合作开发
西班牙语(拉丁美洲)脚本麦克风
238
向下箭头 产品类型ots-text 西班牙语(秘鲁)发音词典
文本 ASR, TTS,语言建模 不适用 15000个单词 添加引用 水疗中心 阿彭环球 发音字典 西班牙语 秘鲁 不适用 不适用 不适用 不适用 15,000 不适用 文本 西班牙语(秘鲁)发音词典
235
向下箭头 产品类型ots-text 西班牙语发音词典
文本 ASR, TTS,语言建模 不适用 100000个单词 添加引用 spa_ESP_PHON 阿彭环球 发音字典 西班牙语 西班牙 不适用 不适用 不适用 不适用 100,000 不适用 文本 西班牙语发音词典
28
向下箭头 产品类型ots-sound 西班牙语(西班牙)脚本麦克风
音频 ASR,虚拟助理,聊天机器人 麦克风 39个小时 添加引用 ESP_ASR001 阿彭环球 脚本化的演讲 西班牙语 西班牙 混合 200 4 40,000 6367年 22 当地法律 完全转录到speech hdat类型约定
数据集配有包含所有转录词的发音词典
每个演讲者有200个提示,包括100个命令和控制类型项目和100个语音丰富的句子
西班牙语(西班牙)脚本麦克风
30.
向下箭头 产品类型ots-sound 西班牙语(西班牙)脚本麦克风
音频 TTS 麦克风 1小时 添加引用 ESP_TTS001 阿彭环球 脚本化的演讲 西班牙语 西班牙 低背景噪音(演播室) 1 1 1787年 3614年 22 当地法律 数据集附带一个发音词汇表,其中包含数据集中说出的所有单词
每个演讲者有1787个提示,包括语音丰富的句子
西班牙语(西班牙)脚本麦克风
97
向下箭头 产品类型ots-sound 西班牙语(西班牙)脚本麦克风
音频 ASR,虚拟助理,聊天机器人 麦克风 46小时 添加引用 Speecon西班牙数据库 细微差别 脚本化的演讲 西班牙语 西班牙 混合(办公、娱乐、汽车、公共场所) 600人(550名成人及50名儿童) 4 170000年 可根据要求提供 16 可根据要求提供 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告
每名成人和每名儿童分别有290个和210个提示,包括数字、自然数字、字母串、个人、地点和业务名称、成人使用的应用词汇、儿童使用的命令(玩具、电话和通用)、发音丰富的单词和句子,以及成人使用的自由和自发的反应
西班牙语(西班牙)脚本麦克风
117
向下箭头 产品类型ots-sound 西班牙(西班牙)脚本智能手机
音频 ASR,虚拟助理,聊天机器人 移动电话 540小时 添加引用 ESP_ASR002_CN 中国的动作 脚本化的演讲 西班牙语 西班牙 低背景噪音(家庭/办公室) 347 1 258395年 134939年 16 wav 数据集完全转录 西班牙(西班牙)脚本智能手机
239
向下箭头 产品类型ots-text 西班牙语(美国)发音词典
文本 ASR, TTS,语言建模 不适用 90000个单词 添加引用 spa_USA_PHON 阿彭环球 发音字典 西班牙语 美国 不适用 不适用 不适用 不适用 90000年 不适用 文本 西班牙语(美国)发音词典
240
向下箭头 产品类型ots-text 西班牙语(委内瑞拉)发音词典
文本 ASR, TTS,语言建模 不适用 15000个单词 添加引用 spa_VEN_PHON 阿彭环球 发音字典 西班牙语 委内瑞拉 不适用 不适用 不适用 不适用 15,000 不适用 文本 西班牙语(委内瑞拉)发音词典
241
向下箭头 产品类型ots-text 斯瓦希里语(肯尼亚)发音词典
文本 ASR, TTS,语言建模 不适用 66000个单词 添加引用 swa_KEN_PHON 阿彭环球 发音字典 斯瓦希里语 肯尼亚 不适用 不适用 不适用 不适用 66000年 不适用 文本 斯瓦希里语(肯尼亚)发音词典
243
向下箭头 产品类型ots-text 瑞典语(瑞典语)语音词典的一部分
文本 ASR, TTS,语言建模 不适用 105000个单词 添加引用 swe_SWE_POS 阿彭环球 语音词典的一部分 瑞典的 瑞典 不适用 不适用 不适用 不适用 105000年 不适用 文本 瑞典语(瑞典语)语音词典的一部分
242
向下箭头 产品类型ots-text 瑞典语(瑞典)发音词典
文本 ASR, TTS,语言建模 不适用 100000个单词 添加引用 swe_SWE_PHON 阿彭环球 发音字典 瑞典的 瑞典 不适用 不适用 不适用 不适用 100,000 不适用 文本 瑞典语(瑞典)发音词典
98
向下箭头 产品类型ots-sound 瑞典(瑞典/芬兰)麦克风
音频 ASR,虚拟助理,聊天机器人 麦克风 30个小时 添加引用 SWE_ASR001 全球电话 脚本化的演讲 瑞典的 瑞典;芬兰 低背景噪音(家庭/办公室) 98 1 11816年 可根据要求提供 16 wav 数据集是完全转录和转录是可用的原始脚本和罗马化形式
每个演讲者都会从网络上的全国性报纸文章中选择一些语音丰富的句子,以覆盖广泛的领域和大量的词汇
与卡尔斯鲁厄理工学院(KIT)合作开发
瑞典(瑞典/芬兰)麦克风
244
向下箭头 产品类型ots-text Sylheti(孟加拉国-印度)发音词典
文本 ASR, TTS,语言建模 不适用 22000个单词 添加引用 syl_BGD; IND_PHON 阿彭环球 发音字典 Sylheti 孟加拉国;印度 不适用 不适用 不适用 不适用 22000年 不适用 文本 Sylheti(孟加拉国-印度)发音词典
245
向下箭头 产品类型ots-text 他加禄语(菲律宾)发音词典
文本 ASR, TTS,语言建模 不适用 30000个单词 添加引用 tgl_PHL_PHON 阿彭环球 发音字典 塔加拉族语 菲律宾 不适用 不适用 不适用 不适用 30,000 不适用 文本 他加禄语(菲律宾)发音词典
247
向下箭头 产品类型ots-text 泰米尔语(印度)发音词典
文本 ASR, TTS,语言建模 不适用 105000个单词 添加引用 tam_IND_PHON 阿彭环球 发音字典 泰米尔 印度 不适用 不适用 不适用 不适用 105000年 不适用 文本 泰米尔语(印度)发音词典
246
向下箭头 产品类型ots-text 泰卢固(印度)发音词典
文本 ASR, TTS,语言建模 不适用 50000个单词 添加引用 tel_IND_PHON 阿彭环球 发音字典 泰卢固语 印度 不适用 不适用 不适用 不适用 50000年 不适用 文本 泰卢固(印度)发音词典
101
向下箭头 产品类型ots-sound 泰国(泰国)麦克风
音频 ASR,虚拟助理,聊天机器人 麦克风 28小时 添加引用 THA_ASR001 全球电话 脚本化的演讲 泰国 泰国 低背景噪音(家庭/办公室) 98 1 14039年 可根据要求提供 16 wav 数据集是完全转录和转录是可用的原始脚本和罗马化形式
每个演讲者都会从网络上的全国性报纸文章中选择一些语音丰富的句子,以覆盖广泛的领域和大量的词汇
与卡尔斯鲁厄理工学院(KIT)合作开发
泰国(泰国)麦克风
127
向下箭头 产品类型ots-image 泰文(泰文)打印文本OCR
图像 文档处理,文档搜索 相机 1219张图片 添加引用 IMG_OCR_THA_CN 中国的动作 文档OCR 泰国 泰国 混合照明条件 10 NA NA NA NA jpg 图片包含文字,购物收据/车票/发票/出租车单据等。 泰文(泰文)打印文本OCR
248
向下箭头 产品类型ots-text 泰国(泰国)发音字典
文本 ASR, TTS,语言建模 不适用 55000个单词 添加引用 tha_THA_PHON 阿彭环球 发音字典 泰国 泰国 不适用 不适用 不适用 不适用 55,000 不适用 文本 泰国(泰国)发音字典
249
向下箭头 产品类型ots-text 新美拉尼(巴布亚新几内亚)发音词典
文本 ASR, TTS,语言建模 不适用 10000个单词 添加引用 tpi_巴布亚新几内亚_PHON 阿彭环球 发音字典 托克皮辛语 巴布新几内亚 不适用 不适用 不适用 不适用 10,000 不适用 文本 新美拉尼(巴布亚新几内亚)发音词典
102
向下箭头 产品类型ots-sound 土耳其(土耳其)会话式电话
音频 ASR、会话人工智能、语音分析 移动电话和固定电话 41小时 添加引用 TUR_ASR001 阿彭环球 会话演讲 土耳其的 火鸡 低背景噪音 200 2 可根据要求提供 32,386 8 法律或wav 数据集已完全转录并加上时间戳
数据集配有包含所有转录词的发音词典
该项目记录了200个电话对话-100名演讲者向100个呼叫接收器分别拨打2个电话(1个来自固定电话,1个来自移动电话)
土耳其(土耳其)会话式电话
103
向下箭头 产品类型ots-sound 土耳其(土耳其)麦克风
音频 ASR,虚拟助理,聊天机器人 麦克风 17个小时 添加引用 TUR_ASR002 全球电话 脚本化的演讲 土耳其的 火鸡 低背景噪音(家庭/办公室) One hundred. 1 6950年 可根据要求提供 16 wav 数据集是完全转录和转录是可用的原始脚本和罗马化形式
每个演讲者都会从网络上的全国性报纸文章中选择一些语音丰富的句子,以覆盖广泛的领域和大量的词汇
与卡尔斯鲁厄理工学院(KIT)合作开发
土耳其(土耳其)麦克风
251
向下箭头 产品类型ots-text 土耳其语(土耳其)语音词典的一部分
文本 ASR, TTS,语言建模 不适用 257000个单词 添加引用 tur_TUR_POS 阿彭环球 语音词典的一部分 土耳其的 火鸡 不适用 不适用 不适用 不适用 257000年 不适用 文本 土耳其语(土耳其)语音词典的一部分
250
向下箭头 产品类型ots-text 土耳其(土耳其)发音字典
文本 ASR, TTS,语言建模 不适用 255000个单词 添加引用 tur_TUR_PHON 阿彭环球 发音字典 土耳其的 火鸡 不适用 不适用 不适用 不适用 255000年 不适用 文本 土耳其(土耳其)发音字典
121
向下箭头 产品类型ots-sound 土耳其(土耳其)脚本智能手机
音频 ASR,虚拟助理,聊天机器人 移动电话 739小时 添加引用 土耳其ASR003中国 中国的动作 脚本化的演讲 土耳其的 火鸡 低背景噪音(家庭/办公室) 664 1 185706年 215135年 16 wav 数据集完全转录 土耳其(土耳其)脚本智能手机
69
向下箭头 产品类型ots-sound 土耳其(土耳其)电话
音频 呼叫中心,虚拟助理 移动电话和固定电话 118小时 添加引用 OrienTel土耳其数据库 细微差别 脚本化的演讲 土耳其的 火鸡 低背景噪音 1,700 1 76,500 可根据要求提供 8 可根据要求提供 数据集完全转录为speech hdat类型约定,并伴有发音词典和验证报告
每个演讲者需要45个提示,包括数字,自然数字,字母串,个人,地点和公司名称,确认项目(是,否+模糊),通用的命令和控制项目,语音丰富的句子和单词
土耳其(土耳其)电话
252
向下箭头 产品类型ots-text 乌克兰语发音词典
文本 ASR, TTS,语言建模 不适用 5000个单词 添加引用 ukr_UKR_PHON 阿彭环球 发音字典 乌克兰 乌克兰 不适用 不适用 不适用 不适用 5,000 不适用 文本 乌克兰语发音词典
105
向下箭头 产品类型ots-sound 乌尔都语(印度/巴基斯坦)会话电话
音频 ASR、会话人工智能、语音分析 移动电话和固定电话 47个小时 添加引用 URD_ASR001 阿彭环球 会话演讲 乌尔都语 印度;巴基斯坦 混合 1,000 2 可根据要求提供 10871年 8 wav 数据集已全部转录并打上时间戳
数据集配有包含所有转录词的发音词典
乌尔都语(印度/巴基斯坦)会话电话
254
向下箭头 产品类型ots-text 乌尔都语(巴基斯坦)语音词典的一部分
文本 ASR, TTS,语言建模 不适用 12000个单词 添加引用 urd_PAK_POS 阿彭环球 语音词典的一部分 乌尔都语 巴基斯坦 不适用 不适用 不适用 不适用 12000年 不适用 文本 乌尔都语(巴基斯坦)语音词典的一部分
253
向下箭头 产品类型ots-text 乌尔都语(巴基斯坦)发音词典
文本 ASR, TTS,语言建模 不适用 40000个单词 添加引用 urd_PAK_PHON 阿彭环球 发音字典 乌尔都语 巴基斯坦 不适用 不适用 不适用 不适用 40,000 不适用 文本 乌尔都语(巴基斯坦)发音词典
137
向下箭头 产品类型ots-text 乌尔都语NER新闻文本
文本 内容分类,搜索引擎 不适用 20634句 添加引用 URD_NER001 阿彭环球 新闻尼珥 乌尔都语 巴基斯坦 不适用 不适用 不适用 20634年 可根据要求提供 不适用 文本 乌尔都语NER新闻文本
108
向下箭头 产品类型ots-sound 越南(越南)麦克风
音频 ASR,虚拟助理,聊天机器人 麦克风 47个小时 添加引用 VIE_ASR001 全球电话 脚本化的演讲 越南 越南 低背景噪音(家庭/办公室) 129 1 18842年 可根据要求提供 16 wav 数据集是完全转录和转录是可用的原始脚本和罗马化形式
每个演讲者都会从网络上的全国性报纸文章中选择一些语音丰富的句子,以覆盖广泛的领域和大量的词汇
与卡尔斯鲁厄理工学院(KIT)合作开发
越南(越南)麦克风
255
向下箭头 产品类型ots-text 越南语发音词典
文本 ASR, TTS,语言建模 不适用 8000个单词 添加引用 vie_VNM_PHON 阿彭环球 发音字典 越南 越南 不适用 不适用 不适用 不适用 8,000 不适用 文本 越南语发音词典
256
向下箭头 产品类型ots-text 吴(中国)发音词典
文本 ASR, TTS,语言建模 不适用 10000个单词 添加引用 乌乌中国丰 阿彭环球 发音字典 中国 不适用 不适用 不适用 不适用 10,000 不适用 文本 吴(中国)发音词典
257
向下箭头 产品类型ots-text 中国发音词典
文本 ASR, TTS,语言建模 不适用 10000个单词 添加引用 hsn_CHN_PHON 阿彭环球 发音字典 中国 不适用 不适用 不适用 不适用 10,000 不适用 文本 中国发音词典
258
向下箭头 产品类型ots-text 祖鲁语(南非)发音词典
文本 ASR, TTS,语言建模 不适用 75000个单词 添加引用 zul_ZAF_PHON 阿彭环球 发音字典 祖鲁语 南非 不适用 不适用 不适用 不适用 75000年 不适用 文本 祖鲁语(南非)发音词典





用例


无论您是在开发文本语音转换系统、语音识别系统还是其他依赖于自然语言的解决方案,高质量的授权语音和语言数据集都能让您更快地进入市场,并获得更多的潜在客户。