800小时四川方言语音采集数据

800小时四川方言语音采集数据

通用类口语句子;交互类句子;重复率1.71 ;平均句长10.83字/句
-获取详情
景联文已通过ISO27001信息安全管理系统,ISO9001质量管理体系认证。
数据简介
标注特点:文本转写,噪音符号标注
数据规模
800小时川方言
采集环境
相对安静的环境,无回声四
数据构成
平均每人录制328句; 409男,391女;小于25岁60%,26-40岁25%,41岁以上7%
采集设备
手机
数据格式
语音数据格式:手机16kHz,16bit,wav,单声道 标注结果格式:txt
数据来源
此数据集由景联文科技及合作供应商共同采集制作,基于GDPR(通用数据保护条例),对数据已进行脱敏处理 获取样例
样例展示
做AI行业客户的数据参谋