景联文声纹识别—让安全的声音听得见

时间:2018-05-18 10:11:36

作者:顾梦楠

浏览:

景联文科技提供50800段中文语音数据集。

声纹识别是生物识别的一种,就是把声音信号转化为电信号,再用计算机进行识别。2020年12月22日,由清华大学人工智能研究院听觉智能研究中心、ALLA-得意音通声纹技术联合实验室、中国电信股份有限公司研究院联合发布了《中国声纹识别产业发展白皮书2.0》,文中列举了声纹识别技术在未来的12大发展趋势。

在疫情防控阶段,为有效阻断“人传人”的传播链,指纹打卡被大面积暂停,国务院大力提倡使用刷脸支付,也为声纹识别技术带来了新机遇。声纹识别相对于指纹识别具有获取更方便、使用更简单、可以远程验证等优点。

e1d1c8854032da5487f98d32e39a6f9

声纹识别让金融监管变得更安全,动态声纹密码已应用到多家银行真实场景中,实现了以声纹识别技术来提升金融服务的满意度。

为了保障公共安全,公安机关已在各地公共安全相关部门加大对语音数据集的采集力度,建设各地声纹数据库,通过声纹识别技术进行治安防控,来保障人民的人身财产安全。

声纹识别技术还被应用到医疗领域,在挂号、缴费、医保理赔、病历录入等方面发挥了作用,可以一定程度上提高医生工作效率,降低其工作强度,以降低医院的每日运作成本,更利于医院更好的发展。

IMG_256

科技的进步需要大量精准的数据支持,景联文科技作为专业的人工智能基础数据服务商在数据采集标注领域深耕多年,有大量的数据库。

景联文科技采集了《50800段中文语音数据集》。

该数据由2540名录音人使用普通话参与录制,参与人员性别分布均匀,涵盖了18到60各个年龄段。该数据在安静且无回声的室内进行录制,每个人录制20句常用语,内容包括日常生活中的句子;交互类句子;会涉及到音乐、娱乐、体育、出行、生活、社交等不同的类别。


该语音数据集可运用于声纹识别技术场景中。

从目前的技术进展来看,声纹识别技术还并不完全可靠,有时会出现一定的偏差,因此还需不断地探索和完善。

50800段中文语音数据集
数据集50800段

 

录制人数

2540人
采集环境安静室内
性别分布男女比例1:1
年龄分布18—60岁
录制内容日常生活中的句子;交互类句子;会涉及到音乐、娱乐、体育、出行、生活、社交等
音频格式wav

关于景联文科技:

成立于2012年,主营业务为数据采集标注服务和指纹防伪算法。在指纹技术领域,持有发明专利13项,软件产品登记证书4项,软件著作权21项,2019年蝉联全球第2届假指纹检测竞赛第一名,曾3次参与国家标准制定,处于行业领先地位。

同时在数据采集领域深耕多年,图像数据,文本数据、语音数据、视频数据,目标检测数据集等现有数据库超300TB,自建数据标注平台,包括图像标注工具,语音标注工具等,可以提供图像数据标注,语音数据标注,文本数据标注,视频数据标注,语义分割,实例分割,3d点云标注,声音转换,语音转换,语音交互,语音合成,智能语音等标注项目支持,目前,已与华为、阿里巴巴、海康威视、群晖科技、浙江省公安厅等企业、机构达成深入合作,成为行业领先的数据采集标注品牌。


相关推荐

做AI行业客户的数据参谋
电话:19157628936
邮箱:liangxiao@jinglianwen.com
地址:杭州市萧山区杭州湾信息港E幢7楼
微信公众号 客服微信二维码