安防之家讯:在为大家介绍声纹识别技术现状之前先介绍下声纹识别的概念,声纹识别,生物识别技术的一种。也称为说话人识别,有两类,即说话人辨认和说话人确认。不同的任务和应用会使用不同的声纹识别技术,如缩小刑侦范围时可能需要辨认技术,而银行交易时则需要确认技术。
在国内,语音识别技术也发展迅速且稳健,目前声纹识别技术现状:
阿里
前沿:2014年10月,支付宝发布了多款非密码支付产品,包括人脸识别、笔迹识别、击键识别、声纹识别、掌纹识别和指纹识别等。
腾讯
前沿:2014年12月,微信上线iOS新版本,增加“声音锁”功能,用户可以使用声音,无需输入密码即可登录微信。该功能使用的技术是由微信模式识别中心语音技术组开发的声纹识别技术,这也是腾讯在其产品中首次使用此技术。
微信语音开放平台:2014年4月,微信语音开放平台登陆微信智能开放平台,开放了在线语音识别、在线语音合成等技术。腾讯将语音相关技术打包成 SDK,第三方开发者可以通过调用腾讯的 API,直接在第三方应用中调用相关的技术。
微信语音开放平台为开发者提供免费的语音技术,目前已经开放的语音技术包括在线语音识别、在线语音合成等。自定义词表识别技术也已对外开放,用户可以自定义词表,识别结果返回非常精准,而不会像通用识别那样有同音字词的问题。
微信语音技术目前在微信、SOSO地图、QQ音乐、招行等得到应用。
百度
前沿:百度在人工智能领域的投入最多,也最为领先。2014年,百度研究出深度学习语音识别系统DeepSpeech,人工智能智能项目取得突破。 Deep Speech是一款采用深度学习技术的语音识别系统系统。其独特之处在于,它可以在饭店等嘈杂环境下实现将近 81% 的辨识准确率。是同样环境下,其他的商业版语音识别 API,包括 Bing、Google 以及 Wit.AI 等的最高识别率也只有 65%。
百度语音:目前百度语音技术支持适用于搜索及指令场景的短文本识别和适用于短信、微博等输入的长文本识别模式,基于百度海量的数据资源,提供针对音乐、视频、应用、网站搜索及地图POI的识别优化。支持提醒、电话、应用、日历、通讯录、航班、酒店、短信、音乐、手机设置、社交网络、火车、旅游、天气、网 址、地图、通用指令等35个场景。还开放了底层API,开发者可以灵活构建语音识别使用场景,灵活实现各种语音识别交互方式。目前可直接在百度开放平台下载SDK,查看文档。
科大讯飞
科大讯飞是国内语音识别技术比较领先的服务商之一,也是专业的语音技术公司。
前沿:2014年8月,科大讯飞发布了多款软硬件产品,其中包括新版灵犀语音助手,将加入“智能设备”模块,以及与第三方合作的智能音响和“未来遥控”。另外,科大讯飞在方言识别方面也颇为重视。
科大讯飞语音云开放平台:目前,科大讯飞语音云开放平台的语音服务包括:
语音合成:在线语音合成,离线语音合成
语音识别:语音听写、在线命令词识别、离线命令词识别
定制服务:语音唤醒、开放语义、语言云
据悉,科大讯飞语音应用开发接口可供任何团队和个人免费使用。
另外在语音识别技术领域相对领先的还有云之声和搜狗语音。
云之声主要产品包括语音云平台、微信语音输入插件、云知声输入法等。支持大词汇量连续语音在线识别,支持应用通过API直接调用公有云服务。
搜狗语音云开放平台使用的是自主开发的语音技术,目前使用该技术的有搜狐产品,如搜狗地图、搜狗输入法、搜狐新闻等。
除了上述服务,阿里、盛大、出门问问、捷通华声、紫冬语音、YY、思必驰等也有相关语音服务。
安防之家专注于各种家居的安防,监控,防盗,安防监控,安防器材,安防设备的新闻资讯和O2O电商导购服务,敬请登陆安防之家:http://anfang.jc68.com/
安防百科|声纹识别技术现状有哪些
2016-08-26 浏览:34