声纹识别引擎(tsVPR)

发布时间: 2011-07-01 12:27 作者: 未知 浏览次数: views 字号:

产品描述 成功案例

一、      产品介绍

当今信息社会中,在国家安全、金融、司法等社会各个领域均需要个人身份验证。生物识别技术是通过计算机与光学、声学、生物传感器和生物统计学原理等高科技手段密切结合,利用人体固有的生理特性(如指纹、人脸、虹膜等)和行为特征(如笔迹、声音、步态等)来进行个人身份的鉴定。生物特征识别技术比传统的身份鉴定方法更具安全、保密和方便性,并且具有不易遗忘、防伪性能好、不易伪造或被盗、随身“携带”和随时随地可用等优点(如图1所示)。

各类认证技术比较

现在主要的生物特征识别方法有:指纹识别、掌纹识别、人脸识别、虹膜识别、声纹识别、签名识别、步态识别等。各种生物特征识别技术都有各自的特点,因此在应用时也各自有自己不同的要求,如涉及到图像采集对图像质量、光线、硬件设备等要求都比较高。近年来,在生物认证技术领域中,声纹识别(又称说话人识别)技术以其独特的方便性、经济性和准确性等优势受到世人瞩目,并日益成为人们日常生活和工作中重要且普及的安全验证方式,尤其适用于远程身份认证!

声纹识别是一项根据语音波形中反映说话人生理和行为特征的语音参数,自动识别说话人身份的技术。与语音识别不同的是,声纹识别利用的是语音信号中的说话人身份信息,而不考虑语音中的字词意思。由于每个人的生物特征具有与其他人不同的唯一性,不易伪造和假冒,所以利用声纹识别技术进行身份认证,安全、准确、可靠。

声纹识别系统包括文本相关(Text-dependent, TD)和文本无关(Text-independent, TI)两种类型。文本相关类型要求说话人按照规定的内容说话,适用于用户配合场合,如网络会员认证、电话银行等领域。文本无关类型中,说话人可以任意说话,系统也可以有高精度的识别率,适用于用户不配合或不知情场合,如公安110防骚扰电话等领域。

天聪公司与厦门大学联合研发的声纹识别引擎(tsVPR),集成国际先进的说话人模型技术,能够依据较短的语音,自动鉴别说话人的身份。第三方可调用天聪声纹识别引擎提供的API接口,实现远程(电话或网络)身份认证的应用。

特别地,tsVPR可与先进的CTI系统无缝集成,实时进行多因子声纹验证,可广泛应用于安全访问呼叫中心、个人银行业务或者司法监控系统等金融和司法领域。

  • 语音采集要求
  1. 信噪比:>25dB;
  2. 录音距离:30cm~1m;
  3. 采样率:8KHz;
  4. 量化位数:8bit或16bit。
  • 语音文件格式

主要为WAV格式:

  1. 8k 8bit PCM(a律压缩/μ律压缩);
  2. 8k 16bit PCM。
  • 技术性能指标
  1. 同信道识别:FAR < 0.5%,FRR < 3%;
  2. 跨信道识别:FAR < 1%,FRR < 5%。
 
二、    主要应用领域

公安、司法:公安110是我国公安机关的品牌,被誉为“人民的保护神”。然而,骚扰电话却如黑暗中的潜伏者,严重干扰110的正常运作。由于报警的过程中主要是通过双方交流的电话语音来完成,因此,跟系统相关的一系列认证,将主要采用声纹认证的方式来完成,即根据说话人的声音特征确定说话人身份。在司法社区矫正应用中,通过识别定位手机位置和呼叫对象说话声音的个人特征,我们的系统就可以快速的自动判断被监控人是否在规定的时间出现在规定的场所,有效地解决人机分离问题。

银行、证券:鉴于密码的安全性不高,可以用声纹识别技术对电话银行、远程炒股等业务中的用户身份进行确认,为了提高安全性,还可以采取一些其他措施,如密码和声纹双保险,如随机提示文本用文本相关的声纹识别技术进行身份确认(随机提示文本保证无法用事先录好的声音去冒充),甚至可以把交易时的声音录下来以备查询。

军队和国防:声纹辨认技术可以察觉电话交谈过程中是否有关键说话人出现,继而对交谈的内容进行跟踪(战场环境监听);在通过电话发出军事指令时,可以对发出命令的人的身份进行确认(敌我指战员鉴别)。目前该技术在国外军事方面已经有所应用。据报道,迫降在我国海南机场的美军EP-3侦察机中就载有类似的声纹识别侦听模块。

咨询电话:0592-5998813   18859277229(叶)
联系邮箱:sales@talentedsoft.com

标签:声纹识别   声纹引擎   声纹开发   VPR   

天聪公司与南京世格软件的成功合作,开辟了声纹识别技术在远程教育上的新篇章!

现代远程教育是将计算机技术、多媒体技术、网络与通信技术和现代教育技术相结合的一种新的教育方式。现代远程教育的网络应用系统属于协同的通信系统,它在教师与学生之间的多个通信实体之间进行协同的群体通信。对于群体的通信环境,使用多播的数据传输方式可以有效的节约网络带宽和提高群体之间通信效率。因此多播在现代远程教育中得到了广泛的应用,如教师授课的视频直播、师生网上的交互讨论以及基于网络的协同虚拟实验等现代远程教育应用系统中都可采用多播的数据传输方式。

但是远程教育的单播、多播都存在着安全问题。由于多播是一种群体之间的通信方式,因此相对于只是涉及一对通信实体的单播通信来说,多播的安全问题也要远远复杂于单播。

而有了声纹识别技术的嵌入,声纹识别是是根据认得声音特征识别出某段语音是谁说的。每个人的指纹是唯一的,与此类似,声纹也是人的个性特征,很难找到两个声纹完全一样的人,这就从理论上为可靠的声纹识别提供了可能。

声纹识别技术对于远程教育的安全性、适用性起到了很好的保障、保护层作用。