监区受控电话通信与声纹识别系统

2018-09-05 ken

监区是一个特殊的场所,在监狱,戒毒所和看守所,都要成为监区的场所,只是名字不一样,都是强制隔离的一个封闭性的区域,监区(戒毒所一般成为戒治区)里面对信息安全有特殊的要求,一般与外界都隔离状态。可以狱警、戒毒警和看守所的警察,必须在监区里面工作。以监狱为例,以前狱警经常处于失联状态,有些狱警设置铤而走险违规把手机带进监区,在一些被查处的恶劣案例中,不乏狱警与监区里的牢头狱霸相互勾结,为他们提供通信工具。为此,监狱里面的对外通信一般采取多种安全措施,也就是所谓的“受控通信”。

监狱里面的通信安全措施很多,在监区内,会在移动警务后台,对每个狱警或者戒毒警的手机设置几个白名单,只有白名单的电话从能打进出(含短信),白名单外都是黑名单,黑名单无法通过警务手机打进打出;设置黑白名单,只是管住了监区外的那一端电话(相对于监区内的警务手机而已)。同时,狱警手机支持声纹系统,警务手机都绑定了对应狱警的声纹密码,在监区内,只有狱警本人才能通话,否则电话会自动挂断(截停);为了防止特殊情况下犯人使用狱警手机,警务手机支持指纹认证功能,狱警只有通过指纹开锁,并在通话中指纹长按指纹感应其实,放开通电话,如果手机离开指纹键,电话自动终端。通过声纹和指纹认证,又管住了电话通信的这样一端。同时在指挥后台可以设置监区内外通话的录音,监听功能。通过这三种方案,可以确保电话通讯的安全。同时,监狱的通信都支持录音,监听,截停定功能。下面重点介绍一下监狱声纹系统的一般原理和部署方式。

1、技术原理

人的声音与指纹、虹膜一样,具有生物特征的唯一性。讲话者的声音经过计算机分析处理后,就会得到声纹图谱。一个人从少年变声期结束到老年变声期到来这段漫长的时间内,声纹特征是基本不变的,每个人的声带长短、松紧各不相同,声道形状也互有差异,即使是声音极其相似的孪生兄弟,声纹也有差异,无法伪造和模仿。

声纹识别系统充分利用了网络技术、视音频媒体技术、以及生物认证技术等多种现代信息技术进行综合分析处理的系统。该系统主要包括语音采集模块,声纹建模模块以及说话人声纹比对模块。语音采集模块是通过抓包软件来提取原电话系统中的通过语音,并传输到服务器上,进行语音分析处理,提取其特征。该语音若是用来建模的数据则建立相应的模型,并保存到模型数据库中;该语音若是用来分析其中涉及到的说话人身份信息,则进行相应的辨别处理。

2、 系统集成方式

在原有的电话系统上集成声纹识别功能,即利用SIP协议通过抓包软件来提取原电话系统中的语音,把通话语音录制并传输到声纹系统中,或进行声纹建模或进行识别,如下图

clip_image002.gif

 

录音模块:利用SIP协议通过抓包软件来实现对原电话系统语音的录制。并将录制的语音传输到声纹系统中。

 声纹系统:对传输上来的语音进行处理,包括声纹建模和声纹识别,声纹建模后把声纹模型保存到声纹模型库中,声纹识别的结果保存到数据库中或推送给原来的业务系统,原业务系统可以根据接收到的识别结果进行处理。

 

 

3、声纹建模与识别

3.1、语音声纹建模

声纹建模有两种方式,一种是离线声纹建模,一种是在线声纹建模。离线声纹建模主要针对事先已经采集好的语音来进行建模的。在线声纹建模主要针对电话系统中录制的人员语音信息的进行建模。

 

建模过程如下:

clip_image004.jpg

 

 

离线语音声纹建模

离线建模,即将事先录制好的语音通过声纹系统中的建模模块来实现。例如,已经录制的大量人员的语音信息,可以通过离线的方式进行声纹模型训练,把这些语音训练成对应的声纹模型,并保存到模型数据库中。

对需要建模的语音进行预处理,把不符合要求的语音剔除,例如语音太短的,噪声太大等语音剔除,不进行声纹建模。


在线语音声纹建模

在线建模,即对通话中录制的语音进行建模。声纹系统管理软件中可以对录制的语音进行播放,人工试听。在确认是同一个人的语音后,可点击训练按键进行模型训练,并返回结果,若训练成功则把相应的模型保存到模型数据库中。

在线建模流程如下:

clip_image005.png

 

3.2声纹识别

该系统主要是针对电话系统中提取的语音进行声纹识别。提取录制下的语音是单通道的,即只有通过一方的语音。识别是基于有效的语音段进行的。即将通话中的语音流进行累计,当每次累计到10s的有效语音后,就进行一次识别。每次识别都将与模型数据库中的每个模型进行比对,将识别结果反馈给业务平台,业务平台可以对声纹识别反馈的结果进行处理,例如发出警报,挂断电话等。

其中累计的有效语音时长,可以根据实际应用中的语音数据进行适当的调整。识别的流程如下所示:

clip_image007.png

 

 

3.3 其他功能

声纹系统除了声纹建模和声纹识别外,还可以查询通话记录,播放录制下的语音,语音数据管理和声纹模型管理,人员信息管理等。