企业为什么需要智能语音质检?

  

       随着近十年人工智能技术的发展,语音和自然语音处理技术不断取得突破,采用智能化的方法对电话语音中的内容进行深层次的分析,可以有效的节约人力成本并提高工作效率。就现在技术而言,语音质检方案主要涉及语音关键词检索、音频对比、情感识别等核心技术。


  跳出传统质检,解读智能语音质检,从关键词检索到情感识别

语音质检.jpg

  一、关键词检索功能


  基于语音识别技术,关键词检索是将语音识别的结果构建成一个索引数据库,然后把关键词从索引数据库中找出来。首先将语音数据进行识别处理,从里面提取索引构建索引数据库,在进行关键词检索的时候,找到概率最高的,输入其关键词匹配结果。


  确定关键词检索网络后,接下来进行的是关键词检索。关键词检索可以基于音节信息。首先将用户设定的关键词文本解析成音节序列,再从检索网络中找出匹配结果,相比直接对文本结果进行检索,这种方法的容错性更强,因此,计算量更小,执行效率更高,更适用于语音质检这种海量数据检索的应用场景。


  跳出传统质检,解读智能语音质检,从关键词检索到情感识别


  二、音频对比


  音频比对是指从音频信号提取特征,通过特征进行比对的方法进行有害信息检索的方法。该方法的核心在于提取的特征值需要满足一定的要求,比如抗噪性、转换不变性、鲁棒性、快速性等特点,主要是为了满足同一音频能够在不同声道下进行准确检索。


  传统的声学特征已经不能满足音频比对任务的需求。所以在完成最大值点完成建模后,需要进行特征的构建,而特征构建是通过最大值点之间的距离来建模,例如两个最大值点的距离、位置信息作为一个固定的特征来完成音频特征信息的构建。


  有了上述音频特征之后,就可以对两个不同音频进行检索,最大相似度的地方就是相似点,这种技术最适用于文本内容无关的录音片段的检索。


  跳出传统质检,解读智能语音质检,从关键词检索到情感识别


  三、情感识别


  语音是人类交际的最重要的工具之一。人们在进行自然口语对话时,不仅传递声音,更重要的是传递说话人的情感状态、态度、意图等。根据情感模型的不同,情感语音识别主要分为离散情感识别和连续情感语音识别。


      离散情感识别是一个典型的模式分类问题,各种传统的分类器均被广泛应用于语音情感识别系统,例如隐马尔科夫模型、高斯混合模型、支持向量机,人工神经网络等。维度情感识别一般被建模为回归预测问题。


热门新闻

微信

华云天下微信公众号

微博

华云天下微博互动空间