欢迎来到得力文库 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
得力文库 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    《语音识别技术》PPT课件.ppt

    • 资源ID:72436748       资源大小:1.13MB        全文页数:16页
    • 资源格式: PPT        下载积分:11.9金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要11.9金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    《语音识别技术》PPT课件.ppt

    语音识别技术的前世今生语音识别技术的前世今生语音识别之语音信号语音识别之语音信号特征提取技术特征提取技术科大讯飞 Siri语音识别与语音信号语音识别与语音信号语音识别语音识别:能把语言和语声转换成可进行处理的信息的过程.语音信号语音信号:冗余度很高的随机信号,必须经过特征提取才能有效地降低信号的冗余度,而语音特征的提取又是通过对语音信号的分析来获得表征语音信号的参数的.语音识别五大问题对自然语言的识别和理解。首先必须将连续的讲话分解为词、音素等单位,其次要建立一个理解语义的规则。语音信息量大。语音模式不仅对不同的说话人不同,对同一说话人也是不同的,例如,一个说话人在随意说话和认真说话时的语音信息是不同的。一个人的说话方式随着时间变化。语音的模糊性。说话者在讲话时,不同的词可能听起来是相似的。这在英语和汉语中常见。单个字母或词、字的语音特性受上下文的影响,以致改变了重音、音调、音量和发音速度等。环境噪声和干扰对语音识别有严重影响,致使识别率低。LPC基本思想:一个语音的采样能够用过去若干个语音采样的线性组合来逼近。通过使线性预测的采样在最小均方误差意义上逼近实际语音采样,可以求取一组唯一的预测系数。这里的预测系数就是线性组合中所用的加权系数。这种线性预测分析技术最早用于语音编码中,因此也常被简称为LPC。目前进行语音特征分析的最有效、最重要的方法之一是线性预测分析(LPC)法,这是由于:1.它有效地解决了短时平稳信号的模型化问题,可把语音信号看成是由全极点模型产生的;2.能很好地逼近共振峰,提供谱估计;3.提供的语音信号模型参数(如基音、共振峰、谱、声道面积函数等)简洁而准确,计算量较小,便于实时处理;4.可用于低数率传输的环境;5.将LPC参数形成的模型参数储存起来,在语音识别中提高识别率和减少识别时间。LPC的基本概念是:语音的每个样值均可由过去若干个样值的线性组合来逼近,同时可采用使实际语音抽样与线性预测抽样之间的均方差最小的方式,来解出一组预测的系数。LPC系数算出后,就可以直接进行倒谱系数C(k)的计算,语音信号特征的提取如图所示,主要包括主要包括A/D转换、端点检测、预加重、加窗、自相关序列、LPC系数、倒谱系数计算等等.AD转换转换就是模数转换,就是把模拟信号转换成数字信号。端点检测端点检测就是从包含语音的一段信号中准确地确定语音的起始点和终止点,区分语音和非语音号,它是语音处理技术中的一个重要方面。预加重预加重是一阶网络,用来对语音信号进行高频提升,可由软件来实现。预加重的作用加窗加窗是为了进行短时分析必须加窗,这在理论上应使用两端具有平滑过渡特性的窗口,如汉明窗口,以减小在信号两端处的预测误差,并避免频谱出现“破碎”现象。结论根据以上提取和分析的过程,可以得出以下结论:(1)在语音特征的提取中,预加重和汉明窗两部分是必不可少的,其参数的选取关系决定了提取语音特征的正确与否;(2)LPC是语音分析的重要手段,因LPC系数能很好地进行谱估计,即可作为语音特征的参数,因此仅用12个LPC系数就能很好地表示复杂语音信号的特征,这就大大降低了信号的冗余度,并有效地减少了计算量和存储量,使之成为语音识别和语音压缩的基础;(3)倒谱也是语音的特征参数,是研究系统特性的有效数据,在实际运作中大多数语音识别系统都会采用倒谱参数来作为有关距离的度量。

    注意事项

    本文(《语音识别技术》PPT课件.ppt)为本站会员(wuy****n92)主动上传,得力文库 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知得力文库 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于得利文库 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

    © 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

    黑龙江省互联网违法和不良信息举报
    举报电话:0468-3380021 邮箱:hgswwxb@163.com  

    收起
    展开