本文目录
什么是语音技术
语音技术,一般指语音合成技术和语音识别技术。
分为:
语音合成即Text to Speech(TTS),就是让设备将文本信息转换成语音的形式朗读出来,就像给设备安装上了嘴巴。微软在此领域处于领先地位并有释出产品Microsoft Reader,一个优秀且免费的标准美音TTS。而中文TTS领域则有安徽科大讯飞,其产品讯飞语音电子书,收费软件价格 49元。
语音识别即Automatic Speech Recognition(ASR),就是让设备听懂人的语言。就像给设备安装了耳朵。
总之,语音技术就是让设备“能听会说”,使其更加智能化、人性化。
语音识别的技术原理是什么
语音识别的技术原理是将一段语音信号转换成相对应的文本信息,系统主要包含特征提取、声学模型,语言模型以及字典与解码四大部分,其中为了更有效地提取特征往往还需要对所采集到的声音信号进行滤波、分帧等预处理工作,把要分析的信号从原始信号中提取出来。
之后,特征提取工作将声音信号从时域转换到频域,为声学模型提供合适的特征向量;声学模型中再根据声学特性计算每一个特征向量在声学特征上的得分;而语言模型则根据语言学相关的理论,计算该声音信号对应可能词组序列的概率;最后根据已有的字典,对词组序列进行解码,得到最后可能的文本表示。-语音技术
作为语音识别的前提与基础,语音信号的预处理过程至关重要。在最终进行模板匹配的时候,是将输入语音信号的特征参数同模板库中的特征参数进行对比,因此,只有在预处理阶段得到能够表征语音信号本质特征的特征参数,才能够将这些特征参数进行匹配进行识别率高的语音识别。-技术
语音技术的介绍
语音技术在计算机领域中的关键技术有自动语音识别技术(ASR)和语音合成技术(TTS)。让计算机能听、能看、能说、能感觉,是未来人机交互的发展方向,其中语音成为未来最被看好的人机交互方式,语音比其他的交互方式有更多的优势。-语音技术
目前的语音识别技术在哪些方面还有提升空间,未来有哪些应用前景
咨询记录 · 回答于2021-10-31
目前的语音识别技术在哪些方面还有提升空间,未来有哪些应用前景
语音识别技术,也被称为自动语音识别Automatic Speech Recognition,(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合,可以构建出更加复杂的应用,例如语音到语音的翻译。
-技术
语音技术的研究方向主要有
语音技术在计算机领域中的关键技术有自动语音识别技术(ASR)和语音合成技术(TTS)。
让计算机能听、能看、能说、能感觉,是未来人机交互的发展方向,其中语音成为未来最被看好的人机交互方式,语音比其他的交互方式有更多的优势。
最早的语音技术因“自动翻译电话”计划而起,包含了语音识别、自然语言理解和语音合成三项非常主要的技术。语音识别的研究工作可以追溯到20世纪50年代AT&T贝尔实验室的Audry系统,此后研究者们逐步突破了大词汇量、连续语音和非特定人这三大障碍。
让计算机说话需要用到语音合成技术,其核心是文语转换技术(TexttoSpeech),语音合成甚至已经应用到汽车的信息系统上,车主可以将下载到系统电脑中的文本文件、电子邮件、网络新闻或小说,转换成语音在车内收听。
-语音技术