【科普之声】我科普 你聆听(九十五)“siri”“天猫精灵”等智能语音产品是怎么工作的?

2021-11-16 10:27:34   
浏览量 30134

图片


图片
图片

siri ”、“小爱同学”、“天猫精灵”,这些智能语音产品已经深入人们的生活当中,为工作生活等提供不少便利。它们又是怎样进行工作的呢?

专家

解读

图片

现在的物联网、智能家居、VR/AR、智能汽车,越来越多的产业,越来越多的场景,都对语音行业的各个方面提出了更深层次的需求,各类智能语音产品也层出不穷。
Siri是大家比较熟知的一款语音助手,很多人也会经常使用它。从用户说话开始,到Siri的语音反馈,其实是经历了很多步骤的。
第一步叫做语音识别,就是将麦克风采集到的用户声音转化为文字的过程。技术原理是:麦克风收集用户声音,软件对音频进行特征提取处理。特征提取之后,结合大量数据训练出的声学模型和语言模型,通过语音解码和搜索算法最终将音频输出为文字。
第二步叫自然语义理解,就是将人类语言转化为标注的机器能理解的语言,例如把转化成文字后的两句话“给张三打电话”和“打电话给张三”理解成同样的操作。
第三步叫自然语言生成,与自然语义理解相反,是将机器的语言转化为人类语言,这个阶段的输出是文字;
最后一个阶段是语音合成,是将文字合成声音并播放出来,并尽可能的模仿人类自然说话的语音语调,给人以交谈的感觉。如我们在使用地图导航时选择林志玲的导航提示,这就是语音合成技术的典型应用,往往这类明星语音合成的功能,需要走录音、标注、建模、优化等几个步骤。
虽然只是普通的一句对话,但却经历了种种步骤,而且每个步骤都是一个庞大的领域。其中自然语言处理,包括自然语义理解和自然语言生成两个方面,是语音产品的关键,也是主要难点,涉及到众多的技术领域,包括中文分词、词性标注、句法分析、知识管理、情感认知等等。


(来源:科普九江)


责任编辑:高圣杰

审校编辑:张江艳

值班总编:朱静

继续阅读
热门评论

扫一扫二维码下载掌中九江

咨询热线:0792-8505892

Copyright © jiujiangzhangkongchuanmei. All Rights Reserved

赣ICP备13005689号

赣公网安备 36040302000178号

互联网新闻信息服务许可证36120190002号