位置：首页 > 文章资讯 > 资讯百科>“时代在变我们对技术的追求不变。”炬芯科技Actions专访

“时代在变我们对技术的追求不变。”炬芯科技Actions专访

发布时间：2019-10-31

来源：本站整理

所属频道：资讯百科

　　　若说当今时代的关键词 “ AIoT ”当之无愧。“ AIoT ”也就是“AI+IoT ” 指的是人工智能技术与物联网在实际应用中的落地融合。目前越来越多的行业及应用将 AI 与 IoT 结合到了一起 AIoT 已经成为各大传统行业智能化升级的最佳通道也是未来物联网发展的必然趋势。

　　作为人工智能应用最成熟的技术之一智能语音技术在 AIoT 领域应用十分广泛。B 端的医疗教育行业;C 端的智能手机智能家居智能穿戴设备中智能语音技术的新赋能都让我们都看到了这项新技术给我们生活带来的巨大改变。

　　　　根据中投顾问发布的《 2018-2022 年中国智能语音行业深度调研及投资前景预测报告》显示智能语音应用将是人工智能发展的重点方向。

　　目前国家正在加快人工智能的产业布局发布多项利好政策促进人工智能产业发展;5G 时代的来临更是为人工智能的发展培育了一片物联网沃土。我们可以预见智能语音作为下一代人机交互的新入口将率先在这片人工智能的沃土上生根发力推动整个产业的茁壮成长。

　　　　中国企业在智能语音领域表现突出创新创业日益活跃还有搜狗智能语音等一批龙头企业加速成长在国际上获得广泛关注和认可。

　　目前智能语音在语音拾取语音分析和语义理解等核心技术环节取得了多项重大突破智能语音技术已经呈现一种整体的解决方案。

　　在声音处理的整体解决方案中第一步也是最关键的一步——

　　如何将人的声音传达至机器让机器“听到” “听清”且“听懂”?

　　“听到”和“听清”在技术上又是如何实现?

　　相关技术上现在有哪些难点和突破?......

　　基于对人工智能行业的智能语音技术发展现状的好奇国内多家知名科技媒体一同来到中国领先消费类芯片原厂炬芯科技一起探索新时代智能语音技术将给我们的生活带来什么改变!

　　炬芯技术市场专家陶永耀应邀接受了媒体的群访为大家一一解开关于智能语音技术的奥秘以及AIoT 行业发展的种种疑惑。

　　陶永耀技术市场专家

　　炬芯“技术劳模” 对声音技术有着独特的见解深受行业人士认可。

　　　　为帮助大家理解陶永耀先就声音的工作原理以及智能语音技术中的关键：声音前处理技术做了简单的科普。我们也一起来学习下吧!

　　声音的工作原理

　　　　△语音处理数据流

　　声音应用的三个主要场景：

　　? 声音的传输例如打电话通过声音传输让通话功能实现;

　　? 声音的存储例如录音播放 CD 等等;

　　? 声音的识别就是语音交互体验

　　而声音的前处理技术和声音的后处理技术就是上述场景实现的关键。

　　声音的后处理技术是声音经过存储之后进行播放的同时处理。是对音源例如 MP3 等媒体解码播放的声音进音效增强处理。(例如虚拟重低音环绕立体声高音增强 EQ 等等。)

　　声音的前处理技术是声音没有进入传输没有存储之前的处理。声音前处理目的就是让声音的存储传输效率更高识别率更好。(例如回声消除降噪声音活动检测等等。)

　　炬芯在过去三十多年一直在进行声音的处理工作例如 MP3 (声音的后处理技术) 录音笔等声音的保留存储(声音的前处理) 声音的麦克风识别声音的回声消除及降噪(声音的前处理) 后期的音效增强(声音的后处理技术)等等。

　　智能语音终端设备关键——声音前处理技术

　　声音前处理技术其实是解决机器“听到”和“听清”两件事从而达到“听懂”的目的。

　　声音的“听到”主要依托的是麦克风。主要形式为单个麦克风或麦克风阵列(多个麦克风按照一定规则排列在特定空间对声音进行获取和处理)。

　　而基于麦克风的语音信号处理算法则是让声音“听懂”的关键。麦克风+算法在不同的环境下排列组合最终达到“听到”和“听懂”。

　　我们可以根据距离将声音的前处理分为分为远场拾音(3 到 5 米)和近场拾音(1 米内)。

　　近场拾音一般采用的是单麦克风可在近距离低噪声的情况下拾取符合语音识别需求的声音。但是一旦将智能手机放在有噪声的较远的距离语音助手的识别率就会直线下降单麦克风的局限就凸显了出来。

　　远场拾音由于距离噪声混响等因素远场拾音多采用多麦克风阵列并且和远场语音识别算法相匹配。

　　通过陶永耀对声音工作原理及声音前处理技术的重点讲解对声音技术有进一步了解众媒体纷纷对炬芯的技术发展进一步提出疑问我们也将相关热门问题及回答罗列出来和大家一起分享!

　　炬芯在声音前处理方面都有哪些独家优势?

　　炬芯的主要优势在于我们一直在做系统集成 SoC 芯片硬件技术跟软件技术能够完美结合。凭借多年的经验炬芯在声音采集的精度速度上有很好的基础并且通过声音处理算法硬件化等方式能够将芯片的功耗和性价比维持在行业领先位置。

　　炬芯在声音前处理技术上已经覆盖了哪些行业及落地了哪类产品?

　　我们现在主要的产品包括儿童录音笔故事机蓝牙音箱等等。在技术方面主要包含了声音的降噪回声消除技术抗混响技术在线语音识别。

　　同时炬芯也在拓展一些新领域例如智能家居和智能家电领域。在这个方向上炬芯会更多的关注离线识别技术(离线语音技术可以避免在线技术网络不稳定联网难人的隐私被曝光等问题;并在较短反应时间内实现家电的控制。)。

　　最近炬芯在推广的智能耳穿戴产品就融合了离线和在线的语音识别功能。我们可以通过有限的命令词条实现一些命令控制也可以通过手机和云上识别去实现一些语义理解命令。离在线结合的识别技术将是未来技术发展的一个重要方向。

　　在未来声音前处理技术还有哪些难点需要攻克?

　　第一如何让机器听懂是我们在技术上需要持续关注的问题。让机器听最大的难点在于机器的识别率和误识别率这两个比率也是未来需要不断地持续发展提高的。需要特别指出的是：机器的识别率和误识别率即听对听错的概率相互之间还存在互相制约平衡的关系。

　　第二是在拾取声音的环境方面。声音的拾取除了受自己的回声和环境混响影响还受环境中各类的噪声影响。各种稳态和非稳态的噪声都需要我们通过声音前处理技术进行处理。如何处理各种稳态的噪声和非稳态的噪声也将是未来需要持续关注的技术难点。

　　对于 AIoT 的发展趋势和相关的行业机会怎么看?

　　AIoT 是必然的发展趋势而技术又是一个长期的研发和投入的过程。在技术的发展过程当中我们发现强人工智能落地是一场持久战但弱人工智能在某些场景下能够切实解决人们的一些需求。因此当一些适应场景的 AI 市场机会出现时我们也需要把握住市场机会。

　　AIoT 是一场持久战短期长期的技术研发及市场收益需要我们不断的平衡与发展。

　　想了解更多精彩采访内容请点击下方采访视频!

　　视频链接：https://v.qq.com/x/page/o301466fbwl.html

　　众所周知炬芯科技多年来一直为无线音频及智能耳穿戴智能多媒体智慧计算及物联网等产品领域提供专业芯片及完整解决方案。尤其在声音领域炬芯已经推出了众多音频和智能机器人等方案在语音交互体验方面已经处于行业领先地位落地产品深受国内外品牌商的青睐。

　　因为炬芯在“声音”领域持续耕耘二十多年的技术积累以及与高要求品牌商深度合作的实战经验让炬芯在行业一直处于领先地位。

　　AIoT 新时代将至炬芯将持续不断的追求技术上的深耕发展用更好的技术带给人们更美好的生活体验!

“时代在变 我们对技术的追求不变。”炬芯科技Actions专访

“时代在变我们对技术的追求不变。”炬芯科技Actions专访