消息,7月7日,中国计算机学会(CCF)主办,与香港中文大学(深圳)主办的第二届CCF-GAIR全球人工智能与机器人峰会在深圳如期揭幕。大会迅速过去了一半,在今日机器人专场的下半场,声智科技创始人兼任CEO,中科院声学所博士陈孝良先生为我们讲解了人机语音交互的技术趋势与商业机遇。陈先生在(公众号:)亦有专栏文章,青睐读者前往读者。
以下是整理的演说主要内容:从全球上看,智能音响引发了许多巨头注目,它很有可能是人工智能的下一个入口。从交互的方式上看,PC到互联网在到AI,嵌入式的方式也发生变化,从鼠标改向触摸屏,现在AI将以语音作为主要输出方式,与其他方式互相融合。从商业模式上看,市场是确认的,从蓝牙音响升级到智能音响,决策成本低,可以用原本的市场重构。
从创意角度上看,远场语音交互能造就全球智能链条的创意。大约分成四个层次的创意:底层还包括器件、芯片、模组,上一层还包括VOS、网络,然后是产品,后面回来内容服务,都必须根据语音交互的变革来展开适当的转变。从技术方面看,智能音响还面对着一些问题:1. 远场的语音辨识的问题:远场所指的是简单的实际环境。
声源与麦克风的距离较近,不会经常出现其他声音阻碍的情况2. 矢量麦克风的技术提升:矢量麦克风是下一步的麦克风,更加很远一点。中间不会特一层智能麦克风。国内的矢量麦克风技术还比较落后3. 芯片:在注重人工智能的芯片上,国内技术竞争力还较为较低4. 算法:声学的技术较为堵塞,如何维持国内的技术领先,也是个较为大的挑战此外,智能音响还面对着商业化挑战,在产品、内容和服务,以及知识产权上,我国都面对着挑战。
陈先生还预测了智能音响发展趋势:1. 智能麦克风2. 解决问题芯片架构3. 多传感融合,麦克风和视频、雷达三者融合4. 算法和模型必须更进一步研究最后陈先生还对比了国内外产品定位的差异:国内的产品大多不会命名为音箱,而国外的产品则防止用于Speaker。陈先生还提及了在智能音响上,一些巨头对产业生态的影响力还是不可忽视的。原创文章,予以许可禁令刊登。
下文闻刊登须知。
本文来源:必威·betway(China)官方网站-www.r-lifeassist.com
Copyright © 2006-2024 www.r-lifeassist.com. 必威·betway(China)官方网站科技 版权所有 备案号:ICP备23637310号-1