技术:
GPU/CPU 传感器 基础元器件 网络通信 显示 交互技术 电源管理 材料 操作系统 APP 云技术 大数据 人工智能 制造 其它
应用:
可穿戴设备 智能家居 VR/AR 机器人 无人机 手机数码 汽车 平衡车/自行车 医疗健康 运动设备 美颜塑身 早教/玩具 安防监控 智能照明 其它
当前位置:

OFweek智能硬件网

传感器

正文

解析谷歌、亚马逊两强智能语音助理优势、硬件、软件及发展趋势

导读: 科技产品的革新浪潮因为人工智能、深度学习、自然语言处理等等技术而再次启动,许多老企业新公司相继投入进行研发或推出各种产品与应用,也为新创团队创造许多加入市场的机会。

OFweek智能硬件网讯 科技产品的革新浪潮因为人工智能、深度学习、自然语言处理等等技术而再次启动,许多老企业新公司相继投入进行研发或推出各种产品与应用,也为新创团队创造许多加入市场的机会。参加竞赛是新创团队获取曝光、资金、辅导、专业咨询等等资源的场域,更有机会与大企业合作,做为信息通讯领域新创团队的推手之一,“Mobileheros通讯大赛”已经举办了15年,更以促进新创意、新技术、新应用为出发点,召募众家好手参与竞赛,今年将鼓励团队运用各种人工智能技术,打造智能家居、智慧城市的装置及应用,让作品更有温度、更加人性化、更能聪明的满足使用者需求。

人工智能的相关技术很多,其中智能语音助理因为 Amazon Alexa 已为许多硬件产品所用,具有“动口不动手”极为方便的使用方式,并与使用者的需求及工作、生活情境关联性强,因此本文以智能语音助理为主题,从说明亚马逊/Google两强优势开始,提供他山之石做为参考,并逐一解析硬件/软件技术及发展趋势,期待让有意参加2017年通讯大赛的团队获得启发,同时给任何想投入此领域的团队做为参考。

从 Amazon Alexa 看智能助理的应用:智能助理高智商、数字服务一手包

亚马逊Amazon的家用音乐播放器Echo依靠具备人工智能的Alexa,窜起成为数字家庭中枢,2017年CES几乎就是其主场,家电搭载Alexa瞬间智慧上身,从食衣住行到柴米油盐酱醋茶,俨然就是全能的智能小管家,其中核心的关键就在具备语意识别能力的自然语言处理技术,在使用各种数字服务时,可以动“口”不动手。

Echo 于2016年在北美家庭掀起一波热潮,原本产品里小小的巧思-语音助理Alexa立了大功,也造就2017年初美国消费性电子展CES,没有参展的Amazon竟然大出风头。家用音乐播放器根本就是老掉牙的产品、数字语音助理也不是甚么新玩意,为什么竟能将早就被打入冷宫的数位家庭再度炒热?加入了人工智能(Artificial Intelligence, AI)、深度学习(Deep Learning)、自然语言处理(Natural Language Processing, NLP)的智能家居助理,可能会卷起下一波科技产业革命的大浪潮。

从智能家居助理的功能与型态来看,硕网信息总经理邱仁钿指出,数字生活助理以Echo为例,可以协助人们处理所有可数字化的工作或服务,这部分装置可再延伸到像Pepper、Zenbo、RoBoHon、Kirobo Mini等具备移动能力,除了数字服务之外还提供学习或陪伴功能的机器人。另外,提供家事服务的扫地、拖地、擦玻璃、煮饭等无法数字化的服务,目前市面上已有多种单一服务的产品,但具备更智能化,可以处理复合式工作与突发状况的家事机器人则还需要至少五到十年后才会看到。

解析谷歌、亚马逊两强智能语音助理优势、硬件、软件及发展趋势

▲硕网科技总经理邱仁钿指出,智能助理可协助人们处理数字化的服务,提供更便利的生活质量。

在语音识别与人工智能结合之后,利用语音指令操作硬设备出现重大突破。亚马逊在2014年底正式推出Echo声控扬声器,并可透过其内建的Alexa语音助理,为用户提供查询天气、订购商品、控制家中其他电器设备等种种应用服务。

Echo推出后,不仅引发话题,更在消费市场上获得欢迎。据研究机构Consumer Intelligence Research Partners预估,自2014年底上市以来,Echo扬声器在美国已卖出超过510万台。由于Echo扬声器并非个人消费性电子产品,其销售型态比较接近一户一台,因此510万台这个数字已相当可观。

有智慧的语音识别:Amazon、Google 两强相争

就在Echo扬声器取得重大成功之后,同样在人工智能领域有深入布局的Google,在2016年底发表Google Home,该产品同样是搭载语音助理及人工智能的扬声器,与Echo在本质上并无太大差异。不过,由于Google本身已经有相当多样化的云端服务,因此Google Home所搭载的Google Assistant语音助理,未来很可能会与自家的其他服务进一步结合,以便满足消费者各式各样的需求。

但亚马逊也不是省油的灯,或许是早已预料到其他大厂也将加入智能扬声器战局,该公司早在Echo推出后半年,便宣布将开放Alexa服务给其他开发商使用,同时还提供相关硬件开发工具包给其他公司,要借助生态系的力量来拉开与其他竞争平台的差距。截至目前为止,Alexa已经有上万项技能(Skills,类似智能型手机上的App)可供使用者下载,涵盖领域包含天气预报、新闻、家庭自动化控制、教育、运动健身等。

解析谷歌、亚马逊两强智能语音助理优势、硬件、软件及发展趋势

▲Echo扬声器所搭载的Alexa语音助理,已经成为一个庞大的生态系统。(数据源:亚马逊)

硬件面:麦克风技术、语音讯号处理器商机涌现

智能语音助理与硬件结合成为优秀的产品或服务,关键包括硬件、软件与云端。在硬件面,收音系统的设计涉及许多声学上的专业及复杂的算法,例如指向性收音、回音消除、背景噪音消除等。而在软件面,系统除了要听得懂各种自然语言外,还得考虑各地方腔调、习惯用语等变量,才能提供精准的识别结果,并进一步将其中的关键词萃取出来,转化成系统能理解的指令。

智能扬声器的使用者体验好坏,主要涉及四大环节,分别是收音麦克风、语音处理器、语音识别引擎以及云端上各种应用服务。其中,收音麦克风的设计,是智能扬声器能否精准识别用户指令的第一道关卡。

一般来说,驻极体麦克风(ECM)的讯噪比(SNR)是最好的,可达70dB以上。截至目前为止,专业录音室所使用的麦克风,基本上都还是ECM的天下。不过,微机电(MEMS)麦克风的讯噪比近年来也有显著改善,目前业界的水平可以做到64~65dB,与ECM的差距正在拉近。

不过,ECM有一个先天的缺点,就是采用数组式设计时,ECM麦克风模块的组装加工较为困难,MEMS则没有这个问题,在大量生产时,加工相对简便。不过,MEMS麦克风先天上对低频的反应不如ECM麦克风,这也是应用开发商在选择麦克风组件时,必须特别注意的。

因此,就智能扬声器应用来说,未来应该会是以MEMS麦克风为主流。毕竟,在采用数组式架构的前提下,MEMS麦克风有很明显的优势。目前市面上的智能扬声器,绝大多数都是采用数组式麦克风,例如中国科大讯飞和电商平台京东联合成立的灵隆科技,便推出了采用五颗麦克风的叮咚音箱,亚马逊的Echo则内建七颗麦克风(图3),Google Home则只有两颗。

解析谷歌、亚马逊两强智能语音助理优势、硬件、软件及发展趋势

▲Echo扬声器顶端的周围与正中央,一共内建了七颗MEMS麦克风。(数据源:iFixit)

在麦克风接收到声音讯号后,后续的噪音消除、回声消除、音源追踪、背景音消除等功能,原则上都是透过语音处理器搭配各种专用算法来实现,有些则可以透过更后段的语音识别引擎来处理。不管是微处理器(MPU)或数字信号处理器(DSP),都可以扮演语音处理器的角色。

目前市场上最主要的语音处理器供货商,除了与亚马逊结盟的科胜讯(Connexant)之外,台湾本土IC设计公司骅讯、瑞昱、新唐也都有芯片解决方案。楼氏电子(Knowles)则为了强化其麦克风业务布局的完整性,购并了语音处理技术公司Audience。据了解,联发科内部也有一支研究团队正在研究相关题目,更有意要打进亚马逊供应链。

事实上,语音处理器已经是相当成熟的技术,加上半导体效能飞快成长,就硬件的层面来说,针对一般应用,目前市面上有很多平价Cortex-M微控制器(MCU)或入门级DSP,都已经能扮演语音处理器的角色,差别仅在于各家厂商所开发的独特算法,可能在不同的特定情境有特殊优势;又或是某些针对高阶语音设备,例如远距会议设备所设计的专用芯片,以便执行一些非常复杂而特别的算法。

1  2  3  下一页>  
责任编辑:Gary
免责声明: 本文仅代表作者个人观点,与 OFweek智能硬件网 无关。其原创性以及文中陈述文字和内容未经本站证实, 对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅 作参考,并请自行核实相关内容。

我来说两句

(共0条评论,0人参与)

请输入评论

请输入评论/评论长度6~500个字

您提交的评论过于频繁,请输入验证码继续

暂无评论

暂无评论

文章纠错
x
*文字标题:
*纠错内容:
联系邮箱:
*验 证 码: