您的位置首页 >网络舆情 >

重新思考消费者语音技术的用户界面

语音可以提供简单,引人注目的用户体验,但是为任何产品,服务或应用程序添加语音控件的途径都很复杂。随着主导技术公司继续开发支持语音的界面和助手,产品设计人员,开发人员和制造商将被迫重新思考用户体验和用户界面。

随着智能扬声器采用的惊人扩展和消费者购买智能家居设备作为点解决方案而非系统的倾向,未来许多家庭将拥有一个分布式智能平台,语音控制作为主要用户界面。

在2019年初,36%的美国宽带家庭拥有至少一个配有语音助手的智能扬声器。

硬件设计

语音设计要求制造商评估其最终产品,并就使用环境,设备使用环境以及消费者互动模型做出决策。这些决定会影响硬件选择。

例如,在空间感知,房间中的潜在噪声水平以及用户在讲话时与设备的接近度方面对设备环境的评估可以导致实现更多或更少的麦克风。

要启用语音识别,设备必须连接到Internet并包含麦克风和扬声器。其他组件包括模数转换器(ADC),数字信号处理器(DSP)和数模转换器(DAC)。

在输入阶段,当用户对设备说话时,麦克风将捕获短语并将其发送到ADC,ADC将语音输入转换为数字音频数据。麦克风可以是模拟的或数字的。模拟麦克风必须与模数转换器配对,而数字麦克风则内置一个。

麦克风阵列中的设计取决于设备的环境。对于那些要求用户靠近设备说话的人来说,一到两个麦克风是理想的选择。远场通信可能需要四到七个麦克风阵列。

输入阶段到达处理阶段后。数字信号处理器将数据馈送到网络模块和自然语言处理引擎。在此阶段,在捕获的语音数据上发起算法。

波束成形,动态范围压缩和自适应频谱噪声降低是有助于提高捕获的语音数据质量的算法示例。在完成处理阶段后,数据被发送到数字 - 模拟转换器和放大器以输出给用户。

软件要求

用于创建用于语音优先技术的软件基础设施的构建块包括自然语言处理,其包括自动语音识别(ASR)和自然语言理解(NLU);唤醒字算法以启动语音响应过程;以及处理数据的云平台。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。