info是什么意思（智能语音交互）_热点知识

摘要：编辑导语：随着亚马逊、小米、阿里巴巴等大公司都推出了智能语音产品，智能语音交互设计成为了一个值得探索的领域。语音交互如何设计才能达到更自然的交互反馈、更好的传达情感，这是目前需要解决的问题。对于用户来说，希望能与智能产品建立亲切的信任感，越相处越好用。ai时代，深知我者，才能久居我心。说到语音交互需求价值，总有一种不言而喻的感觉，语言作为人类信息传递的主要媒

编辑导语：随着亚马逊、小米、阿里巴巴等大公司都推出了智能语音产品，智能语音交互设计成为了一个值得探索的领域。语音交互如何设计才能达到更自然的交互反馈、更好的传达情感，这是目前需要解决的问题。对于用户来说，希望能与智能产品建立亲切的信任感，越相处越好用。ai时代，深知我者，才能久居我心。

info是什么意思（智能语音交互）

说到语音交互需求价值，总有一种不言而喻的感觉，语言作为人类信息传递的主要媒介，用其进行沟通交流，是一种遵循本能的行为。

从我们记忆机器命令的键盘输入，到按机器提示的点击触碰行为，这类需要我们去理解机器的方式，随着科技的不断突破，也迎来了转变。

语音交互除了几乎不需要任何学习成本外，更有意义的是，解放了作为输入的双手（是不有种人类实现直立行走的伟大意义），人们可以同步开展其它任务，并且也调动了人类听觉的感官体验，而不用完全局限在视觉上。

下面就来说说如何设计一款语音交互产品，先说说语音交互产品设计的整体流程框架，再对其中各环节涉及的问题展开说明。

查阅了亚马逊语音界面设计规范和的语音界面设计规范后，结合自己的解分为五个关键步骤：调研→定位→设计→测试→完善。

调研—— 挖掘语音交互使用场景定位—— 聚焦产品定位，创建用户画像设计—— 设计状态流程图，编写脚本，建立原则测试—— 真人感受，在线模拟测试完善—— 数据+案例分析，优化调整。

1）结合用户反馈，数据统计进行分析比如：对于用户同一个问题提出多次原因可能是：

2）示例中等待时间5秒按书中试验得出，这个值可以根据不同产品用户的反应速度调整。

从用户，产品，信息内容，传达方式中的问题与语言特征依次说起。

1）用户意图的识别人们问的问题，因为个体差异，关注的点不同，需要的结果也会不一样。

比如：今天出门需要带伞么？

——男性：关注下雨；女性：关注日晒。区别个体差异，让用户觉得你懂他，体验到产品的温度。

2）产品人格塑造我们在与他人交流的时候，会注意场合，自我形象，用连接词进行话语的过渡。

语音交互，作为一个拟人化产品，这些也是要考虑的。

3）控制内容范围

语音交互实质是连接产品服务与用户需求，所以答案要么和产品有关，要么和产品无关。

有关的是基于产品本身的有限搜索信息库。无关的用兜底的话术结束（这个功能我还在努力学习）还有一种是引导用户，结合着视觉，罗列出和主题相关的选项，引导用户找到答案。

info是什么意思（智能语音交互）

4）信息口语式传达

口语在表达的时候，为了简洁方便，并没有按着严格语法（主谓宾，定语*+名词的结构），省略的、不连续会被大脑自然补齐，比如：

：点餐，来一杯拿铁，大杯加冰，而书面表达可能说，他点了一大杯加冰的拿铁；：询问天气：今天天气怎么样？（隐含用户现在所在的城市）。

继续询问，那杭州呢？（隐含还是问的天气）

书面表达是事后信息重整理，口语表达是大脑同步传递，先表达中心，然后补充细节。用户信息输入后，留出一段停顿的时间，再执行命令，会更符合说话的节奏。

语音交互的信息流处理步骤如下：

info是什么意思（智能语音交互）

1）语音识别 asr ：听清用户说话

处于单模式状态：唤醒对话，再唤醒再对话的方式，反映到现实是这样场景：

小明，播放周杰论的告别气球。小明，声音大些。小明，再大些。小明，循环播放。小明，播放版。

你每次说话都要带上别人的名字。目前大部分产品是单轮对话，采用一问一答交替形式，对用户纠正信息，打断对话是不做响应处理的，期待技术发展后续可以是边听边思考的信息流状态。

2）语义理解nlu ：听懂用户的话

语义理解要做到智能除了字面含义外，用户意图识别，情绪识别，对话的上下文信息关联都是要考虑的因素。

3）信息搜索info ：最强大脑

依赖于检索的准确率，召回率。

4）语言生成nlg：生成结果

分为三个级别：

：

用户：小明，杭州气温多少度？

语音：杭州今天气温10～14度，未来3天有小雨，主人出门建议多带件换洗衣物（用户之前通过语音查询了机票酒店信息，或者上次主人问了这个问题后，有5天都没有再用设备，因为不在家）。

：

用户：小明，来首歌吧！

语音：（识别出语调兴奋）好，播放了一首欢快的high歌。

用户：小明，放首歌！

语音：（识别出语音的低落）好，播放了一首正能量的歌。

这一部分的可关联的空间还很大。说个题外话，语音是人类所擅长的，对其的预期会高，有时说话像个孩子的样子，有时反而还会讨喜。所以还要结合心理预期维度的研究。

5）tts ：播放给用户听

目前可以选择喜欢的明星的声音，以及ai主持人。

无论从市场应用的硬件载体覆盖面（智能音箱、智能手表、智能导航仪等），行业应用广泛推广（医疗，教育，公检法，车联网，泛娱乐等），还是聚焦在产品设计，技术优化上，以及符合人体本能行为需求价值上，还是作为ai时代的入口，这个方向都是很有趣的，欢迎开撩～～

题图来自，基于 cc0 协议

本站所有内容均来自互联网,一切版权均归源网站或源作者所有。如果有侵犯请联系我们删除。

标签：

相关内容