语音设计革命和如何加入:与Cathy Pearl的讨论

艾德·伍德,CareerFoundry博客的撰稿人

语音用户界面将彻底改变我们与技术交互的方式。但我们会这么说,不是吗?

作为第一家供应商VUI综合专业课程, CareerFoundry有信心,这波需求声音设计师已经在路上了。为什么?这不仅仅是因为它是最酷的新职位之一。

从亚马逊到谷歌,科技领域的主要参与者都在语音领域投入巨资。到2017年9月,亚马逊alexa(亚马逊的数字助手和负责它的科技巨头部门的名称)的工作人员达到了惊人的5000人,他们正在招募另外1000人。正如亚马逊Alexa主管罗布•普尔恰尼(Rob Pulciani)在CareerFoundry课程发布会上所说:“语音是一种与技术互动的全新方式,我们相信这是计算的未来。”

那么,为什么语音设计(我们必须习惯这种搭配)现在如此受欢迎呢?毕竟,谷歌早在2009年就引入了语音搜索,苹果在2011年发布了第一个Siri版本。不同之处在于,这项技术现在已经跨越了它对用户真正有用的门槛。这个阈值,估计相当于大概95%的理解正确率这很可能标志着一个拐点,在这个拐点上,我们开始厌倦戳戳我们的设备,而更喜欢与它们交谈。

如今的虚拟用户界面正在迅速变得更加智能,随着时间的推移,它们可以学习用户的语音模式,甚至可以建立自己的词汇表。随着虚拟用户界面的快速发展,语音将成为计算领域的下一个重大颠覆。亚马逊

亚马逊Alexa和语音搜索等产品的采用率表明,向这项技术的迁移正在顺利、真正地进行每天使用语音搜索的成年人数量在美国徘徊在50%左右使用它的青少年人数已经超过了这个数字ComScore对此进行了估计到2020年,50%的搜索将基于语音.此外,安装在智能手机上的语音助手的数量将达到到2022年达到50亿

亚马逊的Alexa已经卖出了超过2000万台设备,相当于市场份额的75%。在2017年的黑色星期五假日购物周末,亚马逊的Echo Dot也是如此任何制造商在任何类别中最畅销的产品在亚马逊。Echo最接近的竞争对手谷歌Home已经售出了大约500万台设备苹果和微软现在都在用Homepod和Invoke进入这个市场。

鉴于语音的快速发展,我们认为有必要与该行业的明星之一Cathy Pearl取得联系,讨论她是如何开始的,其他人是如何开始的,目前的挑战,以及该领域的未来。

从很小的时候起,凯西就对与机器交流产生了浓厚的兴趣——甚至在她还是个孩子的时候,她就已经在为计算机编程了,她唯一真正的愿望就是“计算机能跟我说话”。她接着获得了认知科学的本科学位,随后又获得了计算机科学的硕士学位。\

她的职业经历跨越了近20年:从1999年为语音识别技术先驱之一的Nuance Communications做语音工作,到为从银行到时尚品牌的各行各业设计语音用户界面。

她现在领导着用户体验团队感觉该公司拥有30多名员工,是一家位于旧金山的医疗保健行业初创企业。该公司的虚拟形象莫莉(Molly)帮助慢性病患者管理自己的病情。

该应用程序主要是语音控制的,将患者与医疗设备连接起来进行测量,减少了反复去看医生的需要。她也是最近出版的那本书的作者语音用户界面设计

为新手描述语音设计

有一个伟大的米切尔和韦伯的晚宴素描在这部电影中,一名脑外科医生先是遇到了一名会计,然后是一名慈善工作者,他对两人的职业选择表示赞赏,然后又开起了玩笑:“嗯,这不完全是脑外科手术,对吧?”这时,一位火箭科学家走了进来,让他尝到了以其人之道还治其人之身的滋味;“脑部手术?嗯,这并不完全是火箭科学,不是吗?”

当我问凯茜如何向那些有幸在晚宴上陪伴在她身边的人描述她的工作时,我想起了这幅素描。她把这个概念颠倒过来:“想象一下,你在一个晚宴上和一个不遵守基本对话规则的人说话,这会让人非常沮丧。例如,你问:“你现在有时间吗?”,’ to which they reply, ‘yes’—that would be pretty annoying.”

我回想起餐桌上无数次生硬的谈话,但没有一次是那么生硬的。Cathy继续说:“严格来说,他们已经回答了你的问题——他们已经理解你了。但是,天哪,这是不是很令人沮丧,完全不是你想要的,所以你接着问,‘好吧,这是什么?’,他们的回答是‘对不起,我不明白’,因为他们不知道‘it’指的是什么。

这就是我们目前在很多语音系统中所处的位置。从技术上讲,我们理解你说的话,但我们没有以正确的方式使用它们;我们没有以一种预期的,优雅的方式来做。这就是VUI设计的要点:这不仅仅是技术——我们还必须考虑会话规则。人们期望对话如何进行?人们将如何与设备对话?然后我们必须确保考虑到所有这些因素,并做出适合他们的设计。”

会话规则中的文化差异

任何会说或学过第二语言的人(或只是在其他国家乘坐公共交通工具旅行的人)都知道,国与国之间的对话规则有明显的差异。

我问过语音设计师是如何处理这一问题的,结果发现,人们并不需要借助外语来面对这类问题:

“你必须考虑本土化。即使是从美式英语到英式英语,我们也得到反馈说,人们的反应太过热情,所以我们不得不降低音量。在美国,东海岸人说话前的停顿时间比西海岸人短,所以西海岸人会想,‘他们为什么不让我说话?而东海岸的人会想,“他们为什么不说话?”’目前我们的语音系统很难应对这种情况。”

约束要求设计师具有创造性:“因为我们无法处理更微妙的转向,所以作为设计师的我们必须以一种优雅的方式明确何时需要输入以及需要哪种类型的输入。这才是现在真正的关键。”也许有些天真,我认为语音设计的宏伟目标是尽可能准确地模仿人与人之间的交流,我认为教学方法违背了这一点:

“我不确定自己在这一点上的立场是什么。一方面,我非常喜欢类似人类的对话,因为这样我就不需要学习任何东西。我可以像平常一样说话,不需要用户手册或任何特殊命令。另一方面,我不想说,‘Alexa,请告诉我旧金山今天的天气。’我想说,‘Alexa,天气’,因为它只是一个电脑——一个快捷方式。最终,它应该是双向的。”

这些快捷方式构成了我们与数字助手沟通的最初进化之一,就像聊天信息中表情符号的意外爆发一样,它们可能是冗长的速记命令的前身,而这些命令将变得司空见惯。或者,随着设备变得越来越智能,用户可能会开发出自己的、个性化的程式化速记。

“Alexa,告诉我今天会是晴天。”

“对不起,迈克尔,你得把外套拿回去了。”

我想知道这种交流是否会对人类彼此交流的方式产生影响。凯西证实媒体对此有一些争议:

“我知道有人对此有点担心:‘哦,我的孩子在亚马逊上购物,我担心这会让我的孩子变得粗鲁’——我并不真的担心这个。孩子们可以很容易地区分与设备和人说话。但我确实看到了最近的一篇文章,它说的不是学习粗鲁说话的人,而是他们给世界留下的印象。也许,如果我听到你对自己的设备很粗鲁,我会认为这不是一种好方式。”

或者,我们根本听不到人们对着他们的设备说话,除非我们和他们在一起。

许多研究表明,手机用户不喜欢在公共场合用手机说话。虽然超过50%的受访者会在家里或车里使用语音助手,但只有不到25%的人会在公共场所使用语音助手,无论是在公共交通工具上、聚会上还是在健身房。40%的人还表示,在公共场合使用语音助手的人会让他们感到恼火,所以我们的沉默不是完全没有根据的。

尽管有一些显著的人口统计学差异——越年轻,越富有,越男性化,你就越有可能在公共场合使用声音,凯西也发现了主流接受度更高的迹象,从超级碗的广告到周六夜现场的恶搞。

然而,她承认,在默念技术开发出来之前,在公共场合使用声音仍将是一个问题(显然,美国宇航局已经在研究这一技术),这样人们就不必大声说话了。她还指出,在我们的工作环境中,开放式办公室仍然是常态,但却无法同时容纳20人使用他们的设备。

那么,除了不断提高的使用率和潜台词交流,2018年还为语音设计师们准备了什么呢?“我希望我们能看到更多真实的对话和更智能的上下文识别系统,这是我们人类与生俱来的东西,所以当我们的系统不能理解它时,这是非常令人沮丧的。2018年,我们将与语音系统进行更智能的互动,而不仅仅是一个回合。”语音设计师将在推动这一发展中发挥重要作用:

“亚马逊Echo拥有超过2.5万个技能,很多人,尤其是开发人员,都在创造技能,但问题是:你如何让人们使用你的技能?在我看来,这正是VUI设计师的用武之处,因为如果你按照正确的顺序说出正确的内容,就会有许多技能发挥作用,但它们并不是非常令人满意的体验。设计师可以在这方面提供帮助,为用户创造很棒的体验,让用户想要再次回到游戏中。”

这个世界需要VUI设计师,否则在可预见的未来,我们将被迫与电路板进行尴尬的对话。从抽象的人机交互和2018年的预测中,我问了一个问题:作为一名VUI设计师是什么感觉?典型的一天是怎样度过的?

“我不知道是否有一个典型的一天,但我经常做的事情包括查看人们的匿名日志,了解我们在哪里出错,以及如何改进。我还会花时间与我们的客户——与我们有互动的公司——以及患者本人交谈,了解他们对患者的需求,询问他们喜欢什么,不喜欢什么,我还会与视觉设计师合作,帮助设计和改进我们的移动应用程序。”

我认为这似乎与用户体验设计师的任务非常相似:“这只是另一种设计系统——当然,它有自己的怪癖和特点——但这里适用的设计原则太多了。”

(除了参加CareerFoundry的课程显然),一个人应该如何进入VUI设计领域?

“我最大的建议是去尝试。这是什么意思呢?做一些叫做样例对话的东西,就像写电影剧本一样。比如,“这是系统会说的,这是用户会说的,这是系统会说的……”你反复尝试,然后使用原型工具,比如Sayspring故事情节或者pullstring——这些都是免费的工具,可以让你创建真实的语音对话,你可以真正地说话并尝试它们。你不需要成为一个程序员,你甚至会让自己感到惊讶。更正式的说法是,你可以从h·p·格赖斯(h.p. Grice)那里学习对话理论,例如,他在70年代提出了人类交流的定理。他引入了很多伟大的概念。”

Cathy将语音的历史分为两个时代:一个是ivr(交互式语音响应)的成本削减时代,自动应答器将站在人类和他们想要的东西之间;另一个是新时代,自动应答器执行其他人不想做的增值任务,无论是从商店订购还是选择播放的曲目。

由于IVR对用户表面上缺乏积极的影响,她已经对它失去了兴趣。现在,新技术以及它为用户提供的机会和好处让她感到振奋。谈到senense,她说:“我们正在使用技术来真正帮助人们——那些可能患有困难的慢性疾病的人,那些每天都需要帮助的人,我对此感到兴奋。我们的用户年龄较大,不太懂技术,但他们不需要上两个小时的课程来学习如何使用应用程序。他们只需说话,我认为这很棒。”

毫无疑问,VUI设计是一个蓬勃发展的领域,代表了人与设备交互的下一个前沿。如果你想了解更多关于这个领域的知识,可以看看凯西的书,语音用户界面设计,CareerFoundry的VUI设计课程

想了解更多关于用户体验设计的知识吗?看看这些文章:

CareerFoundry是什么?

CareerFoundry是一所在线学校,专为那些希望在科技领域转行的人开设。选择一个课程,与专业导师和导师配对,从零开始成为一名准备工作的设计师、开发人员或分析师,否则你的钱就会退还。

了解更多关于我们的节目