2015年,Amazon 发布了 Echo。截至今年一月 销量已经突破一千万,而根据 eMarketer 的估计,Amazon 已经占据了七成的声控音响设备市场。而在去年推出的 Google Home 则瓜分了这块市场将近四分之一的比例。
预测指出,在今年,将有超过3560万美国用户每月至少使用一次声控助手设备,较之去年上涨将近129%。
苹果在 Amazon 及 Google 之后也推出了自己的智能音箱 James Martin/CNET
在今年的 WWDC 上,苹果发布了 HomePod,这款售价高达349美元的产品是苹果推出的第一款智能音箱,正好在十年前,苹果推出了 Apple TV。从某种角度而言,互联网和智能设备的发展演化实际上也是一部各大厂商抢占用户客厅的历史。
这段历史可以一直追溯到索尼和微软如火如荼的游戏主机大战的时代。
在索尼推出 PlayStation 获得巨大成功后,微软进入到游戏主机市场。在2001年及2005年先后推出 Xbox 及 Xbox 360,以此来对抗 PlayStation 2及 PlayStation 3。双方在次世代游戏主机战争中进行着异常激烈的鏖战,但是,无论是索尼还是微软并没有仅仅将据置机作为用户购买之后进行游戏的设备而已,他们在产品上寄托了更大的前景和展望。
在发布 PlayStation 3时,索尼同时提供了 PlayStation Network 服务,不仅提供多媒体兼容功能,而且还与索尼的游戏掌机 PlayStation Portable 及 PlayStation Vita 进行了设备内容上的联动。更重要的是,它不仅以蓝光光盘作为储存载体,同时也是第一款支持 Blu-Ray 2.0的蓝光播放器。
而微软则大力推动 Xbox Live 服务,为用户提供了游戏之外的音乐、电影电视下载服务,更重要的是,微软将 Xbox 360与 Windows 系统紧密地联系了起来,用户通过桌面上的媒体中心就能在 PC 和游戏主机之间分享内容。同时,微软还与当时的 Netflix、ESPN 合作推出流媒体服务。
时至今日,Newton依然被不少人视为苹果历史上最伟大的产品之一
实际上,就在微软与索尼的游戏主机大战一触即发前的1998年,苹果在乔布斯的直接命令下终止了个人智能移动终端 Newton 产品线。在游戏主机厂商大战正酣的那段岁月,互联网才繁荣起来,对当时的人而言,移动互联网和智能设备接近天方夜谭。
那么问题来了,面临互联网浪潮的冲击,造收音机和电视机都已经显露出衰落趋势的关头,下一个能在消费者的客厅里牢牢占领住位置的设备是什么呢?所有的厂商都在思考并担忧着这样的问题,毕竟在当时来说,大多数人最重要的互联网应用场景就是公司或家,而电脑市场又已经被微软、IBM 这样的厂商割据殆尽。
寻找到一个新的应用场景切入点,以此来撬动用户使用习惯,最终围绕这样的硬件设备渗透到互联网趋势里去。对当时的索尼或微软而言,即使这样的年头并不如此清晰,至少也如火花一样在他们的心中闪烁过。
到2012年底宣布停止销售 PlayStation 2时,这款产品的历史累计销量超过1.5亿台,在十二年内每年平均售出超过一千万台以上,这样的事实有着无与伦比的吸引力,无论索尼还是微软都相信,游戏主机市场的消费潜力足以帮助实现他们抢占客厅的野心。
在2013年的 E3上,Xbox 主管菲尔·斯宾塞介绍 Xbox One
到2013年时, PlayStation 3和 Xbox 360的销量均达到了8000万台,同年,索尼和微软先后推出了 PlayStation 4和 Xbox One,然而, 由于一开始就采取了激进而触犯广大玩家利益的锁区、禁止二手交易以及联网验证政策,加之较对手高出的100美元售价,Xbox One 在市场上遭遇了惨败。
尽管这些措施最终在遭到消费者的强烈批评和质疑后都被微软官方取消,而在机器发售半年多后,Xbox One 也最终降低到和 PlayStation 4一样的水准。
这些补救措施已经不足以拯救一开始就被对手全方位针对压制的 Xbox One,微软最终输得一败涂地,截至今年六月,PlayStation 4销量已经超过6000万部,而微软拒绝公布其产品销量数字之后,现在最乐观的估计也只有大约3000万台左右。
在游戏主机市场,微软毫无疑问兵败如山倒,但是,从另一方面来看的话,这样的结果实际上早在萨提亚·纳德拉(Satya Nadella)2014年担任微软 CEO 时就已经注定。
在他的主导下,微软采取了轻重有别的企业发展策略,Windows、Office 及云业务成为公司中最重要的业务,而移动手机和 Xbox 则渐渐被边缘化。
菲尔·斯宾塞在今年 E3上介绍 Xbox One X Casey Rodgers/Invision for Xbox/AP Images
Xbox 身上的次世代主机特色正逐渐被清除,无论是去年 E3上推出的 Xbox Play Anywhere 让用户一款游戏可以在 PC 和 Xbox 双平台上运行,还是今年 E3上推出的 Xbox One X 在独占内容方面的萎靡,我们都看到,Xbox 在微软的发展策略里越来越多地体现出通过云端和 PC 共通的趋势。
但是,如果我们就像微软那样不仅仅是把 Xbox 当做一部游戏主机来看的话,我们就会发现,微软的这一切做法似乎都能说通。
事实上,回溯 Xbox One ,我们会发现其中有一个容易为大多数人忽视的细节,用户只要通过 Kinect 就能利用语音来操控设备,而就在2014年,微软的语音助手 Cortana 第一次在公开市场进行应用展示。
事实上,PlayStation 4也清楚地意识到,语音交互会是用户的客厅应用场景中一个重要组成部分,在索尼的游戏主机里,同样也有着语音指令操作功能。
微软极力弱化 Xbox 的游戏主机色彩,更多地是把它当做以一个客厅中枢来看待。所以,必然要强化它和家中的 Windows 电脑的联动,而这种联动实际上又需要通过云端的流媒体、Xbox Play Anywhere 乃至游戏《我的世界》(Minecraft)等技术内容方式来完善丰富。
当个人电脑的趋势渐渐从台式机变化到笔记本电脑、从客厅迁移到卧室等私人属性更重的场合的时候,微软唯有通过Xbox 这样一个曾经有着一亿用户的产品来占领客厅。
这样的占领不止是为了寻找用户应用场景的突破口,同时,也是为了更好地加强 Windows 系统本身和云端的连通。
随着智能时代和移动互联网的跨越式发展时代的到来,这种联动又逐渐体现出新的潮流,而 Amazon、Google 乃至苹果正是观察并试图把握这股新潮的公司。
Echo 最典型的应用场景
就在推出 Echo 前一年,Amazon 野心勃勃地发布了 Fire Phone 智能手机,结果却遭遇了灾难般的失败后果,到第三季度末,该公司积压了大约8300万美元的 Fire Phone。而据该公司 CFO 披露,Fire Phone 在三个月里共计造成了1.7亿美元的损失。发售仅仅14个月后,Amazon 就宣布终止该智能设备生产线。
在首次试水智能设备便以惨败告终的背景下,Echo 的问世实际上显示了 Amazon 切入移动互联网应用场景的坚定信念。在 KIndle 产品线已经缺乏实质更新、空有数据和技术却无法和消费者直接联系的情况下,Amazon 最后选择了音箱这个乍看起来和智能、移动互联网关系并不密切的产品。
Google 在2012年发布了 Nexus Q
更早之前,Google 在2012年的 I/O 大会上推出了“美国制造”的播放器 Nexus Q,让用户通过手机、平板等硬件设备来远程控制该设备播放电视、印象里的内容,它的理念是人与人之间在一个场合下的内容共享体验。Google 的这一尝试最终仅仅持续了半年就偃旗息鼓。
实际上,直到推出 Echo 之前,以 Amazon、Google 为代表的互联网公司还从来没有推出过一款在市场上获得商业成功的智能硬件设备。
我们不妨回顾移动互联网的发展历史来看看硬件设备究竟如何才能更好地适应引领趋势。
iPhone 推出之前,移动互联网刚刚起步,用户大多 PDA 及黑莓手机利用进行邮件、网页浏览等工作性事务,后者的 BIS、BES等 Push Mail 服务成为吸引用户最大的利器。
但是,随着苹果推出智能手机和 App Store,用户认识到移动智能设备不仅仅是传统桌面设备的补充,iOS 带来了更多操作体验、更新颖的交互体验及更天然符合移动设备特性的应用。
这些都使得以 iPhone 和 Android 手机为代表的移动智能设备获得了狂飙突进式的大爆发。随后,iPad 的出现又让人们意识到,在传统个人电脑大屏幕和移动设备小屏幕之间还有着新的使用和交互体验。
1968年问世的 RKS 100-86 是世界上第一款滚轮鼠标
实际上,我们归纳移动互联网和移动智能设备的发展,最核心最本质的趋势或表现就是用户交互方式的演进。从传统桌面电脑的鼠标键盘在80年代中期以后成为用户体验的基准,到 iPhone 为智能手机确立的触摸使用交互准则,其间经历了大约三十多年的漫长进化。
硬件的推出和成熟完善并推动交互和使用体验的优化,而这种体验又进一步地刺激硬件设备的提升,在两股推力的共同作用下,新的交互体验便应运而生。技术的大发展更是极大地加快了这股新的交互使用体验的发展应用,于是,在触摸屏幕体验发展不到十年的时候,语音、VR/AR 等交互体验应运而生。
2011年,Siri 面世,一年后,Google Now 随着 Android 系统历史上具有里程碑意义的4.1系统一同曝光,在2014年,Cortana 揭开了面纱。在三年多的时间里,苹果、Google 及微软先后推出了自己的语音助手应用。
早在2002年,Google 的就已经推出了语音搜索,着手进行语音输入、语义识别和语音文本转换等研究,经过十多年的演进,语音交互已经到达了能够为用户提供准确、易操作、相对成熟的使用交互体验的程度。
我们将用户使用场景分为室内和室外,从这样的维度来讨论语音交互。出于隐私和安全性的考虑,在室外使用场景下,用户并不习惯或认可语音交互。但是如果在室内,这样的顾虑便迎刃而解。用户什么时候会用到语音交互呢?
- 简单指令;
- 较为复杂的内容输入;
- 身脑忙碌时的操作。
设置定时、播放音乐、读新闻、设定闹钟、查时间实际上是用户在使用 Echo 时最多使用的功能,而这些应用场景实际上并没有太多的突破性,它们实际上仅仅是为用户提供了一种更方便更轻松的操作方式和体验。
真正体现 Echo “智能”所在的是控制智能灯、连接到付费音乐、购物及控制智能调温系统。这些功能意味着真正完善成熟的家庭物联网,意味着通过云端用户就可以进行消费内容,意味着摆脱桌面或应用就可以直接消费。上述任何一项内容都可能意味着一个价值千亿美元的市场,而小小的智能音箱则通过硬件、技术、云服务把企业和用户联系在了一起。
我们甚至预测,未来的消费者在室内甚至会越来越倾向于摆脱图形界面的操作体验,用户的操作交互逻辑背后始终应该是抛弃繁琐的“模拟”过程。
无论是以往的拟物化还是现在的扁平化界面,实际上都在迫使用户进行一个从现实认知到实际功能的转换,这样的过程事实上是在技术发展不成熟阶段的权宜之计,真正的交互体验实际上应该是所见即所得、所作即所得的。
从根本上来说,用户并不需要一个点击 App 然后思考选择操作的过程,这样的过程是和人类天性背道而驰的。所以,语音交互操作、VR/AR 的沉浸式体验带来的是最接近人类使用工具直觉的。从这一点上来说,在现阶段,语音是最方便、技术最成熟的交互操作方式。
Echo 实际上分担了用户其他智能设备的功能
语音交互实际上解放了用户,或者更准确地说,语音交互将用户从众多的移动智能设备中解放了出来。从这一点观察的话,我们可以清楚地看出这样的趋势,用户在室外会使用智能手机、平板、智能手表等设备进行不同任务的操作,不同的场合对应不同的使用场景,不同的使用场景迫使用户使用不同的设备。智能音箱不仅仅是连接着设备,甚至它同时也在取代着它们。
回到家中,使用场景被大地内缩了,上述功能都可以通过 Echo 这样一个智能音箱完成,这意味着,交互体验实际上是可以倒逼用户改变硬件和场景使用习惯的。
事实上,如果我们再将“室内”和“室外”这样的场景从更加抽象的维度上划分的话,我们认为,用户的使用场景可以被分为“自我”(self)与“他者”(the other)两种处境。
如果以此观察的话,我们会发现,消费者绝大部分时候一般都是处于“自我”场景下的,车上、家中的时间占据了一个人大部分的时间,而也恰恰是这两个使用场景现在是对语音技术研究最深入、应用最广泛的。
所以,智能音箱现在成为最有可能取得抢占客厅战争胜利的设备,本质上来说,这是互联网、硬件发展必然的结果,应用场景的内化趋势越来越明显,使得用户开始接受并习惯了语音操作这样的交互使用体验,而这样的结果反过来又会极大地推动互联网和硬件的再次发展。
对 Amazon、Google 乃至苹果、微软这样的公司来说,生态越是丰富,它实际上越是需要像智能音箱这样的产品来占领客厅,这样的产品不止是连接硬件和互联网的中枢,更是利用交互体验反哺硬件和技术的绝妙手段。
微软推出了 Invoke
于是,就在苹果推出 HomePod 前一个月,微软最终也推出了自己内置 Cortana 的智能音箱产品 Invoke,用户不仅可以通过它拨打 Skype,还能利用该产品和 Office、Windows 10进行更加密切的联动——早在苹果将 Siri 置入 macOS Sierra 前,微软就早已经将 Cortana 内嵌到 Windows 10系统里。
数据显示,今年使用语音助手的美国用户超过6050万,只有智能手机用户的27.5%,在全美人口中的比重不到1/5。其中,千禧年世代(Millennials,目前在25到34岁之间)用户超过2990万人,这意味着超过1/3的该世代人群都在使用语音助手,而到2019年,这一比例将超过44%达到3930万。
从索尼微软争雄的游戏主机到今天的智能音箱大战,仅仅过去了不到二十年的时间,而从键鼠到触摸屏再到今天的语音交互的发展,也只有三十多年的时间。
我们相信,就在此时此刻,新的交互技术正在蓄势待发,就在不远的未来,它还会掀起新的革命。(本文首发钛媒体,记者/胡勇)
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App