Liang FANG’s Blog My Thoughts On Everything

对话式 AI 生态系统比较分析

voice

(题图来自 Cisco

对话式 AI 的技术、产品和商业模式创新带来的商业生态价值已在中美市场显现。在美国市场,Amazon Alexa 与 Google Assistant 的生态竞争日趋焦灼;而在中国市场,百度 DuerOS 是目前唯一可与国际科技巨头比肩的对话式 AI 生态。

1 三大对话式 AI 生态布局比较

以下,将从产品、平台、内容和渠道 4 个维度进行比较。

产品:从扩展智能家居产品矩阵,到覆盖对话式 AI 设备全场景

product

家庭、车载、随身和办公,依次是对话式 AI 的主要使用场景1

家庭场景,Amazon 自研设备最为丰富,覆盖高中低档,并提供将非智能设备 Alexa 化的 Echo Input/Link 等产品。Google 加速扩展品类,但自研产品丰富度仍不及 Amazon,Nest 虽为 Google 系智能家居品牌,但在支持Google Assistant 的同时也支持 Alexa 。百度已推出 3 款自研音箱。

车载、随身和办公场景,Google 布局较早,Amazon 正迎头赶上,双方都已覆盖全场景。

平台:硬件+技能平台双开放成标配,差异化解决方案成竞争关键

platform

Alexa 早在 2015 年就开放了 AVS 和 ASK 两大平台,从广度和深度上拓展生态,落地设备和技能数量当前均大幅领先,不过 Google 增速更快缩小了差距。解决方案层面,Alexa 更为开放,芯片组 Alexa Connect Kit2 将大大降低 WiFi、蓝牙和访问 AWS 的旧设备升级为对话设备的门槛,DuerOS 在开放程度上直追 Alexa,并推出有屏、蓝牙设备解决方案。

Alexa 在开放平台的同时,成立了 Alexa Fund,初始资金 1 亿美元,聚焦投资细分领域方案商,2017 年底又增资 1 亿美元,聚焦投资硬件品牌商。效仿 Alexa,Google 和 DuerOS 也推出相应扶持计划,不过 Google 前期更重视对开发工具和细分领域方案商的投资,尚未覆盖硬件公司。

内容:通过自产、投资等方式,控制原生优质内容,是重要的竞争力

content

Amazon 和 Google 在音视频内容领域均有广泛布局,在购买 Echo 和 Google Home 的相关用户评论中,Prime 和 Chromecast 是高频提及词,体现了两者重要的协同作用,而 Google 限制 Amazon Echo 接入 YouTube 则体现了强烈的对抗意图。百度通过与 QQ 音乐合作及战略投资网易云音乐等,阶段性弥补了音乐内容的短板。

渠道:ToC 渠道优劣势差异明显,ToB 渠道各方已开始布局

channel

Amazon 自建电商平台及物流系统是 Alexa 的巨大优势,并在合作零售商的线上线下商城均有布局。Google 自建渠道薄弱,以往 Pixel 系列销量不佳很大程度上也缘于此,当前更多依赖传统商超和运营商渠道。百度与 Google 类似,且更多依赖直接竞争对手的渠道,存在风险。

此外,Amazon 和 Google 都已开始在新房预装领域布局。Lennar 有几个社区预装了 Alexa 设备,KB Home 已决定提供 Google Assistant 设备及其兼容家居产品。

2 三大对话式 AI 生态路径比较

path

Amazon 领先 2 年进入智能音箱领域,取得先发优势,在挑落 Sonos 后,从 2016 年底开始与 Google 进行了若干次针锋相对的交锋,并一步步将战场从家庭场景拓展到全场景。在移动、办公场景远远落后于 Google3,4 (以及 Apple、Microsoft)的 Amazon 「不得已」选择从家庭场景切入,借助对话式 AI 实现了弯道超车。Alexa 与Cortana 的合作打通,标志着竞争已从智能音箱的设备本体转移到对话式 AI 的生态抗衡。DuerOS 则是中国市场最大、最具活力的对话式 AI 生态。

3 对话式AI生态发展趋势预测

当前的合理预期

硬件产品方面,已进入全场景竞争阶段:1)智能音箱高低两端均推出标杆产品;2)带屏音箱已成趋势,交互优势使其更有机会成为主控设备;3)更多第一方硬件,促进交互,4)布局存量市场,非智能产品的智能化。

核心系统方面,AI 能力是竞争核心之一:1)更自然的交互,多轮对话、自动分解多重回复等;2)区分不同用户,配对不同的回答和服务;3)更多与内容的交互,如问「这个人是谁」;4)Multi-room,多空间同步。

开放平台方面,进一步丰富解决方案种类:1)推出端到端解决方案,需联合芯片、硬件、设计公司;2)推出芯片组,互联设备都可将其嵌入,成为语音对话设备;3)隐私安全,需硬件+芯片+身份认证整体解决方案。

内容服务方面,强势内容是重要协同要素:1)版权内容争夺日益激烈;2)短视频需求将在带屏终端上爆发;3)更多针对中老年、儿童的内容及服务,如戏曲、广场舞、教育;4)借力 Alexa 生态,兼容 AVS 服务。

关键的不确定性

硬件产品方面:1)可穿戴设备的语音化,借助百度 DMA、Amazon ACK 等解决方案,智能耳机、智能眼镜等市场即将爆发?2)多传感器融合,更自然的交互带来成本增加,难以成为主流?

商业变现方面:1)当前 Alexa 仅 2% 曾用于购物,语音购物何时普及?2)语音平台更适合品牌推广,而非语音购物?3)平台主的主要变现方式是硬件(如 Apple),服务(如 Prime、YouTube),还是广告?

生态竞合方面:1)多个对话式 AI 间在内容、技能等层面实现互通?2)核心内容(如音乐、视频)和渠道(如电商)竞争对手大概率会限制?3)手机和音箱,谁更有可能成为家庭中控设备?长期来看实现普适计算?

隐私安全方面:1)政策法规、隐私技术、用户意识共同影响市场走向,机遇大于风险?2)ToC 场景(家庭、随身、私家车)与 ToB 场景(办公、酒店、公共交通)是否实现账号打通?若打通如何保障用户隐私?。


  1. KPCB 的《2016 年互联网报告》调研得出美国用户语音使用场景:家庭(43%)、车载(36%)、随身(19%)和办公(3%)。 

  2. 含硬件模组以及一次性云服务收费,9 月新发布的微波炉很大程度上是对 ACK 的 Demo 展示。 

  3. 根据专业机构 Stone Temple 的调研,对 5000 个常见的问题,Google Assistant 回答了 68.1%,是 Alexa 的 3 倍。 

  4. Google Home Hub 为隐私舍弃了摄像头,并提供物理按键,可完全关闭音箱的收音能力。