贝佐斯(Jeff Bezos)是骨灰级《星际迷航》粉丝。他一度希望用皮卡尔船长的口头禅“make it so”命名他的电商平台(亚马逊)。2016年,在贝佐斯多年的乞求下,派拉蒙影业终于在《星际迷航3:超越星辰》中给他安排了一个小角色。
这就不难解释,为什么亚马逊开始打造AI助手——Alexa时,贝佐斯希望它能成为一个随叫随到的、善良、博识的助手,就像《星际迷航》里的计算机那样。
同时担任Echo、Alexa、Appstore副总裁的乔治(Mike George)表示:“我们真的想让它(Alexa)无所不在,你只要对着空气说,‘Computer, beam me up’(国家项目扶持网注:“Beam me up”,《星际迷航》中让计算机转移人类位置的指令。)”。
亚马逊摩天大厦Day 1坐落在西雅图市中心的丹尼三角区,从高处望去,蓝天下的太空针塔与远处的雪山相比显得非常渺小,两者看起来像是亚马逊精心布置的风景。
亚马逊总部的30座建筑即便到了Lake Union也能看见,150多米的大楼下方还在打地基,准备建成亚马逊的新楼。
摩天大楼之间,正在建造的两座30米高的生物圈可容纳300种植物,这将成为亚马逊另一个办公空间,一旦建成,920万平方米的办公区足以容纳两倍于现在的亚马逊员工。
亚马逊的总部可以说是亚马逊的缩影:总是向前看,迅速成长,让别人没法跟上。
2017年4月,亚马逊市值达到4398亿美元,成为世界第四大公司,紧跟在苹果、Alphabet和微软之后。与此同时,“亚马逊”所代表的含义也越来越复杂:
Prime会员体系已经有几千万固定用户;
AWS服务着包括Netflix和Spotify在内的许多互联网企业,年营业额达120亿美元;
今年2月,亚马逊影视制作工作室赢得了三个奥斯卡奖;
亚马逊在美国开设实体店,租用了40架货机用于物流;
亚马逊计划为其机器学习研发中心招募400名新员工;
亚马逊以超过177亿美元的价格购买美国连锁超市“全食”和它的400多个零售点;
......
但AI才是亚马逊业务的新核心。贝佐斯在今年5月的互联网协会年度庆典上表示:
“实际上,机器学习的价值我们早就实现了,只是并不明显。它被用于改进的搜索结果,改进的商品的建议,改进库存管理预测和许多其他事情。”
这是一家靠买书起家的公司,现在它已经有了自己的音乐、电影和硬件设备业务,还卖日常必需品和杂货。而这样一个庞然大物最急迫的事情却是,希望通过向第三方开放平台,将Alexa引入人们生活的每一个角落。
出任亚马逊首席科学家之前,Rohit Prasad曾在BBN Technologies研究了多年的自然语言和语音识别。在他脸上,可以看到见证历史转折的兴奋。
坐在亚马逊波士顿的办公室里,穿着条纹衬衫和西裤的Rohit Prasad看上去精力充沛,他回忆道,2013年,当亚马逊为创建一个声控AI系统找到他时,他意识到自己的机会来了,“当时我感到很惊喜。很久以前我们就说,演讲、语言,其最终目的就是解放双眼和双手。”所以,他毫不犹豫地接过了对方的橄榄枝。
实际上,Alexa的愿景在Prasad到达之前就已经决定好了。当时,亚马逊还为Alexa准备了一份新闻稿,上面写道,用户能在房子里任何地方唤醒它,它将反映亚马逊自己的品牌规范:聪明、谦虚、有帮助。
据一名Lab126前员工透露,甚至更早以前,Alexa便是亚马逊AR项目的一部分,但并没有得到高层支持。直到亚马逊为了夯实Alexa的语音技术基础,同时收购了两家AI创业公司——韩国YAP和剑桥的Evi,然后在2014年推出了Amazon Echo。
到目前为止,亚马逊已经销售了上千万台搭载Alexa的设备,《机器、平台、用户:驾驭数字革命》的联合作者,麻省理工数字经济计划主任Erik Brynjolfsson表示:”这是一个打破常规的尝试,Alexa让交互更加容易了。以前,它一直停留在理论上。”
Google Home直到2016年10月才出现,苹果的Siri和微软的Cortana还限制在在智能手机上。
总之,在Echo之前,很少有人愿意在公开场合和人工智能对话。
Google的优势是搜索,能给用户带来无穷无尽的信息,亚马逊则拥有强大的物流和零售系统。Google Home可以告诉你一些东西;而Alexa可以却在几小时内给你带来东西,如果说Google Home是陪你玩的人,Alexa则是照顾你的人。
亚马逊的野心很大,因为语音助手的竞赛结果将决定谁将主导下一个无处不在的界面,理论上,它不仅能淘汰触摸屏,还可以让搜索栏消失。
Alexa实际上不是一个团队,而是一个舰队。乔治说:“我们有成千上万的人跨越不同领域和基础学科支持Alexa。划分新领域,命名交互类型,并组建专门的程团队去完善它们。”
一些团队努力不断调整Alexa的个性、语调、知识库,以回应用户的反馈,这些调整让Alexa给人一种全能的、人类般的助手形象;波士顿办公室的分析师们则研究Alexa的内部警报,这些警报与Alexa未回答的问题有关,目的是维持一种成熟AI的“假象”。
使用这些方法,Alexa建立了新闻报道,音乐搜索的对话框架,“由于Alexa是建在云端的,我们每周都可以添加新功能。”乔治说。
众所周知,亚马逊对用户数据是严格保密的,但Alexa的成功却是因为它的开放。
乔治说:“接近50%的亚马逊全球销量归功于我们向第三方商家开放了平台。就AWS而言,一开始我们仅仅构建原始的计算服务,主要客户是软件开发人员。这有利于更快地调整,我们在Alexa中延续了这一点。”
通过语音服务,Alexa可以存在于任何产品中,而通过Alexa基金会这个1亿美元的风险投资项目,亚马逊也在资助能够为这个平台做出贡献的创业公司。乔治表示:“我们非常期待竞争与合作,这些都会使我们变得更好,也能让更多的人能看到Alexa。”
Brynjolfsson说:“亚马逊在创建平台方面一直很聪明。它创造出的,是一个更有价值的生态系统,当其他实体把自己的Skills放到网上时,亚马逊和消费者都会受益。”
开放为Alexa引申出了更多的应用场景。纽约的计算机工程师Bob Paradiso为行动不便的人发明出了不同的设备,他用Alexa设计出了声控医院病床、声控轮椅和声控娱乐系统。
Alexa负责开发人员关系的副总裁Steve Rabuchin说:“有个人为了它行动不便的兄弟在天花板上贴上了Echo Dots,这改变了他的生活;孩子们通过Alexa与年迈的父母联系,提醒他们按时吃药。”
Rabuchin个人也已经向“长青健康”在西雅图的新生儿重症监护室捐赠了Echo Dots,他的双胞胎女儿就是在那里出生的。家长可以向Alexa询问孩子的情况;帕金森病患者也正在使用Alexa来练习讲话。乔治补充道:“整个世界将会合作起来解决我们甚至还没有想到的问题。”
4月份,亚马逊公布了Echo Look,这台设备配备了摄像头,是第一个能听又能看的Echo,与“风格评分”技能结合之后,Echo Look的机器学习功能甚至会为你的穿着评分。最关键的是,它还会提出购买建议。
几天后,亚马逊又推出了Echo Show,一个有屏幕的Echo,可以用来进行视频通话。在亚马逊的促销视频中,一些父母保借助Echo开看护自己的新生儿,并订购尿布、听亚马逊音乐和观看主要电影。
Echo Show弥补了Echo的一个能力缺陷:在向客户出售商品时,Echo只能读出选项列表,这是与便利性设计相矛盾的。但Echo Show也是亚马逊无情的表现。
2016年9月,Alexa支持的家庭对讲机创业公司Nucleus表示,他们已经募集了560万美元的资金,主要的资金来自Alexa Fund。
Alexa团队在与Wired记者的会面中充满了对Nucleus的赞誉,他们很快就把这家公司吞并了。亚马逊的宣传视频与Nucleus自己的原创广告惊人地相似,只是为达到广告效果加上了一些亚马逊的零售体验的东西。
亚马逊设备和服务部高级副总裁David Limp坚持认为,Nucleus早就获得了Echo Show的详细信息,在他看来,“Nucleus能补充Show的不足,能够挂在墙上,而且更薄,两者的使用场景也不同,Nucleus和其他人都能使用Echo的API,他们可以做到和Echo Show一样好甚至更好。”
国家项目扶持网(公众号:国家项目扶持网)注:亚马逊设备和服务高级副总裁David Limp
但在Echo Show公布不久后,Nucleus创始人Jonathan Frankel在接受采访时表示:“不同的是,他们想要卖更多的东西,我们只是希望帮助家庭更便利地沟通,他们必须意识到,我们是Alexa Fund生态系统的最重要的合作伙伴,如果我们受到威胁,他们的生态系统也会真正被削弱,整个生态的其他参与者也会人人自危,如果他们真的愿意施加威胁,现在倒是个好机会。”
Echo Show和Echo Look中存在着巨大的零售商机。但是,Nucleus和亚马逊的争议还在继续。
它应该是个人
Toni Reid是Alexa体验部和Echo的副总裁,他的工作是管理一个由行为科学家和工程师组成的团队。这个团队主要负责塑造Alexa的个性。他们的目标是理解和总结如何使用分析技术,将Alexa从应付简单会话提升到能突出自己。
当Reid加入Alexa团队时,Alexa还处在早期开发阶段,她意识到,Alexa必须要有更可爱的性格。“当我和我的家人在车里时,我们都会使用Alexa,如果不用的话,总感觉好像少了些什么,”Reid说。这就亚马逊希望所有客户都能体验到的。“当你需要它的时候,Alexa就会在那里,当你不需要它的时候,你感觉不到它的存在。”
想让Alexa更人格化,需要花更多的时间。Prasad说:“人类情感是门很深的学问。你需要非常了解一个人才能识别真正的情感。”如果说世界上有什么公司能够做这件事的话,那大概就只有亚马逊了:它知道你穿什么,读什么,看什么,听什么。Alexa可能不了解你,但是亚马逊甚至比你最亲密的朋友还要了解你。
在2016年9月,亚马逊推出了Alexa奖,参与选拔的大学生需要开发出一个可以进行20分钟谈话的社交机器人,十四个参赛队伍共同角逐33.8万英镑的奖金。
设立该奖项的目的是为了让AI看起来更加人性化、确保对话能够持续进行。“想象一下,如果与一个人初次见面,聊天能够超过20分钟,这是非常困难的。”Prasad说。“从对你的情绪反应层面来说,你会面的人必须是有趣的、博学的、有同理心的,感性的。这难得让人有点望而生畏,不仅仅是难在理解口语方面,更难在词汇知识。对于没有语言的行为,该如何反应?对我而言,这才是终极AI,是Alexa的下一步。”
Prasad对于Alexa的未来非常乐观,他已经在考虑制衡的必要性,以防止Alexa太过人格化了。亚马逊在四月份发布了产品,甚至它会发出“哔”的声音,这是提醒我们,它还只是一台机器。
有一个原因决定了Alexa必须像人:信任。如果Alexa的最终目标是实现无处不在,那么它就必须获得客户足够的信任,允许Alexa、摄像头、和所有的其它设备都进入他们的生活。
Toni Reid, Alexa体验部和Echo的副总裁,1998年加入亚马逊
现在,Alexa可以尝试使用词语来体现它的同理心。如果人们信任它,它还可以通过摄像头来获得用来判断情感的图像。通过推出Echo Look,在用户家中投放摄像头,亚马逊已经向更好地理解情感这一目标迈出了第一步。Prasad说:“我们希望能够做好这件事,真正去理解情感。”
Evi的创始人William Tunstall-Pedoe说:“这个行业始终会走到这一步。语音助手拥有的信息越多,它就能够做得越好。到了某个阶段,她会采集视觉信息和其他信息。这也可能会引起关于隐私的问题,一些人可能会反对使用Echo Look的摄像头。但是AI有了很大的进步,深层神经网络能够解读出照片中发生的事情。虽然Alexa会录下用户的话,但人们也可以删除掉这些。
如果人工智能系统发现有人正在看着自己或者朝着自己说话,用于安全目的唤醒词就没有必要了,因为AI可以识别出正在说话的人,这也将使得Alexa的使用体验更加流畅。
亚马逊一直强调隐私对亚马逊的重要性。但是,当眼下AI大热,事情就变得复杂起来。在2017年的阿肯色州谋杀案中,亚马逊在法官发令之前,一直拒绝交出一位用户的Echo声音数据。
这就是设置唤醒词,Alexa被激活时会亮灯和发出噪音、Echo上有静音按钮的原因。“静音按钮断开麦克风和相机,”Limp说。“如果把它放在柜子里,按了静音,黑客就无法打开相机。除非使用暴力,但是这非常容易被发现。”
用户的信任一直是亚马逊发展的核心因素。在《一网打尽》中,亚马逊当时的总编辑Susan Benson描述了为什么信任如此重要,“为了创造良好的购物体验,也让用户认为在屏幕另一端的人是值得信任的,我们要求用户提供信用卡的信息,这在当时是非常有争议性的。而今天,有一个重要的逆转:必须让客户信任Alexa,但是要相信在设备的另一端,并没有人在暗中操纵。
每一位和Wired记者交谈过的高管都在重复Alexa成为《星际迷航》计算机的愿景,他们像是沉浸在怀旧之中。但这其中也有一定的逻辑:它不是《机械姬》或《她》里面的吓人的AI,而是乐观的愿景。强者的联合可以让AI在人类社会更容易被接受。
在这场和谷歌、苹果、微软一同较量人工智能助手的战役中,亚马逊已经投入了很大的赌注。很快,Alexa将会渗透到人们生活的方方面面,在车里,办公室里或酒店里,它会一直在你的身边。
随着越来越多的应用场景的出现,机器学习就能把它变得越来越好,让它更有能力、更加人格化。当我们随时随地就能召唤Alexa时,或许隐私问题就不再那么重要,生活也将毫不费力。而在这样的全方位的系统上,亚马逊将向用户提供购物和娱乐服务。无论你想要什么,Alexa都能Make it so。
国家项目扶持网编译,via Wired.
国家项目扶持网版权文章,未经授权禁止转载。详情见转载须知。