Rokid祝铭明:中国Home AI市场将达到千万量级

2014年,亚马逊围绕其语音助手Alexa打造了一款智能音箱Echo,智能家庭(Home AI)的概念初具雏形。Echo的问世不像Fire Phone那样火爆,然而两年过去了,经过市场这块试金石的筛选,Fire Phone已经成为过眼烟云,而Echo的出货规模则达到百万量级。今年5月份,谷歌也推出了连接智能家居设备的枢纽Google Home,欲与亚马逊Echo争夺Home AI的市场主动权。近日,国内也出现了一款基于人工智能的家庭机器人Rokid,这家公司已经完成了B轮融资,并且估值达到4.5亿美元。究竟是什么让这个仅成立2年、只有90多人的团队获得资本青睐,对此科技采访了Rokid创始人祝铭明(Misa)。

创业被收购再创业 这次打造的产品有何不同?

两年前,Rokid创始人兼CEO Misa从阿里辞职创业。因为之前他加入阿里的方式就是自己的创业公司猛犸科技被阿里收购,而自己也进入阿里组建了神秘的M工作室,专注机器学习、语音识别和人像识别等研究。此时的辞职创业,更像是回到老本行。

“早在2014年Rokid就已经有了原型机,经过近2年不间断的打磨测试,才有了今天我们见到的产品。”这是Misa对Rokid第一款产品若琪(Rokid的音译)的整体描述。

若琪是一款基于机器深度学习的产品,整体采用有机曲面设计,并且在两侧提供了滑动触摸感应,通过滑动可以控制音量和亮度,这只是一种交互方式,其最主要的交互方式是通过语音,即“若琪”这2个音节。据Misa介绍:“若琪唤醒只需要2个音节,而苹果唤醒Siri则需要3个音节(Hey, Siri),这不仅仅是一个音节的差别。”

用户在使用Siri之前都要一声“hey, Siri”,回答完问题,若想接着对话还需要再喊一声“Hey, Siri”才能再次唤醒Siri,而面对若琪时只需2个音节“若琪”将其唤醒,之后即便进行多轮对话,若琪都能成功亮起底座灯并回答用户所需,并且若琪更像是在喊一个人的名字,不像Siri那样唤醒一台机器。这点不仅仅是一个音节的微小进步,而是Rokid在语音交互技术和用户体验方面的突破之处。

AI产品最终落地的是服务和内容

语音交互只是实体验方式

若琪顶部搭载了一颗1300万像素的高清摄像头,支持用户手势识别以及手机App二维码扫码登录;底部配有8颗麦克风阵列,可接受360度方位的语音来源;4颗全频扬声器和2颗重低音辐射器,360度全向高品质音响系统,通过“若琪”用户能够收听百万首高品质音乐,还可以享受听故事、学英语、查询天气等生管家式生活服务。

目前Rokid已经开始同智能家电厂家合作,将Rokid产品接入智能家居设备的控制系统中,像电影中那样通过语音控制家居设备将成为现实。于此同时,随着用户使用Rokid产品时间的增加,具有自动学习功能的若琪能了解不同用户的日常喜好和使用习惯,除了个性化向用户推荐内容以外,还能更加“贴心”控制家居设备。

Misa认为AI产品尤其是Home AI最终落地的将是对用户提供的内容和服务,语音交互和触摸控制只是实现内容和服务的方式,为机器学习并掌握人类喜好提供输入的途径,最终目的是为了机器能够更好的提供人类需要的内容和符合人类体验的服务。

Misa自己家中也有一台若琪,他举例称:“使用一段之后,每天起床向若琪问好,若琪会被语音唤醒并回应,然后自动播放舒缓的音乐,将灯光逐渐调亮,打开窗帘,并播报当天的天气情况。”人机交互不再是对指令的机械回应,而是经过一段时间与人类的“相处”,通过一个指令就能了解并完成人类的所想所需。

中国在Home AI的消费欲望和消费能力将超越欧美?

不同于之前的互联网革命,在面对移动互联网特别是最近AI/VR浪潮来袭时,国内企业的技术水平能够跟上国际科技巨头的步伐,Misa以Rokid在北京和硅谷的实验室举例:“分别在中国和美国的实验室在技术研发上能跟上国际水平,单点技术上可能互有优劣,但在产品打磨和产品体验上是领先于国际水平的(这里是同Google Home和Amazon Echo比较)。”Misa称Echo是旧品类的新玩法,是在传统音响的基础上加入了智能功能,而Rokid的定位则是新品类的新玩法,若琪不仅仅是一款智能音响,更多的是凸显声控性和陪伴性。