智慧语音四步走,让人工智能变有趣

智慧语音操控基本上够用,驾驶模式下大部分操控都已经实现了,用的住,同时,希望中兴能够在后续版本技术升级中不断增加细粒度,也就是提高智慧语音操控手机和应用的种类、应用内动作等。比如,是否可以在未来通过开放api的方式让一些经常使用的应用能够接入进来,比如驾驶模式下语音读新闻、读帖子、读小说应用里的小说、读微信朋友圈文字等等,将整个手机操作系统彻底实现语音操控。

智慧语音的个性化会很有趣

内嵌的智慧语音现在能够唤醒并打开使用高德地图,但是高德地图有个名人播报,高德地图的这个功能,让天天见到的地图应用充满了乐趣和亲切感,如果中兴也借鉴一下高德地图的这个思路会很有趣。每天名人们给我打开音乐、搜这搜那,读短信,会是很拉风的一件事儿。

口音识别的技术现在做的总体还是不错的,但还需要提升,降噪是一个思路,智慧语音能识别口音,是否它能用烟台话和我交互呢?目前智慧语音只能把方言识别成普通话,那么,是否可以逆向思维,输出方言,从而更容易跟各个地方的人进行交流呢?比如,我的星星手机起名为“小嫚”,我跟她说“小嫚,过来哈点儿酒吧”,智慧语音估计很难识别出来,这个机器学习是否能够解决呢?

我还想到一个有趣的场景,罗永浩一直被称为手机界里相声说的最好的,其实,演讲能力大家是都需要的。智慧语音的机器人可以扮演观众,手机主人面对观众进行演讲训练,每当稍长停顿就来点鼓励或掌声,让每一个人都变成相声演员,让腼腆内向的人走出封闭,让孤独寂寞的人有一地方宣泄。所以,我觉得语音情景模式和场景细节中很多东西,这些可以构建出一个智慧语音产品层面的store,让社群参与智慧语音的外部研究和应用场景研究。

语音操控的更高境界是什么

语音操控的核心就是语言系统和操作系统的无缝整合,语音指令系统和操作系统api的整合统一,在语音模式下,语音指令权重更高,操作系统的api起到很重要的作用。逆向思维,智慧语音的操控系统同样也是可以输出api的,如果以语音操控系统为基点,开放语音操控api给手机app开发者们,让各种优秀应用的操作都能够接入到语音操控系统里,这样智慧语音就可以更早一天实现全语音操控手机和使用应用。

更进一步,既然语音操控能够开放api,那么,就意味着可以进行复杂的api编程,可以根据算法序列将一个个语音指令连续起来,并且可以接入到工业机器人、军用机器人、园艺机器人等身上,从而实现语音远程操控系统。这样,我们就可以远程语音和家里的机器人管家对话了,这有点像我们现在正在推进智能家居的连接工作。

高级的语音操控编程在计算能力支撑之下,可以和人进行实时地远程对话交流,我军派出的无人机在自动化战斗的同时,也可以听从指挥部或预警机空中指挥部直接进行语音指挥作战,此时,一言既出,驷马也能追啦。

登陆|注册欢迎登陆本站,认识更多朋友,获得更多精彩内容推荐!