智慧语音四步走，让人工智能变有趣_人工智能_计算头条_中国计算网——工业互联网一站式服务平台—

智慧语音操控基本上够用，驾驶模式下大部分操控都已经实现了，用的住，同时，希望中兴能够在后续版本技术升级中不断增加细粒度，也就是提高智慧语音操控手机和应用的种类、应用内动作等。比如，是否可以在未来通过开放api的方式让一些经常使用的应用能够接入进来，比如驾驶模式下语音读新闻、读帖子、读小说应用里的小说、读微信朋友圈文字等等，将整个手机操作系统彻底实现语音操控。

智慧语音的个性化会很有趣

内嵌的智慧语音现在能够唤醒并打开使用高德地图，但是高德地图有个名人播报，高德地图的这个功能，让天天见到的地图应用充满了乐趣和亲切感，如果中兴也借鉴一下高德地图的这个思路会很有趣。每天名人们给我打开音乐、搜这搜那，读短信，会是很拉风的一件事儿。

口音识别的技术现在做的总体还是不错的，但还需要提升，降噪是一个思路，智慧语音能识别口音，是否它能用烟台话和我交互呢?目前智慧语音只能把方言识别成普通话，那么，是否可以逆向思维，输出方言，从而更容易跟各个地方的人进行交流呢?比如，我的星星手机起名为“小嫚”，我跟她说“小嫚，过来哈点儿酒吧”，智慧语音估计很难识别出来，这个机器学习是否能够解决呢?

我还想到一个有趣的场景，罗永浩一直被称为手机界里相声说的最好的，其实，演讲能力大家是都需要的。智慧语音的机器人可以扮演观众，手机主人面对观众进行演讲训练，每当稍长停顿就来点鼓励或掌声，让每一个人都变成相声演员，让腼腆内向的人走出封闭，让孤独寂寞的人有一地方宣泄。所以，我觉得语音情景模式和场景细节中很多东西，这些可以构建出一个智慧语音产品层面的store，让社群参与智慧语音的外部研究和应用场景研究。

语音操控的更高境界是什么

语音操控的核心就是语言系统和操作系统的无缝整合，语音指令系统和操作系统api的整合统一，在语音模式下，语音指令权重更高，操作系统的api起到很重要的作用。逆向思维，智慧语音的操控系统同样也是可以输出api的，如果以语音操控系统为基点，开放语音操控api给手机app开发者们，让各种优秀应用的操作都能够接入到语音操控系统里，这样智慧语音就可以更早一天实现全语音操控手机和使用应用。

更进一步，既然语音操控能够开放api，那么，就意味着可以进行复杂的api编程，可以根据算法序列将一个个语音指令连续起来，并且可以接入到工业机器人、军用机器人、园艺机器人等身上，从而实现语音远程操控系统。这样，我们就可以远程语音和家里的机器人管家对话了，这有点像我们现在正在推进智能家居的连接工作。

高级的语音操控编程在计算能力支撑之下，可以和人进行实时地远程对话交流，我军派出的无人机在自动化战斗的同时，也可以听从指挥部或预警机空中指挥部直接进行语音指挥作战，此时，一言既出，驷马也能追啦。

登陆|注册欢迎登陆本站，认识更多朋友，获得更多精彩内容推荐！

2/2 首页上一页 1 2