这五种人工智能技术可以识别图片

很长一段时间以来,人工智能的研究都停留在文字层面,比如著名的图灵测试(Turning Test),证明了机器能够像人类一样智能地回答书面问题。

而如果让机器变得更聪明,仅仅处理文字显然是不够的。事实上,人类心智非常善于视觉处理。从所见当中识别图案、物体以及文本情景的能力让我们很智能,这种能力也是人的本质特征。

不过直到最近,计算机都对图片束手无策。比如,除非人为添加一些标签和注释,否则机器就无法理解图片,图片也就是成了无用的文件。

但是,这种尴尬的情况正在发生变化。一大批能看懂图片的人工智能技术已经来到人间,下面不妨来看看机器之心的盘点:

谷歌 TensorFlow

5月份谷歌推出 Google Photos时,媒体关注的焦点是:人工智能和图片搜索结合后所产生的强大功能。谷歌声称(并且用户也很快确认),搜寻特定某人,你会找到对方从现在到婴儿时期的照片。搜索品种名,你就能找到相应品种狗的照片。把名字和食品类别结合起来,比如输入「最大披萨」,就能锁定特定图片。

这五种人工智能技术可以识别图片

这款应用发布之初,媒体无从得知谷歌究竟研发了多长时间。不过,一些搜索功能在Google+上出现一年多了。

两周前,谷歌以TensorFlow平台形式开源了它的人工智能主体部分。

尽管TensorFlow并不是第一个开源人工智能平台,但是,它是与谷歌强大图片搜索关系最为密切一个。

开源TensorFlow意味着,包括初创公司在内的其他公司,能够利用谷歌的这个开源平台,快速将人工智能和图片结合起来。尽管谷歌并未开放人工智能关键技术,包括在众多服务器上运行的能力。谷歌也没有开放让其如此强大的用户数据库。但是,谷歌的此举毫无疑问将刺激整个机器学习和人工智能创业生态的发展。

我们也期待着基于TensorFlow的各种震撼新应用能于明年进入市常

Facebook Photo Magic

Facebook近期开始在Messenger应用上测试一项新功能——Facebook Photo Magic。这是一个可选应用,它会扫描手机相册照片并对它们进行面部识别处理。Photo Magic会识别照片中的人物(他们也是你的Facebook好友),建议你和他们一起分享这些照片。

这五种人工智能技术可以识别图片

毫无疑问,这项功能给Facebook带来了双重优势。首先,它鼓励用户更多在Messenger上分享。其次,它改善了识别。但是,仅仅这项便利功能是不够的,用户实际上可以赞成或拒绝在任意灯光条件、角度和其他参数条件下,Facebook使用人工智能对面部和名字进行匹配。Facebook人工智能掌握的照片越多,识别效果也越好。

令人吃惊的是,即使遮住了脸部,Facebook的「面部识别」一样能能识别出你的脸部。这个系统也关注发型、姿势、衣着和身材。(请注意,我们并不清楚Facebook是否已经实现了这种先进系统,但很明显的是,它从用户照片中收集数据。)

Facebook 的Photo Magic拓展了图片库来源,它不仅收集Facebook(社交网站),还收集Messenger(聊天应用)的数据,扩充了数据量。Photo Magic还鼓励赞成或否定匹配结果,提高数据质量。

很明显,Facebook最终目标是识别任意场景中的任何人,即使在看不清脸部的恶劣灯光条件下。毫无疑问,未来Facebook的人工智能会扫描和分析环境,发现可市场化的线索——比如,如果某人在照片里经常打棒球,广告商就可以利用这个信息锁定棒球迷,尽管他在上传照片的文字里并没有表露出这种兴趣。

毫无疑问,他们也打算通过观察图片中一起出现的人,进一步建立社交图谱。

微软牛津项目(Project Oxford)

微软日前也更新它的牛津项目,这是一个工具包,让开发者通过旗下的Azure云平台,使用微软的人工智能系统。