云创大数据向深度学习领域进军

  2016年3月28日,云创大数据宣布正式成立深度学习组。自此之后,云创大数据将应用趋于成熟的云计算技术优势,依托大数据的数据管理平台,为全新的深度学习版图提供强有力的支撑。这既是云创大数据继2016年1月4日启动平台部以后的又一重大举措,也是其顺应深度学习大潮的不二之选。

  

大数据

 

  早在2011年,Google X从YouTube视频中抽取了1000万张静态图片,把它“喂”给“谷歌大脑”,目标是从中寻找重复出现的图案。3天后,谷歌大脑在没有人类帮助的情况下,从这些图片中发现了“猫”,实现了在互联网中“自学成才”。

  

 

  2012年,微软公开演示了一个全自动的同声传译系统,讲演者用英文演讲,后台的计算机一气呵成自动完成语音识别、英中机器翻译和中文语音合成,效果非常流畅,而其支撑的关键技术也是深度神经网络(DNN),或者深度学习(DL)。

  

 

  2016年,机器人AlphaGo在距离击败欧洲围棋冠军樊辉不到半年的时间,又以4:1的比分战胜了九段棋手李世石,以强悍的深度学习再一次刷新了人类对人工智能程序的认识与理解。

  

 

  上图为计算机眼中的国际象棋落子思路,而下图为计算机眼中的围棋落子思路

  

 

  因此,深度学习俨然成为了机器学习研究的新领域,而其动机在于建立、模拟人脑进行分析学习的神经网络。这些用多层神经元构成的电脑神经网络像人类大脑一样,可以收集信息,从而模仿人脑的机制来解释数据,例如图像,声音和文本等,并基于收集到这些信息做出相应行为,以达到机器学习的功能。

  

 

  深度学习广为人知的便是视觉功能,如果说相机能够记录这个世界,那么深度学习却可以看懂这个世界。有了深度学习,我们可以很方便地刷脸付款,百度识图可以准确识别照片中的物体类别,并对照片进行自动归类或搜索,有了深度学习,机器可以检测一定空间内所有人员、车辆的行踪,并对可疑和危险事件及时报警。云创大数据深度学习组的成立,正是适应时代大潮的必然选择。

  深度学习的基础——海量的数据资源

  “深度学习需要大数据的助力,就像火箭有了燃料。”潘争博士曾介绍,深度学习技术建立在大量实例基础上,就像小孩收集现实世界的信息一样,而且“喂”的数据越多,它就越聪明,并且不会“消化不良”。因为大数据的不可或缺,所以目前深度学习做得好的基本是拥有大量数据的IT巨头,如谷歌、微软、百度等。

  

 

  对此,云创大数据具有得天独厚的大数据平台优势。其中,智能硬件大数据免费托管平台——万物云(http://www.wanwuyun.com/)基于数据立方云计算大数据库,无限承载物联网与智能硬件数据,支撑数亿个手机的实时信令流在线处理,可提供实时、可靠、安全、免费的一站式数据托管服务。

  

 

  其次,环境云(http://www.envicloud.cn/)作为环境大数据免费开放平台,通过大规模布设各种传感器,实时感知环境,以API共享与环境有关的多元化数据(包括水体环境、大气环境、污染物排放、地质灾害、气象灾害、城市位置查询、城市编码查询等),同时支持多种应用,可提供海量优质的环境数据。