人工智能视域下机器学习的教育应用与创新探索

  二、机器学习的概念梳理

  (一)机器学习的定义

  机器学习是人工智能和数据挖掘中最重要也是最热门的算法。国外有些学者对机器学习进行了定义,Mitchell认为,机器学习是对能通过经验自动改进的计算机算法的研究[10];Alpaydin认为,机器学习是指利用数据或以往的经验,以此优化计算机程序的性能标准[11]。由此可知,机器学习是通过经验或数据来改进算法的研究,旨在通过算法让机器从大量历史数据中学习规律,自动发现模式并用于预测。换句话说,机器学习即机器从数据中学习,其处理的数据越多,预测就越精准。

  (二)机器学习的两大阶段

  机器学习的发展可以分为两个阶段:浅层学习(Shallow Learning) 和深度学习(Deep Learing)。

  1、浅层学习

  20世纪80年代末期,用于人工神经网络的反向传播算法(也称为Back Propagation算法或者BP算法)[12]的出现,拉开了浅层学习的帷幕。利用BP算法可以让人工神经网络模型从大量样本中学习出规律,并进行预测。但是,浅层学习模型依靠人工经验来抽取样本的特征,往往要求开发人员挖掘出好的特征。

  2、深度学习

  2006年,加拿大多伦多大学教授、机器学习领域的泰斗Hinton和学生Salakhutdinov在上Science发表文章Reducing the Dimensionalitg of Data with Neural Networks[13],翻开了深度学习的新篇章。随后,深度学习在学术界持续升温,目前有多所知名高校纷纷加入深度学习的研究。与浅层学习模型依赖人工经验不同,深层学习模型通过构建机器学习模型和海量的训练数据,来学习更有用的特征,从而最终提升分类或预测的准确性。2013年4月,深度学习技术被《麻省理工学院技术评论》(MIT Technology Review)杂志列为2013年十大突破性技术(Break­through Technology)之首[14]。

  (三)机器学习的发展现状

  机器学习的研究主要分为基于小数据和大数据环境下两类。一般而言,小数据指的是基于内存的数据。基于小数据环境下的机器学习通常被认为是传统的机器学习,研究问题主要包括理解并模拟人类的学习过程、研究计算机系统和人类用户之间的自然语言接口、针对不完全的信息进行推理的能力、构造可发现新事物的程序[15]。而随着传感器和连接设备的广泛使用,每年都有数百“泽字节”(ZettaByte,简称ZB,)数据产生[16],可见,大数据时代已经来临。一般而言,大数据是无法装载进内存的数据,如何从复杂、真实、凌乱和无模式的大数据中挖掘出对人类有用的知识,是目前迫切需要解决的问题,也是大数据时代下机器学习面临的挑战。目前,大数据环境下的机器学习研究主要包括大数据分治策略与抽样、特征选择、分类、聚类和关联分析等[17]。

  三、机器学习与智慧教育的适切性

  技术中介的智慧教育已经成为教育信息化的新境界、新诉求[18],通过构建技术融合的学习环境,让教师能够施展高效的教学法,让学习者能够获得适宜的个性化学习服务和美好的发展体验,是智慧教育的核心目标[19]。在智慧教育环境中,学习者的数据被收集形成教育大数据,迫切需要智能化手段挖掘这些数据,以发现潜在模式和知识来支持智慧教育的创新发展。机器学习的本质是使用计算机从大量数据中学习规律,自动发现模式并用于预测。因此,机器学习助力智慧教育深度理解学习者的学习是确定无疑的。

  (一)作用对象和环境

  机器学习方法的作用对象是教育数据,包括学习者与教育系统交互产生的所有数据,以及人口统计、情感、协作和管理数据等,这些数据源来自不同的教育环境。Romero和Ventura认为,教育环境可以分为传统教育环境和基于计算机的教育环境[20];Papamitsiou和Economides认为,教育环境包括虚拟学习环境(Virtual Learning Environment,VLE)和学习管理系统(Learning Management System,LMS)、MOOCs和社会性学习、基于网络的教育、认知导师系统、基于计算机的教育、多模态和移动环境[21]。

  我们认为,智慧教育环境可以分为传统教育环境和网络教育环境,如图1所示。

  传统教育环境一般基于学校或课堂。根据数据存储的不同,可分为封闭式教学环境和开放式教学环境。其中,封闭式教学环境指单机版、在本地部署的教学平台或桌面版应用,数据存储于内存;开放式教学环境指基于网络的远程教育平台(受控环境,用来收集学习者和活动数据),数据存储于网络空间。