怎样理解教育大数据——访电子科技大学教育大数据研究所常务副所长聂敏
践行社会主义核心价值观,传播社会正能量
采访及整理:郭伟(作者系人民时代期刊中心主任) 王方圆
中国发展网能量中国平台受权首发
记者:您是如何理解教育大数据的?
聂敏:我觉得从两个层面来看理解教育大数据,一个是广义的点一个是狭义的点。从广义的角度来讲,有两方面,第一点教育大数据其实本质上不是一种技术,而是一种推动我们教育形态以及教育手段变革的一种力量,这种力量能帮助传统教育的形态从集成化、规模化转变为一种面向个性化的一种教育形态。第二点,教育大数据又能够去推动传统的教育手段多样化,传统教育主要是通过教师教授学生这种做法来做,今后我们可以引进更多的信息化包括但不限于大数据的一些手段来去对学生进行教育和教学。
从狭义的层面讲教育大数据是一种面向教育全过程的新兴技术,这个全过程指的不仅仅是这个教育这个过程中的课堂,从时间上来讲,它应该是涵盖从我们学前教育一直到大学、就业、职业教育甚至终身教育的更多阶段。教育大数据会在依托传统信息化的基础上,采用大数据的技术对教育全过程产生的相关数据进行深度的挖掘和分析。无论采用传统的统计的做法还是采用新的机器学习、深度学习等等新的做法,从这些看似不相关的数据里面去找到其中的相关性,进而对学生的学业表现、生活表现、综合技能、领导力综合素养等各个方面进行预测和预警,这个是教育大数据这个技术最为精髓的地方。
记者:您认为教育大数据怎样助力教育治理与教育现代化?
聂敏:这其实是一个比较大的话题,因为教育治理是一个涉及方方面的问题,它可以从宏观的国家层面扩展到具体的教学层面,所以我想首先把这个教育治理稍微放窄一点。
我们是做教育大数据的,其本质上是一个通过技术结合行业的这种方式来去探究的一个路径,所以教育治理其中的一个方面就是对教育数据进行治理,而教育大数据在教育治理方面更多的是推动教育数据的治理。
教育数据的治理在行业中是一个痛点的存在。在教育信息化走过的十来年的时间里,全国各地区、各大高校信息化的进程是不一致的,除此之外,在教育信息化的这个过程中,学校并不是完全采用统筹规划集中建设的方式来进行建设,而是采用分点分散的方式。这就导致了从学校自身的层面到一个区域、一个省份乃至整个国家的层面都呈现了一个数据孤岛的问题。数据孤岛的问题则导致学校各部门和机构部门之间的协作不畅通。我举个简单的例子,比如说某大学的校领导在从事学生管理工作十几年之后仍旧不完全清楚学校的具体人数,虽然这是一个很小的点,但其实它反映出我们在数据层面是没有打通的。如果数据无法实现互通,那么数据也无法建立一个统一的标准,那何谈把这些数据融合汇集再进行数据挖掘?所以在通过教育大数据推进教育信息化发展的过程中可以产生很多新的成果,而这种效果可以反向推动数据治理的发展变革,从而去推动教育信息化过程中的一些数据标准和数据融通。
在教育大数据推动教育现代化的方面,从宏观角度来讲,我们国家目前是走在教育信息化到现代化的一个进程中,大数据其实是这个过渡阶段的一种黏合剂,是促进教育现代化的一种催化剂,它既推动了教育信息化进程的加快、以及过程中的规范和标准,同时它也展望了教育现代化的一些具体的意识形态与教育教学手段。
教育现代化的进程是一个相对扎实且漫长的过程,这个过程是可以通过由点及面的方式进行推进的,教育大数据可以在这一过程中快速的产生效果。我再举个例子,我们在成都七中试点的实验结果显示,采用大数据教学手段班级的学生成绩在一个学期内比采用传统教学手段的班级成绩平均分能够提高五到十分,这说明教育大数据在教育教学过程中是可以快速产生效果的。
记者:请您谈谈未来教育大数据的发展趋势?
聂敏:整个教育大数据的一个发展趋势从技术上来讲,毫无疑问是日新月异、不断更新迭代的,将来会采用更多更复杂甚至关联度更多的一些算法和理论思想。
同时,未来教育大数据将从理念方面带来一些重大变化,我从四个点来进行分别讲述。
第一点是从这个后置性的应急管理到前置性的预测预警。学生在校期间,除了学习之外还有很多的生活的过程,在生活过程中就可能会存在一些意外情况的发生。以学生的心理问题为例,我们通过最新的研究发现,零零后的心理风险是零零后以前学生心理风险的近三倍以上,他们出现重度抑郁和自杀倾向这种心理问题的概率会大很多。大数据能够通过对学生行为的分析之后提前感知到异常,让相关的学生管理部门进行提前的引导,进而防止一些意外事件的发生。
第二点我想谈的是这个定性化到定量化的过程。以前我们对于学生学习成绩、综合素质、领导力或者创新创业能力等等各个维度的刻画更多的是凭借一些经验性的判断,或简单的通过成绩的数字来进行判断。这种刻画是片面的,它并不能够全面反映或者准确地反映学生状态,比如说学生的成绩实际上只是一个结果,其实中间会涉及很多过程,对于过程性的这种管控,我们可以采用数据化定量化的方式去做,进而能够实时地感知到学生的成绩的变化,以及身心健康的波动状态。
第三个点就是从离线分析到在线分析。还是以成绩为例,在传统的教学方法里面,大学里面基本上每个学期会做一次学生成绩的统计,但其实这只是通过对学习结果的一个考证,进而去判断我们未来应该怎样去引导学生。但是对于成绩已经下滑的学生来说这已经变成了一个过去,我们只能通过分析过去然后更好的去对未来的学生进行教育。但实际上学生学习成绩波动的这种状态与其在自习、借阅、生活规律这些日常行为都是息息相关的,在这个过程中,我们把这些数据实时的接入进来对成绩进行预测,从而将传统的离线分析变成在线分析,进而实时的对学生状态进行感知,实时的对学生的一些可能出现的风险进行引导。
第四点就是传统的规模性教育到个性化教育。通过教育大数据技术,学校能够实现对学生成绩的预测,对心理异常的情况进行感知和预测预警,发现虚假贫困生和隐性贫困生,同时也能对可能失联学生进行预警,在未来我们就可以不再采用传统的规模化的教育和管理模式了。通过大数据手段,学校可以采用个性化的引导,进而针对性的对学生可能出现的问题进行引导和管理。
记者:想学习这种教育大数据的应用应该具备哪些基础知识呢?
聂敏:实际上从整个国家形态来讲国家的现状来讲,我们对于大数据人才的储备仍然处于一个紧缺的阶段。所以现在很多大学纷纷开设了大数据专业,电子科技大学的这个专业的整个课程体系设计是也由我们教育大数据研究所来完成的。如果想学习教育大数据应用,我认为是有几个核心的点是需要去掌握和具备的。首先大数据是属于计算机大学科下的一个方向,那么一些计算机的基础技能例如c语言、java 、python等基础的这个语言工具是需要掌握以支撑我们去开发一些大数据的应用。
其次,因为大数据用到的核心算法和技术需要具备深厚的理论和算法功底,所以数学是必不可少的一门学科,一定要掌握很多比较扎实的数学知识。第三,在大数据的研究和应用过程中,还需要有一定的算法的设计和实现的人。现在我们在大数据的基础算法理论层面取得了一些成绩,但是我认为其实远远不够,我们需要把大数据技术和人工智能的技术深度的融合和创新,这也是我觉得需要具备的。
最后我们做大数据的研究与应用不能停留在理论研究层面,一定要将理论去进行实践应用,否则这个技术是没有价值的。那涉及到应用的,就意味着我们其实要去深刻理解整个教育教学过程中的存在的具体问题和流程,我们才能更好地把这种技术能够应用到实践的过程中,才能够去产生真正的价值。
在我们将大数据的研究进行产业化的过程中,要真正找到这样的人才是非常的不容易的。所以在我们电子科技大学教育大数据研究所产学研一体化的实践过程中我们更多的是采用人才整合的方法,让专业的人去做专业的事,将大数据研究、技术、业务进行有效整合形成一个运转机制,最终能够将教育大数据的相关研究成果落地进行应用。