智慧校园大数据云平台建设和运营整体解决方案
的逐步成熟,将有越来越多的数据采集技术应用到教育领域,推动智慧校园大数据更加实时、连续、便捷的采集。为了保证高质量教育数据的可持续性采集,教育数据采集在实践过程中需要注意如下事项:
2.5.1、 要提前规划设计
智慧校园大数据的建设与应用是一项系统工程,需要进行顶层设计,以便有目的、有序地采集高质量教育数据。规划设计的内容包括:数据采集的范围、使用的数据采集技术、数据采集环境的部署、数据采集质量的保障措施、采集数据的应用目的和场景、数据的存储方案、数据的更新机制、数据的交换标准等。不同层级的教育数据采集应当有不同的侧重点——国家智慧校园大数据和区域智慧校园大数据应以管理类数据采集为主,同时注重与社会、医疗、交通等领域大数据的关联交叉分析与挖掘,重点服务教育政策的制定以及区域教育的均衡发展;学校、班级、课程大数据应以教与学活动数据采集为主,重点服务教学质量的提升;个体大数据应以学习者个体的行为数据、状态数据、情境数据等采集为主,重点服务学习者的个性化学习诊断和发展。
45
智慧校园大数据云平台建设和运营整体解决方案
2.5.2、 要有清晰的边界
大数据虽然具有混杂性、来源多样性等特征,数据的存储成本也越来越低,但并非要囊括一切数据,没有价值的数据是不值得收集和分析的。智慧校园大数据同样如此,其采集应当有清晰的边界,而非盲目采集任何教育活动数据。究竟要采集哪些数据,取决于数据的应用目的。举个例子,为了检测评估学生的学习进展,就需要对课程浏览、作业练习、交流互动、提问答疑等数据进行实时采集和分析,而不必采集学生的饮食、运动等数据。当然,我们并不否认饮食、运动等数据在诊断学生体质状况方面的价值。这里所提的“数据边界”是相对于具体的应用目的而言的,任何数据分析模型的构建都需要依赖特定的数据集合,唯有如此才能保证分析模型的有效性和分析结果的应用价值。
2.5.3、 要保持连续性和规范性
很多时候,仅凭某个学生的一次作业成绩并不能说明什么问题,但如果将一个班级每位学生历次的作业成绩甚至作业的过程数据都全部采集到,便可以客观评估学生的整体学习效果、发现学习盲点、诊断教学难点,开展针对性教学和个别化辅导,这时
46
智慧校园大数据云平台建设和运营整体解决方案
的作业数据便具有了“大”价值。智慧校园大数据的采集应秉持“持续创造价值,规范提升价值”的理念。教育数据的采集一方面应当保持连续性,即根据前期规划设计,定期、连续、有规律地采集各种教育数据,通过长时间累计从小数据生成大数据;另一方面,为了保证后期数据的融通互换和一致化处理,教育数据的采集应遵循特定的技术标准和规范。目前,全国信息技术标准化技术委员会教育技术分技术委员会已在教育信息化标准研制方面做了大量的工作,有些技术标准已经成为国标,各应用系统的研发应当遵循教育管理信息化标准、教育资源建设标准等。此外,国际上一些通用标准也值得借鉴,如IMS-QTI(问题与测试交互)标准、xAPI(学习体验记录)规范等。
2.5.4、 采集粒度要尽可能小
数据粒度是指数据的细化和综合程度。一般来说,细化程度越高,粒度越小;细化程度越低,粒度越大。数据采集应处于一个合适的粒度级别,粒度的级别既不能太高也不能太低。这是因为,低的粒度级别能提供详尽的数据,但要占用较多的存储空间、需要较长的查询时间;高的粒度级别能快速方便地进行查询,但
47
智慧校园大数据云平台建设和运营整体解决方案
不能提供过细的数据。就智慧校园大数据采集而言,在保证数据有效性的基础上,数据粒度应尽可能细,以便从中挖掘更多的潜在价值。传统的教育数据以分数为核心,一份作业、一张试卷最后采集到的仅仅是一个表征成绩的数字符号,即采集的数据粒度比较大。如果基于在线学习平台或点阵数码笔技术能够采集到每个学生的答题过程,如做题的顺序、每道题的停留时间、答案修改次数等更细化的过程记录数据,便能更加精准地判断学生在哪些知识点存有疑惑和答错的具体原因(马虎大意还是未掌握知识)。因此,可以说“小颗粒汇聚大数据,大数据蕴藏大价值”。
2.5.5、 智慧校园大数据数据源分析
2.5.5.1、 数据涉及面窄
? 主要是数字化校园系统产生数据 ? 数据的维度少,业务来源不足
2.5.5.2、 有效数据量少
? 数据量百GB到几TB,数据量少 ? 以结构化数据为主,达不到大数据要求
48
智慧校园大数据云平台建设和运营整体解决方案
2.5.5.3、 数据接口不完善
? 部份数据源有错误,数据不一致 ? 业务接口与数据结构不规范
2.5.6、 智慧校园大数据服务用户分析
智慧校园类似一个小社会,用户群体较多,各部门都存在大数据需求,而关注的内容会有较大的区别。比如校领导关注全校基础数据和总体情况,用于战略决策与发展评估。管理部门关注学生的生活、消费和心理状态。教学部门关注学生成绩情况、教师教学质量和学生满意度等。因此,这些特点决定了高教大数据的应用模块和类型会比较丰富。
49