通版阅读请点击:
展开通版
收缩通版
当前版:04版
发布日期:
加强教育信息系统数据共享 提升基础教育学生数据质量
——贵州省基础教育学生数据衔接应用系统设计构想
  ■ 李佩
  数据是信息时代宝贵的资源,数据能发挥多大的价值,首先取决于数据本身的质量,数据的质量越高,其价值就越大。然而,在实际工作中,数据失真甚至人为失实的现象比比皆是。因数据不真实导致政府部门决策失误,又产生一批不真实的数据,进一步导致下一轮决策的失误,严重影响政府部门的公信力。
  目前,我省基础教育学生数据主要依托于全国中小学生学籍信息管理系统和教育事业统计系统。全国中小学生学籍信息管理系统是我国教育行业基础而重要的信息管理系统,在我省教育工作中举足轻重,支撑着基础教育事业的日常工作运转。教育事业统计,是教育行政部门制定政策规划、督查工作进展、评价发展水平时的重要依据,是教育科学管理的一项基础工作。但从调研结果分析,两个系统相同指标的数据存在着一定差异。如学籍系统是一个动态数,而教育事业统计为年度数据;因学籍没有更新完成或出现学生跨县跨省转学审核不及时等原因,统计时都会导致数据差异。
  如何做好以上两个系统数据的衔接,从而提升数据质量,确保数据的真实性,是教育信息化管理工作中的重中之重。
  从传统意义上来看,信息系统的数据质量管理是IT系统本身的事,但实际上,数据质量问题的形成,很多情况下是因为有缺陷的工作流程和执行力不足造成的。因此,提高数据质量,不仅要考虑技术层面的问题,也要从管理层面入手。数据质量解决方法应该包括各业务的数据质量管理和数据质量管理流程再造的过程。
  教育数据的质量包括:1.完整性。用于度量哪些教育数据丢失了或者哪些数据不可用;2.规范性。用于度量哪些教育数据未按统一模式存储;3.一致性。用于度量哪些教育数据的值在信息含义上是冲突的;4.准确性。用于度量哪些教育数据和信息是不正确的,或者教育数据是超期的;5.唯一性。用于度量哪些教育数据或者教育数据的哪些属性是重复的;6.关联性。用于度量哪些关联的教育数据缺失或者未建立索引。
  怎样提升数据质量?如何提高工作效率?现阶段我们需要积极推进基于学生基本信息的学籍系统与教育事业统计数据的衔接应用。
  管理层面
  建立全国中小学生学籍信息管理系统和基础教育统计双向促进机制,对底层基础数据严格把控,进而提升基础教育学生统计数据和全国中小学生学籍信息管理系统数据的质量,提升教育事业统计数据为决策服务的科学性和精准性。
  应用基础教育学生数据衔接系统,有效提高中小学学籍数据和基础教育统计数据的准确性。全面实施以学生身份基本信息为核心的数据审核工作,减少或降低存在问题的学籍,提高数据的质量,为基础教育统计工作提供高质量的数据支撑。同时,基础教育统计也能够有效反映学籍系统数据的准确度,凸显数据问题,促进基础数据的改进,能有效提高数据质量。
  统计全国中小学生学籍数据与基础教育统计数据,进一步对统计结果进行分析比对。积极落实和推进对接实名制学籍数据与基础教育统计数据。逐步在基础教育经费管理中运用全国中小学生学籍系统的相关数据,健全经费管理机制,提高财政资金分配和使用的准确性。逐步在教育事业发展规划和各项建设中运用全国中小学生学籍系统数据,提高决策水平。
  使用基础教育学生数据衔接应用,做好基础教育阶段学生的学籍建立和正常变动(如:升学、毕业等)、学籍异动(如:转学、休学、复学、辍学等)的管理和统计工作。监测学生上学考勤情况,做好义务教育“控辍保学”工作。监测随迁子女流动情况,提高平等接受义务教育水平,推动高中阶段教育公平。为招生入学提供支撑,控制义务教育学生无序流动,遏制超大规模高中学校,规范招生入学秩序和办学行为。
  利用基础教育学生数据衔接应用,完善工作方案、健全管理制度,形成有效工作机制,及时解决各类问题,提高基层工作管理水平。
  建立基础教育学生数据衔接应用运行监测机制,及时准确掌握全国学籍系统和基础教育统计系统的运行情况。健全系统运行问题研判机制,完善教育技术服务平台,畅通学校和教育行政部门快速反映和解决全国中小学生学籍信息管理系统和基础教育统计系统问题的渠道。
  技术层面
  (一)设计思想
  基于全国中小学生学籍信息管理系统数据巨大、数据复杂的特点,数据采集要求必须高效、敏捷,整个数据分析的链路为:数据收集/采集—数据清洗—挖掘分析—数据可视化—应用模板开发,从而实现对数据形象、直观的展示。
  1.数据对接平稳高效。在和中小学学籍信息管理系统对接时,要充分保障数据连接的持续性、稳定性,不能影响中小学学籍系统业务的正常运行。采用数据源连接池技术预先建立好一定数量的数据库连接,并将这些连接保存在连接池中,由连接池负责对这些数据库存连接管理,当访问数据库时,只需要从连接池中取出有空闲状态的数据库连接;当程序访问数据库存结束时,释放连接池。
  2.数据采集完整一致。在采集中小学学籍系统数据时,充分保障数据源和采集后数据的完整性和一致性,不能出现数据丢漏、紊乱现象。基于BI的ETL数据采集技术从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据洛克菲勒过程数据仓库中去。
  3.采集操作灵活多样。数据采集操作按照业务需求配置进行。采集的时间和频率,根据需求设定,可以定时同步,也可以人工同步。默认所有数据都是人工采集的,不用时采集服务为停止状态。
  4.数据转储按需合理。数据按照原表原样原则采集到应用系统后,根据业务需求进行查询、汇总,满足前端数据展示所需要求。
  5.基于需求展示数据。根据业务需求,形成基础教育年鉴数据,并以图表的形式进行业务展示。
  (二)数据可视化
  数据可视化,是大数据处理技术的一个流行的展现技术。数据是一个专业、抽象的概念,由代表不同意义的信息组成,但利用数据使用数据却又是我们都需要的。如何将数据由抽象变为可识别且易理解,这就需要有一个转储的过程和全新的呈现方式。大数据的最大价值在于通过对数据潜在价值的分析和再利用,实现对事物未来发展方向的“预测”,技术只是为这种预测提供了科学依据,但最后的决策仍需要人来决定,决策人需要读懂这些数据才能给出正确的决策,这其中必须借助“可视化”的手段。
  可视化是一种公众可以看,易懂的大数据表示技术。它是将大量复杂而晦涩的数据信息转换成直观、易懂的图表形式,以便公众更容易接受和理解。它可以为同时进行的数据分析和预测提供多样式、多维度的图表方法,反映数据信息模式、数据关联或预测趋势,帮助决策者生动、直观地观察和分析数据。实现人与晦涩的信息之间互动,进而挖掘数据中隐藏的价值。
  可视化系统整体设计的原则包括:可靠性、安全性、健壮性、可伸缩性、可扩展性、标准化、先进性和易用性,针对不同的原则采取不同的设计方法。
  (三)安全设计
  基础教育数据衔接系统基于自身业务特点、覆盖数据面及数据量,总体设计上应按照信息系统安全等级保护第三级设计,即:在统一的安全策略下,它可以保护系统免受外部有组织、有预谋的群体、资源丰富的威胁源、更为严重的自然灾害以及其他危害程度相当大的威胁和恶意攻击,它可以发现安全漏洞和安全事件。系统损坏后,可以快速恢复大部分功能。
  大数据时代,各类统计平台数据共享,相互比对,相互监督,加强教育数据资源的统一归集和治理,发挥数据作为生产要素在教育管理方式重构和流程再造中的作用,推动教育数据资源融合共享,是教育信息化管理的新模式。
  教育事业的发展,离不开教育信息化的推动,没有信息化就不可能实现教育现代化。深入挖掘教育大数据应用价值,建立“用数据说话、用数据决策、用数据管理、用数据创新”的机制,不断提高政府决策、管理和服务水平。
  (作者单位:贵州省教育管理信息中心)

贵州省互联网出版业务许可证:黔新闻出网版准字第046号黔ICP备05003182号-1 Copyright @ 2003-2015 DDCPC.COM 法制生活网 Inc. All rights reserved
法制生活报主管主办 技术支持:锦华科技