数据中台架构在智慧校园建设中的应用与研究——以南京财经高等职业技术学校智慧校园建设为例

姚 峰,程筱箐

(1.江苏联合职业技术学院南京财经分院,江苏 南京 210000;
2.中科曙光南京研究院有限公司,江苏 南京 210000)

教育部先后出台了《教育信息化十年发展规划(2011—2020年)》[1]《教育信息化“十三五”规划》《教育信息化2.0行动计划》[2]。正如教育部原副部长杜占元在“2018年全国教育信息化工作会议”上所说的,教育信息化2.0“就是要全面提升教育信息化的发展水平,使中国教育信息化步入世界先进行列,发挥全球引领作用,以教育信息化全面推动教育现代化,开启智能时代教育的新征程”[3]。这些政策明确了下一阶段教育信息化建设的目标是智能化,围绕智慧校园建设打造统一的数据中心。

随着数据规模的不断扩大、信息业务多元化,中台服务架构应运而生。中台是一个能够同时支撑多个业务,将不同业务的数据信息收集、分析,形成有机统一的交互、运营和管理的平台。中台根据其功能定位可以分为业务中台和数据中台两部分[4],业务中台主要包括业务共享中心以及为业务提供基础服务的各组件,数据中台主要完成对业务数据的采集接入、清洗、计算、关联以及存储。通过数据中台,可以借助大数据实现对既有业务全方位的分析和运营能力。中台技术的引入,能够为智能化服务进行模块化的抽象和封装,实现功能间的可复用、低耦合,降低开发和运维成本,提高内部协同效率。便于对快速变化的业务市场及时响应,从而实现智能信息建设的创新发展。

许多职业院校经过初期的数字化智慧校园建设,已经建立了包括教学信息、科研能力、师生管理、服务整合的信息化平台,提供了有力的信息化支撑和服务[5]。因此,将大数据的中台技术应用于智慧校园建设成为改革的必然趋势。南京财经高等职业技术学校是首批江苏省高水平现代化的职业学校,近年来不断加强基础设施建设,完善信息化建设,全面优化教育教学环境。目前拥有先进的云计算中心和四网合一的万兆校园网,现有国家级实训基地1个,省级实训基地2个,现代化实训室70余个,多媒体教室110个。在信息化技术的依托下,校内已经形成了涵盖师生教务管理、生活管理、校园建设的信息化平台,包括校园一卡通系统,课程教学系统、学生教务管理系统、图书管理系统、学生生活管理系统、校园安全监控系等。各类应用系统已建成并投入使用,支撑校园各自业务的信息化需求。然而,随着快速扩张的业务需求和数据规模,智慧校园建设在实际运用中也出现诸多问题。

(1)跨部门数据共享困难。学校各部门业务系统大多都是独立建设,导致跨部门数据共享困难,同时,各职能部门往往需要基于学生、教师、科研等不同阶段和方面开展管理和服务,对数据同步的要求较高。而数据无法及时共享将导致无法对其充分利用,形成众多信息孤岛,造成很多流程脱节,不利于学校的管理。

(2)数据标准不统一。校园内部信息系统建设初期,往往都是独立建设的,每个系统建设标准不一,而且各个系统数据都是独立采集,导致很多同类数据不一致的情况。比如,大多数系统都需要录入学生个人基本信息,但由于各系统数据标准不一致、人工填报有误差等问题,导致每个系统统计到的学生个人信息项不一致,甚至相同信息项的内容参差不齐,不利于学校后续数据的统计分析。

(3)数据资产不清晰。数据资产是拥有数据权属、有价值、可计量、可读取的数据集。目前一些校园数据都隐藏在各个业务系统后面,缺乏统一梳理和管理,难以实现量化与可视化,导致学校对目前校内数据资产情况不清晰。当学校遇到多方面数据统计的需求时,很难精准地获取到所需数据。

(4)数据分析场景匮乏。信息化建设最终目的是为了提升学校的管理和服务水平,能够为师生和管理方提供精细化的服务,实现数据赋能,但目前智慧校园系统往往积累了一定的数据存储,但对于数据的应用场景、数据价值没有得到体现。例如,人事部门在对师资队伍考核、评优时缺乏强有力的数据支撑,学生在奖助学金申请、未来方向发展等方向缺乏科学化引导。

(1)建设数据中心硬件平台,为学校数据管理工作提供硬件设施支撑。

(2)建设学校数据标准体系,统一数据在采集、交换、传输过程中的规范,为后续业务系统的建设提供标准。

(3)建设大数据管理平台,为学校数据的汇聚、管控、治理和共享提供信息化工具。

(4)建设大数据分析平台,实现学校对重点领域(如学生、教师、科研、教学等)的数据分析,挖掘数据价值,辅助领导决策,为学生、教师提供精细化数据服务。

(5)完成学校初步的数据管理,对学校数据现状进行调研、梳理、采集、分类,开展主数据建设、数据共享接口开发等,搭建学校数据底座雏形。

智慧校园建设是一个系统性工程,并非一蹴而就,是一个逐步建设完善的过程。本项目根据校园的实际情况,依托定制的大数据治理平台,构建统一的数据中台体系。具体架构如图1所示。

统一数据中台建设的依附前提是需要与之匹配的基础设施。包括通用服务器、存储节点和底层存储系统;
数据存储则使用分布式文件存储系统HDFS、任务资源调度YARN和一些集群索引等,为上层数据处理与分析提供数据承载服务;
大数据治理平台是数据中台的核心,提供众多的业务数据构建、处理和分析服务,包括数据来源接入采集,数据统一管控,数据标准建设,数据处理管理等;
在此基础上,针对学校重点关注的业务主题和场景构建相关主题库和专题库,包括学生主题库、教师主题库、学生成绩专题库等;
通过数据集市、接口服务或者全文智搜可以简单高效地获取主题库和专题库数据,实现部门间数据的协作共享;
进一步地,该系统将已有的数据资产拓宽应用场景,借助于大数据分析平台和可视化交互界面,提供校情驾驶舱、师生画像、学生监管预警、校园安全监控等专项应用,为用户提供良好的交互功能;
系统本身包含完善的系统管理,包括用户权限管理、任务调度、服务监控、设备组件管理等,能够实现低成本的功能扩展和日常运维。

4.1 数据汇聚

(1)数据采集管理。根据数据来源信息,将各个业务系统的多样性数据汇入平台,进行统一的存储,因此需要提供多数据库的采集接口。提供采集Oracle/MySQL/Oracle集群/SQLServer/MPP/GBase 8a等主流数据库、FTP文件库、Kafka实时库、Txt/Word/Csv等本地文件数据,实现对多平台多数据源的采集管理。

(2)数据源管理。数据来源信息的统一管理,通过登记注册业务系统、数据库、文件库、实时库等导入资源的基本信息,为后续的数据采集做准备。包括对生产环境的业务系统、数据库、文件库和实时库进行管理,并提供可视化交互界面,实现数据源的统一。

4.2 数据资产管理

智慧校园数据中台系统的数据资产管理提供数据仓库、全文库、文件库等数据资产全生命周期管理,能够根据各类数据的特征进行分类,全盘掌握数据状态。根据分析目标进一步形成面向业务的公共基础库,以构建需求导向下的数据资产库。

4.2.1 数据标准

结构化数据的接入需要统一标准。数据标准基于中华人民共和国教育行业标准(JY/T1001-2012)《教育管理基础代码》和《高等学校管理信息标准》,结合学校现状,编制符合学校实际需求的校级数据标准规范,具体包括元数据标准、信息编码规则、代码集标准等。数据中台根据建立的数据标准体系,结合数据采集和数据治理模块功能,将原始数据进行规范化处理,完成所有应用系统数据入库后的准确性和一致性。

基于统一的数据标准,结合平台的标准化建表页面工具,提供建立统一标准、规范的数据表服务,实现录入数据的存储和管理。

4.2.2 数据仓库

接入采集的结构化数据,需要基于国家、教育部标准,以已有的大数据平台为基础,构建学校的数据仓库,实现结构化数据仓库管理。针对汇聚中的数据建立数据仓库,并创建资源目录,将数据进行分类管理,实现按照业务规则自定义搭建符合业务需求的各类数据仓库。

数据仓库不仅是对业务数据的结构化存储,而且能够提供数据表的更新和修改,并根据业务特点对数据资源查看和管理。

4.2.3 全文库和文件库

平台提供数据仓库数据表的全文库注册服务,注册为全文库的数据表可进行大数据全文搜索,同时能够依据使用场景进行全文库分类管理和字段标签匹配服务,有助于业务的数据使用,拓宽了应用场景。

对于非结构化数据,平台提供了文件库管理服务,可依据使用场景进行非结构化数据的上传与更新,以及文件库分类管理。

4.2.4 主题专题库建设

根据智慧校园数字平台所要求的数据范围,以能够支撑所有大数据业务需求为目标,主要以满足各重点实体知识库总体边界,以业务实体统一视图为主题域划分参考依据,由此得到学校数字平台的数据模型及主题域。主题库数据通过标准层实现冗余、去重,同时有可能对标准层的实体表(大宽表)进行拆分或多表重组,保证数据权威性,形成面向全校的、公共的主题数据层。主题库包括学生主题库、教职工主题库、教学主题库、科研主题库、资产主题库等。主题库主要是根据各类主题的业务应用需求,实现对数据的冗余化重组,以适应复杂的即席查询和分析的需求。

不同于特定个体的主题库,专题库是针对学校特定的应用分析场景形成的特定数据库,更偏向于个体与行为、场景的关联,具有更强的业务导向。目前专题库包括学生奖惩专题库、学生就业升学专题库、学生录取专题库、学生住宿专题库、图书借阅专题库等。

4.3 数据治理

4.3.1 数据质量管理

数据汇聚由于多平台多渠道的特性,数据质量往往参差不齐。在统一数据标准的基础上,平台通过内置的质量检测规则,对数据进行质量剖析、检测,生成实用的剖析、检测报告,从数据库宏观角度为用户展现数据概貌,辅助用户不断提升数据质量,为后续数据分析、挖掘、应用打下坚定的基础。

平台提供通用质量检测规则,如空值检测、数值范围检测、日期范围检测、数列分布检测、身份证号码检测等,同时也提供自定义质量检测规则。可在页面上进行查看、更新和修改。

另外,平台也提供对单个表的专业算法分析,如空值率、数值范围、日期范围、数列分布等,提供检测任务在线创建服务,可对数据仓库内所有数据资产表进行检测,掌握数据资源表的质量情况。

4.3.2 数据清洗管理

平台提供对质量低下的数据进行字段级别的清洗过滤。根据配置的清洗规则,系统可根据表字段信息智能推荐最适合的清洗规则。支持查看输出的清洗报告,并对清洗任务可页面配置管理。平台还提供了在线清洗模型创建,针对数据源的规模和增长方式可选择全量或增量清洗,提升清洗效率与机器资源利用率。

4.4 数据应用

4.4.1 智搜应用

数据中台的智搜应用可以用于检索全平台的结构化、非结构化数据,实现全平台数据的碰撞检索,为实际业务应用提供全面的数据支撑,达到驱动决策的目标。

该应用基于全文库的结构化数据检索,可以快速检索出全平台内符合条件的数据,并可以根据数据分类进行高级精准化的检索。基于文件库的非结构化数据检索,实现文件名称、属性、内容的模糊匹配检索。

4.4.2 数据集市

数据集市展示已在数据中台系统中添加过标签的数据,并为用户提供接口服务申请功能。提供已注册通过的服务展示和基础服务展示,系统按注册标签将服务进行展示,包含服务名、服务记录数、服务来源数据、服务数据的更新时间等内容,提供服务的模糊搜索服务。

对于已提交的申请,提供服务申请管理,针对已提交服务申请的流程,可在服务申请内统一查看审批状态(审批中、审核通过、审核驳回),实现平台对下游接口服务的统一分配与管理。

4.4.3 校情驾驶舱

校情驾驶舱模块以可视化大屏展示,在一张大屏界面上实现对全校信息的整体掌控,主要信息包括校园概况、学生信息基本分布、教师信息基本分布、资产信息分布、学生生源地及就业去向展示、学院科研信息展示、学院学习分析、图书馆信息展示、能源信息展示等模块,具体详细信息和筛选查询功能在之后的对应模块进行体现。

4.4.4 人物画像

在已经构建人物主题库和专题库的基础上,整合人物的业务属性,提供更全面具体的学生画像和教师画像。以学生画像为例,提供统计学生综合数据(人数、性别、生源分布、年龄、学业成绩等)、以及学生行为数据(图书借阅、一卡通刷卡)等。每种综合统计数据可在页面上直观呈现可视化结果,并且提供详细的二级属性分布统计。

4.4.5 实时监控

智慧校园数据中台的校园安全模块提供校园实时监控和校园出入分析服务,对接视频平台,展示各校区实时校园监控,可自行选择或者输入监控名称进行查看;
能够通过一卡通/门禁数据分析,展示近一月/近一年校园出入人流量趋势,保证师生的校园生活安全。

对于学生而言,平台提供了一系列实时监控预警功能,包括学生学习成绩不良预警、网课异常预警、消费异常预警、行踪异常预警,支持对预警条件进行自定义修改,及时更全面的帮助学生健康发展。

4.5 平台运维

该平台提供运维监控,包括对大数据硬件状态、集群状态、HDFS存储、HEDFS、MAPREDUCE、Hbase、Z00KEEPER、YARN、HIVE等组件进行监控;
同时对平台数据进行监控,包括已有数据存储量、数据增量、表数量、在线访问人数等信息等都可以实时获取;
平台的操作情况,数据采集和共享行为都会以日志和统计图标形式记录,若有触发告警策略的操作,会以邮件形式进行告警;
提供整个平台的周期任务、非周期任务的智能调度,用户可根据业务需要选择执行优先级,任务调度系统会结合任务优先级以及系统资源占用情况,合理调度执行;
提供用户审批管理,提供审批权限配置工具,并根据配置进行流转审批管理。

5.1 学生管理立体化

学生管理工作是校园管理工作的重要环节,通过对学生综合数据以及行为数据的采集,客观记录学生的个人情况和成长轨迹,沉淀和积累多维度的学生成长数据。学生群体及个人数据的可视化为校方提供了解学生的个人成长需求高效途径,为学生在未来学业和就业方向上提供更加精准和科学的指导。

大数据管理平台建设等大幅度提高了各部门有关学生的管理工作效率,降低了人工成本。例如,在实现多平台数据互融互通之后,在学生的奖助学金评选与申请工作方面,有关部门通过调取学生个人成绩、消费情况和行动轨迹等数据,对相关数据进行分析处理,便可快速对该学生做出判断。同时,学生个人避免了烦琐的各类信息填报和材料提交等环节,工作人员也省去对信息以及材料审核等工作,大幅降低了人工成本,使得整个流程效率大大提高。

此外,大数据管理平台为需要重点关注的学生设置专栏,并做了系统分类。根据数据分析结果,对于已经出现问题的学生做星标,对于可能出现问题的学生做预警标记,以便校方领导及时对这些学生做出方案预判,进行同步跟踪关注并做出正确应对决策。

目前,学校以将校内的一卡通系统、课程系统、教务系统等接入至大数据管理平台,全方位构建学生的学习、生活画像,更高效地实现校内学生管理,满足管理数据的自动化分析需求。

5.2 教学管理精准化

职业院校未来的长足发展离不开优秀教师的科研和教学能力,因此,学校管理者需要全方位掌握教师的相关动态和能力,以便从整体上运筹帷幄,做出重大战略决策和调整。大数据分析平台的建设帮助学校实现对这些重点领域的数据分析,利用数据价值,做出客观判断。

首先,通过大数据分析平台,教师的教学和科研能力可以通过数据更加直观地展现。其次,人事部门在对师资队伍考核、评优时得到了强有力的数据支撑,大大提高了工作效率,促进了考核与评定的客观与公正,教师个人也避免了材料整合等烦琐工作。

同时经过对数据的整合分析,教师可以看到学生出勤、绩点、选课情况、课程合格率等综合信息,在结合评教结果等数据后会对教学情况拥有全面的了解,这不仅有利于教师规范组织教学、示范教学,也有利于教师根据结果改善和提高其教学能力和水平。

借助大数据分析平台,学校在专业建设方面有了有力的支撑。如能够实现财务教育共享服务资源的整合,支撑真实财务实训,助力产教深度融合;
平台对接动漫制作技术等课程,打通线上线下数据传递,让师生关注的重心放在教学内容上,真正实现了信息技术与教学内容和的结合,有助于提升学生创新实践能力。

5.3 学校管理高效化

各种业务系统的应用使得学校师生员工在校园内的行为数据被全面记录,这些数据资产具有宝贵的价值,为学校领导在进行学校管理和制定决策方面提供有力的支撑。学校管理者只需收集和分析相关数据便可以洞悉和预判现实中师生行为,准确定位师生的需求,从而实现精细化管理。

大数据管理平台实现跨系统的数据融合,并向外提供统一数据服务,各个业务系统采集的数据被进行统一梳理,为各部门工作提高了效率,节约了成本。

在教育教学方面,跟进学生和教师的状态有利于教育质量的提高。例如,图书馆和网络课程资源等相关数据帮助学校合理地运用信息平台和智能环境,尽量实现教育资源的共享,同时根据数据结果学校领导可以有效地判断需要引入哪些资源,以便于满足学校师生的发展需求。

在招生以及学生就业方面,通过用数据定位学生的生源地,就业率、就业去向以及就业单位类型等,帮助在校学生做好正确的职业指导,同时为学校的招生工作提供客观有效的数据支撑。

南京财经高等职业技术学校已经实现汇文数字化校园系统、智能建筑综合管理系统的接入,通过校情驾驶舱可以直观看到校内图书管理情况和主要教学楼栋、宿舍水电信息;
同时、校园安全监控系统能够整合多校区的视频监控资源,为全面的校园安全保驾护航。

数据中台技术架构下的智慧校园建设打破了传统的高校管理方式,使用信息化的思维,提供了一个相对通用的技术架构模型,使用模块化的层级系统实现信息的分析与处理,大大提升校园智慧建设的功能性和可扩展性。南京财经高等职业技术学校借鉴中台概念,实现“一切业务数据化,一切数据业务化”。在保证学校业务规范化的基础上,能够快速支撑学校业务的变化、创新,消除信息孤岛,让数据辅助校务管理,服务师生,提升校园运行效率,让师生具备更高的获得感。相信在不久的将来,大数据平台将会在智慧校园建设中发挥重要作用,有效提升学校人才培养质量和教育治理能力,更好地服务于职业教育的高质量发展。■

猜你喜欢 校园服务学校 服务在身边 健康每一天今日农业(2019年12期)2019-08-15服务在身边 健康每一天今日农业(2019年10期)2019-01-04服务在身边 健康每一天今日农业(2019年16期)2019-01-03招行30年:从“满意服务”到“感动服务”商周刊(2017年9期)2017-08-22校园的早晨琴童(2017年3期)2017-04-05春满校园小天使·二年级语数英综合(2017年3期)2017-04-01学校推介留学生(2016年6期)2016-07-25I’m not going back to school!我不回学校了!中学生英语·外语教学与研究(2008年2期)2008-02-18

推荐访问:智慧 校园 南京