中国高校SAS数据分析大赛2018宣讲会-华南赛区巡讲

高校大数据挖掘方向探索

发表时间:2016-09-20 20:23

中国人民大学副研究员陈璞在《人民日报》撰文总结道,通过采集和比对学生进出寝室、夜间用电的时间等数据,可以将最适合的人安排在同一个宿舍;通过对图书馆和自习室座位信息的动态推送,可以解决“占座”问题;通过对选课系统的数据分析,可以在瞬间评出最受欢迎的课程和老师。当各方面管理数据的丰富度和系统化水平达到一定程度后,海量数据之间的相互关联将生成以即时分析和动态预测为基本功能的智能化校园管理系统,为学生自我管理提供便利,帮助学校破解一些管理上的难题。比如,利用标签化技术,可以对学生的情绪进行动态采集和量化监控。发现严重的负面情绪累积和社交异常时,校园管理部门可以及时启动心理咨询和行为干预。当然,智能化校园管理平台建设,要以校园法治化水平提高为前提。对学生学习生活数据的采集和运用,必须得到学生的同意和授权。



让大数据“小宇宙”爆发

  2016年3月,南京某高校的“暖心饭卡”项目引发了社会关注。该校教育基金会对全校所有在校本科生在2015年9月中旬到11月中旬的饭卡刷卡记录进行了数据分析,将每个月在食堂吃饭超过60顿、一个月消费不足420元的学生列为受资助对象,圈定了314人的名单,再经过各学院辅导员的核对,最终对301人进行的暖心饭卡资助,以一日三顿、每顿7元,30天总计630元的标准,对学生消费的差额进行补贴,将资助直接充入学生饭卡。学生无需为此提交申请。为保证样本真实,学校还做了保密工作。(澎湃新闻,2016-03-24)新闻一出,该校此举获得不少学生的支持:“这种做法充满了对学生的尊重,对人性的关怀。”更多人为学校科学分析、大数据管理的做法点赞。

  学生学习和生活每时每刻都产生着数据。他们的成绩、奖学金信息、生源信息,甚至是他们在图书馆和食堂刷卡的次数都会被一一记录。高校正是用这些信息加以分析,帮助高校找出问题学生,及时提供帮助,甚至大数据能像“章鱼保罗”一样帮助学校预测“未来”。

  在美国马里兰大学系统中的马里兰大学学院,开课前一周,一些学生开始提前浏览挂在网上的课程提纲,以简单了解课程内容,但另一些学生则不屑一顾。仅凭课程开始前这一学生行为,学校就可以精确预测出哪些学生能够顺利完成课程,哪些学生仅能勉强应对。

  从学习行为推断学习态度并预测结果,这或许没什么难度。该校还根据数据统计和分析发现,在课程报名系统关闭前最后一刻注册课程的学生往往表现不佳。学校分管分析计划和技术的副校长皮特·杨表示,这一发现让学校改变了课程报名政策,在第一堂课开课前不允许学生注册课程。在课程开始之后,学生也可以根据课程难度选择放弃。比如在工程学入门课程成绩只拿到C的学生很可能无法顺利毕业。所以,学校不需要等到学生门门功课亮红灯才介入,而是在学生入门课程出现问题的时候就及时提供帮助与咨询。


“暴走”的大数据

  在大数据时代,曾经手写的纸质表格、试卷上鲜红的分数、算盘上的算珠、鼠标的点击都变成了电脑中跳动的数据,生源信息、学生成绩、财务数字、网站流量,浩如烟海。高校有着丰富的数据来源。2015年4月,甲骨文公司发布《改善高等教育在大数据方面的表现》(Improving Higher Education Performance with Big Data)的报告。报告指出,目前高等教育管理领域的大数据资源主要有以下来源:

学校运营传统数据

●学生考试数据:主要是学生成绩

●社交媒体数据:关注人数、转发量、点赞量、评论量等

●市场营销数据:营销费用、受众面、投放量、营销效果等

●财务数据:预算、决算等

●网站浏览数据:用户点击量、鼠标停留位置、浏览时间等

●校园传感数据:传感器收集的数据,比如教师门口设置指纹签到功能等

●通过移动端收集的数据:手机、iPad等移动端的数据

  通过这些渠道收集来的数据通常可以被用于以下方面:

●优化招生

●辅助学生选课、选专业

●提升保有率

●跟踪学生进步程度

●改善教学效果

●提高IT管理效率

  这些数据被保存在服务器中或云端上,成为亟待开发的资源。然而对高校来说,海量数据资源有时也让管理者头痛。2016年,四大会计师事务所之一的毕马威公司(KPMG)发布了一项名为《2015—2016高等教育产业前瞻调查》(2015-2016 Higher Education Industry Outlook Survey)的报告。在接受调查的102位高校管理者中,53%表示他们会将数据应用于招生注册,42%应用于募款。在数据分析和使用过程中,校方面对的最大问题就是如何有效地将数据用于不同领域(60%),其后的问题是数据质量较差(40%)和需要新的或更先进的分析技术(39%),其他问题还包括新数据种类难以处理、数据量过大影响决策进度等。有87%表示学校拥有充足的数据。但仅有29%的高校有自主分析数据并根据数据做出相应决策的能力。22%的高校数据充足,却未能有效使用。

  美国教育数据分析公司“西维塔学习”(Civitas Learning)自2011年成立以来就为大学提供数据分析云平台和服务,以帮助高校提升学生学习效果和保有率。其联合创始人之一马克·米勒龙认为,高校并不是没有足够的数据,它们就置身在数据的海洋之中。但经常出现的麻烦是数据指出了问题,学校没有继续分析的能力,也就不知如何处理。“更麻烦的是,一些高校试图用两年前的旧数据帮助解决新学期学生的问题。这就像是开车时使用没更新的GPS。”


大数据分析如何“开挂”

  当高校不具备深入分析数据和挖掘能力时,丰富的大数据资源难道就要躺在云端睡大觉吗?

  从毕马威发布的数据可以看出,不少高校在数据分析方面心有余而力不足,想用而不知怎么用成了大数据管理的问题。在这种情况下,36%的高校选择将数据分析工作外包给外部供应商或合作伙伴。

  马克·米勒龙创立的西维塔学习就是这样一家公司。目前该公司与全美880所高校合作,为320万大学生服务。比如,该公司为奥斯汀社区学院量身打造了“学位地图”(Degree Map)软件,学生可以在软件中了解到自己完成学位需要修习哪些课程,需要花费多少时间和资金。不同于一般学位监测系统给问题学生亮红灯或者黄灯的消极警示,学位地图系统更倾向于鼓励学生继续努力,为他们指出下一个里程碑的位置,并指导学生按计划和步骤完成。与西维塔学习合作的院校将按照学校规模和所使用的服务付费,校方还被邀请参加两年一度的峰会,讨论他们的使用心得和改进意见。

  也有高校打定主意弥补数据分析方法的短板,引入专业人才。大数据没有将这些高校淹没,而是让他们学会了游泳。比如约翰·霍布金斯大学自2013年起就在自主研发一款名为HopReach的软件,它可以标出哪些学生缺交作业或逃课,根据学生问题的类型将学生引导到补课教师、助学金专员或是医疗保险专员那里,获取帮助。

  马里兰大学巴尔的摩郡分校教学技术副校长约翰·弗里茨通过大数据分析发现,课程成绩得了D或F的学生使用Blackboard系统的频率比得A、B和C的学生低40%。基于此,他开发了一个允许学生对比自己和匿名的同班同学使用Blackboard频率的软件,结果是学生使用了这一软件后,成绩拿到C 或以上的可能性比之前提高了1.5~2.8倍。

  在大数据分析方面达到“炉火纯青”境界的马里兰大学学院则将学校在大数据方面的优异表现再提高了一个层次。2015年9月,马里兰大学系统董事会批准了该校创建一家名为HelioCampus的教育管理公司,启动资金为1000 万美元,公司主要为高等教育机构提供整合和分析学校数据的技术支持。公司的平台将每天与学校数据系统连接,进行数据复制、清理,然后将数据进行转换,设置汇报模式,有专门的分析员帮助解读数据并将总体趋势进行突出,提醒高校注意数据中反映出的潜在问题。

  不过在大数据不断发展的过程中,随着数据来源的丰富,有关学生和教职工隐私的保护问题也开始受到高校的重视。马里兰大学系统内的学术创新中心主任MJ·比索认为,保护学生隐私是大数据管理应用时的第一要务。她表示,马里兰大学系统领导很可能在近期公开学生信息被采集的方式和使用方式,以获得学生的支持和理解。当学生对此有了深入了解之后,随着他们看到大数据使用的更多益处,学生也就不会有排斥情绪了。同时,校方也应该加强安全措施,保护数据安全,防止数据外泄,让师生隐私不受侵犯。

  马里兰大学系统分管行政和财务的副校长本·帕斯莫尔谈及大数据在高校管理中的应用时比喻道:“就像是在满是金子的土地上建造房子,我们可以做的事情太多了。”毫无疑问,未来,高校会在大数据挖掘与分析的路上不断探索前行。


商务合作
BD@ibbd.net
简历投递
fuwu@ibbd.net
关于迪奥
产品中心
联系我们
行业应用
公司简介
新闻动态
人才招聘
自然语言理解
场景文字识别
文档OCR识别
金融行业
政府&公共事业
零售行业
020-29179586
工作日:9:30-18:30
广州市天河区华观路田头岗二路一横街起点国际三层
能源行业
文本数据挖掘