年上海市数据科学与工程暑期学校暨华东师范大学第六届数据科学与工程暑期学校于7月13日至26日在华东师范大学举办。今年暑期学校的主题是“数据驱动的计算教育学”。
推进信息技术与教育教学的深度融合,实现教育现代化已经成为我国的重要战略任务。近年来,国家教育部和国家自然科学基金委组织发起了教育的交叉学科研究,鼓励用自然科学的思路和方法来研究教育的科学和实践问题。华东师范大学则在年适时启动了“教育+”和“智能+”行动计划,以响应国家号召,促进校内教育和信息技术优势学科的交叉融合。
现代科学从三百多年前的牛顿时代算起,在其发展历史进程中经历了科学探究的实证范式(EmpiricalParadigm)、理论范式(TheoreticalParadigm)、计算范式(ComputationalParadigm)三个阶段,取得了辉煌的成果,极大地推动了人类社会的进步和发展。第四范式(TheFourthParadigm),即数据密集型范式(Data-IntensiveParadigm)的提出,预示着科学探究和发现将进入一个崭新的阶段,会带来方法论和思维方式的根本变化,人类将更有可能接近科学的本质。第四范式是科学探究前三个范式融合统一的结果,是科学研究方法的螺旋式上升。站在第四范式这个新的高度和起点,一些目前还没有进入科学研究范畴的学科领域将有可能借助数据和数学(算法),进入科学发展的快车道,迎来具体实践和科学理论相互促进,蓬勃发展的繁荣局面。数据驱动的计算教育学就是基于这种认识提出来的,是我们关于教育的科学研究和科学实践新范式的探索。
教育研究是关于人的研究,属于应用社会科学的范畴,按照传统自然科学的观点,科学研究的第一范式(实证范式)在这些领域还没有真正获得成功。互联网的出现带来革命性的改变,利用互联网平台进行真实的行为数据的采集和处理;利用数据来分析和解构社会现象,并且形成闭环;协同过滤算法和人工智能算法作为强有力的工具,对人类行为进行建模和预测。数据驱动的计算教育学的根本宗旨就是用数据作为依据、数学作为工具,将教育研究和教育实践提升到新的科学层面。
数据驱动的计算教育学是一个典型的学科交叉的研究领域,需要教育学、计算机科学、人工智能、互联网等各个领域的观念碰撞和密切合作,需要不同领域知识的深度融合和协同创新,需要立足现实应用,在解决痛点问题中,逐渐形成和完善新的概念和理论体系。
围绕着这一新兴研究问题,今年的暑期学校邀请了来自计算机科学、人工智能、教育学、教育技术、管理信息系统、图书情报等领域的学者和来自企业的专家,在两周时间中,从不同角度讲授支撑计算教育学研究的理论和方法,探讨其学科内涵和外延,讨论它的发展方向和在教育实践中的作用。
数据科学与工程暑期学校是华东师范大学数据科学与工程学院在每年暑期面向全国计算机科学、软件工程和其他相关领域的研究生、青年教师、高年级本科生以及企业研究和工程技术从业人员举办的系列学习和研讨活动,旨在通过密集的课程和研讨会,系统性地梳理信息技术——特别是大数据和人工智能——新兴研究领域的理论知识和技术方法,为学员进一步的学习和研究奠定基础、提供思路。暑期学校至今已举办六届。前几届暑期学校课程有些已经演化、发展成当前华东师范大学数据学院高年级本科生或者研究生课程,有些为学员近年来承担或参与的国家科研计划项目和校企联合研发项目培养了研发队伍。
面向互联网级应用的分布式数据库系统
数据科学与工程学科建设
面向科学发现的大数据管理
面向新经济的数据管理系统
面向异构体系结构的数据管理
数据驱动的计算教育学
/07/13暑期学校拉开序幕(链接)
/07/14计算机视觉技术与应用
计算机视觉是指从一张图像或一系列图像中自动提取、分析和理解有用信息,即教会计算机理解图像。马超老师从计算机视觉的历史讲起,对计算机视觉经典应用以及相关的重要技术做了详细介绍。同时,他也结合自己的研究内容,介绍了视觉目标检测相关的技术和改进。马老师还介绍了计算机视觉在教育实践中的应用现状和发展潜力。
马超上海交通大学助理研究员/07/15国家自然基金教育项目研讨会(链接)
年,国家自然科学基金新增了“F”(教育信息科学与技术)代码,从年开始资助教育与信息技术融合的交叉学科研究。同年,NSFC-广东大数据科学研究中心项目中将“教育大数据分析与应用的基础理论与关键技术研究”设立为重点支持项目。本次研讨会邀请了获得资助的项目,围绕如何用自然科学的方法研究教育的问题,交流探讨计算机教育学最新的研究进展。具体研讨内容包括:社交网络与教育大数据、基于强化学习的学习行为检测、教育大数据获取、采集和知识构建、面向智慧教育的知识追踪技术、学科知识点的深度关系抽取等。
金澈清华东师范大学教授/07/16面向自然语言处理的深度学习基础和最新研究进展
这场报告深入浅出地介绍了自然语言处理技术路线,主流的人工神经网络模型,自然语言处理领域的最新进展以及由复旦大学自然语言处理组开发的自然语言处理工具fastNLP。复旦大学邱锡鹏老师从基本的网络模型开始介绍,一步一步引入重要的概念和技术,包括注意力机制、深度学习的优化、过拟合等。最后,他介绍了由复旦大学自然语言处理组开发的fastNLP,这是一款轻量级的NLP处理套件,包括多个预处理模型,能够帮助快速复现代码,并且该项目在github上开源,欢迎广大科研工作者使用。
邱锡鹏复旦大学副教授/07/17教育知识图谱与学习行为分析
华东师范大学高明教授详细介绍了教育知识图谱的构造方法与应用。他指出,教育知识图谱描述了教育过程中的参与对象(教学主体、教学资源、知识点)及其相互之间的关系,其目的是更好的提供智能化教育服务。高老师详细地讲解了教育知识图谱中的三个研究内容,包括知识地图的构建,资源建设,即试题、题库多维/深度标引,以及教学主体画像。
高明华东师范大学教授学习行为分析关于学习行为分析,华东师范大学陆雪松老师讲解了为什么要做学习行为分析,并介绍了学习行为的定义和分析学习行为的目的。华东师范大学周昉老师则作了题为”UnderstandingDropoutinMOOCs”的报告,介绍了如何分析MOOC上辍学率的影响因素。她还介绍了动态调查的方法,并分享了今后的研究方向和可能遇到的挑战。
/07//20教育信息技术基础与前沿
教育技术领域长期以来一直在探索信息技术在教育学研究和教学实践中的作用。今年暑期学校安排了三天的课程,由华东师范大学教育信息技术学系吴永和研究员组织专家授课。
1吴永和华东师范大学研究员
课程的第一部分由吴永和老师开场,主题是“教育大数据与学习分析“。他指出需要用数据驱动的方法研究教育,提高教育质量。他认为,学习分析技术是测量、收集、分析和报告有关学生及其学习环境的数据,用以理解和优化学习及其环境的技术,它可以通过收集不同情景下学生学习创造的大量数据、推断来评价学习情况,及时发现潜在的问题。
吴永和老师的另一部分课程主题为“STEAM教育促进教育创新变革”。他从教育创新驱动之需、STEAM教育创新之策、STEAM教育实践之例等三个方面进行了讲解。除此之外,吴老师还给出了教育创新的需求和相关政策,阐述了STEAM教育的理念、理论和方法,分析了STEAM教育多个实践应用案例,并从数据驱动层面,基于xAPI标准对STEAM教育开展相关的研究。
2冯翔华东师范大学
副研究员
课程的第二部分主题是“人工智能+教育”。华东师范大学副研究员冯翔老师围绕此问题结合案例展开研讨。包括人工智能的基本情况,人工智能如何提高教育绩效,中小学人工智能教育如何开展,教育领域引入人工智能的思考等内容。他认为新技术带来的教育变革方兴未艾,人工智能与智慧教育引领教育教学的创新已经成为教育信息化发展的必然趋势。
3刘明卓华东师范大学
副研究员
华东师范大学副研究员刘明卓老师的课程内容主题是“数字化资源发展动因与前沿”。她从数字化教育起源与分类说起,介绍了我国数字化教育资源政策与实践现状,经历了三个阶段,分别是起步探索阶段(-年)、稳步发展阶段(-年)、深度推进阶段(年)。数字化资源配置的发展也经历了从无到有、从有到优、有优到特-适性的过程。最后,刘老师重点介绍了MOOC平台的发展历程和设计策略,推荐了几个优质MOOC网站,如爱课网、清华学堂在线、好大学在线、Coursera、Edx、Udacity、FutureLearn等。
4陈向东华东师范大学教授
华东师范大学陈向东教授给学员带来了“社会网络视角下的教育研究”主题报道。陈老师结合现实生活中的例子,从社会网络的含义和基本视角出发,带学生们认识了社会网络的研究内容和方法,并向大家解释了教育研究的“低度社会化”和“过度社会化”两种倾向。
5吴忭华东师范大学副教授
华东师范大学副教授吴忭老师从量化民族志切入,做了大数据时代的质性数据量化建模方法的报告。他首先介绍了数据科学的研究闭环,接着介绍大数据的发展,从而引申到主位描述和客位描述的概念,以及主位诠释和客位诠释的概念。
/07/21研究生学术论坛
暑期学校不仅有系统性的课程,还有研究生学术论坛,为学员之间的交流提供了舞台。今年的研究生学术论坛邀请了《华东师范大学学报(自然科学版)》数据科学与工程专刊的15位作者做了学术报告。
报告题目报告人
单位
面向自动问答的机器阅读理解综述
杨康
华东师范大学
基于模糊聚类和支持向量回归的成绩预测
申航杰
四川大学
基于LevelDB的二维数据二级索引实现
刘子豪
华东师范大学
基于社区问答数据迁移学习的FAQ问答模型研究
邵明锐
中国人民大学
共指消解技术综述
陈远哲
华东师范大学
基于法计算学理论的人工智能辅助决策算法研究
陈亮
同济大学
Woodpecker+:基于数据特征的自定义负载性能评测
张涛
华东师范大学
基于用户偏好的最优路径搜索
葛又铭
中山大学
面向日志结构化数据存储的高效数据加载
丁国浩
华东师范大学
基于自注意力机制的冗长商品名称精简方法
王超强
桂林电子科技大学
基于Paxos的分布式一致性算法研究
祝朝凡
华东师范大学
基于IsolationForest的电能量异常数据检测研究
钱淑韵
南瑞集团,南京农业大学
基于可微分的环境的深度学习
郑宁远
华东师范大学
基于自适应神经网络的电网稳定性预测
李灿
上海电力大学
基于GPU的关系型流处理系统实现与优化
黄皓
华东师范大学
/07/22计算教育学——来自企业的观点
随着社会对教育越来越重视和北京中科白癜风医院圆梦征程北京哪家医院治疗白癜风效果好