编辑推荐:
开放教育数据在学情分析、教育数据挖掘和AI教育等领域的应用日益重要,但数据集的公开实践尚不明确。本文系统调查了2020-2024年间LAK、EDM、AIED三大顶会1125篇论文,发现172个公开数据集(其中143个为首次记录),并构建了包含数据背景、分析方法、应用场景等属性的分类体系。通过对比分析揭示当前数据开放存在的标准化不足、共享机制不完善等关键问题,提出PRACTICE八项实践指南(发布标准、元数据规范、伦理审查等),并公开了首个标注完整的开源数据集目录。研究成果为提升教育数据研究的可复现性和协作效率提供重要参考。
生物通 版权所有