“学生课本里住着一个智能助手,它能够帮学生理解复杂的知识点,还能提供个性化的学习建议。”这个原来存在于想象中的场景,如今已经在清华大学的部分课程中成为现实。
清华大学以“千亿参数多模态大模型GLM”为平台与技术基座,研发出多个AI助教系统,服务不同学科领域的教师的教与学生的学。自2023年秋季学期开始8门课程试点,已有5门课程的相关系统完成了第一阶段开发,并开始进入初步投入使用阶段。这些AI助教系统不仅能够提供24小时的个性化学习支持、智能评估和反馈,还能辅助学生进行深入思考,激发学习灵感。
在教育领域,AI技术的应用正逐步改变传统的教学模式,为教育教学带来新的 机遇和挑战。与此同时,高校也在探索将人工智能从“工具”变为“伙伴”,创新教学范式。
当AI与教育场景深度交互,将有哪些可能性?AI化身成为哪些角色,如何赋能教师的教和学生的学?是形式大于内涵的教学辅助,还是变革知识传授范式、重构能力培养目标?围绕这些问题,新京报记者与清华大学两门试点课程“新城市科学”和“心智、个体与文化”负责人进行深入探讨。
AIGC元年多个重量级的AI产品发布、清华大学启动试点建设……在多种机遇的促使下,清华大学建筑学院长聘副教授龙瀛开始探索AI教学。他选择将“新城市科学”这门本科通识课作为试点,这一课程主要探讨科技革命下城市科学的前沿进展,分为新的城市科学,新城市的科学和未来城市三个模块。
这三个模块也对应学生大作业(论文或课程报告)的三个部分。龙瀛介绍,学生大作业大概五六千字篇幅,要求体现课程的三个教学模块,请同学们针对某一类城市空间要素(例如校园操场、社区公共空间等)准备实验计划、观察报告、改造方案等。
AI助教系统主要是用来辅助学生完成大作业。基于教师提供的教材、习题、最新论文等大量材料,实现了自动知识点抽取,通过知识库的辅助,智能助教将通用模型的答题正确率从80%提升到了95%,并附带了详细的答题解释。
根据作业要求的三个模块,研发人员在AI助教系统中定义了五类共25个功能卡片,也是问题模板,例如“我该用什么数据来研究这个空间?”“这一空间使用有什么行为上的变化”“结合未来发展趋势,这类空间有什么改造的可能性?”进一步方便同学们上手操作。
学生输入自己的基础素材和相关需求,点击某个小卡片,AI助教就可以便捷给出项目设计的思路提示、流程设计、分析角度等,从而加深对相关知识的理解和研究思路的启发,并能帮同学们明确研究思路、细化研究场景、润色文字报告等,且全天候服务,不受时空约束。
龙瀛全程参与了AI助教的研发。分为几个模块、卡片如何定制、引导同学们问什么问题对作业最有帮助……这些都要思考并与技术团队碰撞打磨。龙瀛介绍,大模型学习了20余万字的同名教材,38节慕课课件,1200多篇最新中英文论文,以及280个报告案例,还输入了虚拟教研室中所构建的知识图谱,“相当于AI助教具备了新城市科学这个领域最新、最广、最深的理论支持,能够给学生的超越了课堂所讲授的。这1200多篇论文如果让同学自己短期内看完,几乎是不可能的。”
课程结束后,龙瀛收到了很多同学的反馈,AI系统作为一个能够全天24小时即时反馈的对话平台,在探索不熟悉的领域知识时提供充足的基础知识帮助,为他们提供了研究灵感和思路,促进了他们的个性化学习,也是对传统课堂答疑的必要补充。
“就类似学生身边多了一位老师可以随时提问,浩瀚的知识点可以随意抽取、为我所用。当然,AI助教给出的内容是辅助性的,要真正把作业做好,光靠这些是远远不够的。”龙瀛说道。
教师的“分身”:精准高效反馈提升学生写作水平
AI助教在清华大学“心智、个体与文化”课上,则是完全不同的应用方式。该课程授课教师、清华大学社科学院副教授钱静介绍,AI助教系统不仅能生成写作评价标准,还能针对学生的写作给出具体评价。
“心智、个体与文化”是清华大学为本科生开设的一门人文社会科学通识课程。该课程涵盖心理学核心内容,并探讨心理学与多个学科领域的交叉融合,例如人工智能、生物学和社会学等。
通识课程的目标是拓宽学生的视野,让他们对多个领域的尖端动态保持敏感,并建立扎实的知识架构。钱静坚信,写作是思维训练的最高形式,她希望通过有针对性的写作练习来提升学生的思辨技巧。每周,钱静都会设计两个写作题目,让学生选择其中一个进行500-800字的写作练习。这些题目中,一个着重于分析和创作性写作,旨在深化学生对人文及社会科学领域的认知;另一个则着眼于批判性分析实证研究,旨在锻炼学生的逻辑推理和科学沟通技能。学生提交作业后,课程的两名博士后助教将负责批改作业并提供反馈。
为了提高学生的写作能力,学生反复的刻意练习和老师有高质量的反馈是必不可少的。钱静指出,大多数课程的师生比例偏低,老师难以对每个学生都提供详细的反馈,这一问题在大班课中尤为突出。为了践行因材施教的教学理念,钱静老师将大班课转变为小班课,使得个性化教学成为可能。
学生的进步依赖于反复的修改和完善。人工智能助教在此过程中可以发挥重要作用,它能够不知疲倦地提供详尽且持续的反馈。钱静表示,她希望通过AI助教,实现“双师模式”,为学生提供更频繁、更个性化的反馈。这样的教学方式能够激励学生持续练习写作,并在实践中不断磨砺思维。
让AI助教替代老师和真人助教的一部分功能,需要具备极强的专业度,对大模型的要求更高。钱静与计算机系的技术团队深度合作,共同开发针对这门课的AI助教。
钱静回忆说,最初尝试让大型模型根据课程标准对学生的写作进行评价和打分时,结果并不理想,“机器味儿”特别浓,生成的评价不仅缺乏专业性,而且显得生硬,点评也显得过于宽泛。为了解决这个问题,团队对大模型进行了持续调整和优化,包括向模型提供专门的心理学资料和教材,让模型学习真人助教的批改方法,以及加入更多肯定性和鼓励性话术。在不断的反馈和调整过程中,模型逐渐改进,最终达到了课程要求和学生期望的标准。
钱静注意到,学生们对助教的需求各不相同。有些学生期望直接的评价,有些则更偏好鼓励和认可,还有一些则希望得到具体且针对性的建议。“我们认识到,学生们渴望的并非仅仅遵循最高学术水平的全面评价,而是需要有的放矢的反馈,理解如何基于现有水平进行提升。把握这一需求,我们不断调整优化,使AI助教在批改时能精确地指出学生作品的每一处优点和不足,并给出具体的改进建议,让学生感受到自己的作品得到了认真对待,进而获得积极的激励。”
钱静调侃称,这些高频的评价工作如果由真人助教来做,则特别“费人”。“这项繁重的工作,其实完全可以AI来做。”在一学期的调试后,由钱静设计的单盲试验显示,学生们对智能助教的表现给予了极高的评价。他们认为,在内容的准确性、结构的清晰性、认同感和帮助性等方面,智能助教不仅不输于真人助教,甚至在某些方面更具优势。
期待AI在评价体系发挥更大价值
大模型如何与课程教学或科研做更深的融合?
“我们在摸着石头过河。”龙瀛告诉记者,在试点使用过程中,他也在反思。比如投喂给大模型的物料,涉及到的版权问题如何处理?目前AI助教是校内学生使用,但慕课上还有10万人,他们能不能使用?另外在龙瀛看来,还需要谨慎看待AI助教的输出结果,“只是辅助,用来开拓视野、提升效率,目前还不能直接替代人脑。”
此外,龙瀛认为,还可以探讨如何利用AI支持慕课更新,“比如不用自己去棚里录制视频,而是用数字人根据脚本自动生成视频,有望成为未来慕课录制的一种模式选择。”
钱静希望AI大模型能在学生评价和学习情况分析的反馈中发挥更大的作用。她强调,教学中重要的是过程性评价,这需要对学生的能力进行全面的评估,而不仅仅是通过期末考试分数或GPA来衡量。
每一门课程开始的时候,钱静和助教们都会做学情调查和分析,并且在学期中持续评估,测量每位学生的能力展示以及发展变化,但是这项工作需要花费很多时间和精力。
钱静设想,如果能借助AI技术,为每位学生生成一份学生档案,把对学生的过程性评价集成到教学系统中,无缝交互,自动收集和分析学生数据。比如,AI助教可以通过分析学生的写作内容、语言表达、逻辑结构等方面,判断学生是否用心投入,文章是否有深度、论点是否清晰、论据是否充分等。这样的评估不仅是动态的,而且能够持续跟踪学生的进步和能力发展。通过这一系统,教师能够迅速且全面地掌握每位学生的学习状况,了解他们的强项和待提升领域。“这不仅将极大提高教育质量,也是我们向往的未来教育模式。”
此外,钱静观察到,整体上来说AI助教能给到的反馈可以优于真人助教。学生的偏好各不相同,有的倾向于直接且效率高的交流方式,而另一些则偏好以鼓励和安慰为主的沟通。为了满足不同学生的需求,AI助教可以设计多种“人格”或“交流风格”,让学生根据个人喜好进行选择。这样的个性化设置不仅能够提升学生对AI助教的使用体验,也有助于创造一个更加包容和适应性强的教学环境。
“随着AI助教的引入,我们的教学模式经历了显著的转变。传统上,教学活动仅涉及教师和学生之间的互动,但现在,我们引入了第三个角色——智能助手。”钱静认为,AI助教的应用释放了教师和真人助教的时间,使他们能够更多地关注学生的个性化需求,并致力于实现机器无法替代的教学环节。“通过这种支持,我们致力于打造高品质的课程,并将本科生的教学质量提升至接近于个性化的‘一对一’教学水平。”
据悉,2024年,清华大学将开展100门人工智能赋能教学试点课程,利用人工智能辅助或深度介入课程,打造人工智能助教、人工智能教师,持续创新教学场景,提升教与学效率与质量。