大概半个月前,站长的Google Cloud绑卡后获得了300刀赠金,一直愁在什么地方花。今天下午随机过程的期中也是随机拿分了……因此我也在反思为什么自学没有想象中那么高效。
正巧今晚重读了叶老师关于“一对一辅导的学习效果极大地优于传统课堂教学”的译文。一个小想法油然而生——大学中「自助式学习」的重要性已经是老生常谈了,那么在大模型性能飞速增强的现在,LLM被高水平学习者有效利用的最佳实践是什么?是能处理杂务,协作研讨,还是连导师的身份也能很好胜任?
于是上课摸鱼弄了个计划书,没有质量和细节,轻喷。
探索前沿LLM模型
(Gemini 2.5 Pro Preview )
对早期本科生学习工作流、技能发展与个人状态的影响——多元案例研究
1. 背景与研究目的
- 背景: DeepSeek爆火后,LLM正以前所未有的速度渗透高等教育。对于刚步入大学、正在塑造学习习惯和探索未来方向的早期本科生而言,LLM(如高性能的 Gemini 2.5 Pro Preview 和快速响应的 2.0 Flash)可以革新信息获取、作业完成、概念理解、编程学习甚至跨学科技能培养的方式,从而改变教育关系。
- 研究缺口: 当前对 LLM 在教育中应用的研究,较少专门针对国内早期本科生这一关键群体,以及 LLM的差异化应用。此外,LLM 对非传统学术技能的支持以及“超级用户”的最佳实践探索也缺乏深入研究。
- 研究目的: 本研究旨在通过一项为期两个月的多元案例研究,深入探索 8 位背景各异的早期本科生(包含研究者本人)如何利用 Gemini 2.5 Pro Preview 和 2.0 Flash 模型(通过 Cherry Studio 平台交互),以支持他们的学习、技能发展和个人探索。研究将重点关注:
- 不同背景学生(学业水平、年级、兴趣方向)对 LLM 不同模型和预设角色 (Persona) 的实际使用模式与偏好。
- LLM 对参与者学习流程(如课程理解、作业完成、编程实践)、时间管理、探索新领域以及特定技能发展的影响。
- LLM 使用与参与者自我报告的认知状态(如学习信心、理解深度)和个人状态(如专注度、压力感知、学习动力)之间的关联。
- 通过研究者本人的参与,探索 LLM 在本科生场景下的“极限”应用和高级工作流。
- 研究意义: 本研究将为理解前沿 LLM 如何融入早期本科生的学习生态提供独特而细致的视角,揭示不同学生群体的差异化需求和挑战,为个性化 AI 助学工具的设计、教学策略的调整以及学生数字素养的培养提供实证依据。
2. 研究问题
- RQ1 (使用模式): 不同背景的早期本科生(年级、学业水平、兴趣方向、艺术生)如何通过 Cherry Studio 使用 Gemini 2.5 Pro Preview 和 2.0 Flash?他们偏好使用哪些模型/预设助手?主要用于哪些类型的任务或实践?
- RQ2 (学习影响): LLM 的使用如何影响参与者的学习流程(如理解课程、完成作业、准备考试)、时间管理效率、以及对新知识/技能的探索?
- RQ3 (认知与状态): 参与者如何感知 LLM 对他们学习信心、理解深度、问题解决能力、学习动力以及个人状态(如专注力、学业压力)的影响?
- RQ4 (特定案例):
- (研究者) 作为一名熟悉 AI 的用户,探索出的针对本科学习场景的 LLM 高级应用策略和工作流是什么?这与普通本科生的使用模式有何异同?
- RQ5 (演化): 在两个月内,参与者的 LLM 使用策略、对其价值的认知或依赖程度是否发生了变化?
3. 研究方法
- 研究设计: 采用定性、纵向、嵌入式多元案例研究设计。将 8 位参与者(包括研究者本人)视为 8 个独立但相互关联的案例,进行为期两个月的数据收集,对比使用前后的变化。
- 参与者 (N=8):
- 大一 (3人): 1 位学业欠佳,1 位 Top 学生,1 位中等水平。
- 大二 (3人): 1 位 OIer,1 位直博生(帮导师工作),1 位方向不明。
- 研究者本人 (1人): 大二直博生,技术爱好者,教育关注者(作为“专家用户”案例)。
- 艺术生 (1人): 北影录音专业学生(高考后,入学前)。
- 抽样方法: 目的性抽样 (Purposive Sampling),旨在最大化样本的多样性以获得丰富视角。
- 研究工具:
- LLM 模型: Google Gemini 2.5 Pro Preview (高性能) & 2.0 Flash (高速度)
- 交互平台: Cherry Studio。利用其助手管理、话题分级、聊天记录导出功能。给予参与者一些默认Persona,允许自定义
- 数据收集工具: 访谈指南(基线访谈、最终访谈)、知情同意书、CheyrryStudio聊天记录备份。
- 数据收集流程:
- 阶段 0:准备与基线访谈 (第 0 周)
- 伦理审批(如需)。
- 招募并筛选参与者,签署知情同意书(特别说明研究者参与的双重角色,以及聊天记录将被脱敏匿名分析)。
- 进行半结构化基线访谈,深入了解:当前学习状况、典型学习任务、时间安排、遇到的困难、常用学习工具/策略、对 AI 的了解和期望、当前的专注力/压力/动力/睡眠等状态。对艺术生,特别询问其专业技能学习方法和痛点。研究者记录自身当前 AI 使用习惯和期望。
- 提供 Cherry Studio/API 访问,培训基本操作,介绍模型差异和预设助手。
- 阶段 1:LLM 使用与数据记录 (第 1-8 周)
- 参与者在学习、生活、技能练习中自由使用 Cherry Studio 调用两种模型。
- 核心数据: Cherry Studio 导出的完整匿名化聊天记录。
- 研究者日志: 研究者本人需定期记录自己的使用情况、探索过程、遇到的问题、形成的策略、以及对过程的反思。
- 阶段 2:结束与最终访谈 (第 9-10 周)
- 研究期结束。
- 收集所有参与者(包括研究者自己)导出的聊天记录。
- 进行半结构化最终访谈,聚焦:整体使用体验、模型选择偏好、对学习流程/效率/时间管理的影响、对课程理解/作业质量的感知变化、对学习信心/动力/压力的影响、特定技能的辅助情况、遇到的挑战与应对、对 AI 未来作用的看法。访谈中可引用其聊天记录片段进行追问。研究者进行自我总结访谈或深度反思报告。
- 阶段 0:准备与基线访谈 (第 0 周)
- 数据分析:
- 聊天记录分析:
- 定量概览: 统计不同模型/助手的使用频率、对话长度、任务类型分布(按参与者背景分组对比)。
- 定性内容分析: 对聊天内容进行编码,识别学习策略(如提问方式、信息验证)、任务分解、思维激发、技能练习(艺术生)、代码调试(OIer/直博生)等具体模式。分析不同背景学生的交互特点。
- 访谈数据分析:
- 采用主题分析法,对访谈稿和研究者日志进行编码,识别跨案例的共性主题(如“AI 作为个性化家教”、“时间管理的重塑”、“从信息获取到能力内化”)和特定案例的独特性(如“艺术创作中的人机协同”、“高阶用户的策略演化”)。
- 案例对比分析: 系统比较不同背景(年级、成绩、兴趣)参与者的使用模式和影响差异。特别分析艺术生案例和研究者案例的特殊性。
- 三角互证: 结合访谈、聊天记录和研究者日志,相互验证发现。
- 聊天记录分析:
- 伦理考量:
- 知情同意: 充分告知研究细节、数据用途、匿名化措施、自愿原则。特别说明研究者既是组织者也是参与者,其数据也会被分析,并会努力减少偏见。
- 匿名化与保密: 对所有数据严格匿名,保护参与者隐私。
- 数据安全: 安全存储数据。
- 利益冲突声明: 在最终报告/论文中明确声明研究者的双重角色。
4. 时间计划 (初步)
- 第 0 周: 准备,伦理审批,招募,基线访谈,工具设置。
- 第 1-8 周: LLM 使用期,数据记录,研究者日志。
- 第 9-10 周: 结束使用,收集数据,最终访谈。
- 第 11-18 周 (或更长): 数据处理、深度分析、案例撰写、跨案例比较、论文撰写。
5. 预期成果与产出
- 一份包含丰富案例细节的深度研究报告,揭示前沿 LLM 在早期本科生多元群体中的应用图景。
- 识别不同学生群体使用 LLM 的有效策略、常见误区和潜在风险。
- 关于 LLM 支持特定技能学习的初步证据和模式。
- 一套由研究者探索总结的、适用于本科学习场景的 LLM 高级用法和工作流建议。
站长水平有限,这份计划书只是初稿,期待正式开始前与参与者一起完善研究计划。
Leave a Reply