我为什么开始这个实验
医学院有一个肮脏的秘密:我们都沉浸在信息中,没人确切知道最好的学习方式了。 像Anki和手写笔记这样的传统方法仍然主导着学习小组,但每个人都在低声谈论AI。ChatGPT可以解释复杂的路径。Notion AI可以总结讲座。Quizlet的AI可以根据你的笔记生成练习问题。但问题在于——没人真正测量这些工具是否有效,或者它们是否只是打扮成高效的昂贵拖延。 我从一月开始记录我的AI工具使用情况,恰好是在我的病理学和药理学模块开始的时候。这是完美的时机,因为这两门课程都重在记忆,每三周就有高风险的考试。我实际上可以测量影响。 我的基线不太理想。在秋季学期,我使用传统方法的考试平均分为78%:Anki闪卡、2倍速讲座录音和手写笔记。我每天学习6-7小时,几乎难以维持头上浮出水面。我需要改变,而AI似乎是显而易见的答案。 于是我制作了一个电子表格。每个学习时段都被记录:我使用的工具、学习多长时间、覆盖了哪些材料,以及我对自己理解的感觉(1-10分的评分)。每次考试后,我会备注我的分数以及为特定内容准备时使用的工具。我还进行了每周的自测,内容来自1、2和4周之前,以追踪记忆效果。 目标不是寻找万灵药。而是弄清楚哪些工具实际上帮助我学习,哪些工具只是让我感觉高效。我差点因为AI而考试失败的那晚
实验进行三周后,我参加了第一次药理考试。我在前两个星期使用了一种从我的讲义生成练习问题的AI工具——暂且称之为“QuizBot”。 QuizBot太神奇了。它可以从我凌乱的讲义中即时创建50个选择题。界面非常流畅。问题看起来很专业。我感觉自己在高效学习,因为我能在一个晚上完成200道问题。 我自信地走进了考试。我已经做了超过600个练习题。我对这个材料了如指掌。 我得了71分。 考后,我坐在车里,盯着手机上的分数,完全困惑。我怎么会考得这么差?我比以往任何时候都学习得更多。我做的练习题也超过了我学习小组中的任何人。 那个晚上,我回过头来仔细查看我回答过的每一个QuizBot问题。我发现了问题所在:AI生成的问题太简单了。它会问诸如“哪种药物阻断ACE?”而实际考试问的是“一位患者在开始新药后出现高钾血症和干咳。最可能的机制是什么?”QuizBot测试的是回忆能力,而考试则测试应用能力。 我花了两周的时间训练自己去识别答案,而不是对材料进行批判性的思考。AI让我变得更笨。 这是我的警钟。并非所有的AI辅助都是有帮助的。有些工具优化了错误的指标——它们让你感觉到学习是有效的,却没有真正提高你的理解。从那时起,我开始严格测量实际结果,而不仅仅是我感觉多么高效。数据:6个月,8种工具,12次考试
在整个学期中,我记录了以下内容:| 工具 | 主要用途 | 每周平均学习时间 | 平均考试分数 | 4周记忆保持率 | 每月费用 |
|---|---|---|---|---|---|
| ChatGPT Plus | 概念解释 | 8小时 | 87% | 82% | $20 |
| Notion AI | 笔记总结 | 3小时 | 81% | 71% | $10 |
| QuizBot(匿名化) | 练习问题 | 6小时 | 74% | 65% | $15 |
| Elicit | 研究论文 | 4小时 | 89% | 88% | $12 |
| Mem.ai | 间隔重复 | 5小时 | 86% | 91% | $15 |
| Otter.ai | 讲座转录 | 2小时 | 79% | 68% | $17 |
| Consensus | 医学文献 | 3小时 | 88% | 85% | $9 |
| Anki + AnkiGPT | 闪卡生成 | 7小时 | 90% | 93% | 免费 + $8 |
这些数字实际上意味着什么
看着那个表格,你可能认为答案很简单:使用Anki,放弃QuizBot,搞定。但实际上情况更为复杂。最佳AI学习工具不是得分最高的那个,而是那个让你思考更深入的,而不是让学习感觉更轻松的工具。ChatGPT Plus成为我使用最多的工具,不是因为它给我答案,而是因为它迫使我明确我的困惑。当我不理解一个概念时,我不能只高亮文本并获取摘要。我必须写出一个问题:“我不明白为什么ACE抑制剂会导致高钾血症。你可以逐步解释机制吗?” 构建问题的这个过程——明确我不知道的内容——是学习的一半。ChatGPT的解释是另一半。但这个工具之所以有效,是因为我主动使用它,而不是被动使用。 Elicit和Consensus因相似的原因得分高。当我需要深入了解一个复杂主题,比如肾素-血管紧张素-醛固酮系统时,我会使用这些工具快速找到相关论文。然后我会使用ChatGPT帮助我理解这些论文。这种双步骤过程——查找原始资料,然后获得帮助解读——比仅仅阅读摘要能导致更深刻的理解。
那些妨碍我表现的工具都有一个共同点:它们让我避开思考的艰苦工作。它们让我感觉很有效率,而实际上让我变得被动。Notion AI的总结功能是最糟糕的罪魁祸首。我会把讲义放进去,得到一个干净的摘要,感觉自己学习了。但我根本没有与材料互动。我只是看着AI与之互动。我的大脑从未进行过决定什么是重要的、什么与什么相关,或我不理解的内容的工作。 Otter.ai也存在同样的问题。拥有每堂课的完美转录听起来很棒,但它消除了主动听和记笔记的需求。记笔记迫使你实时处理信息,决定什么重要,重新表述概念。Otter消除了这种认知工作,我的记忆力下降。 这里的教训不是“避免总结工具”,而是“避免让你跳过学习认知工作的工具”。某些AI工具是认知放大器——它们增强你的思考能力。其他工具是认知替代品——它们代替你思考。你想要第一种,而不是第二种。
AI让学习更快的神话
每个人都认为AI学习工具节省时间。这正是它们的整个卖点,对吗?更聪明地学习,而不是更辛苦。用更少的时间做更多的事情。 这完全是胡说八道。 那些实际上提高我表现的工具让我学习得更久,而不是更短。Anki + AnkiGPT让我每周花费7小时在闪卡上。ChatGPT的会议通常要花90分钟,因为我在处理复杂的主题。使用Elicit来查找和阅读研究论文使我的学习时间增加了数小时。 但:那段时间是高效的。我在学习,而不仅仅是复习。我在建立理解,而不仅仅是记忆事实。 与QuizBot相比,我可以在两个小时内快速完成200个问题,并感觉自己非常高效。我移动得很快,打勾,看进度条填满。但我并没有学习。我只是在训练自己去识别简单问题的模式。最佳AI学习工具并不使学习速度更快。它们通过迫使你更深入地参与材料而让学习更有效。这与大多数学生想要听的完全相反。我们都在寻找捷径、捷径、获得A的方法,而不愿意努力。但是学习不是这样的。你不能把理解外包给AI。 你可以做的是利用AI使你的学习时间更加专注和富有挑战性。ChatGPT可以生成比你自己提出的问题更困难的问题。Elicit可以找到你自己无法发现的论文。Anki的算法可以优化你的复习时间表,比你手动操作更好。 但所有这些工具都要求你投入认知工作。它们不是捷径。它们是动力工具。就像任何动力工具,只有当你愿意去实际工作时,它们才有用。