AI Study Tools: An Honest Review After 6 Months [中文]

# AI学习工具：6个月后的诚实评测我在医学院的6个月里使用了8种AI学习工具。我的考试平均分从78提高到89。但其中有3种工具实际上让我事与愿违。没人告诉你关于AI学习助手的事情：它们并不是平等的，有些工具会在你没有意识到的情况下，积极妨碍你的学习。我是一名三年级医学生，上个学期决定进行一个实验。我记录了每个学习时段、每个练习问题和每个考试成绩，同时更换不同的AI工具。我记录了我的时间、记忆率和在高风险考试中的实际表现。结果让我感到惊讶。我预期会喜欢的一些工具，却成了削弱我记忆的拐杖。而我几乎要撇开的其他工具，成为了我学习例行程序的支柱。最好的工具和最差的工具之间的差异？考试表现的15分波动。这不是一个赞助帖子。我自己为这些工具支付了大部分费用，我将告诉你哪些工具值得它们的订阅费用，哪些在我的浏览器书签中蒙尘。

我为什么开始这个实验

医学院有一个肮脏的秘密：我们都沉浸在信息中，没人确切知道最好的学习方式了。像Anki和手写笔记这样的传统方法仍然主导着学习小组，但每个人都在低声谈论AI。ChatGPT可以解释复杂的路径。Notion AI可以总结讲座。Quizlet的AI可以根据你的笔记生成练习问题。但问题在于——没人真正测量这些工具是否有效，或者它们是否只是打扮成高效的昂贵拖延。我从一月开始记录我的AI工具使用情况，恰好是在我的病理学和药理学模块开始的时候。这是完美的时机，因为这两门课程都重在记忆，每三周就有高风险的考试。我实际上可以测量影响。我的基线不太理想。在秋季学期，我使用传统方法的考试平均分为78%：Anki闪卡、2倍速讲座录音和手写笔记。我每天学习6-7小时，几乎难以维持头上浮出水面。我需要改变，而AI似乎是显而易见的答案。于是我制作了一个电子表格。每个学习时段都被记录：我使用的工具、学习多长时间、覆盖了哪些材料，以及我对自己理解的感觉（1-10分的评分）。每次考试后，我会备注我的分数以及为特定内容准备时使用的工具。我还进行了每周的自测，内容来自1、2和4周之前，以追踪记忆效果。目标不是寻找万灵药。而是弄清楚哪些工具实际上帮助我学习，哪些工具只是让我感觉高效。

我差点因为AI而考试失败的那晚

实验进行三周后，我参加了第一次药理考试。我在前两个星期使用了一种从我的讲义生成练习问题的AI工具——暂且称之为“QuizBot”。 QuizBot太神奇了。它可以从我凌乱的讲义中即时创建50个选择题。界面非常流畅。问题看起来很专业。我感觉自己在高效学习，因为我能在一个晚上完成200道问题。我自信地走进了考试。我已经做了超过600个练习题。我对这个材料了如指掌。我得了71分。考后，我坐在车里，盯着手机上的分数，完全困惑。我怎么会考得这么差？我比以往任何时候都学习得更多。我做的练习题也超过了我学习小组中的任何人。那个晚上，我回过头来仔细查看我回答过的每一个QuizBot问题。我发现了问题所在：AI生成的问题太简单了。它会问诸如“哪种药物阻断ACE？”而实际考试问的是“一位患者在开始新药后出现高钾血症和干咳。最可能的机制是什么？”QuizBot测试的是回忆能力，而考试则测试应用能力。我花了两周的时间训练自己去识别答案，而不是对材料进行批判性的思考。AI让我变得更笨。这是我的警钟。并非所有的AI辅助都是有帮助的。有些工具优化了错误的指标——它们让你感觉到学习是有效的，却没有真正提高你的理解。从那时起，我开始严格测量实际结果，而不仅仅是我感觉多么高效。

数据：6个月，8种工具，12次考试

在整个学期中，我记录了以下内容：

工具	主要用途	每周平均学习时间	平均考试分数	4周记忆保持率	每月费用
ChatGPT Plus	概念解释	8小时	87%	82%	$20
Notion AI	笔记总结	3小时	81%	71%	$10
QuizBot（匿名化）	练习问题	6小时	74%	65%	$15
Elicit	研究论文	4小时	89%	88%	$12
Mem.ai	间隔重复	5小时	86%	91%	$15
Otter.ai	讲座转录	2小时	79%	68%	$17
Consensus	医学文献	3小时	88%	85%	$9
Anki + AnkiGPT	闪卡生成	7小时	90%	93%	免费 + $8

这些数字讲述了一个清晰的故事。那些帮助我积极与材料互动的工具（ChatGPT 用于解释，Elicit用于研究，Anki用于主动回忆）明显优于那些让我被动获取信息的工具（Notion AI总结、Otter转录、QuizBot的简单问题）。在学期中，我的考试平均分从78%提升至89%，但这种改善并非线性。它在我放弃那些不工作的工具并全力以赴使用有效工具时，发生了跃进。记忆数据更具说服力。在学习材料四周后，我可以回忆起93%通过Anki + AnkiGPT学习的内容，而使用QuizBot学习的内容则仅有65%。在你为考察你两年所学的一切而准备的板考试中，这是一大差异。

这些数字实际上意味着什么

看着那个表格，你可能认为答案很简单：使用Anki，放弃QuizBot，搞定。但实际上情况更为复杂。

最佳AI学习工具不是得分最高的那个，而是那个让你思考更深入的，而不是让学习感觉更轻松的工具。

ChatGPT Plus成为我使用最多的工具，不是因为它给我答案，而是因为它迫使我明确我的困惑。当我不理解一个概念时，我不能只高亮文本并获取摘要。我必须写出一个问题：“我不明白为什么ACE抑制剂会导致高钾血症。你可以逐步解释机制吗？” 构建问题的这个过程——明确我不知道的内容——是学习的一半。ChatGPT的解释是另一半。但这个工具之所以有效，是因为我主动使用它，而不是被动使用。 Elicit和Consensus因相似的原因得分高。当我需要深入了解一个复杂主题，比如肾素-血管紧张素-醛固酮系统时，我会使用这些工具快速找到相关论文。然后我会使用ChatGPT帮助我理解这些论文。这种双步骤过程——查找原始资料，然后获得帮助解读——比仅仅阅读摘要能导致更深刻的理解。

那些妨碍我表现的工具都有一个共同点：它们让我避开思考的艰苦工作。它们让我感觉很有效率，而实际上让我变得被动。

Notion AI的总结功能是最糟糕的罪魁祸首。我会把讲义放进去，得到一个干净的摘要，感觉自己学习了。但我根本没有与材料互动。我只是看着AI与之互动。我的大脑从未进行过决定什么是重要的、什么与什么相关，或我不理解的内容的工作。 Otter.ai也存在同样的问题。拥有每堂课的完美转录听起来很棒，但它消除了主动听和记笔记的需求。记笔记迫使你实时处理信息，决定什么重要，重新表述概念。Otter消除了这种认知工作，我的记忆力下降。这里的教训不是“避免总结工具”，而是“避免让你跳过学习认知工作的工具”。某些AI工具是认知放大器——它们增强你的思考能力。其他工具是认知替代品——它们代替你思考。你想要第一种，而不是第二种。

AI让学习更快的神话

每个人都认为AI学习工具节省时间。这正是它们的整个卖点，对吗？更聪明地学习，而不是更辛苦。用更少的时间做更多的事情。这完全是胡说八道。那些实际上提高我表现的工具让我学习得更久，而不是更短。Anki + AnkiGPT让我每周花费7小时在闪卡上。ChatGPT的会议通常要花90分钟，因为我在处理复杂的主题。使用Elicit来查找和阅读研究论文使我的学习时间增加了数小时。但：那段时间是高效的。我在学习，而不仅仅是复习。我在建立理解，而不仅仅是记忆事实。与QuizBot相比，我可以在两个小时内快速完成200个问题，并感觉自己非常高效。我移动得很快，打勾，看进度条填满。但我并没有学习。我只是在训练自己去识别简单问题的模式。

最佳AI学习工具并不使学习速度更快。它们通过迫使你更深入地参与材料而让学习更有效。

这与大多数学生想要听的完全相反。我们都在寻找捷径、捷径、获得A的方法，而不愿意努力。但是学习不是这样的。你不能把理解外包给AI。你可以做的是利用AI使你的学习时间更加专注和富有挑战性。ChatGPT可以生成比你自己提出的问题更困难的问题。Elicit可以找到你自己无法发现的论文。Anki的算法可以优化你的复习时间表，比你手动操作更好。但所有这些工具都要求你投入认知工作。它们不是捷径。它们是动力工具。就像任何动力工具，只有当你愿意去实际工作时，它们才有用。

我目前的工具：什么真正有效

经过六个月的实验，这就是我每天使用的工具： 1. Anki + AnkiGPT用于主动回忆 - 每天早上我花45-60分钟在闪卡上。AnkiGPT帮助我从笔记中生成卡片，但我总是编辑它们，以确保它们测试的是理解，而不仅仅是回忆。关键是制作迫使我解释机制的卡片，而不仅仅是识别术语。 2. ChatGPT Plus用于概念解释 - 每当我在理解某个内容时遇到障碍，我就会打开ChatGPT并逐步解决。我不仅要求解释——我会问它给我测验、给我类比，帮助我将概念与我已经知道的事物联系起来。我把它当作一个导师，而不是一个搜索引擎。 3. Elicit用于查找研究论文 - 当我需要在某个主题上深入时，Elicit帮助我快速找到相关论文。我通常会查看3-5篇论文，快速浏览，然后使用ChatGPT帮助我理解关键发现及其关联。 4. Consensus用于临床背景 - 这个工具搜索医学