Context Is All You Need：用 AI 做深度学习科研的真实经验

![[Gemini_Generated_Image_f8ybwaf8ybwaf8yb.png]]

起因

前几天在 Linux.do 上看到一篇帖子，作者是 Top10 CS PhD 在读，发过 CVPR、ICCV、ICML、NeurIPS 等顶会，分享了自己用 AI 做深度学习科研的真实经验。标题叫《AI科研不完全指北》，副标题是：Context Is All You Need。

这篇文章让我印象深刻，不是因为它给出了什么"终极指南"，恰恰相反——它最有价值的地方在于，把那些网上"AI 科研教程"里被漂亮流程图抹平的脏活、累活、坑，原原本本地写了出来。

我结合自己的理解，把文章里最核心的认知梳理一下。

文章的核心观点可以用一句话概括：

被污染的上下文会崩溃式地影响模型的能力。

AI 一直修不好一个 bug，不一定是它没有这个能力，而是它的上下文已经被彻底带偏了。整篇文章在讲的所有设计、所有踩坑、所有最终选择的方案，背后都只在做一件事：管住每一个 session 的上下文。

这个认知其实可以推广到所有使用大模型的场景——不只是科研。

文章一开始就划了一条清楚的线：

做不到这些，你用 AI 产出的就不是科研成果，而是学术垃圾。而且是带着 AI 高精滤镜、看起来更精致、但污染性更强的垃圾。

作者试过把所有 MCP 都接上、用 Zotero 当知识库，最后都放弃了。最终方案：

关键洞察：文献调研不是可选项，而是在为大模型构建"领域专家级别的上下文"。上下文的质量直接决定后续 idea 的质量。

这一步作者踩了无数坑：

最终结论很务实：

自己先把环境搭好、数据下好，再开一个新的 session 把干净的路径甩给模型。

这是最精彩的部分。作者设计了一套分工明确的流程：

几个关键设计：

这是最被忽视但最重要的一步：

在动手写任何代码之前，先把 hypothesis、成功信号、失败信号全部写清楚。

为什么？因为如果不事先定好标准，模型一定会在结果出来以后帮你合理化——“虽然主指标没达标，但从另一个角度看……” 这就是先射箭再画靶。

Contract 写好后：

读完这篇文章，有几个感触：

1. 工具本身不重要，工作流设计才重要。 作者 clone 过 Paper2Code、AI Scientist、Oh My Research 等各种开源框架，结论是"通用库对真正发出有价值的工作几乎没有帮助"。你必须根据自己的领域去定制。

2. 不要省模型费用。 作者明确说"强烈不建议拿低智能模型做科研探索，纯粹是在浪费生命"。这个观点可能有争议，但在需要高质量推理的场景下确实如此。

3. 上下文管理是一种元能力。 不只是做科研，任何使用大模型的场景——写代码、做设计、写文章——管理好上下文都能显著提升产出质量。知道什么该喂给模型、什么不该、什么时候该开新会话，这本身就是一种需要学习的技能。

原文链接：Linux.do - AI科研不完全指北，作者 Jingxuan，推荐阅读原文获取完整细节。