
Context Is All You Need:用 AI 做深度学习科研的真实经验
![[Gemini_Generated_Image_f8ybwaf8ybwaf8yb.png]]
起因
前几天在 Linux.do 上看到一篇帖子,作者是 Top10 CS PhD 在读,发过 CVPR、ICCV、ICML、NeurIPS 等顶会,分享了自己用 AI 做深度学习科研的真实经验。标题叫《AI科研不完全指北》,副标题是:Context Is All You Need。
这篇文章让我印象深刻,不是因为它给出了什么"终极指南",恰恰相反——它最有价值的地方在于,把那些网上"AI 科研教程"里被漂亮流程图抹平的脏活、累活、坑,原原本本地写了出来。
我结合自己的理解,把文章里最核心的认知梳理一下。
核心认知:上下文管理决定一切
文章的核心观点可以用一句话概括:
被污染的上下文会崩溃式地影响模型的能力。
AI 一直修不好一个 bug,不一定是它没有这个能力,而是它的上下文已经被彻底带偏了。整篇文章在讲的所有设计、所有踩坑、所有最终选择的方案,背后都只在做一件事:管住每一个 session 的上下文。
这个认知其实可以推广到所有使用大模型的场景——不只是科研。
AI 科研 ≠ AI 生成论文
文章一开始就划了一条清楚的线:
- ❌ 让 AI 生成一篇"看起来像论文"的 PDF,那不是科研
- ✅ 所有结论有出处、idea 与 method 一一对应、实验可复现——这才是底线
做不到这些,你用 AI 产出的就不是科研成果,而是学术垃圾。而且是带着 AI 高精滤镜、看起来更精致、但污染性更强的垃圾。
流程拆解:每一步都在管理上下文
文献调研:让 Gemini 去搜
作者试过把所有 MCP 都接上、用 Zotero 当知识库,最后都放弃了。最终方案:
- 用 Gemini 做搜索(搜索能力最强)
- 让 Claude 自动拆解需求传给 Gemini
- 只关注顶会论文 + 有开源代码的工作
- 调研阶段只喂摘要和 Introduction,不要一口气塞整篇论文
关键洞察:文献调研不是可选项,而是在为大模型构建"领域专家级别的上下文"。上下文的质量直接决定后续 idea 的质量。
复现 Baseline:最容易被低估的一步
这一步作者踩了无数坑:
- pip 安装报错、进程卡死
- Claude 无脑调
sleep,几秒能解决的问题耗掉半小时 - 数据集每次从零下载,完全不读已有的文档
- 安装日志污染上下文,导致后续对话质量崩溃
最终结论很务实:
自己先把环境搭好、数据下好,再开一个新的 session 把干净的路径甩给模型。
提出 Idea:三模型协作 + 严格隔离
这是最精彩的部分。作者设计了一套分工明确的流程:
| 角色 | 模型 | 职责 |
|---|---|---|
| 发散 | Gemini | 基于干净上下文一次生成 10 个 idea |
| 评审 | Codex | 每个 idea 独立评审(上下文隔离) |
| 拍板 | Claude | 最终决策 + 调整 |
几个关键设计:
- Gemini 只拿到文献调研结果 + baseline 信息,不知道之前有过什么讨论
- Codex 每次只看一个 idea,看不到其他 9 个,保证评审公平
- 放弃"互相 review"方案——两个模型互相审,永远有"还能改进"的空间,没有终局
- 确定 idea 后让 Gemini 再做一轮针对性文献调研验证
Research Contract:实验前把预期写死
这是最被忽视但最重要的一步:
在动手写任何代码之前,先把 hypothesis、成功信号、失败信号全部写清楚。
为什么?因为如果不事先定好标准,模型一定会在结果出来以后帮你合理化——“虽然主指标没达标,但从另一个角度看……” 这就是先射箭再画靶。
Contract 写好后:
- 不能改(要改就出 v2,写清楚改了什么)
- 所有角色以它为唯一的尺子
- 论文中的每一条 claim 必须对应回 contract 里的信号
我的思考
读完这篇文章,有几个感触:
1. 工具本身不重要,工作流设计才重要。 作者 clone 过 Paper2Code、AI Scientist、Oh My Research 等各种开源框架,结论是"通用库对真正发出有价值的工作几乎没有帮助"。你必须根据自己的领域去定制。
2. 不要省模型费用。 作者明确说"强烈不建议拿低智能模型做科研探索,纯粹是在浪费生命"。这个观点可能有争议,但在需要高质量推理的场景下确实如此。
3. 上下文管理是一种元能力。 不只是做科研,任何使用大模型的场景——写代码、做设计、写文章——管理好上下文都能显著提升产出质量。知道什么该喂给模型、什么不该、什么时候该开新会话,这本身就是一种需要学习的技能。
原文链接:Linux.do - AI科研不完全指北,作者 Jingxuan,推荐阅读原文获取完整细节。