AI 科研工作台

Context Is All You Need:用 AI 做深度学习科研的真实经验


![[Gemini_Generated_Image_f8ybwaf8ybwaf8yb.png]]

起因

前几天在 Linux.do 上看到一篇帖子,作者是 Top10 CS PhD 在读,发过 CVPR、ICCV、ICML、NeurIPS 等顶会,分享了自己用 AI 做深度学习科研的真实经验。标题叫《AI科研不完全指北》,副标题是:Context Is All You Need

这篇文章让我印象深刻,不是因为它给出了什么"终极指南",恰恰相反——它最有价值的地方在于,把那些网上"AI 科研教程"里被漂亮流程图抹平的脏活、累活、坑,原原本本地写了出来。

我结合自己的理解,把文章里最核心的认知梳理一下。

核心认知:上下文管理决定一切

文章的核心观点可以用一句话概括:

被污染的上下文会崩溃式地影响模型的能力。

AI 一直修不好一个 bug,不一定是它没有这个能力,而是它的上下文已经被彻底带偏了。整篇文章在讲的所有设计、所有踩坑、所有最终选择的方案,背后都只在做一件事:管住每一个 session 的上下文

这个认知其实可以推广到所有使用大模型的场景——不只是科研。

AI 科研 ≠ AI 生成论文

文章一开始就划了一条清楚的线:

  • ❌ 让 AI 生成一篇"看起来像论文"的 PDF,那不是科研
  • ✅ 所有结论有出处、idea 与 method 一一对应、实验可复现——这才是底线

做不到这些,你用 AI 产出的就不是科研成果,而是学术垃圾。而且是带着 AI 高精滤镜、看起来更精致、但污染性更强的垃圾。

流程拆解:每一步都在管理上下文

文献调研:让 Gemini 去搜

作者试过把所有 MCP 都接上、用 Zotero 当知识库,最后都放弃了。最终方案:

  • 用 Gemini 做搜索(搜索能力最强)
  • 让 Claude 自动拆解需求传给 Gemini
  • 只关注顶会论文 + 有开源代码的工作
  • 调研阶段只喂摘要和 Introduction,不要一口气塞整篇论文

关键洞察:文献调研不是可选项,而是在为大模型构建"领域专家级别的上下文"。上下文的质量直接决定后续 idea 的质量。

复现 Baseline:最容易被低估的一步

这一步作者踩了无数坑:

  • pip 安装报错、进程卡死
  • Claude 无脑调 sleep,几秒能解决的问题耗掉半小时
  • 数据集每次从零下载,完全不读已有的文档
  • 安装日志污染上下文,导致后续对话质量崩溃

最终结论很务实:

自己先把环境搭好、数据下好,再开一个新的 session 把干净的路径甩给模型。

提出 Idea:三模型协作 + 严格隔离

这是最精彩的部分。作者设计了一套分工明确的流程:

角色模型职责
发散Gemini基于干净上下文一次生成 10 个 idea
评审Codex每个 idea 独立评审(上下文隔离)
拍板Claude最终决策 + 调整

几个关键设计:

  1. Gemini 只拿到文献调研结果 + baseline 信息,不知道之前有过什么讨论
  2. Codex 每次只看一个 idea,看不到其他 9 个,保证评审公平
  3. 放弃"互相 review"方案——两个模型互相审,永远有"还能改进"的空间,没有终局
  4. 确定 idea 后让 Gemini 再做一轮针对性文献调研验证

Research Contract:实验前把预期写死

这是最被忽视但最重要的一步:

在动手写任何代码之前,先把 hypothesis、成功信号、失败信号全部写清楚。

为什么?因为如果不事先定好标准,模型一定会在结果出来以后帮你合理化——“虽然主指标没达标,但从另一个角度看……” 这就是先射箭再画靶。

Contract 写好后:

  • 不能改(要改就出 v2,写清楚改了什么)
  • 所有角色以它为唯一的尺子
  • 论文中的每一条 claim 必须对应回 contract 里的信号

我的思考

读完这篇文章,有几个感触:

1. 工具本身不重要,工作流设计才重要。 作者 clone 过 Paper2Code、AI Scientist、Oh My Research 等各种开源框架,结论是"通用库对真正发出有价值的工作几乎没有帮助"。你必须根据自己的领域去定制。

2. 不要省模型费用。 作者明确说"强烈不建议拿低智能模型做科研探索,纯粹是在浪费生命"。这个观点可能有争议,但在需要高质量推理的场景下确实如此。

3. 上下文管理是一种元能力。 不只是做科研,任何使用大模型的场景——写代码、做设计、写文章——管理好上下文都能显著提升产出质量。知道什么该喂给模型、什么不该、什么时候该开新会话,这本身就是一种需要学习的技能。


原文链接:Linux.do - AI科研不完全指北,作者 Jingxuan,推荐阅读原文获取完整细节。