【源头活水】大模型时代,普通人的科研上限在哪里?

人工智能前沿讲习 2025-08-17 18:00


沿广注!

最近,GPT-5这一曾被寄予厚望能实现AGI的模型发布了。我当时看发布会后,很"满意"其并不出色的表现,并且还在社交网络上写下“感谢OpenAI没有杀死我们的研究方向”。但是,我的研究方向是什么?

你的研究标签是什么?

在ChatGPT之前,我大可轻松坦言:我做迁移学习、机器学习等一些涉及到模型鲁棒性的问题,故我的标签便是“迁移学习”。但是今天来回答此问题,那我得说一大串名词出来:大模型评测、后训练、agent、AI在社会科学的应用、对齐、强化、传统机器学习+大模型,等等,总之就是,所以不需要与训练耗资源的研究,我都可以做。所以,我变成了一块砖,哪里需要哪里搬?我的标签模糊了?

作为一个身上有着多重标签的普通年轻学者,太容易被认为“灌水”、“不务正业“了。我变成了一个”科研投机分子“,什么时候想到了一个”绝妙的想法“,什么时候就让学生去做。我是一个喜欢想东西的人,所以经常会有千奇百怪的想法(这也是为什么更愿意到学校做更自由的研究的原因之一)。

诚然,我们确实在上述多个方面均有成果产出,并且文章的引用和影响还不错,可以“堂而皇之”地说我就是做这个领域的;又或者,我们确实可以用一个更高大上的主题来将所有方向包装起来,如“让大模型变得更可靠”、“理解并提升大模型”。但我想问一个问题:我们的核心竞争力是什么?

2023年我写了一篇《大模型时代,普通人的科研何去何从》的文章,提出了没有巨量计算资源时可以做的一些研究方向,也收获了大家的赞同。2年之后的今天,我想再进一步问:大模型时代,普通人的科研上限在哪里?

所谓上限,便是指你现在的研究方向一直做下去,最好的结果是做出什么? 比如大模型评测,那么,你期待能做出什么样的评测系统来终结或统一这一领域的研究?比如做多智能体,你期待能构建出什么样的智能体来足够解决大多数问题?

很遗憾,我无法回答这个问题。我们从2年前开始做评测问题,发过评测协议(ICML’24, ICLR’24)、综述文章(3000+引用)、评测代码框架(PromptBench)、评测Tutorial (AAAI’25, CVPR’25),看上去挺丰富的,对吧?但是我们真正解决了什么问题?并没有。显然,我把原因归咎于我们的工作尚且不够完美。

大模型给科研带来的新变化

大模型的蓬勃发展使得科研准入门槛进一步下降,做研究、写代码、写论文、投论文、审稿,均变得更加容易了。与此同时,也使得普通科研人员的界限一下子模糊起来,因为绝大多数研究人人都能做,并不存在过去那种某一领域被某些人垄断的情况。很多方向都变得不再存在;又有很多人都开始做相同的方向。比如我在本文一开始提到的我正在做的那些方向,几乎没有门槛。大模型的存在让“专家”一词变得更贬值了。

大模型的蓬勃发展使得学术界和工业界的差别更大了。 绝大多数学术界均没有海量资源去研究模型训练中的问题,而仅是依靠工业界和超级实验室开放出的模型做下游任务。下游并不可怕;真正可怕的是,不知道在海量资源面前,自己定义的下游任务是否真的存在?又或者是,在海量资源面前,我们正在面临的所谓“研究挑战”,根本就不是问题。比如,我们一直说由于数据不足的问题要开发数据生成算法让大模型更对齐某个小领域;但在大公司面前,“数据不足”似乎并不是一个问题。

大模型的蓬勃发展使得工程在科研中越来越重要。 尽管Cursor等AI编程工具已变得广泛使用,但如何高效、正确地编写代码、组织项目,成为了科研能力中更加重要的一环。相比过去研究理论和算法时仅需对某些固定框架小修小补,现在的研究变成了以工程为导向的科研:算法和理论变得没有那么重要,反而是平台、框架、大量实验占的比重越来越大。顶会论文的附录正变得越累越长,动辄几十页的附录中的诸多实验结果或许并无人细看。工程能力的重要性也体现在“手速”上,可能今天你想到的idea还没做,过几天就在arXiv上看到了别人做的同款。

大模型的蓬勃发展使得“idea”变得更重要了。 这很容易理解:因为没有巨量资源、没有大团队,我们不能和别人在正面战场硬刚;我们必须找好问题角度、提出自己的研究小方向。唯有如此,小科研团队才可以生存。比如,在大多数研究围绕着微调模型时,我们从23年起便开辟了“灾难继承”这一方向,研究噪音、偏见等不可见的上游训练数据是否会给下游任务带来影响。此小领域在不到2年时间里,帮助我们收获了ICLR和NeurIPS的spotlight、TPAMI的长文(这些文章均是首次投稿即中)并且也收获了一些引用。因此,更适合小团队的打法是想出有趣的idea,而非在主流赛道上和大团队硬拼,不然会变得非常难受。回过头来想,学校的科研环境是最适合小团队作战的;工业界天然适合大团队攻坚。

大模型的蓬勃发展使得科研人员更加筋疲力尽了。 在这万象更新的时代,我们见证着ChatGPT月活几亿人、自己也在每天用着这些工具加速科研进程,那为什么感觉更累了、工作时间更长了?这其中当然有学习和理解新知识的无所适从,而更多的则是对自己科研目标的不确定和悲观。因为科研门槛降低了、工程能力也可以有大模型来弥补,如果我们再不抓紧,那留给我们的研究不多了。所以,AI真的改变了我们研究人员的生活:让我们更累了。

如何提升科研上限?

好了,现在来回答这个问题:大模型时代,普通人的科研上限在哪里?在此我仅分享自己的一些观点,供大家参考。

最后,来回答这个问题:你的研究方向是什么?我想,做为一个研究者,我不应该执着于某一标签,而是应该以开放平等的心态来开启和拥抱新的研究方向。永远保持好奇心、永远向前看,这可能是做科研的魅力吧?

资讯配图

资讯配图

击呗!

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号