“问渠那得清如许,为有源头活水来”,通过前沿领域知识的学习,从其他研究领域得到启发,对研究问题的本质有更清晰的认识和理解,是自我提高的不竭源泉。为此,我们特别精选论文阅读笔记,开辟“源头活水”专栏,帮助你广泛而深入的阅读科研文献,敬请关注!
最近,GPT-5这一曾被寄予厚望能实现AGI的模型发布了。我当时看发布会后,很"满意"其并不出色的表现,并且还在社交网络上写下“感谢OpenAI没有杀死我们的研究方向”。但是,我的研究方向是什么?
你的研究标签是什么?
在ChatGPT之前,我大可轻松坦言:我做迁移学习、机器学习等一些涉及到模型鲁棒性的问题,故我的标签便是“迁移学习”。但是今天来回答此问题,那我得说一大串名词出来:大模型评测、后训练、agent、AI在社会科学的应用、对齐、强化、传统机器学习+大模型,等等,总之就是,所以不需要与训练耗资源的研究,我都可以做。所以,我变成了一块砖,哪里需要哪里搬?我的标签模糊了?
作为一个身上有着多重标签的普通年轻学者,太容易被认为“灌水”、“不务正业“了。我变成了一个”科研投机分子“,什么时候想到了一个”绝妙的想法“,什么时候就让学生去做。我是一个喜欢想东西的人,所以经常会有千奇百怪的想法(这也是为什么更愿意到学校做更自由的研究的原因之一)。
诚然,我们确实在上述多个方面均有成果产出,并且文章的引用和影响还不错,可以“堂而皇之”地说我就是做这个领域的;又或者,我们确实可以用一个更高大上的主题来将所有方向包装起来,如“让大模型变得更可靠”、“理解并提升大模型”。但我想问一个问题:我们的核心竞争力是什么?
2023年我写了一篇《大模型时代,普通人的科研何去何从》的文章,提出了没有巨量计算资源时可以做的一些研究方向,也收获了大家的赞同。2年之后的今天,我想再进一步问:大模型时代,普通人的科研上限在哪里?
所谓上限,便是指你现在的研究方向一直做下去,最好的结果是做出什么? 比如大模型评测,那么,你期待能做出什么样的评测系统来终结或统一这一领域的研究?比如做多智能体,你期待能构建出什么样的智能体来足够解决大多数问题?
很遗憾,我无法回答这个问题。我们从2年前开始做评测问题,发过评测协议(ICML’24, ICLR’24)、综述文章(3000+引用)、评测代码框架(PromptBench)、评测Tutorial (AAAI’25, CVPR’25),看上去挺丰富的,对吧?但是我们真正解决了什么问题?并没有。显然,我把原因归咎于我们的工作尚且不够完美。
大模型给科研带来的新变化
大模型的蓬勃发展使得科研准入门槛进一步下降,做研究、写代码、写论文、投论文、审稿,均变得更加容易了。与此同时,也使得普通科研人员的界限一下子模糊起来,因为绝大多数研究人人都能做,并不存在过去那种某一领域被某些人垄断的情况。很多方向都变得不再存在;又有很多人都开始做相同的方向。比如我在本文一开始提到的我正在做的那些方向,几乎没有门槛。大模型的存在让“专家”一词变得更贬值了。
大模型的蓬勃发展使得学术界和工业界的差别更大了。 绝大多数学术界均没有海量资源去研究模型训练中的问题,而仅是依靠工业界和超级实验室开放出的模型做下游任务。下游并不可怕;真正可怕的是,不知道在海量资源面前,自己定义的下游任务是否真的存在?又或者是,在海量资源面前,我们正在面临的所谓“研究挑战”,根本就不是问题。比如,我们一直说由于数据不足的问题要开发数据生成算法让大模型更对齐某个小领域;但在大公司面前,“数据不足”似乎并不是一个问题。
大模型的蓬勃发展使得工程在科研中越来越重要。 尽管Cursor等AI编程工具已变得广泛使用,但如何高效、正确地编写代码、组织项目,成为了科研能力中更加重要的一环。相比过去研究理论和算法时仅需对某些固定框架小修小补,现在的研究变成了以工程为导向的科研:算法和理论变得没有那么重要,反而是平台、框架、大量实验占的比重越来越大。顶会论文的附录正变得越累越长,动辄几十页的附录中的诸多实验结果或许并无人细看。工程能力的重要性也体现在“手速”上,可能今天你想到的idea还没做,过几天就在arXiv上看到了别人做的同款。
大模型的蓬勃发展使得“idea”变得更重要了。 这很容易理解:因为没有巨量资源、没有大团队,我们不能和别人在正面战场硬刚;我们必须找好问题角度、提出自己的研究小方向。唯有如此,小科研团队才可以生存。比如,在大多数研究围绕着微调模型时,我们从23年起便开辟了“灾难继承”这一方向,研究噪音、偏见等不可见的上游训练数据是否会给下游任务带来影响。此小领域在不到2年时间里,帮助我们收获了ICLR和NeurIPS的spotlight、TPAMI的长文(这些文章均是首次投稿即中)并且也收获了一些引用。因此,更适合小团队的打法是想出有趣的idea,而非在主流赛道上和大团队硬拼,不然会变得非常难受。回过头来想,学校的科研环境是最适合小团队作战的;工业界天然适合大团队攻坚。
大模型的蓬勃发展使得科研人员更加筋疲力尽了。 在这万象更新的时代,我们见证着ChatGPT月活几亿人、自己也在每天用着这些工具加速科研进程,那为什么感觉更累了、工作时间更长了?这其中当然有学习和理解新知识的无所适从,而更多的则是对自己科研目标的不确定和悲观。因为科研门槛降低了、工程能力也可以有大模型来弥补,如果我们再不抓紧,那留给我们的研究不多了。所以,AI真的改变了我们研究人员的生活:让我们更累了。
如何提升科研上限?
好了,现在来回答这个问题:大模型时代,普通人的科研上限在哪里?在此我仅分享自己的一些观点,供大家参考。
自己定义研究问题,而非盲从已有文章。 承接上文”idea“更重要的描述。大模型创造了一个百花齐放的时代,有太多的问题还没有被很好地研究。比如,虽然大模型评测是如今最炙手可热的方向之一,但此方向依然可以推陈出新:别人做某领域的LLM评测,你就去想想有没有VLM可以做;别人靠收集大量数据来构建benchmark,你就想能不能自动生成评测数据。总之,要比别人多想一步、多扩展一步,这样你就能定义一个自己的研究领域、发表某领域的第一篇文章。 多从社会现象中找寻研究问题。 大模型的核心是庞大的预训练数据,而这些数据的绝大多数均是由人和自然产生的。因此,人和自然界中存在的问题,模型多半也有。大模型之前我们研究的长尾问题便是一个经典的自然界问题;大模型时代,人、社会、自然界中依然存在着很多问题等着我们去发现、然后迁移到大模型上。 经典机器学习研究嫁接于大模型场景。 深度学习爆火时,有人认为不应该再投入时间到传统机器学习;大模型时代,我们还需要研究经典机器学习和深度学习吗?当然需要。经典的问题场景、理论等为我们开辟新赛道、研究新问题,提供了无穷的可能性。如果你自己找不到研究新问题,那就去看传统的教材和课程吧。本人最近在准备下学期要讲的《Generative AI》课件时再翻看传统机器学习材料,也有一番收获。 多与不同领域的研究人员交流合作。 这一点我在之前文章中也有提到,因为大模型使得科研和应用门槛大大降低,便得非计算机人员也可以快速使用和部署模型了。我们多与不同领域的人接触,便有机会能从他们那里了解最新的使用情况和可能存在的问题,方便我们日后抽象成自己的研究问题。当然,如果能和跨学科人员一直合作,带来的裨益将是更大的。
最后,来回答这个问题:你的研究方向是什么?我想,做为一个研究者,我不应该执着于某一标签,而是应该以开放平等的心态来开启和拥抱新的研究方向。永远保持好奇心、永远向前看,这可能是做科研的魅力吧?
本文目的在于学术交流,并不代表本公众号赞同其观点或对其内容真实性负责,版权归原作者所有,如有侵权请告知删除。
收藏,分享、在看,给个三连击呗!