这个暴论需要叠加很多buff,但我想说的确实就是这个标题。也算是和大家对齐一下认知。
这个暴论自然引申出一个问题:不训练大模型怎么办?
如果你还没有毕业,导师布置的课题是大模型训练相关,那还是要继续深入搞搞研究。
对于企业来说,尤其是小规模的团队。做好开源LLM+RAG的部署就已经能cover 99%的需求,在没有触及到开源模型的性能边界之前,不要微调模型。
为什么不要微调?因为没有模型的原始数据配比,更有可能原始的训练数据都没有,微调之后极有可能损失掉大部分的性能。
那如果开源模型在特定领域的效果非常差,怎么办?
如果是很垂类的领域模型,可以先试试RAG,不行就试试In-context Learning,在上下文中,教LLM一些领域知识。能尝试的低成本方案都尝试后,再考虑垂类领域模型的微调训练!
一些实际使用过程中的经验,将最需要脑子的任务交给o1系列模型,比较需要脑子的任务,交给4o这一梯队的模型。
除了付费的模型,还可以考虑国产的大模型,点名表扬DeepSeek、豆包、Qwen等等开源大模型。
还有一些通用的任务,也可以考虑开源的大模型或者性价比高的闭源模型。
这其实就是Agentic AI的思路。
如果你的业务在上面的方案中都跑不通,那么自己训练模型大概率也是白瞎。大模型时代,基础模型能力的每一次提升,都算是一次地球Online的版本更新。
距离大厂基座模型团队之外的AI人,需要先了解现有LLM的性能边界,敏锐的分辨出现有模型能力和过去方案的差异,能否给当前的业务带来新的变化,然后快速解决现有业务的难题。
不要在低收益的赛道上无意义的投入,错位竞争,降维打击,也许更有效。
以上。
当前大模型领域最具代表性的技术就是RAG和Agent,企业对掌握 RAG、Agent 等技术的人才需求高涨,这些技能已成为 AI 从业者的核心竞争力。如果你也对大模型的前沿技术感兴趣,欢迎加入我们最新推出的『大模型之心Tech知识星球』。
集视频 + 图文 + 学习路线 + 问答 + 求职交流为一体,是一个综合类的大模型社区,旨在为大家打造一个交流+技术分享的聚集地。

国内最全的大模型技术栈社区:大模型之心Tech
社区创建的出发点是给大家提供一个大模型相关的技术交流平台,交流学术、应用和工程上的问题。星球内部的嘉宾正在快速扩张中,我们邀请了来自国内外知名高校实验室、大模型/互联网相关的头部公司,其中高校和科研机构包括但不限于:上交、清华、北京大学、上海人工智能实验室、港科大、港大等等!公司包括但不限于阿里千问、美团LongCat、深度求索DeepSeek、字节豆包、百度文心一言、月之暗面Kimi等等。未来我们会打造一个大模型的前沿技术聚集地~
我们为大家汇总了大模型全栈学习路线图,包括但不限于:
这里能够让小白快速入门,让已经入门的同学进一步提升,已经提升的同学结交更多的朋友。每一个学习路线,都有清晰的技术汇总,非常适合大家系统性学习!


加入星球有哪些福利?
第一时间掌握大模型相关的学术进展、工业落地应用; 和行业大佬一起交流工作与求职相关的问题; 优良的学习交流环境,能结识更多同行业的伙伴; 大模型相关工作岗位推荐,第一时间对接企业; 行业机会挖掘,投资与项目对接。
星球内容一览

针对目前应用最广泛RAG、Agent和通用大模型训练、部署,我们进行了非常详细的技术路线拆解。
(一)大模型检索增强生成 - RAG
星球内部为大家分享了RAG小白入门的专业技术资料,汇总了最新的综述、开源仓库、BenchMark等等,并进一步细化了RAG的子领域。

1)BenchMark汇总

2)综述汇总

3)Graph RAG

4)Knowledge-Oriented RAG

5)多模态RAG

6)Reasoning RAG


7)RAG在AIGC中的应用
8)个性化RAG

(二)大模型 AI Agent
针对AI Agent,星球里首先为大家详细介绍什么是AI Agent,再展开最新综述、开源仓库、评测等内容,并进一步细化了Agent的相关子领域。

1)前沿综述汇总

1)Agent评测

2)Agent强化学习

3)多模态Agent

4)Agent通讯

5)基座Agent汇总

6)自进化Agent

7)Multi-Agent

(三)多模态大模型训练(微调/强化学习)
多模态大模型训练也是很多小伙伴实习科研和工作需要的内容,星球内部详细汇总了相关数据集、强化学习RLHF、MoE等方向的内容,未来还将持续丰富相关模块。

1)开源数据集

2)多模态大模型MLLM

3)视觉语言模型VLM

4)大模型微调

5)强化学习与RLHF

6)MoE(混合专家模型)

7)VLM的提示适配器学习

8)LLM在3D世界中的应用

(四)大模型量化、部署及推理
同时,也有很多小伙伴对于部署自己的大模型感兴趣,所以星球进一步扩展了大模型量化、部署和推理的内容。

1)大模型量化

2)大模型推理

3)大模型部署

星球后续计划
直播分享
未来,星球内部会不定期邀请行业大佬直播分享,直播内容可以反复观看,我们计划邀请国内外顶尖学术界和工业界的大佬作客『大模型之心Tech』,敬请期待。
星球内部交流
为了构建一个专业的交流社区,我们目前已经邀请到了40+学术界和工业界的大佬,他们来自国内外知名高校实验室、大模型/互联网相关的头部公司,其中高校和科研机构包括但不限于:上交、清华、北京大学、上海人工智能实验室、港科大、港大等等!公司包括但不限于阿里千问、美团LongCat、深度求索DeepSeek、字节豆包、百度文心一言、月之暗面Kimi等等。未来我们会打造一个大模型的前沿技术聚集地~
求职分享
岗位分享也是同学们的刚需,后期我们也会在星球内部分享一些独家岗位招聘信息,赋能更多的小伙伴!
扫码加入
欢迎扫码加入我们的大模型社区,一起交流产业、产品、求职等内容。
