但我还是想说:建议个人和小团队不要碰大模型训练!

大模型之心Tech 2025-09-20 11:30

这个暴论需要叠加很多buff,但我想说的确实就是这个标题。也算是和大家对齐一下认知。

这个暴论自然引申出一个问题:不训练大模型怎么办?

如果你还没有毕业,导师布置的课题是大模型训练相关,那还是要继续深入搞搞研究。

对于企业来说,尤其是小规模的团队。做好开源LLM+RAG的部署就已经能cover 99%的需求,在没有触及到开源模型的性能边界之前,不要微调模型。

为什么不要微调?因为没有模型的原始数据配比,更有可能原始的训练数据都没有,微调之后极有可能损失掉大部分的性能。

那如果开源模型在特定领域的效果非常差,怎么办?

如果是很垂类的领域模型,可以先试试RAG,不行就试试In-context Learning,在上下文中,教LLM一些领域知识。能尝试的低成本方案都尝试后,再考虑垂类领域模型的微调训练!

一些实际使用过程中的经验,将最需要脑子的任务交给o1系列模型,比较需要脑子的任务,交给4o这一梯队的模型。

除了付费的模型,还可以考虑国产的大模型,点名表扬DeepSeek、豆包、Qwen等等开源大模型。

还有一些通用的任务,也可以考虑开源的大模型或者性价比高的闭源模型。

这其实就是Agentic AI的思路。

如果你的业务在上面的方案中都跑不通,那么自己训练模型大概率也是白瞎。大模型时代,基础模型能力的每一次提升,都算是一次地球Online的版本更新。

距离大厂基座模型团队之外的AI人,需要先了解现有LLM的性能边界,敏锐的分辨出现有模型能力和过去方案的差异,能否给当前的业务带来新的变化,然后快速解决现有业务的难题。

不要在低收益的赛道上无意义的投入,错位竞争,降维打击,也许更有效。

以上。

当前大模型领域最具代表性的技术就是RAG和Agent,企业对掌握 RAG、Agent 等技术的人才需求高涨,这些技能已成为 AI 从业者的核心竞争力。如果你也对大模型的前沿技术感兴趣,欢迎加入我们最新推出的『大模型之心Tech知识星球』。

集视频 + 图文 + 学习路线 + 问答 + 求职交流为一体,是一个综合类的大模型社区,旨在为大家打造一个交流+技术分享的聚集地。

资讯配图

国内最全的大模型技术栈社区:大模型之心Tech

社区创建的出发点是给大家提供一个大模型相关的技术交流平台,交流学术、应用和工程上的问题。星球内部的嘉宾正在快速扩张中,我们邀请了来自国内外知名高校实验室、大模型/互联网相关的头部公司,其中高校和科研机构包括但不限于:上交、清华、北京大学、上海人工智能实验室、港科大、港大等等!公司包括但不限于阿里千问、美团LongCat、深度求索DeepSeek、字节豆包、百度文心一言、月之暗面Kimi等等。未来我们会打造一个大模型的前沿技术聚集地~

我们为大家汇总了大模型全栈学习路线图,包括但不限于:

RAG学习路线
AI Agent学习路线
多模态大模型学习路线
Graph RAG学习路线
AI Agent核心技术解析
开源数据集汇总
RAG在视觉理解中的应用
Agent强化学习学习路线
MLLM工作汇总
Knowledge RAG学习路线
多模态Agent学习路线
VLM工作汇总
多模态RAG学习路线
Agent中的协议学习路线
大模型微调学习路线
Reasoning RAG学习路线
Autoware仿真
MoE学习路线
RAG在AIGC中的应用
基座Agent汇总
RLHF学习路线
个性化RAG学习路线
自进化Agent学习路线
LLM在3D世界中的应用
......
......
......

这里能够让小白快速入门,让已经入门的同学进一步提升,已经提升的同学结交更多的朋友。每一个学习路线,都有清晰的技术汇总,非常适合大家系统性学习!

资讯配图
资讯配图

加入星球有哪些福利?

  • 第一时间掌握大模型相关的学术进展、工业落地应用;
  • 和行业大佬一起交流工作与求职相关的问题;
  • 优良的学习交流环境,能结识更多同行业的伙伴;
  • 大模型相关工作岗位推荐,第一时间对接企业;
  • 行业机会挖掘,投资与项目对接。

星球内容一览

资讯配图

针对目前应用最广泛RAG、Agent和通用大模型训练、部署,我们进行了非常详细的技术路线拆解。

(一)大模型检索增强生成 - RAG

星球内部为大家分享了RAG小白入门的专业技术资料,汇总了最新的综述、开源仓库、BenchMark等等,并进一步细化了RAG的子领域。

资讯配图

1)BenchMark汇总

资讯配图

2)综述汇总

资讯配图

3)Graph RAG

资讯配图

4)Knowledge-Oriented RAG

资讯配图

5)多模态RAG

资讯配图

6)Reasoning RAG

资讯配图
资讯配图

7)RAG在AIGC中的应用

8)个性化RAG

资讯配图

(二)大模型 AI Agent

针对AI Agent,星球里首先为大家详细介绍什么是AI Agent,再展开最新综述、开源仓库、评测等内容,并进一步细化了Agent的相关子领域。

资讯配图

1)前沿综述汇总

资讯配图

1)Agent评测

资讯配图

2)Agent强化学习

资讯配图

3)多模态Agent

资讯配图

4)Agent通讯

资讯配图

5)基座Agent汇总

资讯配图

6)自进化Agent

资讯配图

7)Multi-Agent

资讯配图

(三)多模态大模型训练(微调/强化学习)

多模态大模型训练也是很多小伙伴实习科研和工作需要的内容,星球内部详细汇总了相关数据集、强化学习RLHF、MoE等方向的内容,未来还将持续丰富相关模块。

资讯配图

1)开源数据集

资讯配图

2)多模态大模型MLLM

资讯配图

3)视觉语言模型VLM

资讯配图

4)大模型微调

资讯配图

5)强化学习与RLHF

资讯配图

6)MoE(混合专家模型)

资讯配图

7)VLM的提示适配器学习

资讯配图

8)LLM在3D世界中的应用

资讯配图

(四)大模型量化、部署及推理

同时,也有很多小伙伴对于部署自己的大模型感兴趣,所以星球进一步扩展了大模型量化、部署和推理的内容。

资讯配图

1)大模型量化

资讯配图

2)大模型推理

资讯配图

3)大模型部署

资讯配图

星球后续计划

直播分享

未来,星球内部会不定期邀请行业大佬直播分享,直播内容可以反复观看,我们计划邀请国内外顶尖学术界和工业界的大佬作客『大模型之心Tech』,敬请期待。

星球内部交流

为了构建一个专业的交流社区,我们目前已经邀请到了40+学术界和工业界的大佬,他们来自国内外知名高校实验室、大模型/互联网相关的头部公司,其中高校和科研机构包括但不限于:上交、清华、北京大学、上海人工智能实验室、港科大、港大等等!公司包括但不限于阿里千问、美团LongCat、深度求索DeepSeek、字节豆包、百度文心一言、月之暗面Kimi等等。未来我们会打造一个大模型的前沿技术聚集地~

求职分享

岗位分享也是同学们的刚需,后期我们也会在星球内部分享一些独家岗位招聘信息,赋能更多的小伙伴!

扫码加入

欢迎扫码加入我们的大模型社区,一起交流产业、产品、求职等内容。

资讯配图

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
more
抱歉ChatGPT Health!全球应用能力最强的医疗AI在中国
苹果官宣降价,最高立省1000元/微信回应下架聊天记录导出争议/黄仁勋:AI时代蓝领更吃香
小米多项AI成果入选ICASSP 2026,覆盖音频理解、音乐评估与多模态生成等前沿方向
影视飓风Tim再启极限挑战:零下30℃雪地百小时生存仅凭AI识图获取物资
曝光马斯克AGI秘密的他,被xAI开除了?
苹果下个爆款可能不是 iPhone,居然「复活」全网群嘲的 Ai Pin,首批 2000 万台
先进封装三足鼎立时代来临,两岸厂商共掀AI产业新浪潮
阿里千问回应“AI新寒门”争议:技术正重塑教育公平边界
DeepMind CEO哈萨比斯质疑OpenAI过早引入广告:AI助手应以用户信任为先
黄仁勋:AI机器人是欧洲“一生一次”的产业跃升契机,但能源瓶颈亟待破解
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号