【AI】视频理解新标杆,快手多模态推理模型开源:128k上下文+0.1秒级视频定位+跨模态推理

人工智能产业链union 2025-09-12 14:55
资讯配图

能看懂视频并进行跨模态推理的大模型Keye-VL 1.5,快手开源了。

资讯配图

相比此前的预览版本,Keye-VL 1.5的时序定位能力进一步升级,并且支持跨模态推理。

还创新性地提出Slow-Fast双路编码机制,给模型带来了128k的超长上下文窗口,而且速度与细节兼顾。

成绩上,不仅在Video-MME短视频基准斩获73.0的高分,还在通用、视频和推理场景的大量Benchmark当中领跑同级模型。

资讯配图

视频元素0.1秒级定位,还支持推理

要说Keye-VL-1.5最大的亮点,研究团队认为主要有三个,也就是开头提到的128k上下文、突出的短视频理解能力、 以及更强的Reasoning能力。

在视频理解场景当中,这三项能力能够同时得以展现。

首先是时序信息理解,Keye-VL-1.5能够准确判断特定物品在视频中出现的时间点,而且精确到0.1秒级。

比如在这段26秒带货视频片段中,介绍了一款充电宝,其中一个环节是将其装进包包,以体现便于携带。

Keye-VL-1.5看完这段视频后,准确回答出了其中包包出现的时间——22.3-23.8秒。

而其他模型或者时间只精确到秒而且还不准确,或者干脆不说时间,直接数起了镜头。

再来是描述能力,Keye-VL-1.5能够详细描述视频画面场景和细节。

例如对于上面这段视频,Keye-VL-1.5给出了这样的描述:

资讯配图

并且Keye-VL-1.5还具备视频推理能力,能够根据前序视频内容推断后续事件发生原因。

在这段宠物视频当中,大狗做出了一个咬小狗耳朵的动作,而Keye-VL-1.5要分析大狗为什么要咬。

其实答案在视频当中已经以文字的形式写了出来,但是Keye-VL-1.5的解释更加详细,并进一步用视频中的后续变化来加强自己的观点。

资讯配图

跑分方面,Keye-VL-1.5在多项公开Benchmark以及内部评测中都拿到了同尺寸模型中的最高分。

在MMBench、OpenCompass等综合类基准中,Keye-VL-1.5的成绩均超越Qwen2.5-VL 7B,并取得多个SOTA。

在图像推理强相关的AI2D、OCRBench等数据集中,也均超出同级其他模型。

资讯配图

针对视频理解,Keye在Video-MME、TempCompass和LongVideoBench上,成绩同样领先于Qwen2.5-VL 7B等模型。

包含视觉的数学与逻辑推理维度上,Keye也保持了领先优势。

资讯配图

除了这些公开数据集,Keye团队还构建了200条面向短视频应用的内部多维度评测。

Keye-VL-1.5-8B在人类标注的五项指标(正确性、完整性、相关性、流畅度、创造性)上获得3.53分的综合成绩,较预览版本提升了0.51分,也超过了作为对比的竞品模型。

资讯配图

那么,Keye-VL是如何实现的呢?

视频理解,也用上了快慢思考

模型架构和快慢编码策略

整体设计上,Keye-VL-1.5采用了“视觉Transformer(ViT)+MLP投影器+语言解码器”的三段式架构。

ViT将输入图像或视频帧切成14×14的patch序列,用自注意力捕捉全局空间关系。

该ViT在初始化时直接继承SigLIP-400M参数,SigLIP是一种图文对比预训练方法,可让视觉特征天然带有语义对齐能力。

为了在不裁剪的情况下处理任意分辨率,团队对ViT添加了“原生分辨率”支持,操作上先把绝对位置向量插值到任意尺寸,再引入2DRoPE(二维旋转位置编码)增强高分辨率外推。

ViT输出的patch特征经由两层MLP投影器送入语言解码器,语言端采用Qwen3-8B,并在其位置编码中加入3DRoPE。

3DRoPE是在传统二维旋转角的基础上再增加一维“时间/深度”角度,目的是让文本token与视觉token按统一时序排序。

资讯配图

针对视频的高帧率与高分辨率矛盾,Keye-VL-1.5还创新性地提出Slow-Fast编码策略。

模型首先会对连续帧做patch级余弦相似度计算,若与最近一次“慢帧”(又称变化帧,低帧数高分辨率)相似度>95%则判定为“快帧” (又称静止帧,高帧数低分辨率),否则标记为新“慢帧”。

处理时,慢帧保留高分辨率,快帧分配慢帧30%的token预算,再结合二分搜索,能够让总预算精确落在限制内,并在序列里插入时间戳特殊符号以标注帧界。

资讯配图

通过这种视频快慢编码策略,Keye实现了性能与计算成本的有效平衡。

资讯配图

四阶段渐进式预训练

预训练采取四阶段渐进流水线,按照“先单模后多模、先对齐后扩窗”的顺序展开:

资讯配图

整个预训练语料超过1万亿token,数据源既包含LAION、DataComp、CC12M等公开多语言图文库,也有大规模自建图像、视频与文本。

四阶段结束后,Keye团队对不同数据配比训练的“同质”权重与针对OCR、数学等薄弱项单独强化得到的“异质”权重进行模型融合,以减小偏差并提升鲁棒性。

“同质模型”指的是在退火期采用相同网络结构和相似任务目标,但调整数据配比、样本难度或随机种子训练出的多份主干权重,这些模型彼此性能分布接近;

“异质模型”则是利用与主干不同的专用数据域进行进一步精调而生成的专家权重,例如团队针对车牌、票据和街景文字额外收集/合成数据训练出的OCR-Expert。

由于双方架构一致,融合过程可以通过直接权重插值实现,不引入推理时额外开销,却能将专家的局部能力注入通用模型。

Post-training

Keye-VL-1.5的训练后处理包含四个主要阶段:

资讯配图

在监督微调阶段,团队先构建包含750万多模态问答的候选池,用TaskGalaxy将样本映射到七万种任务标签,再刻意提高高难度类型的占比。

随后进入MPO,以25万开源、15万纯文本和2.6万人工样本为基底,利用Keye-Reward模型分数和人工评估构造高低质配对,通过偏好损失函数让模型在同一问题上倾向得分更高的答案,从而进一步提升回答质量。

有了质量可控的答案后,模型借助链式思考冷启动流水线迅速补齐推理深度,先自动生成带步骤的解答,再由第二模型逐步打分进行分级,中档样本经人工精修后复审,高分样本直接入库,为后续强化学习提供可靠冷启动权重。

接下来进入通用强化学习,系统首先按照样本难度分组,然后利用GSPO在组内基于序列重要性权重裁剪优势函数,缓解长序列梯度不稳。

当推理能力趋于收敛后,训练转入最后的对齐阶段。

规则奖励通过正则和AST解析强制检查JSON、Markdown等结构与内容安全,生成式奖励由外部大模型评估逻辑一致性与语言风格,模型奖励则来自Keye-Reward模型的细粒度偏好分。

三类信号动态加权,使最终模型既能遵循指令又能保持格式正确并符合用户偏好,同时有效降低无依据生成风险。

团队成果多次亮相顶会

说到快手大模型,我们可能更熟悉视频生成模型可灵,但实际上,快手在其他类型的大模型上同样有很强的实力。

打造Keye-VL的Keye团队,是快手内部专注多模态大语言模型研发的核心AI部门,主攻视频理解、视觉感知与推理等前沿方向。

Keye团队认为,整合视觉、语言和行为等多源数据的智能体,对于解锁更深层次的认知和决策至关重要。

目前,Keye团队已经拥有大量成果,在今年的多个顶会上密集发布。

ICML 2025上,Keye团队提出了多模态RLHF框架MM-RLHF(2502.10391),通过120k人类偏好对比与批评式奖励模型,显著提升MLLM安全性及对齐性能。

资讯配图

KDD 2025上,视觉语言模型治理框架VLM as Policy(2504.14904)获得了最佳论文提名。

该框架通过VLM驱动内容质量与风险判定,显著提高短视频审核效率与准确率。

资讯配图

CVPR 2025上,Keye团队也发布了两项成果。

交错图文多模态数据集CoMM(2406.10462),提供了高一致性图文叙事样本,从而增强模型图文穿插理解与生成能力。

资讯配图

视觉token压缩加速算法LibraMerging,采用位置驱动合并,在无需再训练的情况下大幅降低推理开销。

资讯配图

还有ICLR 2025中,Keye有三项研究成果亮相,包括一种优化算法和两个数据集。

MoE模型优化算法STGC(2406.19905),可以检测token梯度冲突并进行重路由,提升专家利用率与收敛速度。

资讯配图

视频对话理解基准SVBench(2502.10810),构建了时序多轮问答链,评测LVLM在流式长视频场景的推理水平。

资讯配图

还有视觉任务指令数据集TaskGalaxy(2502.09925),可以自动生成万级层级任务与40万余样本,增强模型跨任务泛化能力。

资讯配图

在快手内部,Keye团队的这一系列成果,正在为短视频内容审核、智能剪辑、搜索与互动推荐等业务场景提供底层AI能力。

Keye正在把多模态技术从实验环境推向千万级日常场景,验证复杂视频理解在真实业务中可行且高效,为同类技术的工程化落地提供了直接样本。

技术报告:
https://arxiv.org/pdf/2509.01563

代码:
https://github.com/Kwai-Keye/Keye/blob/main/Kwai_Keye_v1_5.pdf

模型权重:
https://huggingface.co/Kwai-Keye/Keye-VL-1.5-8B

在线DEMO:
https://huggingface.co/spaces/Kwai-Keye/Keye-VL-1_5-8B

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—  —

 

☟☟☟

☞人工智能产业链联盟筹备组征集公告☜

 


精选报告推荐:

11份清华大学的DeepSeek教程,全都给你打包好了,直接领取:


【清华第一版】DeepSeek从入门到精通

【清华第二版】DeepSeek如何赋能职场应用?


【清华第三版】普通人如何抓住DeepSeek红利?

【清华第四版】DeepSeek+DeepResearch让科研像聊天一样简单?

【清华第五版】DeepSeek与AI幻觉

【清华第六版】DeepSeek赋能家庭教育

【清华第七版】文科生零基础AI编程:快速提升想象力和实操能力

【清华第八版】DeepSeek政务场景应用与解决方案

【清华第九版】迈向未来的AI教学实验

【清华第十版】DeepSeek赋能品牌传播与营销

【清华第十一版】2025AI赋能教育:高考志愿填报工具使用指南

 10份北京大学的DeepSeek教程

【北京大学第一版】DeepSeek与AIGC应用

【北京大学第二版】DeepSeek提示词工程和落地场景

【北京大学第三版】Deepseek 私有化部署和一体机

【北京大学第四版】DeepSeek原理与落地应用

【北京大学第五版】Deepseek应用场景中需要关注的十个安全问题和防范措施

【北京大学第六版】DeepSeek与新媒体运营

【北京大学第七版】DeepSeek原理与教育场景应用报告

【北京大学第八版】AI工具深度测评与选型指南

【北京大学第九版】AI+Agent与Agentic+AI的原理和应用洞察与未来展望

【北京大学第十版】DeepSeek在教育和学术领域的应用场景与案例(上中下合集)

8份浙江大学的DeepSeek专题系列教程

浙江大学DeepSeek专题系列一--吴飞:DeepSeek-回望AI三大主义与加强通识教育

浙江大学DeepSeek专题系列二--陈文智:Chatting or Acting-DeepSeek的突破边界与浙大先生的未来图景

浙江大学DeepSeek专题系列三--孙凌云:DeepSeek:智能时代的全面到来和人机协作的新常态

浙江大学DeepSeek专题系列四--王则可:DeepSeek模型优势:算力、成本角度解读

浙江大学DeepSeek专题系列五--陈静远:语言解码双生花:人类经验与AI算法的镜像之旅

浙江大学DeepSeek专题系列六--吴超:走向数字社会:从Deepseek到群体智慧

浙江大学DeepSeek专题系列七--朱朝阳:DeepSeek之火,可以燎原

浙江大学DeepSeek专题系列八--陈建海:DeepSeek的本地化部署与AI通识教育之未来

4份51CTO的《DeepSeek入门宝典》

51CTO:《DeepSeek入门宝典》:第1册-技术解析篇

51CTO:《DeepSeek入门宝典》:第2册-开发实战篇

51CTO:《DeepSeek入门宝典》:第3册-行业应用篇

51CTO:《DeepSeek入门宝典》:第4册-个人使用篇

5份厦门大学的DeepSeek教程

【厦门大学第一版】DeepSeek大模型概念、技术与应用实践

【厦门大学第二版】DeepSeek大模型赋能高校教学和科研

【厦门大学第三版】DeepSeek大模型及其企业应用实践

【厦门大学第四版】DeepSeek大模型赋能政府数字化转型

【厦门大学第五版】DeepSeek等大模型工具使用手册-实战篇

10份浙江大学的DeepSeek公开课第二季专题系列教程

【精选报告】浙江大学公开课第二季:《DeepSeek技术溯源及前沿探索》(附PDF下载)

【精选报告】浙江大学公开课第二季:2025从大模型、智能体到复杂AI应用系统的构建——以产业大脑为例(附PDF下载)

【精选报告】浙江大学公开课第二季:智能金融——AI驱动的金融变革(附PDF下载)

【精选报告】浙江大学公开课第二季:人工智能重塑科学与工程研究(附PDF下载)

【精选报告】浙江大学公开课第二季:生成式人工智能赋能智慧司法及相关思考(附PDF下载)

【精选报告】浙江大学公开课第二季:AI大模型如何破局传统医疗(附PDF下载)

【精选报告】浙江大学公开课第二季:2025年大模型:从单词接龙到行业落地报告(附PDF下载)

【精选报告】浙江大学公开课第二季:2025大小模型端云协同赋能人机交互报告(附PDF下载)

【精选报告】浙江大学公开课第二季:DeepSeek时代:让AI更懂中国文化的美与善(附PDF下载)

【精选报告】浙江大学公开课第二季:智能音乐生成:理解·反馈·融合(附PDF下载)

6份浙江大学的DeepSeek公开课第三季专题系列教程

【精选报告】浙江大学公开课第三季:走进海洋人工智能的未来(附PDF下载)

【精选报告】浙江大学公开课第三季:当艺术遇见AI:科艺融合的新探索(附PDF下载)

【精选报告】浙江大学公开课第三季:AI+BME,迈向智慧医疗健康——浙大的探索与实践(附PDF下载)

【精选报告】浙江大学公开课第三季:心理学与人工智能(附PDF下载)

【精选报告】浙江大学公开课第三季:人工智能赋能交通运输系统——关键技术与应用(附PDF下载)

【精选报告】浙江大学公开课第三季:人工智能与道德进步(附PDF下载)


相关阅读

干货推荐:
AI加油站】第一部:《大型语言模型应用检索增强生成:改变搜索、推荐和 AI 助手》附下载
【AI加油站】第二部:《程序员的自我修炼手册》(附下载)
【AI加油站】第三部:《大规模语言模型:从理论到实践》(附下载)
【AI加油站】第四部:《使用生成式人工智能和Python开始数据分析》(附下载)
【AI加油站】第五部:《使用生成式人工智能和Python开始数据分析》(附下载)
【AI加油站】第六部:《时间序列:建模、计算与推断》(附下载)
【AI加油站】第七部:《因果关系的逻辑理论的好书-A Logical Theory of Causality》(附下载)

【AI加油站】第八部:《模式识别(第四版)-模式识别与机器学习》(附下载)

【AI加油站】第九部:《Python深度学习(中文版)》(附下载)
【AI加油站】第十部:《机器学习方法》(附下载)
【AI加油站】第十一部:《深度学习》(附下载)
【AI加油站】第十二部:《从零开始的机器学习》(附下载)
【AI加油站】第十三部:《Transformer入门到精通》(附下载)
【AI加油站】第十四部:《LLM 应用开发实践笔记》(附下载)
【AI加油站】第十五部:《大模型基础 完整版》(附下载)
【AI加油站】第十六部:《从头训练大模型最佳实践》(附下载)
【AI加油站】第十七部:《大语言模型》(附下载)
【AI加油站】第十八部:《深度强化学习》(附下载)
【AI加油站】第十九部:清华大学《大模型技术》(附下载)
【AI加油站】第二十部:Prompt入门神书-《Prompt 学习指南》(附下载)
【AI加油站】第二十一部:吴恩达&open AI联合推出《大模型通关指南》(附下载)
【AI加油站】第二十二部:《李宏毅深度学习教程》值得反复阅读的神书!(附下载)
【AI加油站】第二十三部:Prompt经典中文教程-《提示工程指南》(附下载)
【AI加油站】第二十四部:爆火下载28万次!MIT最新神书《理解深度学习》(附下载)
【AI加油站】第二十五部:LLM4大名著,OpenAI专家强推《深度解析:大语言模型理论与实践》(附下载)
【AI加油站】第二十六部:NLP大牛Thomas Wolf等新书《Transformer自然语言处理》(附下载)
【AI加油站】第二十七部:哈工大博士耗时一年整理《PyTorch常用函数手册》,轻松掌握PyTorch的各种操作(附PDF下载)
【AI加油站】第二十八部:大模型炼丹大师必备《深度学习调优指南中文版-系统性优化模型》(附下载)
【AI加油站】第二十九部:炸裂发布!《大语言模型:导论》重磅发布!(附下载)
【AI加油站】第三十部:最值得读的LLM书!下载量10w+!《基于Transformer和扩散模型的生成式AI》(附下载)
【AI加油站】第三十一部:RL稀缺宝典!《强化学习的艺术》(附下载)
【AI加油站】第三十二部:一本醍醐灌顶的教科书!《大语言模型提示工程:构建LLM应用的艺术与科学》(附下载)
【AI加油站】第三十三部:机器学习好评榜第一《机器学习基础》(附下载)
【AI加油站】第三十四部:所有大模型领域学习者必读,没有之一!由深度学习三巨头联合撰写!(附下载)
【AI加油站】第三十五部:{AI炼丹神书}——从0到1榨干深度学习模型每一滴性能的终极战术手册《深度学习调优指南》(附下载)
【AI加油站】第三十六部:面向生产环境的大型语言模型实战手册《LLM 大语言模型构建指南》(附下载)
【AI加油站】第三十七部:《深度学习的数学导论:方法、实现与理论》从神经网络架构到物理信息模型的全景综述(附下载)
【AI加油站】第三十八部:下载量10w+!《大型语言模型:语言理解和生成》从文本分类到主题建模的实战指南(附下载)
【AI加油站】第三十九部:包教包会!《从零开始构建大语言模型的关键要点》大模型训练全景指南:从0到1的系统性最佳实践(附下载)
【AI加油站】第四十部:《大规模机器学习训练工程实战手册》——从硬件选型到故障恢复的系统性指南(附下载)
【AI加油站】第四十一部:《ChatGPT后训练全景解析:技术演进、核心挑战与未来方向》(附下载)
【AI加油站】第四十二部:《百页机器学习书》:从算法到实战的全景指南(附下载)
【AI加油站】第四十三部:《掌握大语言模型》核心知识速览:从NLP基础到LLM前沿实践(附下载)
【AI加油站】第四十四部:《精通PyTorch》-从CNN到Transformer、LLM、GNN的端到端实战图谱(附下载)
【AI加油站】第四十五部:《图神经网络导论》-全景拆解:从数学基石到落地应用的知识地图(附下载)
【AI加油站】第四十六部:谷歌大佬编写,我唯一熬夜看完的机器学习神作《机器学习:概率视角》(附下载)
【AI加油站】第四十七部:复旦大学张奇老师《自然语言处理导论》(附下载)
【AI加油站】第四十八部:Github持续霸榜!「Leetcode刷题笔记」解题思路/代码/模板开放下载!(附下载)
【AI加油站】第四十九部:下载10W+爆火神书《基于LangChain进行生成式AI开发》(附下载)
AI机器人设计推荐:
【AI加油站】机器人设计系列一:《IBM Robocode人工智能机器人研究》从Java编程到智能战斗系统指南(附下载)
【AI加油站】机器人设计系列二:《PVCBOT零基础机器人制作》从PVC线槽到专属机器人的完整入门指南(附下载)
【AI加油站】机器人设计系列三:《ROBOTC与机器人程序设计》从NXT到TETRIX的完整实战指南(附下载)
【AI加油站】机器人设计系列四:《多关节机器人原理与维修》全本技术精要总结(附下载)
【AI加油站】机器人设计系列五:《工业机器人应用与维护职业认知》——基于“任务驱动”的中职人才培养全景教材解析(附下载)
【AI加油站】机器人设计系列六:带你走进《机器人世界》:从古代机关到未来伙伴的全景漫游(附下载)
【AI加油站】机器人设计系列七:从零件到成品:《爱上机器人 —— 机器人制作晋级攻略》带你玩转机器人世界!(附下载)
【AI加油站】机器人设计系列八:从古代木牛流马到未来智能危机:机器人发展的千年探索与思考(附下载)
【AI加油站】机器人设计系列九:一文读懂固定翼空中机器人:从原理到应用的全方位技术指南(附下载)
RPA 流程自动化系列推荐:
【AI加油站】RPA 流程自动化系列一:《机器人流程自动化魔力象限》市场格局、厂商优劣与选型指南(附PDF下载)
【AI加油站】RPA 流程自动化系列二:从RPA到APA:ProAgent引领的智能代理流程自动化革命(附PDF下载)
【AI加油站】RPA 流程自动化系列三:AUTONODE:认知 GUI 自动化的“神经-图式”自学习引擎全景解读(附PDF下载)
【AI加油站】RPA 流程自动化系列四:PromptRPA——面向智能手机的自然语言驱动机器人流程自动化系统综述(附PDF下载)
【AI加油站】RPA 流程自动化系列五:《FlowMind》:金融级智能工作流自动生成框架(附PDF下载)
【AI加油站】RPA 流程自动化系列六:GUIDE:开启认知驱动RPA时代的多模态GUI智能数据集全景解读(附PDF下载)
【AI加油站】RPA 流程自动化系列七:多模态基础模型如何破解企业自动化困局?ECLAIR 系统的突破与探索(附PDF下载)
【AI加油站】RPA 流程自动化系列八:SmartFlow:融合 LLM 与计算机视觉的智能机器人流程自动化系统解析(附下载)
【AI加油站】RPA 流程自动化系列九:以人为本:重塑自动化技术的未来 —— 从挑战到实践的全面探索(附PDF下载)
面试推荐:
【AI加油站】AI面试专题一:BIO,NIO,AIO,Netty面试题(附下载)
【AI加油站】AI面试专题二:Git常用命令面试题(附下载)
【AI加油站】AI面试专题三:Java常用面试题(附下载)
【AI加油站】AI面试专题四:Linux系统的面试题集(附下载)
【AI加油站】AI面试专题五:Memcached 面试题集(附下载)
【AI加油站】AI面试专题六:MyBatis框架的面试题(附下载)
【AI加油站】AI面试专题七:MySQL相关的面试题资料(附下载)
【AI加油站】AI面试专题八:Netty面试题资料(附下载)
【AI加油站】AI面试专题九:Nginx的面试题资料(附下载)
【AI加油站】AI面试专题十:RabbitMQ的面试题资料(附下载)
【AI加油站】AI面试专题十一:Redis的面试题资料(附PDF下载)
【AI加油站】AI面试专题十二:Spring的面试题资料(附PDF下载)
【AI加油站】AI面试专题十三:Apache Tomcat的面试题资料(附PDF下载)
【AI加油站】AI面试专题十四:Zookeeper的面试题资料(附PDF下载)
【AI加油站】AI面试专题十五:《阿里巴巴Java开发手册》终极版的面试题资料(附PDF下载)
【AI加油站】AI面试专题十六:大数据技术面试题资料(附PDF下载)
【AI加油站】AI面试专题十七:Java并发多线程面试题资料(附PDF下载)
【AI加油站】AI面试专题十八:设计模式的面试题资料(附PDF下载)
【AI加油站】AI面试专题十九:Java虚拟机(JVM)的面试题资料(附PDF下载)
【AI加油站】AI面试专题二十:Elasticsearch的面试题资料(附PDF下载)
【AI加油站】AI面试专题二十一:TCP UDP Socket Http网络编程的面试题资料(附PDF下载)
【AI加油站】AI面试专题二十二:消息队列Kafka的面试题资料(附PDF下载)
【AI加油站】AI面试专题二十三:Spring Boot的面试题资料(附PDF下载)
【AI加油站】AI面试专题二十四:Spring Cloud的面试题资料(附PDF下载)
【AI加油站】AI面试专题二十五:Dubbo的面试题资料(附PDF下载)
大模型课程推荐:
【AI加油站】大模型课程系列一:大模型应用:从提示工程到AI智能体——系统化知识地图(附PDF下载)
【AI加油站】大模型课程系列二:大模型应用:从提示工程到AI智能体——系统化知识地图--合集(附PDF下载)
【AI加油站】大模型课程系列三:《大模型应用·第3章:大模型提示词》-大模型提示词设计七步法(附PDF下载)
【AI加油站】大模型课程系列四:《大模型应用·第4章:大模型辅助工作学习》一站式检索-办公-创作全攻略(附PDF下载)
【AI加油站】大模型课程系列五:《大模型应用·第5章:大模型检索增强》读懂大模型检索增强生成(RAG)全景(附PDF下载)
【AI加油站】大模型课程系列六:《大模型应用·第6章:大模型认知框架》从情景模仿到自我进化的7种思维范式(附PDF下载)
【AI加油站】大模型课程系列七:《大模型应用·第7章:大模型使用工具》-从“会聊天”到“能办事”的7个关键洞察(附PDF下载)
【AI加油站】大模型课程系列八:《大模型应用·第8章:AI智能体核心技术》-从单脑到群体协作的工程落地指南(附PDF下载)
【AI加油站】大模型课程系列九:《大模型应用·第9章:AI智能体开发平台》-从理论到落地的母婴助手案例解析(附PDF下载)
【AI加油站】大模型课程系列十:《大模型应用·第10章:AI智能体行业案例》-四大场景深度解析与实战指南(附PDF下载)

人工智能产业链联盟高端社区




资讯配图
精选主题推荐:
Manus学习手册
从零开始了解Manus

DeepSeek 高级使用指南,建议收藏

一次性说清楚DeepSeek,史上最全(建议收藏)

DeepSeek一分钟做一份PPT

用DeepSeek写爆款文章?自媒体人必看指南

【5分钟解锁DeepSeek王炸攻略】顶级AI玩法,解锁办公+创作新境界!

DeepSeek接入个人微信!24小时智能助理,随时召唤!
PS×Deepseek:一句话编写PS脚本,搞定PS批量导出图层
如何让AI给自己打工,10分钟创作一条爆款视频?
荐:
【中国风动漫】《姜子牙》刷屏背后,藏着中国动画100年内幕!
【中国风动漫】除了《哪吒》,这些良心国产动画也应该被更多人知道!

【中国风动漫】《雾山五行》大火,却很少人知道它的前身《岁城璃心》一个拿着十米大刀的男主夭折!

资讯配图
声明

免责声明:部分文章和信息来源于互联网,不代表本订阅号赞同其观点和对其真实性负责。如转载内容涉及版权等问题,请立即与小编联系(微信号:913572853),我们将迅速采取适当的措施。本订阅号原创内容,转载需授权,并注明作者和出处。如需投稿请与小助理联系(微信号:AI480908961)

编辑:Zero

资讯配图


资讯配图

资讯配图

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI 定位 开源
more
当人形机器人也能“网购”?看东京大学团队如何打造开源双足机器人MEVITA!
ICCV'25开源 | Dita:基于DiT的通用VLA模型
中国开源AI下载量年底登顶Hugging Face,美国首次被甩开,a16z合伙人惊爆:80%美国AI创业公司,都在用中国大模型
100轮工具调用,8B小模型也能做复杂长搜索!MiniMax&港科大最新开源
智源研究院携手联合国、GOSIM共同举办“可持续发展大会”,凝聚全球开源力量共探AI普惠全球
π0.5开源前,国内也开源了一个强大的端到端统一基础模型!具备强泛化和长程操作
ICCV`25 | 把DragDiffusion“卷”哭了:速度快600倍,效果更精准!港大开源Inpaint4Drag
全球第一!腾讯混元模型登顶开源热榜
微软开源1976年运行在8位微处理器上的汇编代码,比尔·盖茨曾参与开发
TPAMI 2025开源| PointGST:参数量仅0.67%,精度首破99%,三维点云处理迎来谱域新范式!
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号