转自架构师带你玩转AI，仅用于学术分享，如有侵权留言删除

想象你在和朋友看一部电影，朋友突然问你："这个人为什么突然笑了？"你不仅要看懂画面中人物的表情，还要结合剧情背景、人物关系来推理原因。这就是人类天生具备的多模态推理能力。

而让AI也具备这种"看懂并想通"的能力，正是计算机视觉和自然语言处理交叉领域最具挑战性的任务——多模态推理。

今天我们深入探讨多模态推理的两大核心任务：视觉问答（VQA）和视觉常识推理（VCR），看看AI如何从"看图说话"进化到"看图思考"。

一、多模态推理

什么是多模态推理（MultiModal Reasoning）？

简单说就是让AI像人类一样，能够同时理解图片、文字、声音，并且能够推理它们之间的关系。

想象这个场景：你看到朋友在咖啡厅里皱着眉头看手机，你的大脑会自动进行如下分析。

视觉信息：皱眉表情 + 专注看手机
背景知识：咖啡厅环境 + 朋友平时性格
推理过程：皱眉通常表示困扰 → 可能收到了麻烦消息
结论：朋友可能遇到工作上的急事

这就是人类天生的多模态推理能力！

为什么多模态推理这么重要？

（1）单模态的局限性

纯视觉AI：只能识别"看到什么"

输入：一张图片（人在看手机）输出：检测到"一个人"、"一部手机"局限：无法理解为什么看手机，也无法回答意图相关问题

纯语言AI：只能处理"文字描述"

输入：文字问题"这个人为什么皱眉？"输出：理解了问题的语法和含义局限：没有视觉信息，无法看到具体表情和环境

（2）多模态的优势

信息互补：视觉+语言=完整理解

视觉提供：具体的场景细节（表情、动作、环境）语言提供：抽象的概念和问题（"为什么"、"怎么样"）结合效果：既能看懂画面，又能回答抽象问题

推理深度：从"是什么"到"为什么"

Level 1：识别 → "看到一个人在看手机"Level 2：理解 → "这个人正在专注地查看信息"  Level 3：推理 → "从表情判断可能收到了重要/麻烦的消息"

多模态推理的三个难度等级是什么？

Level 1：信息融合

任务：把不同模态的信息组合起来

输入：图片（一只橙猫） + 文字（"这是什么动物？"）处理：图像识别 + 文字理解 + 信息匹配输出："猫"本质：信息检索和匹配

Level 2：关系推理

任务：理解不同信息之间的关系

输入：图片（猫在沙发上） + 文字（"猫在哪里？"）处理：空间关系理解 + 位置定位输出："在沙发上"本质：空间/时间/逻辑关系分析

Level 3：逻辑推理

任务：基于观察进行逻辑推导

输入：图片（人穿厚外套，地面有雪） + 文字（"现在是什么季节？"）处理：观察线索 + 常识知识 + 因果推理输出："冬天"本质：综合分析和逻辑推导

二、视觉问答（VQA）

什么是视觉问答（Visual Question Answering，VQA）？

想象一下，你拿着一张照片问朋友："这张图里有几只狗？"朋友看了看，很自然地回答："两只。"

VQA（Visual Question Answering）就是要让AI也能做到这一点——给它一张图片和一个问题，它能像人类一样给出准确答案。

听起来很简单？其实不然。最大的挑战是：AI需要真正"看懂"图片内容，而不是通过记忆训练数据中的常见答案来"蒙"对。

比如，如果训练数据中"香蕉是什么颜色"这个问题99%的答案都是"黄色"，那AI很可能会记住这个模式。当你给它一张绿色香蕉的图片时，它仍然会回答"黄色"——这就是记忆答题，而不是真正的理解。

要解决这个问题，我们需要了解VQA任务的复杂程度。根据推理难度，VQA问题可以分成四个等级。

Level 1：感知型问题（看得见就能答）

图片：一个红色苹果在桌子上问题：这是什么水果？答案：苹果难度：★☆☆☆☆技术要求：- 基础物体识别- 颜色形状检测

Level 2：计数型问题（需要仔细数）

图片：三只猫在沙发上问题：图片中有几只猫？答案：三只难度：★★★☆☆技术要求：- 目标检测和分割- 重复计数避免- 遮挡情况处理

Level 3：空间推理型问题（需要分析位置关系）

图片：桌子上有书，书旁边有杯子问题：杯子在书的什么位置？答案：旁边难度：★★★★☆技术要求：- 空间关系理解- 相对位置推理- 几何关系分析

Level 4：知识推理型问题（需要结合常识）

图片：一个人穿厚外套，呼出的气体可见问题：现在可能是什么季节？答案：冬天难度：★★★★★技术要求：- 常识知识运用- 因果关系推理- 多线索综合分析

VQA技术如何演进突破？

第一代：简单特征拼接（2015-2017）

把图片特征和文字特征直接"拼"在一起，只能简单融合，无法处理多步推理。

图片处理：图片 → CNN → 全局特征向量 [2048维]问题处理：文本 → 词嵌入 → LSTM → 问题特征向量 [512维]特征融合：方法1：简单拼接 [图片特征 + 问题特征] → [2560维]方法2：元素相乘 图片特征 ⊙ 问题特征 → [2048维]答案预测：融合特征 → 全连接层 → Softmax → 答案概率分布

第二代：注意力机制登场（2017-2019）

让AI能够"专注"于图片的相关区域，能定位问题相关的视觉区域，显著提升复杂问题准确率，具有一定程度的可解释性。

问题："这个人穿什么颜色的衣服？"Step 1：问题编码"穿什么颜色衣服" → LSTM → 问题表示 qStep 2：图像区域特征图片 → 目标检测器 → 候选区域特征 {v1, v2, ..., vn}Step 3：注意力计算for each 区域 vi:    注意力分数 = 计算(q, vi)  # 问题与区域的相关性Step 4：加权融合attended_feature = Σ(注意力分数[i] × vi)

第三代：Transformer统一建模（2019-至今）

将视觉和语言统一为序列建模问题

Step 1：统一Token化处理图片处理：输入图片 → 切分patch → 线性投影 → 图像tokens[img_token1, img_token2, ..., img_token196]问题处理：输入文本 → 分词 → 词嵌入 → 文本tokens  [这个, 人, 穿, 什么, 颜色, 的, 衣服, ?]Step 2：序列拼接[CLS] + 图像tokens + [SEP] + 文本tokens + [SEP]Step 3：三分支Transformer处理- Object-Relationship Encoder：处理图像目标和关系- Language Encoder：处理文本序列- Cross-Modality Encoder：跨模态交互Step 4：交互机制- Self-Attention：模态内部信息整合- Cross-Attention：模态间信息交换- 多层堆叠：逐步深化理解

三、视觉常识推理（VCR）

什么是视觉常识推理（Visual Commonsense Reasoning，VCR）？

VCR不仅要求AI回答问题，更要求AI能够解释为什么这样回答，展现出类似人类的推理过程。

（1）VQA任务：只要答案对就行

输入：图片 + 问题输出：答案评估：答案正确性示例：图片：一个人拿着雨伞问题：这个人手里拿着什么？答案：雨伞

（2）VCR任务：答案对了还要解释为什么

输入：图片 + 问题  输出：答案 + 推理解释评估：答案正确性 + 推理合理性示例：图片：一个人拿着雨伞，地面湿润问题：为什么这个人拿着雨伞？答案：因为在下雨解释：可以看到地面是湿的，而且天空灰暗，这些都表明正在下雨，所以这个人拿雨伞是为了避免被雨淋湿。

VCR的三个递进任务是什么？

任务1：Q→A（问题到答案）

给定：图片 + 问题要求：从4个选项中选择正确答案图片：办公室场景，一个人在电脑前打哈欠问题：这个人为什么打哈欠？选项：A. 因为很困B. 因为很饿  C. 因为在表演D. 因为在运动正确答案：A

任务2：QA→R（问题+答案到推理）

给定：图片 + 问题 + 正确答案要求：从4个解释中选择最合理的承接上例，给定正确答案A后：问题：为什么选择"因为很困"？解释选项：R1. 可以看出他在办公室环境中，时间应该是工作时间，    打哈欠通常表示困倦，可能是睡眠不足导致的。R2. 他看起来很放松，应该是在休息。R3. 办公室的灯光很亮，会让人感到困倦。R4. 打哈欠是因为空气不好。正确解释：R1

任务3：Q→AR（问题到答案和推理）

端到端任务：给定：图片 + 问题要求：同时预测答案和解释，两者都必须正确这是最困难的任务，因为需要：- 正确理解图像内容- 准确回答问题- 生成合理的解释- 保证答案和解释的一致性

VCR需要构建多步推理链、运用常识知识并生成可解释答案，核心挑战是让机器推理过程符合人类逻辑。主流解决方案是基于知识图谱的增强推理。

外部知识集成：ConceptNet：概念关系图谱"疲惫" → "打哈欠" → "需要休息"知识检索：给定图像和问题 → 提取关键概念 → 检索相关知识"办公室" + "打哈欠" → 检索工作相关的疲惫知识知识融合：视觉推理 + 知识推理 → 综合判断图像证据：观察到打哈欠动作知识证据：工作时间打哈欠通常因为困倦结合推理：因为工作疲劳所以打哈欠

一文搞懂基于知识图谱的多模态推理

多模态推理代表了AI从简单的"看图识物"向复杂的"看图思考"的关键跃升。VQA让AI学会了准确回答图像相关问题，而VCR更进一步要求AI提供推理解释，真正模拟人类的思维过程。

从早期的特征拼接到注意力机制，再到Transformer统一建模，技术演进的每一步都在缩小AI与人类认知能力的差距。

当前基于知识图谱的增强推理方案虽然取得了显著进展，但要实现真正的机器常识推理，仍需要在多步推理链构建、大规模常识知识获取和可解释性生成等方面持续突破。未来的多模态AI将不仅能看懂世界，更能像人类一样理解和解释世界。

日拱一卒，让大脑不断构建深度学习和大模型的神经网络连接。

☟☟☟

☞人工智能产业链联盟筹备组征集公告☜

☝

精选报告推荐：

11份清华大学的DeepSeek教程，全都给你打包好了，直接领取：

【清华第一版】DeepSeek从入门到精通

【清华第二版】DeepSeek如何赋能职场应用？

【清华第三版】普通人如何抓住DeepSeek红利？

【清华第四版】DeepSeek+DeepResearch让科研像聊天一样简单？

【清华第五版】DeepSeek与AI幻觉

【清华第六版】DeepSeek赋能家庭教育

【清华第七版】文科生零基础AI编程：快速提升想象力和实操能力

【清华第八版】DeepSeek政务场景应用与解决方案

【清华第九版】迈向未来的AI教学实验

【清华第十版】DeepSeek赋能品牌传播与营销

【清华第十一版】2025AI赋能教育：高考志愿填报工具使用指南

10份北京大学的DeepSeek教程

【北京大学第一版】DeepSeek与AIGC应用

【北京大学第二版】DeepSeek提示词工程和落地场景

【北京大学第三版】Deepseek 私有化部署和一体机

【北京大学第四版】DeepSeek原理与落地应用

【北京大学第五版】Deepseek应用场景中需要关注的十个安全问题和防范措施

【北京大学第六版】DeepSeek与新媒体运营

【北京大学第七版】DeepSeek原理与教育场景应用报告

【北京大学第八版】AI工具深度测评与选型指南

【北京大学第九版】AI+Agent与Agentic+AI的原理和应用洞察与未来展望

【北京大学第十版】DeepSeek在教育和学术领域的应用场景与案例(上中下合集)

8份浙江大学的DeepSeek专题系列教程

浙江大学DeepSeek专题系列一--吴飞：DeepSeek-回望AI三大主义与加强通识教育

浙江大学DeepSeek专题系列二--陈文智：Chatting or Acting-DeepSeek的突破边界与浙大先生的未来图景

浙江大学DeepSeek专题系列三--孙凌云：DeepSeek：智能时代的全面到来和人机协作的新常态

浙江大学DeepSeek专题系列四--王则可：DeepSeek模型优势：算力、成本角度解读

浙江大学DeepSeek专题系列五--陈静远：语言解码双生花：人类经验与AI算法的镜像之旅

浙江大学DeepSeek专题系列六--吴超：走向数字社会：从Deepseek到群体智慧

浙江大学DeepSeek专题系列七--朱朝阳：DeepSeek之火，可以燎原

浙江大学DeepSeek专题系列八--陈建海：DeepSeek的本地化部署与AI通识教育之未来

4份51CTO的《DeepSeek入门宝典》

51CTO：《DeepSeek入门宝典》：第1册-技术解析篇

51CTO：《DeepSeek入门宝典》：第2册-开发实战篇

51CTO：《DeepSeek入门宝典》：第3册-行业应用篇

51CTO：《DeepSeek入门宝典》：第4册-个人使用篇

5份厦门大学的DeepSeek教程

【厦门大学第一版】DeepSeek大模型概念、技术与应用实践

【厦门大学第二版】DeepSeek大模型赋能高校教学和科研

【厦门大学第三版】DeepSeek大模型及其企业应用实践

【厦门大学第四版】DeepSeek大模型赋能政府数字化转型

【厦门大学第五版】DeepSeek等大模型工具使用手册-实战篇

10份浙江大学的DeepSeek公开课第二季专题系列教程

【精选报告】浙江大学公开课第二季：《DeepSeek技术溯源及前沿探索》（附PDF下载）

【精选报告】浙江大学公开课第二季：2025从大模型、智能体到复杂AI应用系统的构建——以产业大脑为例（附PDF下载）

【精选报告】浙江大学公开课第二季：智能金融——AI驱动的金融变革（附PDF下载）

【精选报告】浙江大学公开课第二季：人工智能重塑科学与工程研究（附PDF下载）

【精选报告】浙江大学公开课第二季：生成式人工智能赋能智慧司法及相关思考(附PDF下载）

【精选报告】浙江大学公开课第二季：AI大模型如何破局传统医疗（附PDF下载）

【精选报告】浙江大学公开课第二季：2025年大模型：从单词接龙到行业落地报告（附PDF下载）

【精选报告】浙江大学公开课第二季：2025大小模型端云协同赋能人机交互报告（附PDF下载）

【精选报告】浙江大学公开课第二季：DeepSeek时代：让AI更懂中国文化的美与善（附PDF下载）

【精选报告】浙江大学公开课第二季：智能音乐生成：理解·反馈·融合（附PDF下载）

6份浙江大学的DeepSeek公开课第三季专题系列教程

【精选报告】浙江大学公开课第三季：走进海洋人工智能的未来（附PDF下载）

【精选报告】浙江大学公开课第三季：当艺术遇见AI：科艺融合的新探索（附PDF下载）

【精选报告】浙江大学公开课第三季：AI+BME，迈向智慧医疗健康——浙大的探索与实践（附PDF下载）

【精选报告】浙江大学公开课第三季：心理学与人工智能（附PDF下载）

【精选报告】浙江大学公开课第三季：人工智能赋能交通运输系统——关键技术与应用（附PDF下载）

【精选报告】浙江大学公开课第三季：人工智能与道德进步（附PDF下载）

相关阅读

干货推荐：

【AI加油站】人工智能简史：关于人工智能的过去、现在与未来（附PDF下载）

【AI加油站】第一部：《大型语言模型应用检索增强生成：改变搜索、推荐和 AI 助手》附下载

【AI加油站】第二部：《程序员的自我修炼手册》（附下载）

【AI加油站】第三部：《大规模语言模型：从理论到实践》（附下载）

【AI加油站】第四部：《使用生成式人工智能和Python开始数据分析》（附下载）

【AI加油站】第五部：《使用生成式人工智能和Python开始数据分析》（附下载）

【AI加油站】第六部：《时间序列：建模、计算与推断》（附下载）

【AI加油站】第七部：《因果关系的逻辑理论的好书-A Logical Theory of Causality》（附下载）

【AI加油站】第八部：《模式识别（第四版）-模式识别与机器学习》（附下载）

【AI加油站】第九部：《Python深度学习（中文版）》（附下载）

【AI加油站】第十部：《机器学习方法》（附下载）

【AI加油站】第十一部：《深度学习》（附下载）

【AI加油站】第十二部：《从零开始的机器学习》（附下载）

【AI加油站】第十三部：《Transformer入门到精通》（附下载）

【AI加油站】第十四部：《LLM 应用开发实践笔记》（附下载）

【AI加油站】第十五部：《大模型基础完整版》（附下载）

【AI加油站】第十六部：《从头训练大模型最佳实践》（附下载）

【AI加油站】第十七部：《大语言模型》（附下载）

【AI加油站】第十八部：《深度强化学习》（附下载）

【AI加油站】第十九部：清华大学《大模型技术》（附下载）

【AI加油站】第二十部：Prompt入门神书-《Prompt 学习指南》（附下载）

【AI加油站】第二十一部：吴恩达&open AI联合推出《大模型通关指南》（附下载）

【AI加油站】第二十二部：《李宏毅深度学习教程》值得反复阅读的神书！（附下载）

【AI加油站】第二十三部：Prompt经典中文教程-《提示工程指南》（附下载）

【AI加油站】第二十四部：爆火下载28万次！MIT最新神书《理解深度学习》（附下载）

【AI加油站】第二十五部：LLM4大名著，OpenAI专家强推《深度解析：大语言模型理论与实践》（附下载）

【AI加油站】第二十六部：NLP大牛Thomas Wolf等新书《Transformer自然语言处理》（附下载）

【AI加油站】第二十七部：哈工大博士耗时一年整理《PyTorch常用函数手册》，轻松掌握PyTorch的各种操作（附PDF下载）

【AI加油站】第二十八部：大模型炼丹大师必备《深度学习调优指南中文版-系统性优化模型》（附下载）

【AI加油站】第二十九部：炸裂发布！《大语言模型：导论》重磅发布！（附下载）

【AI加油站】第三十部：最值得读的LLM书！下载量10w+！《基于Transformer和扩散模型的生成式AI》（附下载）

【AI加油站】第三十一部：RL稀缺宝典！《强化学习的艺术》（附下载）

【AI加油站】第三十二部：一本醍醐灌顶的教科书！《大语言模型提示工程：构建LLM应用的艺术与科学》（附下载）

【AI加油站】第三十三部：机器学习好评榜第一《机器学习基础》（附下载）

【AI加油站】第三十四部：所有大模型领域学习者必读，没有之一！由深度学习三巨头联合撰写！（附下载）

【AI加油站】第三十五部：{AI炼丹神书}——从0到1榨干深度学习模型每一滴性能的终极战术手册《深度学习调优指南》（附下载）

【AI加油站】第三十六部：面向生产环境的大型语言模型实战手册《LLM 大语言模型构建指南》（附下载）

【AI加油站】第三十七部：《深度学习的数学导论：方法、实现与理论》从神经网络架构到物理信息模型的全景综述（附下载）

【AI加油站】第三十八部：下载量10w+！《大型语言模型：语言理解和生成》从文本分类到主题建模的实战指南（附下载）

【AI加油站】第三十九部：包教包会！《从零开始构建大语言模型的关键要点》大模型训练全景指南：从0到1的系统性最佳实践（附下载）

【AI加油站】第四十部：《大规模机器学习训练工程实战手册》——从硬件选型到故障恢复的系统性指南（附下载）

【AI加油站】第四十一部：《ChatGPT后训练全景解析：技术演进、核心挑战与未来方向》（附下载）

【AI加油站】第四十二部：《百页机器学习书》：从算法到实战的全景指南（附下载）

【AI加油站】第四十三部：《掌握大语言模型》核心知识速览：从NLP基础到LLM前沿实践（附下载）

【AI加油站】第四十四部：《精通PyTorch》-从CNN到Transformer、LLM、GNN的端到端实战图谱（附下载）

【AI加油站】第四十五部：《图神经网络导论》-全景拆解：从数学基石到落地应用的知识地图（附下载）

【AI加油站】第四十六部：谷歌大佬编写，我唯一熬夜看完的机器学习神作《机器学习：概率视角》（附下载）

【AI加油站】第四十七部：复旦大学张奇老师《自然语言处理导论》（附下载）

【AI加油站】第四十八部：Github持续霸榜！「Leetcode刷题笔记」解题思路/代码/模板开放下载！（附下载）

【AI加油站】第四十九部：下载10W+爆火神书《基于LangChain进行生成式AI开发》（附下载）

【AI加油站】第五十部：打破 “AI 神话”！《AI 3.0 》剖析机器智能的真实能力，探讨人机共生的未来图景（附下载）

AI机器人设计推荐：

【AI加油站】机器人设计系列一：《IBM Robocode人工智能机器人研究》从Java编程到智能战斗系统指南（附下载）

【AI加油站】机器人设计系列二：《PVCBOT零基础机器人制作》从PVC线槽到专属机器人的完整入门指南（附下载）

【AI加油站】机器人设计系列三：《ROBOTC与机器人程序设计》从NXT到TETRIX的完整实战指南（附下载）

【AI加油站】机器人设计系列四：《多关节机器人原理与维修》全本技术精要总结（附下载）

【AI加油站】机器人设计系列五：《工业机器人应用与维护职业认知》——基于“任务驱动”的中职人才培养全景教材解析（附下载）

【AI加油站】机器人设计系列六：带你走进《机器人世界》：从古代机关到未来伙伴的全景漫游（附下载）

【AI加油站】机器人设计系列七：从零件到成品：《爱上机器人 —— 机器人制作晋级攻略》带你玩转机器人世界！（附下载）

【AI加油站】机器人设计系列八：从古代木牛流马到未来智能危机：机器人发展的千年探索与思考（附下载）

【AI加油站】机器人设计系列九：一文读懂固定翼空中机器人：从原理到应用的全方位技术指南（附下载）

【AI加油站】机器人设计系列十：排爆机器人技术全景：从核心突破到实践应用的创新之路（附下载）

【AI加油站】机器人设计系列十一：全球空战机器人技术发展与军事应用展望（附下载）

【AI加油站】机器人设计系列十二：人工智能：复杂问题求解的结构和策略（附下载）

【AI加油站】机器人设计系列十三：双足步行机器人仿真设计核心（附下载）

【AI加油站】机器人设计系列十四：探秘自主移动机器人：从机械运动到智能感知，这本名校教材《自主移动机器人导论》带你入门（附下载）

RPA 流程自动化系列推荐：

【AI加油站】RPA 流程自动化系列一：《机器人流程自动化魔力象限》市场格局、厂商优劣与选型指南（附PDF下载）

【AI加油站】RPA 流程自动化系列二：从RPA到APA：ProAgent引领的智能代理流程自动化革命（附PDF下载）

【AI加油站】RPA 流程自动化系列三：AUTONODE：认知 GUI 自动化的“神经-图式”自学习引擎全景解读（附PDF下载）

【AI加油站】RPA 流程自动化系列四：PromptRPA——面向智能手机的自然语言驱动机器人流程自动化系统综述（附PDF下载）

【AI加油站】RPA 流程自动化系列五：《FlowMind》：金融级智能工作流自动生成框架（附PDF下载）

【AI加油站】RPA 流程自动化系列六：GUIDE：开启认知驱动RPA时代的多模态GUI智能数据集全景解读（附PDF下载）

【AI加油站】RPA 流程自动化系列七：多模态基础模型如何破解企业自动化困局？ECLAIR 系统的突破与探索（附PDF下载）

【AI加油站】RPA 流程自动化系列八：SmartFlow：融合 LLM 与计算机视觉的智能机器人流程自动化系统解析（附下载）

【AI加油站】RPA 流程自动化系列九：以人为本：重塑自动化技术的未来 —— 从挑战到实践的全面探索（附PDF下载）

【AI加油站】RPA 流程自动化系列十：CAAP：仅通过前端 UI 解决计算机任务的上下文感知操作规划提示技术（附PDF下载）

面试推荐：

【AI加油站】AI面试专题一：BIO,NIO,AIO,Netty面试题（附下载）

【AI加油站】AI面试专题二：Git常用命令面试题（附下载）

【AI加油站】AI面试专题三：Java常用面试题（附下载）

【AI加油站】AI面试专题四：Linux系统的面试题集（附下载）

【AI加油站】AI面试专题五：Memcached 面试题集（附下载）

【AI加油站】AI面试专题六：MyBatis框架的面试题（附下载）

【AI加油站】AI面试专题七：MySQL相关的面试题资料（附下载）

【AI加油站】AI面试专题八：Netty面试题资料（附下载）

【AI加油站】AI面试专题九：Nginx的面试题资料（附下载）

【AI加油站】AI面试专题十：RabbitMQ的面试题资料（附下载）

【AI加油站】AI面试专题十一：Redis的面试题资料（附PDF下载）

【AI加油站】AI面试专题十二：Spring的面试题资料（附PDF下载）

【AI加油站】AI面试专题十三：Apache Tomcat的面试题资料（附PDF下载）

【AI加油站】AI面试专题十四：Zookeeper的面试题资料（附PDF下载）

【AI加油站】AI面试专题十五：《阿里巴巴Java开发手册》终极版的面试题资料（附PDF下载）

【AI加油站】AI面试专题十六：大数据技术面试题资料（附PDF下载）

【AI加油站】AI面试专题十七：Java并发多线程面试题资料（附PDF下载）

【AI加油站】AI面试专题十八：设计模式的面试题资料（附PDF下载）

【AI加油站】AI面试专题十九：Java虚拟机（JVM）的面试题资料（附PDF下载）

【AI加油站】AI面试专题二十：Elasticsearch的面试题资料（附PDF下载）

【AI加油站】AI面试专题二十一：TCP UDP Socket Http网络编程的面试题资料（附PDF下载）

【AI加油站】AI面试专题二十二：消息队列Kafka的面试题资料（附PDF下载）

【AI加油站】AI面试专题二十三：Spring Boot的面试题资料（附PDF下载）

【AI加油站】AI面试专题二十四：Spring Cloud的面试题资料（附PDF下载）

【AI加油站】AI面试专题二十五：Dubbo的面试题资料（附PDF下载）

大模型课程推荐：

【AI加油站】大模型课程系列一：大模型应用：从提示工程到AI智能体——系统化知识地图（附PDF下载）

【AI加油站】大模型课程系列二：大模型应用：从提示工程到AI智能体——系统化知识地图--合集（附PDF下载）

【AI加油站】大模型课程系列三：《大模型应用·第3章：大模型提示词》-大模型提示词设计七步法（附PDF下载）

【AI加油站】大模型课程系列四：《大模型应用·第4章：大模型辅助工作学习》一站式检索-办公-创作全攻略（附PDF下载）

【AI加油站】大模型课程系列五：《大模型应用·第5章：大模型检索增强》读懂大模型检索增强生成（RAG）全景（附PDF下载）

【AI加油站】大模型课程系列六：《大模型应用·第6章：大模型认知框架》从情景模仿到自我进化的7种思维范式（附PDF下载）

【AI加油站】大模型课程系列七：《大模型应用·第7章：大模型使用工具》-从“会聊天”到“能办事”的7个关键洞察（附PDF下载）

【AI加油站】大模型课程系列八：《大模型应用·第8章：AI智能体核心技术》-从单脑到群体协作的工程落地指南（附PDF下载）

【AI加油站】大模型课程系列九：《大模型应用·第9章：AI智能体开发平台》-从理论到落地的母婴助手案例解析（附PDF下载）

【AI加油站】大模型课程系列十：《大模型应用·第10章：AI智能体行业案例》-四大场景深度解析与实战指南（附PDF下载）

人工智能产业链联盟高端社区

精选主题推荐：

Manus学习手册

从零开始了解Manus

DeepSeek 高级使用指南，建议收藏

一次性说清楚DeepSeek，史上最全（建议收藏）

DeepSeek一分钟做一份PPT

用DeepSeek写爆款文章？自媒体人必看指南

【5分钟解锁DeepSeek王炸攻略】顶级AI玩法，解锁办公+创作新境界！

DeepSeek接入个人微信！24小时智能助理，随时召唤！

PS×Deepseek：一句话编写PS脚本，搞定PS批量导出图层

如何让AI给自己打工，10分钟创作一条爆款视频？

荐：

【中国风动漫】《姜子牙》刷屏背后，藏着中国动画100年内幕！

【中国风动漫】除了《哪吒》，这些良心国产动画也应该被更多人知道！

【中国风动漫】《雾山五行》大火，却很少人知道它的前身《岁城璃心》一个拿着十米大刀的男主夭折！

声明

免责声明：部分文章和信息来源于互联网，不代表本订阅号赞同其观点和对其真实性负责。如转载内容涉及版权等问题，请立即与小编联系（微信号：913572853），我们将迅速采取适当的措施。本订阅号原创内容，转载需授权，并注明作者和出处。如需投稿请与小助理联系（微信号：AI480908961）

编辑：Zero