
西南财经大学《大模型应用:从提示工程到AI智能体》课程系统梳理了大模型从原理到落地的全链路知识。以下是核心内容提炼:
一、大模型基础
定义与特征
基于Transformer架构,参数量达亿级至万亿级(如GPT-3的1750亿参数),通过预训练+微调实现多任务泛化。
典型应用:文本生成、翻译、情感分析、问答系统。
技术演进
从统计语言模型(N-gram)→神经语言模型(RNN/LSTM)→预训练大模型(BERT/GPT)。
二、提示工程(Prompt Engineering)
核心原则
明确任务:避免模糊指令(如“写故事”→“写400字童话,主角为小老鼠,主题冒险与友谊”)。
角色设定:赋予模型特定身份(如“法律专家”),提升输出专业性。
上下文与输出控制:提供背景信息,限定格式、长度(如“50字内总结”)。
优化策略
迭代反馈:通过多轮交互修正输出(如代码优化案例)。
情绪勒索法:添加“这对我的职业很重要”提升准确性。
三、AI智能体(Agent)
核心能力
自主决策:动态调整策略(如ReAct框架:思考→行动→观察→循环)。
工具调用:集成API、数据库等外部工具(如调用天气API规划行程)。
记忆系统:短期记忆(上下文)+长期记忆(外部向量存储)。
关键技术
反思机制:Reflexion框架通过自我评估和总结优化决策(如家庭任务中“用台灯检查杯子”的失败反思)。
任务分解:将复杂任务拆解为子目标(如旅行规划分解为订票、查天气)。
四、检索增强生成(RAG)
非结构化RAG
结合向量数据库(如FAISS)和语义搜索,处理文本/多媒体数据,解决大模型知识过时问题。
应用:实时联网搜索(如查询2025年成都马拉松日期)。
结构化RAG
知识图谱:GraphRAG通过实体关系(如“爱因斯坦→获得→诺贝尔奖”)增强推理。
数据库查询:TAG模型将自然语言转为SQL(如“票房最高的经典爱情片”→SQL查询→生成总结)。
五、工具与场景落地
本地部署
工具:Ollama(本地运行Llama/DeepSeek)、Cherry AI(多模型客户端)。
优势:数据隐私保护、离线使用。
行业应用
办公:ChatExcel自动处理表格、讯飞智文一键生成PPT。
创作:即梦AI生成图文、天谱乐作曲、海螺AI制作视频。
金融:Vestinda自动化交易策略、Swallow金融定价模型。
六、挑战与未来
瓶颈:高延迟、工具安全性、真实用户数据匮乏。
趋势:多模态工具(情感识别、3D生成)、更轻量化的工具接口设计。
一句话总结
课程贯通大模型“理论→提示优化→智能体构建→工具集成→场景落地”全链条,强调通过提示工程和RAG技术释放大模型潜能,推动AI从对话到自主行动的跨越。











本书免费下载地址
关注微信公众号“人工智能产业链union”回复关键字“AI大模型02”获取下载地址。