用一个行程规划助手,说一说 AI 圈最火的 8 个概念
LLM、Agent、RAG、ReAct、Function Call、MCP、Workflow、Embedding……
因为最近开始恶补AI,导致一刷朋友圈和短视频,这些词就跟刷屏一样真的快把我看沙雕了(顺便吐槽一下信息茧房😂) 老实说,每次看完都记不住,认识的一直认识,不认识的,看一百遍还是它认识我我不认识它。
直到前几天自己捣鼓了一个「智游AI」,做完它,这些之前绕来绕去的概念,突然就全串起来了(现在私信公众号,就能直接体验哦)。
不想像那些大牛一样聊那些干巴巴的理论,太枯燥了,毕竟我本人就是手比脑子快的典型代表。就以这个自己做的智游AI Bot为例,把上面那几个词拆解开,用最简单的话跟大家聊一聊这些火出圈的概念,保证大家看完能记住。
先看这张图:一个能“听懂人话”的旅行助手
我自己画了一张架构图,大家先大概扫一眼,不用急着看懂,后面慢慢说。

图里有5层:交互层、决策层、能力层、存储层、基础层。
其实不用死记硬背,你把它想象成一家我们平时接触的旅行社,一下子就懂了:
交互层= 客服。你打电话咨询、加微信问行程、进门店找工作人员,所有跟人对接的环节,都在这一层。
决策层= 行程定制师。你跟他说“想去日本玩”,他得先判断你是随口问问、想先看看目的地,还是真的要订行程、规划路线,然后再安排人去查机票、订酒店、找景点。
能力层= 导游、订票专员、司机。定制师把活儿安排好,真正动手干活、落地执行的,就是这波人。
存储层= 客户档案、供应商信息库。比如你上次去了哪、喜欢住什么样的酒店、不吃什么忌口,这些都记在这里,下次你再咨询,就能精准匹配你的需求。
基础层= 办公OA + 全员培训过的大模型员工。旅行社所有的业务、所有员工干活,都得靠这个底层支撑,相当于“地基”一样。
先看核心:这些概念怎么串起来?
光说分层可能有点抽象,先用一个真实的用户对话,把所有概念串起来,大家一看就有直观感受:
用户:“6月带12岁儿子去青海,中等预算,规划3天。”
1. 交互层:用户在微信公众号里,发出了这句话,相当于“走进了旅行社门店,找到了客服”。
2. 决策层:
Workflow启动,开始按照定的10步流程,一步步规划
Agent判断,这是“完整行程规划”需求,于是选中“行程规划”这个Skill
ReAct模式启动,AI边想边干——思考“6月青海冷不冷?”→行动(调天气插件)→观察(10-21度,有点凉)→思考“得提醒用户带外套”
3. 能力层:
RAG去查知识库,找到“青海湖门票价格、开放时间”
Function Call调用高德地图插件,算出酒店到景点的距离、大概车程
Embedding去向量数据库里搜,找到“用户之前喜欢自然风光、偏好民宿”,于是推荐湖边的亲子民宿
4. 存储层:
Session记着“目前已经规划到第2天行程”,方便后续继续补充
关系数据库把这条新规划的青海行程,存到用户的历史行程里
向量数据库更新记忆,记下来“用户喜欢自然风光、带孩子出行,偏好民宿”
5. 基础层:LLM综合以上所有信息,把这些零散的内容,整理成口语化、按天分段的行程文案,不用用户自己再整理。
6. 用户:在微信公众号里,收到AI的回复:“第1天到西宁,下午去塔尔寺……晚上住市区酒店。回复1或继续查看第2天。”
看完这个真实场景,再回头拆分层和概念,就简单多了👇
第一层:交互层 —— 你在哪里找到它?
这个很简单,就是你平时能接触到它的地方。
现在最方便的,就是在微信公众号里跟它聊天,不用下载APP,打开公众号就能问,很省事。
测试的时候,会用CLI(命令行)在后台调试,这个大家不用管,纯属后台操作。
未来还打算把它做成Web网页版,到时候电脑上也能直接用。
说白了,交互层就是用户接触产品的“门面”,你看到的界面、操作的按钮、聊天的窗口,全都是这一层的活儿。
第二层:决策层 —— 最“聪明”的地方
这一层是AI的“大脑”,也是最复杂、最核心的部分,我拆成4个小块,一步步跟大家说,保证不绕。
① Workflow(工作流)—— “做事情的顺序”
给这个智游AI定了10步固定流程,一步都不能乱:
信息补全 → 查天气 → 定城市顺序 → 定城市间交通 → 推荐景点 → 景点拆分 → 推酒店 → 推餐厅 → 算预算 → 写文案
就像我们平时做菜一样,得先洗菜、再切菜、再下锅、最后调味,顺序乱了,菜就做砸了。
Workflow其实就是这个意思:先把做事情的步骤、顺序定好,再让AI照着这个流程干,不慌不乱、不遗漏。
② Agent(智能体)—— “做决定的那个人”
举个很实在的例子:你跟AI说“想去日本玩”,Agent就得先判断——你是只是随口聊聊,想让它推荐几个日本的目的地?还是真的要规划一场完整的旅行,需要订机票、酒店、做每日行程?
判断完之后,它再决定:该叫哪个“技能”来干活,不用我们自己动手安排。
所以Agent,其实就是那个“能自己做决定、帮你安排活儿”的助理,不用你事事操心。
③ ReAct 模式(思考+行动)—— “边想边干”
ReAct说白了就是“Reasoning(推理)+ Acting(行动)”,翻译过来就是边想边干,跟我们普通人做事情的逻辑一模一样。
还是举个旅行的例子,大家一看就懂:
思考:“用户说喜欢海,而且预算有限,不能去太远、太贵的地方”行动:“去调天气插件、搜一下适合亲子的海边目的地”观察:“搜到了三亚、厦门、青岛,三个地方都靠海”再思考:“用户是从北京出发,青岛离得最近,机票也便宜,最贴合他的预算”
就这样一步步循环,直到把用户的需求搞定、把行程规划好。
ReAct就是让AI像人一样,不瞎猜、不蛮干,边琢磨、边动手,直到把事情做好。
④ Skill(技能)—— “各干各的活”
这个Agent,目前有5个“专属技能”,每个技能管一件事,不跨界、不偷懒:
意图识别、行程规划、目的地推荐、单品查询(酒店/航班/景点)、行程调整
Agent根据用户的实际需求,选一个最合适的技能来用。比如用户只是问“三亚有什么景点”,就用“单品查询”;如果是要完整的行程,就用“行程规划”。
简单说,Skill就是“员工的专业能力”,每个人只干自己擅长的活;Agent就是“安排活儿的店长”,负责分配任务、统筹全局。
第三层:能力层 —— AI 的“工具箱”
光有“大脑”(决策层)肯定不够,还得有“手脚”,也就是能实际动手查资料、搜信息、调工具的能力,这就是能力层,相当于AI的“工具箱”,里面装满了各种能用的工具。
① RAG(检索增强生成)—— “先查资料,再回答”
这个词听起来很玄,其实特别简单,就是让AI学会“先查资料,再说话”,不瞎编、不胡说。
比如用户问“茶卡盐湖6月份天气怎么样?”,AI不会凭着自己的记忆瞎回答,而是先去调天气插件,查到“6月茶卡盐湖以多云为主,气温10-20度”,再结合自己的知识,整理成口语化的话回复用户。
就像我们平时被人问一个不确定的问题,会先去百度查一下,再跟人说答案,RAG就是这个逻辑,避免AI“一本正经地胡说八道”。
② Function Calling(函数调用)—— “自己决定用哪个工具”
这个也很好理解,就是AI能自己判断,该用哪个工具来解决问题,不用我们手动操作。
比如用户问“茶卡盐湖海拔多少?”,Agent发现这个问题自己答不上来,就会主动把这个问题“扔给”高德地图插件,让插件去查海拔数据,拿到结果之后,再整理成用户能看懂的话,回复给用户。
Function Calling就是让AI能“主动上手”干活,不只是停留在“聊天”层面,能真正帮我们解决实际问题。
③ MCP(模型上下文协议)—— “万能插头”
这个目前在智游AI里还没加上,先跟大家简单说一下,方便大家后续理解。
以后如果想让这个AI,能读取电脑里的PDF行程单、连接手机日历,或者对接其他的工具,只要这些工具符合MCP标准,AI就能统一调用,不用再一个个单独调试。
相当于一个“万能插头”,不管什么品牌、什么类型的“电器”(工具),只要插上这个插头,就能正常使用,省了很多麻烦。
④ Embedding + 向量数据库 —— “长期记忆 + 按意思找”
这个是AI的“记忆法宝”,普通的数据库,只能精准搜索,比如你搜“酒店名称=希尔顿”,它就只能找到希尔顿酒店,多一个字都不行。
但向量数据库不一样,它能“读懂你的意思”。比如你搜“用户喜欢什么样的酒店”,它能根据之前的对话记录,找出“用户喜欢海景、亲子、安静的酒店”,哪怕你没明确说“海景”“亲子”这几个字,它也能get到你的需求。
再比如,你之前跟AI说过“我不爱吃辣”,Embedding就会把这个喜好记下来,下次给你推荐餐厅的时候,就会自动避开辣菜,相当于AI有了“长期记忆”,能记住你的小偏好。
第四层:存储层 —— AI 的“备忘录”
存储层就相当于AI的“备忘录”,负责记各种信息,但不是混在一起记,而是分了三类,各管各的,不混乱:
Session(内存):记当前的对话。比如你跟AI说“3天行程、2大1小、中等预算”,它就临时记在“草稿纸”上,等把行程规划完,这笔临时信息就会删掉,不占内存。
关系数据库:记硬事实。比如“你2024年去过新加坡”“你上次订的酒店是希尔顿”,这些确定的、不会变的信息,就存在这里,方便后续查询。
向量数据库:记模糊感觉。比如“你好像喜欢海边”“你不爱吃辣”“你偏好安静的酒店”,这些没有明确说、但能感受到的偏好,就存在这里,让AI更懂你。
简单说,就是短期记忆、硬事实记忆、感觉记忆,分工明确,各司其职。
第五层:基础层 —— 真正的大模型
这一层是整个AI的“地基”,也是最底层的“大脑”——LLM(大语言模型)。
做这个智游AI,用的是DeepSeek大模型。它的作用很关键,负责“听懂你说了什么、判断该用哪个工具、用口语化的话写出行程”,相当于所有的指令,最终都要靠它来落地执行。
没有LLM,上面的所有层都相当于“空中楼阁”,没法正常运转。
写在最后
做完这个旅行助手,有一个很深的体会,想跟大家分享:
AI真的不只是一个“聊天机器人”,不是你问一句、它答一句那么简单,它其实是一整套协作系统——从你接触它的交互层,到帮你做决定的决策层,再到动手干活的能力层,还有记东西的存储层、做支撑的基础层,每一层都各司其职,才能形成一个“聪明”的AI。
如果你也跟我一样,看了很多AI概念,觉得“看得懂但不会用”,不妨从自己擅长的领域入手,做一个简单的助手——旅行、美食、育儿、职场都可以。
真的,AI这东西,光看理论、光记概念没用,用起来,才是最好的学习方式。
最后再提一嘴,目前这个「智游AI」已经能正常使用了,私信公众号,就能直接跟它聊行程、查景点、算预算,大家可以去体验一下,亲手感受下这些AI概念的实际应用~
相关文章
发表评论
评论列表
- 这篇文章还没有收到评论,赶紧来抢沙发吧~