《旅游学刊》| 乔向杰等:生成式AI行程规划持续使用意愿的双阶段适配机制
生成式AI行程规划持续使用意愿的双阶段适配机制
乔向杰, 赵子惠, 刘丁菀
[摘 要]生成式AI在旅游行程规划中面临用户认可度高但实际使用率低的认知-行为割裂困境,传统技术采纳模型难以解释人-AI 动态协作的复杂性。文章提出“功能适配性-修正可行性”双阶段任务适配框架,揭示持续使用意愿的形成机制:生成阶段中,AI 生成方案的质量(完整性、准确性、关联性)正向驱动功能适配性,而技术基础风险(如算法缺陷与解释缺失)有显著抑制效应,用户技术熟悉度通过认知归因优化与补偿策略机制缓冲风险负面效应;修正阶段中,操作交互的流畅性提升用户优化方案的可行性,其效应随用户微调能力增强而放大,但修正衍生的情绪损耗与认知负荷构成核心约束。双阶段框架通过任务适配度协同转化价值:功能适配性提供优化基础,修正可行性保障迭代可持续性,二者经任务适配度完全中介驱动持续使用意愿,从而揭示了技术属性需经任务效能评估方能转化为行为意愿的传导逻辑,为生成式AI 采纳研究提供新范式。最终,研究提出平台技术优化、用户赋能及风险分治的协同发展路径。
0 引言
生成式人工智能(generative artificial intelligence,简称“生成式AI”)正以创作型工具的定位深刻变革旅游行程规划范式。相较于传统搜索引擎或推荐系统,其核心突破在于通过自然语言交互即时生成定制化方案,将用户角色从信息检索者重构为方案审核与微调者[1]。这一角色转换催生了独特的采纳行为特征:Skift Research的一项调查数据显示,65%使用过生成式AI 行程规划应用的用户认可输出质量,仅13%将其作为核心规划工具(高频使用),37%偶尔使用[2]。这种高满意度与低常规使用率的背离,暴露了经典技术采纳理论在解释人-AI 协同决策场景时的局限——用户并非被动接受技术输出,而是需通过动态修正行为(如调整景点顺序、补充约束条件)实现“人工-智能”控制权再分配[3],而此过程衍生的额外成本构成采纳转化的核心障碍。
随着ChatGPT、DeepSeek 等工具在旅游行程规划中的普及,现有研究主要聚焦在3个层面。第一,在驱动机制上,用户的采纳与使用意愿既关注传统技术接受模型中的实用性因素,如信息准确性、系统可靠性及信息质量对采纳意愿的影响[4-8],同时相关实证也更凸显情感因素的支配性作用[9],包括与AI 建立的准社会互动[10-11]、感知愉悦性与酷炫性通过情绪体验提升行为意愿[7-8,12-13],且其长期使用动力显著增强。第二,在风险认知上,生成式AI展现出区别于传统工具的特有问题,包括虚构景点或错误信息的内容幻觉风险[5,14]、算法黑箱引发的信任危机[15-16],以及选项缩减触发的选择过载效应[17],这些风险直接削弱用户信任[18-19]。第三,在行为模式上,用户角色从结果接受者转向主动协作方,通过修改提问约束条件、调整推荐内容片段及基于反馈优化后续指令等主动协作行为优化方案[20-21],同时在关键决策中保持主体最终决策权[22]。
尽管当前研究已取得相关进展,但仍存在两大理论缺口。其一,静态框架失效,无法解释动态修正的场景需求。主流理论,以技术接受模型(technology acceptance model,TAM)和整合技术接受理论(unified theory of acceptance and use of technology,UTAUT)为代表,聚焦用户对最终方案的接受度(如感知有用性),但生成式AI 输出的内容往往只能算初稿,用户需通过多次调整完善方案。现有框架无法涵盖动态修正衍生的时间压力、认知与情绪负荷,导致对行为意愿的预测失效。其二,风险分治缺失,治理同质化。现有研究未区分技术内生性风险(如算法黑箱)与交互过程性风险(如选项缩减焦虑),导致治理路径模糊,前者需算法迭代缓解,后者则依赖人机交互设计优化。而当前理论尚未提供风险分治的差异化指引,造成优化策略适配性不足。
据此,本文提出“功能适配性-修正可行性”双阶段任务适配框架,通过解析生成阶段AI输出质量阈值与修正阶段用户优化效率阈值的协同机制,揭示持续使用意愿的形成路径,为破解“高认可-低使用”困局提供可操作方案。最终提出技术迭代(算法透明度提升)、用户赋能(体验设计优化)及风险分治(技术缺陷vs.人机交互分类治理)的协同优化路径。该框架通过提升用户持续使用意愿,为加速生成式AI 行程规划技术在行业中的规模化应用与深度普及提供关键理论支撑与落地指引。
图片来源于微信公众平台AI配图

1 理论框架与假设提出
1.1 人-AI协作视角下的任务适配度模型
旅游行程规划的独特性对生成式AI 提出特殊挑战:首先,时空动态性要求景点间通勤时间精准匹配(如上午故宫至下午八达岭需≥2小时车程)[16,23],但现有系统多数方案存在时间冲突;其次,行程规划的多目标协调特性使得用户需协调交通、住宿、景点等多维变量,导致需要多轮修正结果方案[17,20];最后,高风险决策依赖使得大部分用户要求机票、酒店等不可退款项目的最终决策权[9,22]。传统任务-技术适配模型(task-technology fit,TTF)因假设任务需求静态稳定,无法解释这些动态场景中的适配失效问题。典型的如突发事件导致行程变更的场景,传统任务-技术适配模型只会评估初始方案的技术适配性(如景点关联度、时间合理性等),却无法处理这种变动的实时性。经典技术接受模型(TAM、UTAUT)则因默认输出确定性与用户被动性[24-25],难以捕捉生成式AI 的非确定性输出与修正依赖性本质,从而导致用户虽认可AI 价值(高感知有用性),却因修正成本过高放弃使用[12],形成认知-行为割裂。例如游客面临行程中断风险(如航班误点)时,传统技术接受模型无法解释其因高修正焦虑放弃AI工具的行为。
人-AI协作理论(human-AI collaboration)揭示,生成式AI 将用户角色从决策执行者转化为方案修正者[29]。这一角色转型的核心特征是主动干预取代被动接受。用户通过3 类微调行为优化AI 输出[30],一是指令精炼,修改提问约束输出方向(例如添加亲子友好型景点条件);二是片段编辑,直接调整方案局部(例如替换AI推荐的航班时段);三是迭代优化,基于反馈循环改进后续生成(例如根据首次错误进行多轮修正)[31]。这种角色转型要求理论框架同步革新,必须同时解释技术输出质量(生成阶段)与用户修正效能(修正阶段)的协同机制。
为此,本研究整合人-AI 协作理论、任务-技术匹配模型与认知负荷理论,提出生成-修正-价值转化3层动态框架(图1):生成层通过功能适配性设定初始方案的质量门槛,其形成受AI生成效能驱动与技术基础风险抑制;修正层通过修正可行性保障优化行为可持续性,其效能由操作流畅性赋能但受修正衍生风险约束;价值转化层通过任务适配度整合双维输出(功能适配性提供“能修正”基础,修正可行性维持“愿修正”动力),最终中介转化为持续使用意愿。

图1 生成-修正-价值转化3层动态框架Fig.1 A three-tier dynamic framework of“generation-adjustment-value transformation”
本框架突破传统技术接受模型,基于生成式AI的创作-修正双阶段特性重构核心变量。
1)AI 生成效能替代“感知有用性”。传统模型假设技术输出具有确定性(如搜索引擎结果稳定),而生成式AI输出具有非确定性(相同指令可能生成优质或错误方案)。基于此,效能三维度(完整性、准确性、关联性)被用来直接衡量决定初始方案的可修正潜力,是功能适配性的质量基石。
2)技术基础风险区别于普适风险。传统风险(如隐私泄露)可通过协议规避,但算法缺陷(如虚构景点)、解释缺失(如黑箱决策)等是生成式AI 的固有技术缺陷。其与生成效能构成“能力-缺陷”的共生矛盾,共同定义功能适配性的理论边界。
3)操作流畅性升维“易用性”。传统易用性关注基础操作(如点击按钮),而修正阶段需多轮动态交互(如拖拽行程、迭代提示)。流畅性通过响应敏捷性-认知减负-情绪保护机制,直接压缩修正成本,成为可行性核心杠杆。
3 个变量分别承载能力供给(效能)、技术约束(风险)、交互赋能(流畅性)的核心职能,构成双阶段驱动的“黄金三角”。
1.2 任务适配度的双维建构
传统技术接受模型(TAM、UTAUT)存在技术属性与任务需求的适配性缺位的问题。典型如技术接受模型的“感知有用性”构念,虽测量用户对技术效用的主观评估,但未解构技术能力与任务维度的适配机制。例如在行程规划场景中,未对景点覆盖完整性、时间配置合理性等关键任务指标进行量化评估。Goodhue与Thompson提出的任务-技术适配度理论则填补了技术-任务联结的理论空白。其核心思想是:技术采纳的核心驱动力并非单一的技术属性或用户态度,而是技术能力与任务需求的匹配程度[33]。也就是说,技术能力覆盖的任务需求越广,用户使用意愿越强。任务-技术适配模型是衡量技术是否能够有效支持个体任务执行的关键因素。这一框架将研究视角从“用户认知”转向“技术-任务协同”,为解释技术异质性对采纳行为的影响提供了更精细的工具。
任务-技术适配模型通过评估技术功能对任务需求的覆盖度(如数据库支持多级查询的能力)预测用户行为,在解释企业资源计划、客户关系管理等传统信息系统采纳时具有理论稳健性。然而,在生成式AI 场景中,传统任务-技术适配模型隐含用户作为被动接受者的预设,仅聚焦技术输出的静态质量评估(如检索结果的相关性)。而生成式AI的“协作式创作”特性,实质要求用户扮演主动修正的协同决策者角色,通过多轮交互(如调整提示词、编辑方案片段)优化输出[32]。同时,传统任务-技术适配模型将风险简化为单维技术风险构念(如系统稳定性问题),未解构技术内生性风险(如AI 内容幻觉)与修正衍生性风险(如时间资源消耗、情绪挫折)的本质差异。在生成式AI 场景中,两类风险具有本质差异:技术基础风险主要源于算法缺陷,需通过算法迭代消解(如增强数据训练);修正衍生风险则根植于人机协同摩擦,需通过交互设计降低(如提供一键修正功能)[31]。
由此可见,传统任务-技术适配模型因其固有的被动性、静态性与单一维度特征,难以有效阐释生成式AI 应用场景中用户主动参与方案修正的核心机理,亦难以揭示动态风险治理的必要性。亟须构建动态双维机制,以完整捕捉用户从生成评估至修正投入的连续决策链路。因此,本研究提出动态双维任务适配度机制,其核心创新在于将任务适配度分层界定为功能适配性与修正可行性两个相互独立且协同作用的维度,分别对应技术采纳的生成阶段与修正阶段。功能适配性主要评估生成阶段AI 生成方案的初始质量,而修正可行性主要衡量修正阶段用户优化方案的操作效率边界。
1.3 功能适配性及其作用机制
功能适配性表征生成式AI 初始方案与用户需求的动态匹配效度。该构念作为用户对AI 输出的初阶效用评估,构成是否启动修正阶段的核心决策依据。具体表现为:当功能适配性高于用户容忍下限时(如初始方案覆盖80%以上核心需求),用户倾向触发修正行为;当功能适配性低于阈值时(如遗漏关键景点或严重信息错误),即便修正工具高效,用户仍将可能终止决策。
1.3.1 驱动因素——AI生成效能
在生成式AI行程规划框架中,功能适配性的本质是方案输出与用户需求的精准匹配度。这种匹配的达成,根本上依赖于AI生成效能,即系统生成高质量、个性化行程方案的核心能力。它是用户评估功能适配性的基础[33]。基于生成式AI 在旅游行程规划场景的应用,将其效能分解为3个方面。
完整性:景点、交通、住宿等要素的覆盖广度。例如AI 能否生成包含用户指定必去景点的完整多日行程[7.21]。
准确性:信息真实性。例如推荐的景点开放时间、门票价格是否与实际情况一致,交通接驳时间计算是否合理可信[19,34]。
关联性:行程逻辑的连贯、一致。例如地理区位的关联性、景点间空间邻近性;文化主题的一致性、行程主题的连贯性(如“历史文化之旅”中排除现代游乐项目);功能动线的适配性、住宿与游览景点分布的空间匹配度(如酒店与核心景点半径≤5 km)[5,12]。
1.3.2 抑制因素——技术基础风险
在生成式AI驱动的行程规划框架中,功能适配性代表AI 生成方案(如景点、交通、住宿组合)与用户个性化需求(如预算、兴趣、时间约束)的匹配程度。风险感知理论指出,用户对技术缺陷的敏感性显著影响效用评估[35]。例如当用户发现AI推荐虚构景点时,即使其他要素完整,功能适配性仍骤降[18]。因此,技术基础风险是抑制功能适配性的核心机制,是生成式AI 系统因其算法局限性或数据偏差导致的固有技术缺陷。具体表现如下。
首先,技术不透明性与功能可信度需求之间的矛盾。生成式AI的决策逻辑(例如特定景点推荐依据)存在透明度缺失的问题。用户不得不依赖非透明系统的输出来判断方案适配度,而潜在的技术基础风险(如训练数据偏差或算法缺陷)可能引发方案的隐性偏差风险(例如过度商业化的推荐倾向)。这种难以验证的特性显著侵蚀了用户对功能适配性感知的信任根基。
其次,动态与实时需求适配的缺失。行程规划需响应实时变量(如天气突变、票务更新),但AI 依赖静态历史数据训练。当技术基础风险表现为数据时效性滞后(如未整合景区最新限流政策),将导致方案生成与现实环境失配(如推荐已关闭景点),造成功能适配性在实践层面失效。
第三,系统脆弱性对适配过程的干扰。功能适配性需通过多轮交互优化实现(如调整景点顺序),若技术基础风险引发系统延迟、中断或崩溃,会破坏交互连续性,迫使用户接受未充分优化的次适配方案。
因此,技术基础风险可解构为算法可靠性风险(模型内在的逻辑偏差、错误生成倾向)[19,34]、数据质量风险(训练数据过时、偏见、覆盖不全)[7,17]、系统稳定性风险(响应延迟、会话中断、高并发崩溃)[14,27]、可解释性缺失风险(无法追溯推荐逻辑)[4,10]等维度。
1.3.3 调节因素——技术熟悉度
生成式AI 的技术不可解释性与动态演进特征导致技术基础风险不可避免。当用户遭遇行程规划中的输出异常或系统缺陷时,低认知水平用户易触发部分-整体过度泛化认知偏差,将局部技术故障错误推断为功能适配性全面失效;而深入理解AI原理的用户却能识别技术局限边界,并将缺陷归因为可修正外部因素(如数据更新延迟),通过调整预期建立合理容错阈值。这种认知调节能力的异质性导致技术基础风险对功能适配性的影响强度存在显著个体差异。基于此,本研究通过引入技术熟悉度的调节效应,揭示用户知识结构对“风险-适配性”关系的核心调控路径。
技术熟悉度指用户对生成式AI 技术原理认知与操作经验的积累程度。其调节逻辑主要体现在以下3个方面。
一是认知过滤效应。高熟悉度用户通过局部可控性归因(如将行程错误归因为数据更新延迟等可修正因素),避免将技术缺陷泛化为系统性失效(如全盘否定AI可靠性)[36-37]。
二是预期调节机制。熟悉AI 技术局限性的用户(如了解训练数据时效性约束),会对功能适配性建立合理预期(如AI 推荐需人工验证)。当遭遇技术基础风险时(如推荐已停运公交),预期落差较小,缓解了对适配性感知的冲击[19,38]。
三是风险预控能力抑制效应。具备技术素养的用户通过主动策略(如修改提示词、切换参数),可规避风险触发点(如添加“仅推荐近3月最新开放的景点”指令)。此类风险预控行为将有效抑制技术基础风险向功能适配性的传导[10,27]。
1.4 修正可行性及其作用机制
修正可行性指用户在可承受资源阈值内将AI初始方案优化至理想状态的可行性,其本质是修正成本的逆向表征[29]。修正可行性反映了用户对优化过程的资源投入评估,其作用呈现边际递减效应。
1.4.1 驱动因素——操作流畅性
行程规划本质上是一种迭代优化活动,用户需要在初始方案基础上进行多轮修正,以期逐步趋近理想状态(如动态调整景点构成或优化游览时序)。在这一过程中,操作流畅度构成了修正行为的核心前提条件:若交互界面存在响应迟滞、指令输入语义模糊或系统反馈显著延迟,即便用户具备明确的修正意图,操作过程中遭遇的阻力亦可能导致其放弃优化行为;反之,高效流畅的交互则能触发“尝试-反馈”持续优化周期,将修正可行性从潜在可能转化为常规操作实践。尤其在用户执行复杂度较高的修正任务(例如将3日行程扩展为5日)时,操作流畅度所表征的阻力程度,直接决定了修正行为能否持续开展。
这里,操作流畅性是指用户调用修正工具的效率。操作流畅性降低用户启动修正的初始阻力[30],包括响应敏捷度(系统对用户指令的反馈速度,如增删景点的延迟)[14,27]、交互直观性(界面控件与反馈的易理解性,如拖拽调整行程顺序)[5,31]和容错友好性(操作失误的恢复便利性,如一键撤销误删景点)[11,31]等几个方面。
1.4.2 抑制因素——修正衍生风险
在生成式AI行程规划中,修正可行性的核心价值体现为赋能用户高效优化初始方案。然而,修正过程衍生的多维资源损耗将解构该可行性基础,用户天然规避资源过度耗竭行为。当修正操作引发诸如时间资源超载(如多轮调整未达预期目标)[14,41]、认知资源配置失衡(如解析复杂方案的调试负荷)[17,42]、情绪资源耗竭(如反复失败引发的挫折累积)[11,43]等问题时,用户将终止规划以最小化损失[39]。尤其在旅游决策这种高涉入度场景中,修正衍生风险对可行性的抑制效应会被显著放大[40]。
1.4.3 调节因素——微调能力
在生成式AI行程规划中,修正衍生风险对修正可行性的抑制作用存在显著的用户能力异质性。个体对技术交互摩擦的敏感性,取决于其应对技能储备水平。微调能力作为优化行程的核心技能组合(如提示词精准编写、参数工具调用、解析反馈信息),能通过技能补偿机制弱化风险感知。低能力用户面对修正风险时易陷入资源枯竭、不知所措的困境;而高能力用户则将其转化为可管控的操作挑战[46],形成“风险-能力”的自适应平衡。以反馈解析能力维度为例,其表征用户快速解码AI 输出并定向修正的能力,具体包括:1)问题诊断,识别AI输出中的问题或不足;2)归因定位,确定需要修改的具体部分;3)策略生成,知道如何调整以改进方案。在实际应用中,当AI 推荐已关闭的景点(数据质量风险),用户能判定为“数据过时”进而采取策略“替换为同类开放景点”。
基于修正任务的操作链条,微调能力可解构为以下维度。
1)指令精炼力:精准编写提示词引导AI输出优化方案。通过减少无效迭代次数以压缩时间成本[6,27]。
2)参数调优力:熟练运用温度值、Top-P等参数控制输出特性。通过降低反复调整的认知负荷以阻断认知超载[12,44]。
3)反馈解析力:快速解读AI 输出,并定位修正方向。通过避免挫败感累积以维持情绪稳定性[11,45]。
1.5 任务适配度的中介作用
基于任务技术适配理论的核心原则,技术价值必须通过任务完成效能实现用户价值转化[33]。因此,在生成式AI 行程规划框架中,功能适配性与修正可行性作为关键前置变量,须经由任务适配度的中介传导来驱动持续使用意愿。功能适配性(方案与需求匹配度)和修正可行性(方案优化容易度)本质是技术能力属性,而用户持续使用决策取决于任务完成质量的感知(如“该工具是否真正帮我规划出理想行程”)。任务适配度正是对这种技术赋能任务完成的综合评估——当用户感知AI 工具显著提升行程规划质量时(满足感上升、效率提升、决策压力下降),才会形成持续使用意向[25]。基于模型路径,任务适配度的中介作用通过双通道实现。
1)功能适配性→任务适配度→持续使用意愿:方案精准性(完整性、准确性、关联性)将增强规划结果可靠性从而增强任务完成的信心,提升用户持续使用意愿[4,12,27,38]。
2)修正可行性→任务适配度→持续使用意愿:高效优化能力(时间、认知、情绪成本低)将支持方案迭代精修从而实现需求深度满足,提升用户持续使用意愿[13,20,47]。
1.6 假设体系提出
基于前述理论模型的探讨,本研究构建整合性假设体系以系统解析生成式AI 行程规划中持续使用意愿的形成机制。假设体系的设计紧密围绕模型核心架构展开。在生成层,功能适配性作为技术采纳的质量筛选门槛,受AI生成效能与技术基础风险的双向作用,AI 生成效能的完整性、准确性与关联性通过构建多要素行程规划、保障方案可信度及优化行程逻辑[33],形成功能适配性的核心驱动力(H1a);而技术基础风险中的算法可靠性缺陷与可解释性缺失则通过影响技术可信度抑制用户对初始方案的可用性评估(H1b)[18]。技术熟悉度作为认知调节变量,通过归因优化、预期校准与补偿策略启动机制弱化风险感知的负面影响(H1c)。
在修正层,修正可行性作为动态优化的效率控制变量,由操作流畅性与用户微调能力协同驱动,操作流畅性通过响应敏捷性、交互直观性与容错友好性3 大属性降低修正过程的资源损耗[30],直接提升用户对优化可行性的感知(H2a);修正过程中因多轮修改而产生的时间成本、认知消耗及情绪损耗等将对修正可行性产生抑制作用(H2b);而微调能力(如指令精炼力与反馈解析力)则通过技能补偿机制强化操作流畅性的效用,使高技能用户将工具性能高效转化为实际修正效能(H2c)。
任务适配度作为技术价值向行为意向转化的传导枢纽,系统整合生成层与修正层的技术属性:功能适配性通过确立方案质量的基础阈值,确保初始方案具备可优化空间(H3a);修正可行性则通过消减执行风险,支撑用户需求的深度达成(H3b)。二者协同构建完整的“方案生成-迭代优化”价值闭环。另外,任务适配度在技术属性与行为意愿间发挥中介传导作用,即技术价值必须经任务效能转化器驱动持续使用行为:功能适配性通过可信赖度强化机制间接提升使用意愿(H4a),修正可行性经由操作效率增益降低行为中断概率(H4b)。最终,构建如图2所示的人-AI协作视角下的任务适配度模型。该模型突破了传统技术接受模型的线性因果局限,为生成式AI 场景中“高认可度-低采纳率”的悖论现象提供了系统性阐释。

图2 人-AI协作视角下的任务适配度模型Fig.2 Task adaptation model from the perspective of human-AI collaboration
组1:功能适配性的形成机制(揭示生成层核心矛盾)
H1a:AI生成效能正向影响功能适配性
H1b:技术基础风险负向影响功能适配性
H1c:技术熟悉度负向调节技术基础风险对功能适配性的抑制作用
组2:修正可行性的形成机制(解构人机协作瓶颈)
H2a:操作流畅性正向影响修正可行性
H2b:修正衍生风险负向影响修正可行性
H2c:微调能力正向调节操作流畅性对修正可行性的驱动作用
组3:任务适配度的整合驱动机制
H3a:功能适配性正向驱动任务适配度
H3b:修正可行性正向驱动任务适配度
组4:持续使用意愿的中介路径
H4a:任务适配度中介功能适配性对持续使用意愿的影响
H4b:任务适配度中介修正可行性对持续使用意愿的影响
最终,构建以任务适配度为枢纽的整合理论模型(图2)。

2 研究方法与过程
2.1 问卷发放与数据收集
本研究于2025年4月至6月分阶段实施数据收集工作,目标样本限定于近3 个月内曾利用生成式AI 技术规划旅行行程的用户群体。样本有效性通过两级筛选机制保障:首轮筛选问题为“您是否使用过文心一言、携程问道助手等生成式AI工具制定旅行计划?”(选择“否”则终止调研);次轮问题聚焦行为验证,“您是否通过自然语言对话方式修改过AI生成的行程方案?”(选择“否”则退出调研)
预测试阶段(2025年4月1—15日)依托高校旅游管理专业学生实习项目展开。共邀请95 名近期有AI 行程规划经验的学生参与者完成在线问卷测试(问卷星)。根据项目分析和信效度检验,删除因子载荷低于0.5的题项。“技术基础风险”构念的原4个维度8 个量表题,鉴于算法、数据风险区分度低,其验证性因子分析(confirmatory factor analysis,CFA)结果表明,交叉载荷>0.4,通过合并相似维度精简为两个维度4题项;对“技术熟悉度”构念的原3个维度6题项,由于阈值校准机制信度低(α=0.68),仅保留核心维度4 题项;对“微调能力”构念的原3个维度6个量表题,因为参数调优力适用性弱(对非专业用户难感知),则删除此维度后精简为4 题项。最终保留有效问卷88 份(有效率92.6%),各量表Cronbach's α系数均高于0.78。
正式发放阶段(2025 年4 月20 日—6 月10 日)采用三轨并行策略:一是机场景区线下拦截(包括北京首都机场、颐和园、圆明园等景区),采用纸质问卷现场填写并即时审核完整性,共发放问卷210份,回收有效问卷173 份,有效率82.4%;二是线上社群问卷星推送(通过微信社群嵌入问卷星小程序链接),共推送问卷400份,回收有效问卷328份,有效率82.0%;三是滚雪球抽样(要求高校实习生及线下参与者邀请3~5名符合筛选条件的亲友参与),通过问卷星链式追踪完成样本递推,共回收有效问卷104份。
如表1所示,最终样本(N=605)覆盖18~46岁主要旅行群体,其中,18~35岁用户占比76.4%,本科及以上学历者占74.2%,与行业报告中的AI旅行用户主体特征一致(年龄偏差<3%,学历偏差<2%)。学生群体占比41.3%,在职人员占比58.7%,符合抽样设计要求。在AI使用行为方面,每周使用≥1次的高频用户占52.6%,主要依赖在线旅游平台AI 助手(51.6%)和通用大模型(42.3%)。
表1 样本人口学特征分布Tab.1 Distribution of demographic characteristics of the sample

注:“主要使用平台”为多选题,选项百分比之和超过100%。
2.2 信效度与共同方法偏差检验
2.2.1 信度与效度分析
测量模型检验结果显示(表2),量表具备优异的信效度特性。首先,所有变量的Cronbach's α系数介于0.819~0.927,表明量表具有高度的内部一致性。其中,修正衍生风险(α=0.927)与持续使用意愿(α=0.927)表现出最优的信度水平,凸显了核心变量的测量稳健性。其次,CFA结果支持显著的收敛效度:所有题项的标准化因子载荷范围在0.78~0.92,平均方差抽取量(average variance extracted,AVE)为0.640~0.803(均>0.5),组合信度(composite reliability,CR)为0.882~0.943(均>0.7)。
表2 量表信度与收敛效度Tab.2 Scale reliability and convergent validity

另外,修正衍生风险的子维度表现尤为突出:情绪损耗的因子载荷达0.88~0.91(AVE=0.803),显示出使用者对修正过程中的情感反馈最为敏感;而技术基础风险的算法可靠性风险(AVE=0.758)和可解释性缺失风险(AVE=0.728)显著超过判别标准,验证了技术风险测量框架对生成式AI 核心缺陷的有效捕捉。而作为结果变量的持续使用意愿(AVE=0.801,CR=0.943),其高阶测量指标进一步确保了研究推论的说服力。
2.2.2 区分效度检验
区分效度检验结果(表3)表明,所有变量的AVE 平方根(0.825~0.895)均大于其所在行与列的相关系数,满足区分效度标准。任务适配度的AVE 平方根(0.855)显著高于其与最高相关变量(持续使用意愿,相关系数r=0.76),证明其具有独立构念属性。
表3 区分效度检验(AVE平方根与相关系数)Tab.3 Discriminant validity test(AVE square root and correlation coefficient)

注:对角线数字为各变量AVE的平方根,非对角线为变量间相关系数(*p<0.05,**p<0.01,***p<0.001)。
所有变量间的异质-单质比率(heterotraitmonotrait ratio,HTMT)介于0.42~0.87,均低于0.90的推荐阈值。最高HTMT值出现在修正可行性-任务适配度之间(0.87),反映两者存在理论预期的强关联性,但仍在区分效度可接受范围内。
2.2.3 共同方法偏差检验
为控制同源偏差,采用三阶段进阶检验策略。首先,进行Harman 单因子检验。所有题项纳入探索性因子分析(exploratory factor analysis,EFA),未旋转解的因子分析结果显示:第一因子解释方差为32.4%(低于40%临界值),前两因子累计解释率达58.7%(超过50%阈值),表明不存在单一方法因子主导问题。其次,未测量潜因子法(unmeasured latent method construct,ULMC)。在验证性因子分析中增加公共方法因子:1)比较拟合指数(comparative fit index,CFI)变化量ΔCFI=0.015(原模型CFI=0.952 →新模型CFI=0.967);2)Tucker-Lewis 指数(Tucker-Lewis index,TLI)变化量ΔTLI=0.011(原模型TLI=0.948 →新模型TLI=0.959);3)近似误差均方根(root mean square error of approximation,RMSEA)变化量ΔRMSEA=0.003(原模型RMSEA=0.047 →新模型RMSEA=0.044),所有变化量均低于 严 格 阈 值(ΔCFI<0.02, ΔTLI<0.02, ΔRMSEA<0.015)。第三,方法因子载荷检验。公共方法因子对题项的最大标准化载荷为0.21,显著低于0.50 的临界值。综合3 项证据表明,共同方法偏差处于可接受水平(表4)。
表4 共同方法偏差检验结果Tab.4 Common method deviation test results

2.3 结构模型评估与假设检验
2.3.1 模型拟合优度
为验证理论模型与实际数据的适配程度,采用最大似然估计法对结构方程模型进行检验。如表5所示,所有关键指标均达到标准要求:CFI、TLI、增量拟合指数(incremental fit index,IFI)> 0.90;RMSEA<0.08;标注化残差均方根(standardized root mean square residual,SRMR)< 0.08,其 中,χ²/df、RMSEA 和SRMR更达到统计学优度水平。综合判断模型拟合优度达到整体优秀水平,适合进行后续路径分析与假设检验。
表5 结构方程模型拟合优度指标Tab.5 Structural equation modeling goodness of fit index

2.3.2 直接效应检验
为验证理论模型中变量间的直接因果关系,采用最大似然估计法对结构方程模型进行路径分析。所有路径系数的显著性通过Bollen-Stine Bootstrap法(1000次抽样)进行检验。表6给出了标准化路径系数估计值、标准误、t 值、p 值及效应量(Cohen's f2)等关键统计量。
表6 直接效应假设检验结果Tab.6 Direct effects hypothesis test results

注:***p<0.001;效应量Cohen's f²判断标准:0.02(小)、0.15(中)、0.35(大)。
1)功能适配性的形成机制(组1)
AI 生成效能显著正向影响功能适配性(β =0.412,p<0.001),支持H1a,效应量达中等水平(f²=0.204);技术基础风险显著负向影响功能适配性(β =-0.287,p < 0.001),支持H1b,效应量为中等(f²=0.147)。这表明AI生成质量是功能适配的核心驱动力,而技术风险是其关键抑制因素。
2)修正可行性的形成机制(组2)
操作流畅性显著正向影响修正可行性(β =0.432,p<0.001),支持H2a,效应量大(f2=0.228);修正衍生风险显著负向影响修正可行性(β=-0.378,p<0.001),支持H2b,效应量为中等(f2=0.197)。这揭示出人机协作效率的双重决定机制:界面交互体验提供基础赋能,而优化过程的情绪与认知损耗等构成核心约束。
3)任务适配度的整合驱动机制(组3)
功能适配性(β = 0.368,p < 0.001)与修正可行性(β=0.302,p<0.001)均显著正向影响任务适配度,支持H3a 与H3b;功能适配性贡献度更高(f²=0.195>0.148),表明技术输出质量比操作修正效率对任务匹配更重要。
4)持续使用意愿的中介路径(组4)
任务适配度对持续使用意愿存在强驱动作用(β=0.516,p<0.001),支持H4,效应量高达0.363。说明任务层面的适配感知是转化长期使用意愿的核心枢纽。
2.3.3 中介效应检验
为验证任务适配度在功能适配性与持续使用意愿之间(H4a)及修正可行性与持续使用意愿之间(H4b)的中介作用,采用偏差校正Bootstrap法(5000次抽样)进行检验。表7 显示了间接效应值、Bootstrap 标准误、95%偏差校正置信区间(Bias-Corrected CI)及效应量(κ²)。结果如下。
表7 任务适配度的中介效应检验结果Tab.7 The results of the mediation effect test on task adaptability

注:BC CI=偏差校正置信区间;κ²效应量标准:0.01(小)、0.09(中)、0.25(大);***表示95%置信区间不包含0(p<0.001)。
1)功能适配性通过任务适配度影响持续使用意愿的间接效应显著(β=0.190,95%BC CI[0.152,0.231]),H4a成立。
2)修正可行性通过任务适配度影响持续使用意愿的间接效应显著(β=0.156,95%BC CI[0.124,0.188]),H4b成立。
功能适配性的间接效应(0.190)大于修正可行性的间接效应(0.156)(Δ=0.034),且与直接效应检验结果一致:功能适配性→任务适配度(β=0.368,f2=0.195),修正可行性→任务适配度(β=0.302,f2=0.148)。
为确保中介机制结论的严谨性,本研究补充检验了功能适配性/修正可行性对持续使用意愿的直接效应,以明确任务适配度在传导路径中的中介性质(表8)。检验结果显示,两条直接路径均未达显著水平(p 值均>0.05),而间接效应显著且效应占比均超85%,证实任务适配度是唯一传导通道,用户对AI 功能匹配性和修改便捷性的认知必须经由任务场景适用性评估,才能转化为持续使用决策。
表8 直接效应补充检验结果Tab.8 Supplementary test results of direct effects

表9 调节效应的分层回归分析结果Tab.9 Hierarchical regression analysis results of moderation effect

注:表格展示标准化β系数;*p<0.05,**p<0.01,***p<0.001;“—”表示该变量未纳入当前模型;ΔR2和F变化量均相对于前一模型计算。
2.3.4 调节效应检验
采用分层回归分析检验调节效应。在控制年龄、性别变量的基础上,通过3 个模型逐步验证:模型1,仅控制变量;模型2,加入主效应变量;模型3,加入交互项。
首先,检验H1c 技术熟悉度的缓冲作用。在功能适配性模型中,技术基础风险对功能适配性有显著负向影响(模型2:β=-0.284,p<0.001),加入交互项后(模型3),技术基础风险×技术熟悉度的系数显著为正(β=0.165,p<0.001),模型解释力显著提升(ΔR²=0.029,F变化量=14.83,p<0.001)。简单斜率分析结果显示,当技术熟悉度低(-1 标准差)时,技术基础风险→功能适配性:β=-0.441,t(598)=-7.24,p<0.001;当技术熟悉度高(+1 标准差)时,技术基础风险→功能适配性:β =-0.119,t(598) =-2.13,p=0.034。结果表明,技术熟悉度显著缓冲技术基础风险的负面影响(斜率差异Δβ=0.322,t(598)=3.91,p<0.001),支持H1c。
其次,H2c 微调能力的强化作用。在修正可行性模型中,操作流畅性对修正可行性有显著正向影响(模型2:β=0.420,p<0.001),加入交互项后(模型3),操作流畅性×微调能力的系数显著为正(β=0.192,p < 0.001),模型解释力显著提升(ΔR² =0.038,F 变化量=20.18,p<0.001)。简单斜率分析结果显示,当微调能力低(-1 标准差)时,操作流畅性→修正可行性:β=0.228,t(598)=4.11,p<0.001;当微调能力高(+1标准差)时,操作流畅性→修正可行性:β = 0.612,t(598) = 10.12,p < 0.001。结果表明,微调能力显著强化操作流畅性的正向作用(斜率差异Δβ=0.384,t(598)=4.63,p<0.001),支持H2c。

3 结论与建议
3.1 主要研究发现
本文通过“功能适配性-修正可行性”双阶段任务适配框架,采用结构方程模型,揭示生成式AI 行程规划中持续使用意愿的形成机制,有如下发现。
1)生成阶段功能适配性的形成机制:风险抑制效应超预期压倒能力驱动效应。本研究揭示,生成式AI行程规划中,技术基础风险的抑制作用显著强于AI生成效能的促进作用,这一发现颠覆了传统技术接受模型的“能力主导”范式。具体机制表现为3个方面。一是效能驱动的非对称性。AI 生成效能三维度中,准确性(信息真实性)对功能适配性的驱动敏感性最高,印证了用户将信息真实可靠视为核心质量阈值。二是风险抑制的层级分化,技术基础风险子维度中,算法可靠性风险(如虚构景点、时间冲突)的抑制强度远超可解释性缺失风险,反映用户对实质性错误的容忍度更低。三是认知缓冲的调节效能,技术熟悉度通过归因优化机制与补偿策略启动机制缓冲了技术风险的负面影响,验证了认知因素在生成阶段的关键调节作用。
2)修正可行性的实现必须同时突破双重效能阈值:操作流畅性构成基础使能条件,其本质是用户对交互效率的核心感知,直接决定优化方案的落地可行性;而情绪损耗作为修正衍生风险的支配性子维度,被确证为最具破坏性的中断因子,其通过情感耗竭效应瓦解用户持续修正意愿的强度远超其他风险,二者形成非对称性制约框架。平台需优先弥补情绪管理缺口(如部署智能修正辅助工具),而非片面追求响应速度提升,因为当用户情绪负担未减轻时,操作流畅性的效能转化将系统性失效,而微调能力可显著缓冲情绪损耗的负面影响,这揭示了用户异质性(尤其是修正能力差异)是人机协作效能边界的关键决定要素。
3)任务适配度的完全中介作用:功能适配性(初始质量)与修正可行性(优化效率)必须通过任务适配度完全中介驱动持续使用意愿。该机制揭示了生成式AI场景中“高认可-低使用”的行为割裂本质源于任务层价值转化断层,即技术能力认可(功能适配性)与操作可行性(修正可行性)必须通过任务适配度转化为实际价值,才能驱动持续使用行为。
3.2 理论贡献
本研究提出“功能适配性-修正可行性”双阶段任务适配框架,对生成式AI在旅游行程规划中的持续使用悖论(高认可度-低使用率)提供创新性理论解释。相较于现有研究,本框架在以下3 方面深化了AI人机协作理论。
首先,突破静态适配局限,提出动态协作机制。传统任务-技术适配模型假设技术输出具有终态确定性且用户为被动接受者[6,33],而本研究突破性地将用户重构为“主动修正者”,并通过指令精炼与片段编辑行使优化控制权。基于此新范式,本文通过解构生成层(功能适配性)与修正层(修正可行性)的协同机制,首次揭示“初始方案质量基础”与“用户优化效率适配”的双阶驱动路径。这一动态框架回应了Shin等的核心发现:当ChatGPT缩减选项时用户满意度显著降低[17],而本模型通过修正可行性维度(如操作流畅性)赋予用户优化自主权,与Kim等得到的解释性推荐提升接受度的结论形成理论互补[20],解决了传统任务-技术适配模型在动态场景的适配失效问题。
其次,建立风险分治理论,区分技术缺陷与交互损耗。现有研究常将AI风险同质化处理[19],而本文首次提出风险分治框架:技术基础风险作为功能适配性的核心抑制因子,其负向效应可通过用户技术熟悉度缓解,这与Kim等关于有ChatGPT使用经验的旅行者更倾向于在未来旅行中使用ChatGPT的发现一致[14];修正衍生风险作为修正可行性的约束条件,其治理需依赖操作流畅性与用户体验的协同减负机制。而这一点也得到了Wulandari 等相关研究的实证支持,即感知易用性通过认知减负机制提升交互效率,而用户体验通过情感保护机制使负面情绪效应极大降低[26],二者协同抑制修正衍生风险。
第三,重构价值转化路径,揭示任务适配度的完全中介作用。传统技术接受模型默认技术属性直接驱动行为意愿[7],而本文通过实证验证任务适配度作为双维度影响持续使用意愿的完全中介变量。其中,功能适配性通过提供可修正的初始方案,建立任务完成信心,呼应了Ali等关于方案精准性通过可信度增强行为意向的路径发现[34];而修正可行性通过降低优化成本,支持需求深度满足,实证支持了Arora 等的结论:流畅的交互体验通过心流状态提升持续使用意愿[27]。同时,该路径整合了Ayad 和Elsayed的核心发现,即ChatGPT六维度(易用性、实用性、服务质量、信任度、愉悦感、拟人化)需通过满意度间接驱动使用意愿[8],阐明生成式AI 的价值必须通过任务效能感知方能转化为行为承诺,为破解高认可-低使用悖论提供新范式。
3.3 实践启示
3.3.1 平台优化:双轨并行的技术迭代策略
为化解生成式AI 行程规划中功能适配性与修正可行性的协同障碍,平台需采取技术能力升级与人机交互协同优化的双路径策略:在生成层能力升级维度,需首先构建动态知识图谱架构,通过预训练融合文旅部门开放数据、实时交通流及住宿比价API 等多源信息流,从根本上提升行程方案的覆盖完备性;同步嵌入多源交叉验证机制(如整合景区预约系统与票务库存数据),降低信息偏差,阻断技术基础风险向用户体验的传导。进一步开发决策连贯性算法,重点优化时空逻辑与主题关联的一致性,基于地理位置邻近性计算与文化主题聚类分析技术,保障行程动线的深层逻辑连贯(例如避免将现代主题公园嵌入传统建筑游览序列),以精准满足关联性维度的效能要求。
在修正层,为提升行程修正环节的用户体验,需基于人机交互逻辑优化设计路径。具体可通过3项关键措施实现。首先,简化操作单元,采用可视化拖拽组件支持行程要素自由重组,并允许家庭用户通过单次标注实现群体需求的批量同步管理(如单次标注“70岁坐轮椅的父亲”“带1岁小孩”,而系统则自动为所有路线、景点的规划考虑无障碍与亲子设施的要求),降低多步骤操作负担。其次,建立情绪缓冲机制,当用户连续修正超过预设阈值时,系统自动触发AI辅助优化提案,同步加载进度可视化提示(如“已完成80%行程配置”),阻断挫败感累积。最后,构建决策减负框架,通过动态扫描行程冲突点与用户偏好,主动预判潜在决策压力源,并运用智能重组机制化解矛盾。比如在动态地图界面运用三阶色彩编码(红、黄、绿对应30 分钟、60 分钟、90分钟车程)直观呈现景点通勤成本,同时提供一键替换按钮,当用户点击高耗时景点时,系统基于地理围栏与兴趣标签自动推送邻近替代方案,并实时启动时序自适配引擎,通过无缝重组消解行程冲突[17,23]。
3.3.2 用户赋能:分阶认知重构与技能迁移
为增强用户对技术风险的缓冲能力与操作效能,需建立认知重构与技能迁移的分层干预框架。一方面,通过归因优化训练模块设计交互式学习教程,解构系统故障的认知根源(例如可视化展示“景点关闭是由于数据更新延迟而非算法失效”),重塑用户对技术缺陷的归因模式,抑制由局部故障向整体能力否定的认知泛化倾向;另一方面,进行风险规避赋能。同步开发补偿策略资源库(如提供结构化指令模板“亲子友好+排队时长<30 分钟+日均预算500元”),强化用户风险应对的行为预配置能力。
在微调能力强化层面,可通过指令精炼的专项训练引导用户将模糊需求转化为可执行指令,比如训练用户将模糊需求“文化之旅”拆解为可执行指令“博物馆+历史遗迹+非遗体验”,提升指令精炼力;搭建低风险模拟调试平台(支持模拟行程编辑与实时错误诊断,如自动提示“景点间距过远需调整顺序”),通过渐进式解析能力培养,降低现实场景的试错焦虑。此双阶赋能体系最终形成认知重构(技术熟悉度)与行为增效(微调能力)的协同回路,共同提升用户在人-AI协作中的主导效能。
3.3.3 监管设计:风险分治的标准化框架
生成式AI 行程规划的风险治理需建立技术基础风险管控与修正衍生风险追溯的双重标准。针对技术基础风险对功能适配性的结构性制约,监管主体应建立算法可信度认证制度,强制披露核心决策参数(如训练数据的时空覆盖比率),通过提升决策链透明度缓解可解释性危机;实施动态数据溯源规范,要求接入交通、票务官方数据接口并明示时效标识(例如“数据更新日期:2025-03-15”),从源头抑制算法可靠性风险;内嵌决策来源追溯功能(如在推荐卡片展示“地铁枢纽500 m 内+亲子设施达标+中端消费区间”的核心属性摘要),通过可验证的决策依据弥合技术黑箱引发的信任缺失。
对修正阶段衍生的情绪与认知负荷,监管主体需构建三级协同的标准化指导框架。首先,建立决策复杂度分级标准,要求平台通过算法对修改需求进行预判标注(如基于调整项数量、跨区域等级等维度生成低、中、高3级复杂度标识),保障用户预先了解潜在需要的时间成本;其次,设立情绪负荷熔断阈值标准,明确当行程调整涉及跨市级行政区或直线距离超50 km时,系统必须分解任务步骤(如按“交通重组→住宿迁移→景点替换”分段引导),避免用户陷入连续高压力决策;最后,推荐实施邻近资源匹配标准。要求平台在用户触发修正操作时,基于实时空间位置提供经认证的备选方案(如5 km内4A 级景区、官方推荐餐饮等),而非建立静态资源库,通过对接第三方地理信息服务(如高德兴趣点接口,point of interest,POI)或开放平台商家资质系统实现动态供给,确保替代选项的可用性与质量可控性。该框架通过技术认证(复杂度算法审计、熔断阈值验证、资源库更新监测)与用户核心权益(知情、减压、高效)的深度绑定,推动风险治理从事后被动处置转向事前规则化防控,最终实现动态行程韧性的制度化保障。
3.4 局限与未来方向
尽管本研究创新构建并验证了双阶段任务适配机制的理论框架,但仍存在3 方面局限需在未来深化探索。
首先,研究范畴的边界约束。样本集中于18~35岁数字原生群体(76.4%),但银发族(≥60岁)与低数字素养群体的采纳机制可能存在显著差异(如技术熟悉度阈值更高)。未来可扩展跨世代比较研究(如对比青年组与老年组操作流畅性效应);场景单一性局限(仅验证休闲旅游)忽略商务差旅(时间敏感性更高)与定制游(更高需求复杂度)的阈值差异,未来需拓展多场景修正可行性验证;文化同质性(中西方文化差异)可能影响风险应对逻辑,如社会影响弱化或情绪损耗耐受性差异,需跨文化比较验证。
其次,对动态机制的进一步探讨。横截面数据无法捕捉微调能力的纵向进化轨迹(如指令精炼力提升路径),可进一步采用日志分析法追踪3个月内技能增益对修正可行性的动态影响;技术基础风险的静态影响模型未能纳入用户风险感知适应性机制(如反复遭遇AI内容幻觉后的容忍度提升),也需采用纵向面板数据构建风险感知衰减轨迹。
第三,技术迭代带来的新难题。可解释性缺失风险的测量依赖主观评估,而AI可视化工具普及可能重构其内涵,亟须开发更客观、可量化的指标来评估AI的解释能力,例如衡量它展示决策步骤的详尽程度;当前研究聚焦文本交互,多模态界面(语音、增强现实)的兴起或颠覆“操作流畅性”的定义,须探索新的评估方法和标准,以适应这些新兴的技术形式,确保研究结论仍然有效。
图片来源于微信公众平台AI配图


国家社科基金资助期刊
中国最具国际影响力学术期刊(人文社科类)
全国中文核心期刊中国人文社会科学期刊AMI综合评价 (A刊)权威期刊《中文社会科学引文索引》(CSSCI)来源期刊
欢迎转载,转载请联系《旅游学刊》编辑部授权
(lyxkwx@163.com)
相关文章
发表评论
评论列表
- 这篇文章还没有收到评论,赶紧来抢沙发吧~