【数据分享-42】SD | 基于在线旅游博客构建的中国游客流动网络数据集


编辑 | 疯子同学
排版 | 疯子同学

论 文 信 息
英文标题:A dataset of tourist mobility networks across China derived from online travel blogs
中文标题:基于在线旅游博客构建的中国游客流动网络数据集
期刊:Scientific Data (Nature Portfolio 期刊)
时间:13 February 2026
作者:Yunhao Zheng, Jinhua Wang, Yi Zhang*, Naixia Mou, Yu Liu
机构:北京大学地球与空间科学学院遥感与地理信息系统研究所;山东科技大学测绘与空间信息学院;西南联合研究生院
Received:26 September 2025
Accepted:31 January 2026
DOI:https://doi.org/10.1038/s41597-026-06780-9
CODE:https://opensource.org/license/mit
DATA:https://creativecommons.org/licenses/by/4.0/
摘 要
如今,旅游活动面临着日益加剧的人口流动,这使得通过流动性的视角来探索旅游空间变得势在必行。为了研究全国范围内的游客流动性,本研究收集了中国领先的旅游服务平台去哪儿网(Qunar.com)上的在线游记数据,以构建全中国的游客流动网络。在这些网络中,旅游景点被表示为节点,而从游记数据中提取的游客在景点间的移动则被表示为有向加权边。为了捕捉不同的旅行情境,本研究还开发了按出发季节和同行伴侣分类的流动网络。所有网络数据均以简单、易获取的格式发布,以支持未来的研究工作。
引 言
随着游客流动的日益频繁,从流动性视角研究旅游空间变得至关重要。传统的问卷和实地调查受限于地理范围,难以捕捉全面的流动模式,而众包大数据(如旅游博客)因其易获取性成为理想的数据源。
本论文致力于构建并公开一个基于中国全国范围的游客流动网络(Tourist Mobility Networks)数据集。
(1)Input:包含游客时间顺序访问景点的博客轨迹序列。
(2)Output:以节点文件(记录景点地理与属性信息)和边文件(记录有向加权转移量)形式存储的流动网络集合,数学上对应加权邻接矩阵。
关键工作包括使用UGC(照片、GPS日志、博客)构建旅游网络 。代表性应用如 Leung 等人、Jin 等人、Zheng 等人以及 Haris 等人的研究,他们广泛使用博客数据提取流动语义与模式。
小 编 总 结
尽管在线旅游博客存在用户群体偏差(如偏向休闲游、年轻白领),但其海量数据聚合后依然能够有效反映真实世界宏观与中观层面的游客空间流动结构与拓扑特征。
作者没有陷入使用复杂深度学习模型去强行解析无结构游记文本的泥潭,而是精准锁定了“去哪儿网”自带半结构化时间线和POI绑定功能的博客系统。这使得从海量文本中提取精确的时空轨迹变成了一项高效的规则匹配工程,从而成功将研究尺度从单点城市拉升到了全国制图的维度。
疑问/不足:
代表性参考文献:
(1)Shoval, N. & Isaacson, M. (2009). Tourist Mobility and Advanced Tracking Technologies. Routledge(奠定旅游流动性理论基础).
(2)Asero, V., Gozzo, S. & Tomaselli, V. (2016). Building Tourism Networks through Tourist Mobility. J TRAVEL RES, 55, 751(引入网络分析范式).
(3)Jin, C., Cheng, J. & Xu, J. (2018). Using User-Generated Content to Explore the Temporal Heterogeneity in Tourist Mobility. J TRAVEL RES, 57, 779(使用旅游博客研究时空行为的前置工作).
(4)Zheng, Y., et al. (2021). Chinese tourists in Nordic countries: An analysis of spatio-temporal behavior using geo-located travel blog data. COMPUT ENVIRON URBAN, 85, 101561(核心技术:Louvain社区发现算法).
(5)Blondel, V. D., et al. (2008). Fast unfolding of communities in large networks. J STAT MECH-THEORY E, 2008, P10008(信令轨迹与流动网络对比).
关 键 图 表








End

点点赞

点分享

点在看


点击 阅读原文 了解更多详情
相关文章
发表评论
评论列表
- 这篇文章还没有收到评论,赶紧来抢沙发吧~