在职研究生论文栏目提供最新在职研究生论文格式、在职研究生论文硕士论文范文。详情咨询QQ:1847080343(论文辅导)

基于游记的旅游意图的挖掘方法

日期:2022年03月19日 编辑:ad201107111759308692 作者:无忧论文网 点击次数:92
论文价格:100元/篇 论文编号:lw202203051518556268 论文字数:36566 所属栏目:在职研究生论文
论文地区:中国 论文语种:中文 论文用途:在职研究生论文 On-the-job graduate paper

本文是一篇在职研究生论文,本文旨在提出一种旅游意图的挖掘方法,能从游记中挖掘有效信息,并预测游客的内在需求和旅游意图。传统的游客行为模型研究粒度较粗,集中在游客的旅游景点层面。然而即使前往相同景点,游客的游玩活动,情感还是存在区别,因此本文提出细粒度的挖掘游客旅游行为的方法,细化到游客在旅游景点的活动,对活动的情感表达等。

1 绪论

1.1 研究背景

据国家统计局发布的 2019 年中国旅游数据统计显示,全年国内游客达到60.1 亿人次,比 2018 年增长 8.4%。下沉市场的居民人均可支配收入的提高,带来人们的消费观念的升级,人们对生活质量有了更高的要求。可以推断,中国的旅游市场未来仍会持续增长。虽然 2018 年我国在线旅游市场交易规模已经达到15122.4 亿元,但大部分下沉城市的游客仍倾向于线下购买旅游产品,在线旅游的渗透率较低。随着移动设备的普及,在线旅游服务存在巨大的发展潜力和增长空间。

在线旅游 OTA(Online Travel Agency)是指旅游服务提供商通过互联网向消费者提供预订机票、住宿、门票等旅游产品或服务。相较于传统的线下旅游订购服务,在线旅游能够更优的解决旅游信息不对称的问题。它们将服务内容拓展融合,不再单一提供订票或游记,而是覆盖用户旅游前、中、后的所有场景,让用户可以在一个平台上完成旅游的全部流程。体验经济时代的到来,旅游者更加注重个人感受和愉悦度,渴望获得美好体验的旅游经历。各大 OTA 平台基于大数据技术,挖掘用户的兴趣点,精准的推荐旅游产品,提供个性化旅游服务,覆盖了游玩、出行、吃饭、住宿、娱乐、购物等全方面。“智慧旅游”进一步系统化整合了旅游各项资源,基于云计算和移动设备,实时感知游客信息和旅游信息,为游客实时推荐合理的旅游路线,提高游客的旅游体验。

以胡塞尔和谢彦君教授为代表的学者们认为,一系列的旅游活动共同构成旅游体验[1]。旅游心理学中提到,游客的出行是基于某种内在需求,通过旅游行为来满足深层次的需求。游客因为生理或心理体验的缺乏产生旅游需要,而旅游需要会促使产生旅游动机,支配游客产生旅游行为。旅游意图即旅游动机,涵盖了社会交往、文化、身体、声望等方面。内在旅游需求决定了旅游意图,旅游意图直接决定了游客对不同的旅游目的地和旅游活动的选择。根据艾瑞咨询 2019 中国游客对景区类型的选择来看(如图 1-1),游客的选择呈现出多样化,可推断游客的旅游意图是存在明显差异的。选择去主题乐园的游客和选择去海滨岛屿的游客,存在不同的旅游意图。

在职研究生论文怎么写

1.2 研究意义

1.2.1 现实意义

生活物质水平极大提高,旅游者消费观也逐步成熟。相比传统的观光旅游—追求各标志性景点“到此一游”的方式,他们更注重旅游体验—旅游带来的娱乐放松等感受,满足精神层面的需要。

普适的旅游产品不能满足各类群体的差异化需求,需要以个性化、参与化、定制化的旅游模式,满足不同游客的心理需求。个性化旅游产品不仅是独特的旅游路线,还有各景点不同的活动和玩法,以及游、行、吃、住、娱、购全方位的个性服务。OTA 平台主要通过分析游客的历史出行轨迹、搜索浏览记录、与智能机器人的对话问答等并结合实时信息,给用户推荐旅游路线、产品。但是依据历史出行轨迹刻画的用户画像是不准确、粗粒度的,虽然可以反映游客去过哪些地方,但不能确定游客的情感倾向以及旅游活动偏好。智能问答一定程度上可以推断旅游意图,但需要用户主动咨询,提供实时互动信息,如果用户不输入相关信息则无法推断其意图。

本文提出的旅游意图挖掘方法,从游客的大量游记中,分析游客在各旅游景点的活动以及过程中的情绪表达,构建游客行为模型并判断其旅游意图类型。对于旅游平台而言,具有两项现实意义。第一,游客行为模型可以细化游客个人的用户画像,深入理解其心理需求,以此推荐符合其意图的个性化商品和服务。第二,大量游记形成的群体智慧可以帮助旅游平台全面了解游客的旅游活动路径和评价,帮助平台优化旅游路线和活动路径。

2 相关文献综述和理论基础

2.1 用户意图研究现状

对用户意图的研究一直是热点,深度理解用户意图在实际应用中具有非常重大的意义。当前学者在用户查询意图和用户消费意图这两个方向的研究成果比较丰富,而用户旅游意图的相关研究较少。

2.1.1 用户查询意图研究现状

2002 年 IBM 研究员 Broder[2]首次提出了“查询意图”的概念,可以理解为用户查询的目的。他提出的查询意图分类体系为意图研究奠定了基础,但是分类粒度不够细致。一些学者为了针对具体领域的用户查询目的,构建领域的分类体系。

Broder[2]提出的分类体系已受到业界的认可,他将査询意图分为信息类、导航类和事务类。缺点是该体系的分类粒度粗糙并且无法动态更新。一些学者对此问题进行改进,试图针对用户查询内容动态构建意图类目体系。段瑞雪[3]将查询结果中的词作为查询词的相关意图,此类方法可以动态拓展分类体系,减少人工构建。

对用户查询意图的识别和匹配是研究的关键点。目前搜索引擎的返回结果一般是基于与搜索词的相似性和关联性,未能理解用户搜索意图再返回结果。Park[4]和 Gupta[5]等通过上下文搜索和用户查询日志记录来理解用户的搜索目的;Qiu[6]等基于自然语言输入,理解用户语义,为用户优化查询结果。在意图匹配方面,通过关键词查询、图模型查询等方式,将用户查询词与相关信息匹配[7]。

理解用户查询意图的重要应用是给用户提供个性化的查询结果。搜索引擎应该以用户为中心,基于用户的行为和个人信息,理解用户的搜索意图,提供高质量的搜索结果。Chen 等[8]根据用户长期和短期的查询记录和浏览行为,将其线性结合,基于查询语义间的相似度实现查询内容推荐。群体的查询行为具有相似性,石雁等[9]基于查询日志计算用户相似度,再以群体的查询数据扩充个体用户,实现查询内容推荐。

2.2 旅游领域研究现状

本节介绍了旅游领域的研究现状,主要聚焦在游客行为特征和游记文本的研究现状。

2.2.1 游客行为特征研究现状

在推荐系统中,想要提高推荐的准确度,需要深入挖掘用户偏好。旅游领域的用户偏好,可以通过分析用户历史行为等相关信息,构建兴趣模型。Ravi 等[23]通过分析用户的在线浏览和评分行为,构建用户画像进行路线推荐。智能设备的普及和 GPS 定位追踪技术的发展,用户可以实时分享当前所在的位置。这也促进了 LBSN(基于位置的社交网络)的发展(新浪微博等),用户可基于位置签到、发布照片、视频等[25]。De 等[25]研究游客分享在社交网络上的旅游照片,分析游客行为特征;ARASE 等[26]在照片的基础上加入了游客发布时所带的标签和标题,YIN 等[27]分析游客在景点的签到行为,数据包括签到地名称,地理位置,签到时间等,构建用户画像。Yu 等[28]基于 LBSNs 的签到数据获得游客所在地点的信息,并对地点的类型细分,更加细粒度分析游客的浏览行为。吴清霞等[30]认为游客在每个 POI 停留的时间可以反映他对此类 POI 的偏好程度,将地点和停留时间共同作为特征,提出基于时间的用户兴趣偏好。

当前对游客行为的研究,主要是分析游客出行的轨迹和签到行为,此类分析对游客行为特征的反映粒度较粗,不能细化用户画像。

2.2.2 游记文本的研究现状

旅游领域的研究中,学者们基于图片挖掘相关信息的研究比较丰富。相比之下,对游记的研究较少。而游客在行程后分享的游记等用户生成内容,包括图片和大量文字,对景点、旅游轨迹、旅途中的特色体验等的详细描述,信息价值更高。文献[31]使用内容分析法,分析了太白山背包旅游者和度蜜月游客的基本信息和行为特征,通过从论坛上爬取相关游记,并进行词频统计分析和高频词聚类分析。

3 基于旅游活动-情感的游客行为模型..........................19

3.1 游客行为模型的事理图谱表示...................................19

3.2 旅游目的地和旅游事件抽取............................22

4 旅游意图的预测模型..........................................30

4.1 旅游意图类别体系的构建..............................30

4.1.1 基于 LDA 的旅游意图分类体系分析.....................................30

4.1.2 基于文献研究的旅游意图类别体系分析..............................31

5 实验结果与分析....................................41

5.1 数据准备..........................41

5.1.1 实验语料收集.........................................41

5.1.2 游记预处理.......................................41

5 实验结果与分析

5.1 数据准备

5.1.1 实验语料收集

携程网是中国最大的在线旅游机构,不仅提供了各类旅游服务,还包含了游客出行后的游记、攻略的分享,拥有大量游客的真实数据。因此,本文选择携程网站中“目的地攻略”里的游记作为样本数据的来源。利用爬虫工具,从携程中采集了来自 312 位游客发布的 1999 篇游记,数据内容包括游记链接、标题、文本内容、发布时间等。

在职研究生论文范文参考

5.1.2 游记预处理

语料预处理是文本挖掘的准备工作,包括对于中文文本的预处理工作包括标点符号规范化处理、分句、分词、去停用词、词性标注等步骤。

(1) 标点符号规范化

游记是一种不规范的