范例推理下旅游计划推荐系统设计的关键问题
范例推理下旅游计划推荐系统设计的关键问题
随着我国旅游业和互联网电子商务的迅猛发展,互联网上的旅游电子商务网站成百上千,而这
些网站提供的旅游相关信息堪称海量。这为普通游客设计自己的旅游计划提供了丰富的选择和
“ ” 参考,但同时也大大增加了 信 息 筛 选 和 比 对 的 难 度。例 如,使 用 百 度 搜 索 引 擎 检
“ ”索关键字 九寨沟三日游 , 检索结果获得23 800 000 个页面。为此,建立一个第三方网
“ ”站,通过 推荐系统 向游客提供旅游计划个性化服务具有很高的实用价值和商业价值。传统
“ ”的 推荐系统 一般基于用户的历史记录(例如网页浏览记录、产品购买记录、对产品的评价或
评分等)设计推荐算法,但旅游活动不同于一般的产品消费,即游客一般不会重复地旅游或者
“ ” 频繁地旅游。因此,旅游电子商务网站的 推荐系统 有必要选择其他 理论和技术作为基础。比
较普遍的情况是,游客对于自己将进行的旅游活动仅有一些初步的想法(例如时间、费用、旅
游地点等),对于具体行程安排不太了解,所以在制定旅游计划的过程中往往喜欢参考别人的
旅游计划或者经验,并以此作为自己旅游计划的基础和依据,修改这些例子以形成自己的旅行
计划。有鉴于此,范例推理(Case-based Reasoning)理论和技术可运用到旅游电子商务网站
“ ”的 推荐系统 设置中。范例推理理论和技术起源于美国,是人工智能领域中较新颖和成熟的一
种问题求解和学习方法。它的基本思路是在新问题的解决过程中,通过寻找与之相似的历史范
例,挖掘历史范例中可资借鉴的信息和知识,进而形成新问题的对应解决方案。基于范例推理
的问题求解过程的可以分为 4个阶段:范例检索(Retrieve)、范例重用(Reuse)、范例修正
(Revise)和范例保存(Retain )。
1 机构框架
基于范例推理的旅游计划推荐系统由三个层次构成,即游客应用层、Web 服务层和数据源层,
见图 1.
(1)游客应用层。该层为游客访问推荐系统提供一个的良好的交互操作界面,游客可输入文
字、数字等信息,浏览、修改和保存旅游计划推荐系统的输出结果。(2)Web 服务层。该层
负责从数据源中检索、更新数据。旅游计划推荐系统运行在该层。该层主要模块包括管理模块
“ ” “ ”(负责和 游客应用层 相互作用,管理其他模块、维护 数据源层 、检索模块(负责 CBR 技术
中的检索、匹配功能)。(3)数据源层。该层包括旅游计划收集库、旅游计划范例库和游客
资料库等。其中,旅游计划收集库包含大量采集自各网站的、未经整理的旅游信息资料;旅游
计划范例库包含大量的标准化的旅游计划范例;游客资料数据库包含着登陆游客的相关历史记
录。
2 关键技术与方法
基于范例推理理论和技术,本文将范例推理系统作为旅游计划推荐系统的核心组成部分。为了
保证旅游计划推荐系统正常运作,该范例推理系统必须解决 3个关键问题,即旅游计划采集系
统、旅游计划范例库和旅游计划范例检索设计。
(1)旅游计划采集系统。旅游计划范例的搜集工作主要依赖旅游计划自动采集系统进行。该
“系统通过 URL ”模板匹配库 过滤出可以解析的网页,然后将可解析的HTML 文档进行网页结
构化处理,生成XML 文档。最后结合DOM4J 和XPath 语言建立页面解析模板,从XML 文档
中抽取指定节点信息,并将其存储进入旅游计划收集库。旅游计划采集系统工作流程参见图
二。需要说明的是,笔者将 XML 语言应用在网页信息自动抽取过程中。XML 是一种元标记语
言,它将结构、内容和表现分离,提供描述结构化资料的格式,有着较好的数据存储格式,可
扩展性,高度结构化,语义性强、能够解决 HTML 网页的数据的异构性和半结构化问题。URL
模板匹配库是一个包含了旅游电子商务网站 URL 特征的XML 文件,与待抽取网页的 URL 进
行模板匹配,判断页面是否可以被解析并确定其网页解析模板。XPath(XML Path Language)
是一种在 XML 文档中查找信息的语言,可用来在XML 文档中对元素和属性进行遍历。用
DOM4J 解析器可以从指定的 XML 文档中自动抽取出所需信息。
(2)旅游计划范例库。各旅游商务网站提供的旅游计划包含大量信息,内容侧重点和格式等
大相径庭,因此必须将这些旅游计划进行标准化处理,即将一个个旅游计划依据需要事先确立
旅游计划范例模板转化为旅游计划。该范例模版既能够最大限度地反应普通游客对旅游计划的
诸多关注要点,而且信息应该言简意赅,一目了然。为了更好的了解普通游客对旅行计划的关
注要点,笔者与 Phuket ABC Tour 合作进行了旅游计划网络问卷调查,历时 30 天,获
“ ”得 旅游计划问卷调查表 100 份(该问卷调查表调研对象为普通游客,调研主要内容为对旅游
“ ”计划的关注要点进行排序和打分) 旅游计 划问卷调查表 统计结果显示,普通游客对旅游计划
的关注要点由强到弱排序为景点、时间、费用、住宿、餐饮、交通。为此,笔者设计了一个旅
游计划范例模版(以成都国旅的九寨沟三日游为例),见表1.旅游计划范例库存储有大量旅游
计划范例,并且能够不断补充的新的旅游计划范例。
摘要:
展开>>
收起<<
范例推理下旅游计划推荐系统设计的关键问题随着我国旅游业和互联网电子商务的迅猛发展,互联网上的旅游电子商务网站成百上千,而这些网站提供的旅游相关信息堪称海量。这为普通游客设计自己的旅游计划提供了丰富的选择和“”参考,但同时也大大增加了信息筛选和比对的难度。例如,使用百度搜索引擎检“”索关键字九寨沟三日游,检索结果获得23800000个页面。为此,建立一个第三方网“”站,通过推荐系统向游客提供旅游计划个性化服务具有很高的实用价值和商业价值。传统“”的推荐系统一般基于用户的历史记录(例如网页浏览记录、产品购买记录、对产品的评价或评分等)设计推荐算法,但旅游活动不同于一般的产品消费,即游客一般不会重复...
相关推荐
-
轴的设计计算参考公式
2023-07-08 638 -
29542字硕士毕业论文韩少功的小说创作与湘西民间文学文化
2023-07-10 156 -
11904字开题报告专业学位研究生论文开题报告——XX市商业银行农业企业贷款风险管理问题及对策研究
2023-07-10 73 -
农业机械化概念界定与理论基础,农业机械狭义定义简介
2023-07-19 66 -
开题报告在线电磁钢轨探伤数据处理及信息管理方法研究
2023-08-30 107 -
丝杠规格及选型
2025-02-27 76 -
统编版(2025年)七年级道德与法治上册期末复习知识点考点背诵清单【附:1-13课全册教学设计】
2025-09-02 91 -
2025年统编版七年级道德与法治上册期末复习知识点考点背诵清单与教材活动课参考答案
2025-09-02 60 -
2025年新教材统编版七年级上册《道德与法治》教材活动课参考答案(两份供参考)
2025-09-02 132 -
2025年教科版小学三年级上册《科学》第一单元水第2课水沸腾了教学课件
2025-09-02 63
作者:闻远设计
分类:社科文学类资料
价格:免费
属性:4 页
大小:99.27KB
格式:DOCX
时间:2024-02-28

