基于深度学习和知识图谱的文化旅游资源推荐方法与流程

文档序号:19943665发布日期:2020-02-14 23:33
基于深度学习和知识图谱的文化旅游资源推荐方法与流程

本发明涉及机器学习领域。更具体地说,本发明涉及一种基于深度学习和知识图谱的文化旅游资源推荐方法。



背景技术:

文化旅游是目前国家最为支持的旅游发展模式,其泛指以体验异国异地传统文化、追寻文化名人足?;虿渭拥钡鼐侔斓母髦治幕疃康牡穆糜?。并且这种以寻求文化享受为目的的旅游方式正越来越受到人们的欢迎。因此,文化旅游资源不断增多,其主要包括文化旅游景点,古代建筑,民族传统节日,传统美食和传统手工艺品等。用户在琳琅满目的文化旅游资源中不知如何选择,急需一种可以推荐文化旅游资源的服务。

现有的推荐系统在新闻、图书和电影等传统商品的推荐得到了非常好的应用。这些推荐推荐系统大多是基于统计方法构建,其根据用户的购买记录,商品评分,使用习惯、个性化需求以及商品属性来预测用户对某个商品的喜好程度。但这些推荐系统在解决文化旅游资源推荐问题仍有较大挑战。传统的推荐系统缺少文化相关知识的指导,无法很好的使用文化旅游资源中的许多文化元素信息,导致了文化旅游资源推荐系统的效果不佳。



技术实现要素:

本发明的一个目的是解决至少上述问题,并提供至少后面将说明的优点。

本发明还有一个目的是提供一种基于深度学习和知识图谱的文化旅游资源推荐方法,用以解决现有推荐系统缺少文化旅游领域知识指导,导致文化旅游资源推荐系统难以实现的问题。

为了实现根据本发明的这些目的和其它优点,提供了一种基于深度学习和知识图谱的文化旅游资源推荐方法,包括:

构建文化知识图谱和旅游资源自然知识图谱,将文化知识图谱与旅游资源自然知识图谱相互关联得到旅游资源的文化自然知识图谱,所述文化自然知识图谱采用(旅游资源,旅游资源属性,旅游资源属性文本描述)三元组形式表示;

通过深度学习技术构建用户评分预测模型,将用户、文化自然知识图谱中的旅游资源和旅游资源属性文本描述分别转换为用户向量、旅游资源向量和旅游资源属性文本描述向量,并作为用户评分预测模型的输入量;

获取用户对旅游资源的购买历史和评分记录,将用户向量、用户购买过的旅游资源向量、用户购买过的旅游资源属性文本描述向量、用户评分作为训练样本对用户评分预测模型进行训练;

将用户向量、用户未购买过的旅游资源向量、用户未购买过的旅游资源属性文本描述向量输入用户评分预测模型得到预测评分,将预测评分最高且用户未曾购买过的前c个旅游资源向用户推荐。

优选的是,用户评分预测模型包括嵌入层、隐藏层、特征融合层,所述嵌入层包括多个嵌入矩阵,所述隐藏层包括至少两个多层感知机,所述特征融合层包括至少一个多层感知机。

优选的是,将文化自然知识图谱中的旅游资源转换为旅游资源向量采用transe算法,具体包括:使用嵌入矩阵p将文化自然知识图谱中的旅游资源ti转换为旅游资源向量mi,计算公式为:

mi=ф(p,ti)

其中ф(·)表示通过嵌入矩阵获取向量的过程,嵌入矩阵p为可训练参数。

优选的是,将用户转换为用户向量具体方法包括:使用嵌入矩阵u1和u2将用户ui分别转换为用户向量vi1和vi2,计算公式为:

vi1=ф(u1,ui),vi2=ф(u2,ui)

其中vi1表示通过嵌入矩阵u1获取的用户向量,vi2表示通过嵌入矩阵u2获取的用户向量,嵌入矩阵u1和u2均为可训练参数。

优选的是,将文化自然知识图谱中的旅游资源属性文本描述转换为旅游资源属性文本描述向量采用lstm算法,得到的旅游资源属性文本描述向量为d,其中lstm算法中的参数为可训练参数。

优选的是,所述隐藏层包括多层感知机mlp1,所述用户评分预测模型通过嵌入层获取用户向量vi1与旅游资源向量mi后,将用户向量vi1与旅游资源向量mi串联,再输入多层感知机mlp1以获取用户与旅游资源的关联特征vo1,计算公式为:

vo1=mlp1(concate(vi1,mi))

其中concate(·)表示向量的串联操作,mlp1中的参数为可训练参数。

优选的是,所述隐藏层包括多层感知机mlp2,所述用户评分预测模型通过嵌入层获取用户向量vi2与旅游资源属性文本描述向量d后,将用户向量vi2与旅游资源属性文本描述向量d串联,再输入多层感知机mlp2以获取用户与旅游资源属性文本描述的关联特征vo2,计算公式为:

vo2=mlp2(concate(vi2,d))

其中mlp2中的参数为可训练参数。

优选的是,所述特征融合层包括多层感知机mlp3,所述用户评分预测模型通过隐藏层获取关联特征vo1与关联特征vo2后,将关联特征vo1与关联特征vo2串联,再输入多层感知机mlp3以获取融合特征vc3,计算公式为:

vc3=mlp3(concate(vo1,vo2))

其中mlp3中的参数为可训练参数;然后将vc3通过数学计算转换成预测评分计算公式为:

其中σ(·)为非线性函数,w和b分别表示权重和偏置值,且w和b均为可训练参数。

优选的是,所述用户评分预测模型还包括:使用损失函数loss获取预测评分与用户评分的差距,再用反向传播算法训练用户评分预测模型中的可训练参数以优化用户评分预测模型,损失函数loss的计算公式为:

其中,n为用户数量,k为文化旅游资源数量,rij表示第i个用户对第j个旅游资源的评分,表示用户评分预测模型预测的第i个用户对第j个旅游资源的评分,而w为可训练参数,表示二范数,λ为需要预先设置的超参数。

优选的是,构建文化知识图谱的方法包括:从半结构化知识库、专著和文献中抽取人文信息作为文化知识图谱的实体节点,人工构建文化知识图谱的实体节点间的语义联系作为文化知识图谱中的边;

构建旅游资源自然知识图谱的方法包括:从半结构化知识库中抽取旅游资源的自然信息作为旅游资源自然知识图谱的实体节点,构建旅游资源自然知识图谱的实体节点间的语义联系作为旅游资源自然知识图谱中的边;

将文化知识图谱与旅游资源自然知识图谱相互关联的方法包括:分别查询文化知识图谱与旅游资源自然知识图谱中实体节点的关键字,若关键字相互匹配,则将文化知识图谱中的三元组与旅游资源自然知识图谱中的三元组相互关联。

本发明至少包括以下有益效果:不仅使用transe方法获得知识图谱的语义信息,还将旅游资源属性文本描述的自然语言结合到了模型中,具有较强的特征表示能力,因此用户评分预测模型在处理某些知识库不完善的旅游资源时,仍能通过旅游资源的自然语言描述预测该用户对此旅游资源的评分,具有一定的鲁棒性,且本发明中的用户评分预测模型充分利用了旅游资源的文化自然知识图谱中丰富的语义信息,并使用具有较强的特征表示能力的深度学习方法构建模型,因此提升了评分预测的准确率,提高了在文化旅游推荐领域的推荐准确度。

本发明的其它优点、目标和特征将部分通过下面的说明体现,部分还将通过对本发明的研究和实践而为本领域的技术人员所理解。

附图说明

图1为本发明所述文化旅游资源推荐方法的流程图;

图2为本发明所述用户评分预测模型的网络架构图。

具体实施方式

下面结合附图对本发明做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。

需要说明的是,下述实施方案中所述实验方法,如无特殊说明,均为常规方法,所述试剂和材料,如无特殊说明,均可从商业途径获得;在本发明的描述中,术语“横向”、“纵向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不描述,并不是指能理解为对本发明的限制。

如图1所示,本发明提供一种基于深度学习和知识图谱的文化旅游资源推荐方法,包括:

s101、构建文化知识图谱和旅游资源自然知识图谱,将文化知识图谱与旅游资源自然知识图谱相互关联得到旅游资源的文化自然知识图谱,所述文化自然知识图谱采用(旅游资源,旅游资源属性,旅游资源属性文本描述)三元组形式表示;

构建文化知识图谱的方法包括:从半结构化知识库、专著和文献中抽取人文信息作为文化知识图谱的实体节点,人工构建文化知识图谱的实体节点间的语义联系作为文化知识图谱中的边;

构建旅游资源自然知识图谱的方法包括:从半结构化知识库中抽取旅游资源的自然信息作为旅游资源自然知识图谱的实体节点,构建旅游资源自然知识图谱的实体节点间的语义联系作为旅游资源自然知识图谱中的边;

将文化知识图谱与旅游资源自然知识图谱相互关联的方法包括:分别查询文化知识图谱与旅游资源自然知识图谱中实体节点的关键字,若关键字相互匹配,则将文化知识图谱中的三元组与旅游资源自然知识图谱中的三元组相互关联。

上述半结构化知识库主要指百度百科,维基百科等百科网站,而专著和文献主要来源是知网、万方等学术数据库上的学术文章,人文信息主要包括民族风俗、历史名人、民俗故事等,专著和文献通过人工将其中的民族风俗、历史名人、民俗故事及民族风俗、历史名人、民俗故事中的地点等作为文化知识图谱中的概念实体节点,并人工构建实体间的语义联系作为文化知识图谱中的边,再从百科网站的infobox进行自动抽取知识作为人工抽取出的文化知识图谱的补充,即可构建文化知识图谱。上述旅游资源的自然信息主要包括旅游景点名称、旅游景点所在地、特色地理环境、特色动植物品种、特色气候、特色景观等,将从这些百科网站中自动抽取到的旅游资源的自然信息作为旅游知识图谱中的实体节点,节点间的语义关系作为旅游知识图谱中的边,即可构建旅游资源自然知识图谱。

上述文化知识图谱与旅游资源自然知识图谱相互关联的方法中,主要是将文化知识图谱中文化实体的地点属性和旅游资源自然知识图谱的旅游景点所在地进行关键字匹配,以将包含同一旅游景点的文化知识与自然知识归类形成旅游资源的文化自然知识图谱。

上述游资源的文化自然知识图谱中的旅游资源实体节点主要包括景区的名称、所在地、门票价格、开放时间等,旅游资源属性主要包括人文风景、古代建筑、表演艺术、工艺美术、地方特产、红色旅游等,而对这些旅游资源属性文本描述主要包括如表1所述的内容。

表1

s102、通过深度学习技术构建用户评分预测模型,将用户、文化自然知识图谱中的旅游资源和旅游资源属性文本描述分别转换为用户向量、旅游资源向量和旅游资源属性文本描述向量,并作为用户评分预测模型的输入量;

上述将文化自然知识图谱中的旅游资源转换为旅游资源向量采用transe算法,具体包括:使用嵌入矩阵p将文化自然知识图谱中的旅游资源ti转换为旅游资源向量mi,计算公式为:

mi=ф(p,ti)

其中ф(·)表示通过嵌入矩阵获取向量的过程,嵌入矩阵p为可训练参数。

上述将用户转换为用户向量的具体方法包括:使用嵌入矩阵u1和u2将用户ui分别转换为用户向量vi1和vi2,计算公式为:

vi1=ф(u1,ui),vi2=ф(u2,ui)

其中vi1表示通过嵌入矩阵u1获取的用户向量,vi2表示通过嵌入矩阵u2获取的用户向量,嵌入矩阵u1和u2均为可训练参数。

上述将文化自然知识图谱中的旅游资源属性文本描述转换为旅游资源属性文本描述向量是使用预训练的词向量和lstm算法获得,得到的旅游资源属性文本描述向量为d,其中lstm算法中的参数为可训练参数。

上述用户评分预测模型包括嵌入层、第一隐藏层、特征融合层(如图2所示),所述嵌入层包括多个嵌入矩阵,所述第一隐藏层包括至少两个多层感知机,所述特征融合层包括至少一个多层感知机。

所述第一隐藏层包括多层感知机mlp1,该多层感知机mlp1是一个由三个第二隐藏层构成的全连接神经网络。所述用户评分预测模型通过嵌入层获取用户向量vi1与旅游资源向量mi后,将用户向量vi1与旅游资源向量mi串联,再输入多层感知机mlp1以获取用户与旅游资源的关联特征vo1,计算公式为:

vo1=mlp1(concate(vi1,mi))

其中concate(·)表示向量的串联操作,mlp1中的参数为可训练参数。

所述第一隐藏层还包括多层感知机mlp2,该多层感知机mlp2页是一个由三个第三隐藏层构成的全连接神经网络。所述用户评分预测模型通过嵌入层获取用户向量vi2与旅游资源属性文本描述向量d后,将用户向量vi2与旅游资源属性文本描述向量d串联,再输入多层感知机mlp2以获取用户与旅游资源属性文本描述的关联特征vo2,计算公式为:

vo2=mlp2(concate(vi2,d))

其中mlp2中的参数为可训练参数。

所述特征融合层包括多层感知机mlp3,所述用户评分预测模型通过第一隐藏层获取关联特征vo1与关联特征vo2后,将关联特征vo1与关联特征vo2串联,再输入多层感知机mlp3以获取融合特征vc3,计算公式为:

vc3=mlp3(concate(vo1,vo2))

其中mlp3中的参数为可训练参数;然后将vc3通过数学计算转换成预测评分计算公式为:

其中σ(·)为非线性函数,w和b分别表示权重矩阵和偏置值,且w和b均为可训练参数,这里wt表示权重矩阵的转置。

所述用户评分预测模型还包括:使用损失函数loss获取预测评分与用户评分的差距,再用反向传播算法训练用户评分预测模型中的可训练参数以优化用户评分预测模型,损失函数loss的计算公式为:

其中,n为用户数量,k为文化旅游资源数量,rij表示第i个用户对第j个旅游资源的评分,表示用户评分预测模型预测的第i个用户对第j个旅游资源的评分,而w为可训练参数,表示二范数,λ为需要预先设置的超参数。

s103、获取用户对旅游资源的购买历史和评分记录,将用户向量、用户购买过的旅游资源向量、用户购买过的旅游资源属性文本描述向量、用户评分作为训练样本对用户评分预测模型进行训练;

s104、将用户向量、用户未购买过的旅游资源向量、用户未购买过的旅游资源属性文本描述向量输入用户评分预测模型得到预测评分,将预测评分最高且用户未曾购买过的前c个旅游资源向用户推荐。

尽管本发明的实施方案已公开如上,但其并不仅仅限于说明书和实施方式中所列运用,它完全可以被适用于各种适合本发明的领域,对于熟悉本领域的人员而言,可容易地实现另外的修改,因此在不背离权利要求及等同范围所限定的一般概念下,本发明并不限于特定的细节和这里示出与描述的图例。

再多了解一些
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1
北京赛车pk10稳定计划 斗牛棋牌| 波克棋牌| 建筑安装| 棋牌游戏| 波克棋牌|