首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种引入语义约束条件的课程知识图谱联合嵌入方法 

申请/专利权人:重庆邮电大学

申请日:2021-12-08

公开(公告)日:2024-07-05

公开(公告)号:CN114282006B

主分类号:G06F16/36

分类号:G06F16/36;G06F16/35;G06F40/284;G06F40/289;G06F40/30;G06N3/0442;G06N3/084;G06F18/214

优先权:

专利状态码:有效-授权

法律状态:2024.07.05#授权;2022.04.22#实质审查的生效;2022.04.05#公开

摘要:本发明涉及一种引入语义约束条件的课程知识图谱联合嵌入方法,属于计算机领域。所述方法包括以下步骤:第一步:定义课程知识图谱的实体和关系形成结构化数据并进行结构信息嵌入;第二步:编码课程背景信息中的目录文本信息形成目录信息嵌入;第三步:根据课程的简介信息提出相同课程类别下语义约束条件;第四步:在结构嵌入、目录嵌入和语义约束条件下设计新的损失函数,提出联合嵌入方法。本发明充分利用教育知识图谱的背景信息,不仅使实体和关系的嵌入更加准确,而且还能使实体在向量空间呈现聚类效果,进而提高实体分类任务的准确性,更好地适用于教育场景的下游任务。

主权项:1.一种引入语义约束条件的课程知识图谱联合嵌入方法,其特征在于:该方法包括如下步骤:S1:定义课程知识图谱的实体和关系形成结构化数据并进行结构信息嵌入;S2:编码课程背景信息中的目录文本信息形成目录信息嵌入;S3:根据课程的简介信息提出相同课程类别下语义约束条件;S4:在结构嵌入、目录嵌入和语义约束条件下设计新的损失函数,提出联合嵌入方法;三元组定义为h,r,t,其中h,t∈E,E表示所有课程实体的集合,|E|=N,|E|表示实体的数量,一门课程表示为头实体h,或表示为尾实体t;r表示头实体和尾实体之间的实际关系,r∈R,R表示所有课程关系的集合;一个三元组的评分函数fr=hs,ts表示为: 其中hs和ts分别表示课程实体h和t结构信息的向量化表示,Mr表示课程之间逻辑关系矩阵,d表示向量的维度;基于边际的排名损失作为训练目标,损失函数为: 其中[x]+=max0,x,γ为边际参数;训练过程中,课程结构信息嵌入模块不断更新实体和关系的嵌入,并最终得到课程知识图谱的实体和关系的嵌入表示hs,Mr,ts;所述三元组为正三元组,标签yi=1表示三元组为正,在训练过程中需要随机产生负三元组,负三元组不存在于数据集中,用标签yi=0表示;正三元组集合表示为Δ={hj,rj,tj|yj=1},负三元组集合表示为Δ′={hk,rj,tj|hk≠hj∩yj=0}∪{hj,rj,tk|tk≠tj∩yj=0};模型训练过程中,要求正三元组的评分高,而负三元组的评分低;所述课程的简介信息表示为其中im={wim1,wim2,...,wimL}表示第m门课程带有长度为L个词的简介信息;每门课程对应的课程类别信息表示为co表示第o门课程所对应的类别;使用Sentenct-BERT模型对课程简介信息进行编码;在获得课程简介信息的文本嵌入后,对课程hi和课程tj的简介嵌入求其相似度,定义为: 其中hik表示课程实体hi简介嵌入hi的第k个元素;在课程简介语义相似度的基础上,引入语义约束矩阵来达到约束实体嵌入在向量空间中的分布,其中wij表示课程hi和课程tj的语义约束因子;其公式定义为: 其中分别表示课程hi和课程tj所属类别信息;wij=0表示两门课程不属于同一类别,即对于其语义不做任何约束;通过最小化语义约束S来实现相同类别下,实体在向量空间的语义区分;其定义如下: 其中表示二范数的平方;所述语义约束条件是计算相同类别下两两课程间语义信息体现的语义差异,将其作为语义约束因子,进而形成所有实体间的语义约束矩阵;所述联合嵌入为通过GRU单元联合结构嵌入和目录嵌入,并通过语义约束条件限制实体向量在空间中的分布,提升三元组分类任务的性能;对于课程头实体h,GRU单元内部的计算公式为:R=σWsrhs+Wdrhd+brZ=σWszhs+Wdzhd+bz 其中为hs的输入隐藏权重,为hd的隐藏权重,为偏置向量;联合嵌入的损失函数定义为: 其中nt表示训练集中三元组的数量;损失函数中联合课程实体的结构信息和目录信息,S实现对课程实体向量空间的约束,使得同类别下的课程实体在向量空间互相靠近但又有所区分;超参数λ在这两部分进行权衡。

全文数据:

权利要求:

百度查询: 重庆邮电大学 一种引入语义约束条件的课程知识图谱联合嵌入方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。