首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于大数据的在线课程推荐方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:东营科技职业学院

摘要:本发明公开了一种基于大数据的在线课程推荐方法及系统,方法包括:数据采集、张量处理、构建在线课程推荐模型、在线课程推荐模型参数搜索和实时在线课程推荐。本发明属于课程推荐技术领域,具体是指一种基于大数据的在线课程推荐方法及系统,本方案使用奇异值分解进行张量重构,引入多头注意力机制,使用残差连接和层归一化技术优化课程潜在嵌入矩阵的计算过程,基于重构损失和预测损失设计总体损失函数,提高了模型的效率和推荐准确性;通过优先级更新设计动态选择搜索策略,不同阶段使用不同策略搜索,设计螺旋搜索、邻域搜索和自适应游走搜索三种策略,分别针对全局搜索、局部搜索和平衡全局与局部搜索的需求,增加搜索的灵活性和随机性。

主权项:1.一种基于大数据的在线课程推荐方法,其特征在于:该方法包括以下步骤:步骤S1:数据采集;步骤S2:张量处理;步骤S3:构建在线课程推荐模型,使用奇异值分解进行张量重构,引入多头注意力机制对课程嵌入矩阵进行处理,使用残差连接和层归一化技术优化课程潜在嵌入矩阵的计算过程,基于引入正则化损失和相关性损失的重构损失和预测损失设计总体损失函数;步骤S4:在线课程推荐模型参数搜索,通过优先级更新设计动态选择搜索策略,在不同阶段使用不同策略进行搜索,设计了螺旋搜索、邻域搜索和自适应游走搜索三种策略,分别针对全局搜索、局部搜索和平衡全局与局部搜索的需求;步骤S5:实时在线课程推荐;在步骤S3中,所述构建在线课程推荐模型具体包括以下步骤:步骤S31:计算初始推荐列表,包括以下步骤:步骤S311:张量重构,将步骤S23得到的学生-课程张量作为原始学生-课程张量,将原始学生-课程张量沿着每个维度展开成矩阵,对每个展开的矩阵进行奇异值分解,奇异值分解的阶段参数为k,得到每个矩阵对应的左奇异矩阵,基于原始学生-课程张量和所有左奇异矩阵构造核心张量,再基于核心张量和左奇异矩阵重构一个近似于原始学生-课程张量的张量,并将重构学生-课程张量沿着学生编号维度展开得到学生兴趣矩阵Dstudent;所用公式如下: ; ;式中,B是核心张量,C和分别是原始学生-课程张量和重构学生-课程张量,T是矩阵转置操作运算符,Z1、Z2和ZN分别是沿着原始学生-课程张量第1维度、第2维度和第N维度展开的矩阵对应的左奇异矩阵,N是原始学生-课程张量的维度数,、、和分别是模数1乘积、模数2乘积、模数3乘积和模数N乘积;步骤S312:设计重构损失函数,所用公式如下: ;式中,Lcg是重构损失函数,是矩阵的F范数的平方,β1、β2和β3分别是重构权重、正则化权重和相关性权重,Zn是沿着原始学生-课程张量第n维度展开的矩阵对应的左奇异矩阵,n是原始学生-课程张量的维度索引,Corr(·)是相关性系数;步骤S313:初始推荐列表,基于重构学生-课程张量中的学生学习课程的频率数据的高低对课程进行排序,生成初始推荐列表TJY;步骤S32:构建课程潜在嵌入矩阵;步骤S33:计算最终推荐列表,使用Softmax函数对学生兴趣矩阵Dstudent和课程潜在嵌入矩阵KCfeed进行处理,得到学生与课程的预测交互概率,预先设置交互阈值,将预测交互概率大于交互阈值的课程按预测交互概率的高低进行排序,生成最终推荐列表,并且,将在最终推荐列表上的课程与学生之间的预测交互状态设为交互,不在最终推荐列表上的课程与学生之间的预测交互状态设为不交互;计算预测交互概率所用公式如下: ;式中,P是预测交互概率,Wf是权重矩阵,是逐元素相乘运算符;步骤S34:设计总体损失函数,所用公式如下: ;式中,Lzt是总体损失函数,G是课程数量,g是课程索引,yg和分别是预测交互状态和实际交互状态,α是平衡权重;在步骤S32中,所述构建课程潜在嵌入矩阵具体包括以下步骤:步骤S321:课程顺序信息编码,将初始推荐列表转换为嵌入向量,基于课程学习顺序进行位置编码,将计算得到的位置编码添加到相应位置的嵌入向量中,得到课程嵌入矩阵KCembed,所用公式如下: ; ; ;式中,TJembedding是嵌入向量,Embedding(·)是嵌入操作函数,pos是课程学习顺序,d是嵌入向量的维度,i用于控制奇偶校验并于d具有相同的维度,sin(·)和cos(·)分别是正弦函数和余弦函数,Osin(·)和Ocos(·)分别是正弦位置编码和余弦位置编码;步骤S322:多头注意力机制,所用公式如下: ; ;式中,KCmulti是多头注意力机制的输出矩阵,concat(·)是拼接函数,、和分别是第j个注意力头对课程嵌入矩阵KCembed处理得到的查询权重矩阵、键权重矩阵和值权重矩阵,Qj、Kj和Vj分别是第j个注意力头对课程嵌入矩阵KCembed处理得到的查询向量、键向量和值向量,head1、headj和headh分别是第1个、第j个和第h个注意力头的输出,Attention(·)是注意力机制函数,WO是输出变换矩阵,j是注意力头索引,h是多头注意力机制中的注意力头数;步骤S323:残差连接,所用公式如下: ;式中,KCconnect是残差连接矩阵,LayerNorm(·)是层归一化函数;步骤S324:计算课程潜在嵌入矩阵,所用公式如下: ;式中,KCfeed是课程潜在嵌入矩阵,ReLu(·)是激活函数,Linear(·)是线性映射函数;在步骤S4中,所述在线课程推荐模型参数搜索具体包括以下步骤:步骤S41:初始化,基于奇异值分解的阶段参数k、多头注意力机制中的注意力头数h、权重矩阵Wf和交互阈值建立搜索空间,在搜索空间内随机生成个体的初始位置,用个体位置作为在线课程推荐模型参数的代表,将基于模型参数建立的在线课程推荐模型的损失函数作为对应个体位置的适应度值,将具有最低适应度值的个体位置作为全局最优位置Mbest;步骤S42:动态选择搜索策略,设计三种搜索策略,三种搜索策略的优先级Ic都初始化为1,每次进行迭代搜索前先基于优先级计算策略选择概率,基于策略选择概率使用轮盘赌选择方法选择一种搜索策略进行个体位置更新,若更新后全局最优位置的适应度值小于更新前全局最优位置的适应度值,则将使用的搜索策略的优先级加1;否则,使用的搜索策略的优先级不变;三种搜索策略如下:步骤S421:螺旋搜索策略,所用公式如下: ; ; ;式中,是使用螺旋搜索策略更新后第w个个体第v维度的位置,h、w和v分别是迭代次数索引、个体索引和维度索引,H是最大迭代次数,是第h次迭代时全局最优位置的随机维度位置,f和l分别是对数螺旋曲线的可变因子和递减参数,是第h次迭代时随机个体的随机维度位置,是第h次迭代时全局最差位置的随机维度位置,全局最差位置是具有最高适应度值的个体位置,r1和r3是从[1,dim]中随机选取的第一整数和第三整数,r2是从[1,U]中随机选取的第二整数,dim是个体位置的维度,U是个体数量;步骤S422:邻域搜索策略,所用公式如下: ; ; ;式中,是使用邻域搜索策略更新后第w个个体第v维度的位置,rand(·)是随机数生成函数,是第h次迭代时第w个个体第v维度的位置,是第h次迭代时全局最优位置的第v维度的位置,是的邻域位置,LY(h)是第h次迭代时的邻域因子,是第h次迭代时随机个体的第v维度的位置,r4是从[1,U]中随机选取的第四整数,是L2范数;步骤S423:自适应游走搜索策略,所用公式如下: ; ; ;式中,是使用自适应游走搜索策略更新后第w个个体第v维度的位置,Gaussion(·)是高斯随机游走策略,σ(h)是第h次迭代时的标准差,ω(h)是第h次迭代时的自适应控制步长因子,是第h次迭代时全剧最差位置的第v维度的位置;步骤S43:模型参数确定,预先设定适应度阈值,更新个体的适应度,当全局最优位置的适应度值低于适应度阈值时,则将全局最优位置对应的模型参数作为最优模型参数,基于最优模型参数构建在线课程推荐模型;否则,若达到最大迭代次数,则转至步骤S41;否则转至步骤S42继续迭代搜索;在步骤S2中,所述张量处理具体包括以下步骤:步骤S21:数据预处理,对采集的数据进行数据清洗、数据转换和数据归一化处理;数据清洗包括处理噪声、重复值、缺失值和异常值;数据转换是将数据转换为向量形式;数据归一化是基于最大最小归一化方法将数据的数值范围统一缩放到[0,1]内;步骤S22:构建张量,对学生数据和课程数据分别进行张量表示,得到学生张量和课程张量,基于交互数据计算学生-课程交互程度和学生-授课老师交互程度,再对学生编号、课程编号、学生-课程交互程度和学生-授课老师交互程度进行张量表示,得到交互张量;计算学生-课程交互程度和学生-授课老师交互程度所用公式如下: ; ;式中,Sa,b和Ea,b分别是第a个学生和第b个课程之间的学生-课程交互程度和第a个学生和第b个课程的授课老师之间的学生-授课老师交互程度,a和b分别学生编号索引和课程编号索引,γ1、γ2和γ3分别是第一权重、第二权重和第三权重,、和分别是第a个学生学习第b个课程的频率数据、学习时长数据和暂停与拖拽的频率数据,max{·}是取最大值函数,qa,b是第a个学生学习第b个课程时和授课老师互动的频率数据,t1,b、ta,b和tA,b分别是第1个、第a个和第A个学生学习第b个课程时和授课老师的互动时长数据,A是学生总数;步骤S23:张量融合,基于连接操作将学生张量、课程张量和交互张量进行融合处理,得到学生-课程张量;在步骤S1中,所述数据采集是基于在线教育平台采集历史学习数据,历史学习数据包括学生数据、课程数据、交互数据和学生与课程的实际交互状态;所述学生数据包括学生编号、学习目标、学习偏好和认知水平;所述课程数据包括课程编号、课程学习顺序、课程内容和授课老师;所述交互数据包括学生学习课程的频率数据、学习时长数据、暂停与拖拽的频率数据、学习时和授课老师互动的频率数据以及学习时和授课老师的互动时长数据;所述学生与课程的实际交互状态包括交互和不交互;将学生与课程的实际交互状态作为数据标签。

全文数据:

权利要求:

百度查询: 东营科技职业学院 一种基于大数据的在线课程推荐方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。