首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种面向英语学习应用的基于语义搜索的学习内容推荐方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:新联协同通信技术(北京)有限公司

摘要:本发明提出了一种基于语义搜索的推荐算法,用于英语学习应用中的学习内容推荐。该算法可理解和处理大量的学习内容,通过语义搜索获取推荐数据,提供个性化的学习内容推荐。本算法使用自然语言处理技术,对学习内容进行语义分析,生成学习内容的语义表示;然后根据用户的学习需求和水平,生成查询;再使用语义搜索技术,对学习内容的语义表示进行搜索,找到与用户查询最匹配的学习内容;最后将这些学习内容推荐给用户。为避免用户陷入相似内容的推荐,本算法引入了退火机制,通过逐渐减小对用户历史行为的依赖,使推荐内容在保持相关性的同时,增加多样性。本算法能理解用户的学习需求,处理大量的学习内容,提供个性化且多样化的学习内容推荐。

主权项:1.一种面向英语学习应用的基于语义搜索的学习内容推荐方法,其特征在于包括:A创作学习内容,包括:A1接收用户的输入,输入包括音频、图片、短文本、文本中的至少一种,其中,文本类型分为短文本和长文本,A2对用户的输入进行判断并生成学习内容文本,包括:A21若输入为文本,对文本的类型进行判定,其中:若文本判定为短文本,调用大语言模型,使用主题扩展文本的提示词,将用户输入的短文本扩充为学习内容;若文本为长文本,则使用用户输入的文本作为学习内容,A22若输入为音频,使用ASR对音频转译,然后按照文本内容处理,A23若输入为图片,调用计算机视觉模型,使用提取图片元素的提示词,提取图片描述和元素,然后按照文本内容处理,B进行学习内容难度分级,包括对步骤A创作的学习内容,使用Flesch-KincaidGradeLevel算法,计算学习内容的文本阅读难度,用Flesch-KincaidGradeLevel表征学习内容的文本阅读难度,C进行学习内容文本特征值提取,包括使用text-embedding文本特征值提取模型,提取学习内容的文本特征值,提取到的文本特征值是由浮点数数组形式存储的向量,反映了学习内容的文本的语义信息,D学习内容向量数据库存储,包括将步骤C中提取到的学习内容的文本特征值与步骤B中计算的学习内容的文本阅读难度,保存到向量数据库中,E获取用户阅读记录,包括:E1从关系数据库中,获取用户今天阅读的最后一份学习内容,E2若存在用户今天阅读的最后一份学习内容,获取该学习内容的文本的Flesch-KincaidGradeLevel,使用text-embedding文本特征值提取模型提取该学习内容的文本特征值,E3若不存在用户今天阅读的最后一份学习内容,跳转到步骤F,F获取用户画像,包括:F1从关系数据库的用户数据表中,获取用户画像,用户画像包括:年龄、性别、年级、学习成绩、课外辅导情况以及自我介绍,F2使用用户画像的内容,基于固定的模板,拼接出用户描述,将用户描述使用text-embedding文本特征值提取模型提取文本特征值,使用用户的年级和成绩信息,通过系统内置的映射表获取对应的学习内容的文本阅读难度,所述映射表包括通过数据收集建立的用户信息和对应的阅读能力,G进行数据召回,包括:使用向量数据库的同时支持基于向量的语义搜索和传统匹配搜索的混合搜索能力,筛选出所述文本阅读难度下语义相近的原始推荐数据,其中把所述文本阅读难度下语义相近的原始推荐数据的条数限制为最终推荐数据的一个倍数,以为离散抽取数据的操作提供足够的数量并保证过滤之后还有充足的推荐数据,H所述离散抽取数据,包括:设置数据抽取的坐标,初始值为0,遍历步骤G中召回的原始推荐数据,抽取符合坐标的数据,使用随机函数,随机一个获取数据条数1到1.5倍之间的整数,将下一个坐标偏移随机数位置,I过滤数据,包括:I1从关系数据库中获取用户的历史阅读记录,过滤掉用户历史浏览的内容,I2从关系数据库中获取步骤H的离散推荐数据的展示模式,过滤非图文模式的内容,J排序,包括将步骤I中过滤后的滤后推荐数据,基于相似度从大到小,难度从小到大排序。

全文数据:

权利要求:

百度查询: 新联协同通信技术(北京)有限公司 一种面向英语学习应用的基于语义搜索的学习内容推荐方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。