首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种面向在线教育智能助教的自主进化方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:哈尔滨工业大学

摘要:本发明公开了一种面向在线教育智能助教的自主进化方法及系统,所述方法包括如下步骤:步骤S100、问答知识库的构建;步骤S200、数据增强样本生成;步骤S300、基于人机混合智能的知识库自主更新。本发明可以通过Web网络检索的自主更新知识库,并且将人机混合的理念融入系统,可以使得知识库有效的进行自主更新,解决了现在在线教育平台数据难获取、构建知识库时间长、成本高的问题。本发明强调知识库的自主更新,不仅可以通过积累的数据进行更新知识库,而且可以通过利用网络资源进行更新知识库,使得智能助教的知识越来越丰富,更好的进行学生辅导。

主权项:1.一种面向在线教育智能助教的自主进化方法,其特征在于所述方法包括如下步骤:步骤S100、构建问答知识库:步骤S101、通过爬虫进行爬取,获取课程的课后习题、课后习题答案以及讨论区中内容,包括讨论区中的问题、每一个的回答以及回答的身份角色、答案的采纳数量和不采纳数量、回答者的所有的主题回复数量、总共获赞数信息,并将该信息保存;步骤S102、采用预训练模型Bert方法对讨论区问题进行文本分类,分类出有效的问题和无效的问题,把与课程无关问题及对应的回答进行剔除;步骤S103、通过使用分词工具对文本进行分词处理,使用TF-IDF特征提取算法将文本进行词频向量化,使用余弦相似度计算文本之间相似度,使用通用相似性算法进行语义相似度验证,对数据进行融合,并进行保存数据;步骤S104、使用分词工具对问题和回答进行分词和词语重要性分析,将问题和回答中比较重要的词语进行提取作为关键词,使用基于同义词词林扩展版内容对关键词进行向量化,对问题和回答中关键词进行相似度计算,并且进行归一化;步骤S105、通过回答评论属性、用户信息属性以及问题和答案相关性多元属性特征对回答内容进行评分,从讨论区中选择最合适的答案;步骤S106、将课后习题中的问题进行提取,将该问题的解答作为答案;步骤S200、生成数据增强样本:步骤S201、将常见问答对中的问题通过BM25算法计算问题之间的相似度,将不同表达方式但语义相同的问题归纳成同一类问题簇,不同语义的问题组成不同的问题簇;步骤S202、将同一个问题簇内的问题使用基于Bert和UniLM模型的Simbert文本复述的方法,生成具有同样语义的问题;步骤S203、在同一个问题簇之内进行随机组合以及通过同义词替换组成正样本,在不同簇之间进行随机组成以及同种类型实体替换、反义词替换方法组成负样本;步骤S300、基于人机混合智能的知识库自主更新:步骤S301、在面向在线教育智能助教系统使用过程中,学生提出的问题有些并不在知识库中,那么将问题进行网络检索,将网络检索获取到的与问题最相关网址中问题、回答以及答案采纳率进行保存;步骤S302、使用通用的文本相似度计算方法将检索到网址的问题和学生提出的问题进行文本相似度计算,小于阀值则进行删除,否则对其进行保存;步骤S303、使用步骤S104提到的方法,得出当前问题和答案的相关性;步骤S304、通过答案采纳率、问题和答案相关性多维度进行回答质量评估,从中选择评价分值最高的作为答案,若选择的答案的字数较多则采用文本摘要技术进行文本摘要,并且将通过网络检索获取到的知识加入知识库;步骤S305、在实际使用过程中,智能助教的智能性是有效的,会有一些无法回答问题,则面向在线教育智能助教系统推送给老师和助教进行解答,解答后该问题和答案会自动加入到知识库;步骤S306、设置定时器,定时器到时间后自动通过爬虫自动爬取课程讨论区中更新的内容,经过步骤S100从讨论区进行抽取常见的问答对,更新知识库;步骤S307、通过步骤S200对新加入的知识库的问答对生成相应的正负样本,样本可以为基于问答对检索模型提供新的数据训练,从而使得智能助教在使用过程中能够不断的学习到新的知识。

全文数据:

权利要求:

百度查询: 哈尔滨工业大学 一种面向在线教育智能助教的自主进化方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。