Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

作文评分方法、装置、计算机设备及计算机可读存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

摘要:本申请实施例提供了一种基于特征抽取及随机森林的作文评分方法、装置、计算机设备及计算机可读存储介质。本申请实施例属于人工智能技术领域,通过获取待评分的作文,根据预设特征抽取方式抽取作文的目标特征,目标特征包括预设语言基础特征、预设逻辑特征及预设理解力特征,将目标特征输入经过预训练的预设随机森林模型进行评分,以得到作文所对应的分数,由于本申请实施例从语言基础能力、逻辑能力、理解力三大维度进行实施特征工程,抽取全面的具有评价意义的特征指标,可以针对打分结果及不同特征维度给出解释和评价,能够提高作文自动评分所得到结果的准确性。

主权项:1.一种基于特征抽取及随机森林的作文评分方法,其特征在于,所述方法包括:获取待评分的作文;根据预设特征抽取方式抽取所述作文的目标特征,所述目标特征包括预设语言基础特征、预设逻辑特征及预设理解力特征,所述预设语言基础特征包括预设词汇特征、预设语法特征、预设句法特征、预设篇幅特征及预设可读性特征,所述预设逻辑特征包括预设文章结构特征、预设文章连贯性特征及预设文章元素特征,所述预设理解力特征包括与预设文章的相似度特征;所述与预设文章的相似度特征,包括:作文与优质文章的对比以及作文跑题程度;将所述目标特征输入经过预训练的预设随机森林模型进行评分,以得到所述作文所对应的分数;其中,所述预设随机森林模型基于不同年龄段的作者及不同主题的作文分别训练得到;其中,所述预设随机森林模型的预训练过程,包括:获取预训练作文样本,所述预训练作文样本包括预训练作文及所述预训练作文所对应的作文分值;将所述预训练作文样本输入至预设随机森林模型;提取所述预训练作文的预设目标特征及所述作文分值进行学习,并对所述预训练作文样本进行分类,以实现预训练所述预设随机森林模型;所述根据预设特征抽取方式抽取所述作文的目标特征的步骤包括:根据预设语言基础特征抽取方式抽取所述作文的所述预设语言基础特征;根据预设逻辑特征抽取方式抽取所述作文的所述预设逻辑特征;根据预设理解力特征抽取方式抽取所述作文的所述预设理解力特征;所述根据预设逻辑特征抽取方式抽取所述作文的所述预设逻辑特征的步骤包括:根据所述作文中所包含的标点符号将所述作文切割为若干个句子;基于所述句子,统计出所述作文的所述预设文章结构特征所对应的所述作文本所包含的元素个数、所述预设文章元素特征所对应的所有所述元素中单词数目的均值、所述预设文章连贯性特征所对应的相邻句子之间的重叠数量,其中,所述元素为所述作文中所包含的背景类、论点类、主要观点类、支撑观点类或者结论类别中,最大连续出现的类别的句子集合称为该类别的元素;所述根据预设理解力特征抽取方式抽取所述作文的所述预设理解力特征的步骤包括:获取预设语料库中所包含的预设文章;将所述作文与所述预设文章按照预设特征指标进行对比,以得到所述作文与所述预设文章的预设相似度;所述预设文章为若干篇文章,所述将所述作文与所述预设文章按照预设特征指标进行对比,以得到所述作文与所述预设文章的预设相似度的步骤之后,还包括:从所述预设文章中获得与所述作文的相似度分数差距最小的最相似文章;获取与所述最相似文章同属一个文章类别的得分指标为对比指标;基于所述对比指标,将所述作文与得分最高的预设目标文章进行对比,以得到所述作文与所述预设目标文章之间的相似度。

全文数据:

权利要求:

百度查询: 平安科技(深圳)有限公司 作文评分方法、装置、计算机设备及计算机可读存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。