首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于词汇和语法的英文文本筛选方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京林业大学;广州摩翼信息科技有限公司

摘要:本发明涉及一种基于词汇和语法的英文文本筛选方法及系统,其方法包括:步骤S1:用户登录文本筛选系统,选择文本筛选标准,文本筛选标准包括:文本筛选系统预定义的系统标准,用户定义的用户标准,以及由文本筛选系统基于用户上传的文本所定义的综合标准;步骤S2:用户输入待筛选本文,基于文本筛选标准进行筛选,获得筛选结果。本发明提供的方法,具有简单、高效以及筛选结果更为准确的特点,实现了针对不同学习阶段学习者的适合英语教学文本的筛选,极大程度的降低了人工劳力的投入。

主权项:1.一种基于词汇和语法的英文文本筛选方法,其特征在于,包括:步骤S1:用户登录文本筛选系统,选择文本筛选标准,所述文本筛选标准包括:所述文本筛选系统预定义的系统标准,用户定义的用户标准,以及由所述文本筛选系统基于所述用户上传的文本所定义的综合标准;步骤S2:所述用户输入待筛选本文,基于所述文本筛选标准进行筛选,获得筛选结果,具体包括:步骤S21:基于所述文本筛选标准,根据文本超纲语法点统计模块,获取所述待筛选本文中的每一文本的超纲语法点信息;步骤S22:基于所述文本筛选标准,根据文本超纲词统计模块,获取所述待筛选本文中的每一文本的超纲词信息;步骤S23:基于预设的超纲词阈值α和超纲语法点阈值β,以及所述超纲词信息和所述超纲语法点信息,从所述待筛选本文中筛选出符合需求的文本,具体包括:步骤S231:取出所述待筛选本文Corpus中的一篇文本texti,1=i=M,设置一张表textForm用于记录Corpus中所有文本经处理后的相关信息,转至步骤S232;步骤S232:利用所述文本超纲词统计模块,获得texti的超纲词占比a和其超纲词记录表newWordList;利用所述文本超纲语法点统计模块,获得texti的超纲语法点占比b和其超纲语法点记录表newGPList;将texti及其这四类信息存入textForm中,转至步骤S233;步骤S233:若texti不是Corpus中的最后一篇文本,令i+1,转至步骤S232;否则,转至步骤S234;步骤S234:所述用户设定所述超纲词阈值α和所述超纲语法点阈值β,转至步骤S235;步骤S235:根据α、β以及textForm中每一篇文本text的超纲词占比a和超纲语法点占比b,计算并判断textForm中每一篇文本和所述用户需求的符合程度:若a=α且b=β,则说明所述文本符合所述用户的需求,转至步骤S236;若a=α、bβ,则说明所述文本的词汇符合筛选标准,若用户想进行语法改写操作,则向用户提供超纲语法点记录表newGPList;若用户不想进行语法改写操作,则将该文本废弃,转至步骤S236;若aα、b=β,则说明所述文本的语法符所述合用户筛选标准,若所述用户想进行词汇改写操作,则向所述用户提供超纲词汇记录表newWordList;若所述用户不想进行词汇改写操作,则将该文本废弃,转至步骤S236;若aα、bβ,则说明文本的语法和词汇均不符合用户的需求,直接将该文本废弃,转至步骤S236;步骤S236:输出Corpus中满足所述用户需求的所有文本。

全文数据:

权利要求:

百度查询: 北京林业大学 广州摩翼信息科技有限公司 一种基于词汇和语法的英文文本筛选方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。