买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京智精灵科技有限公司;北京喜阅童乐教育科技有限公司
摘要:本申请提供一种组词训练数据生成装置、组词训练装置及方法、电子设备、存储介质及计算机程序。组词训练数据生成装置包括第一数据处理模块,根据汉字数据的字难度等级和字相似性属性创建多个汉字数据集合,每个汉字数据集合包括字表难度等级和一组相似汉字数据;第二数据处理模块,遍历每个汉字数据集合中的汉字数据,针对每个汉字数据集合中的每个汉字数据,确定能够与该汉字数据组词的匹配汉字数据及对应的词数据;至少根据对应汉字数据所在汉字数据集合的字表难度等级确定每个词数据的词难度等级;利用汉字数据集合中的汉字数据的匹配汉字数据创建对应的匹配汉字数据集合,利用汉字数据集合中的汉字数据对应的词数据创建对应的词数据集合。
主权项:1.一种组词训练数据生成装置,其特征在于,包括:汉字数据集合创建模块,用于根据汉字数据的字难度等级和相似字属性从基础汉字数据库中选择汉字数据,利用所选择的汉字数据创建多个汉字数据集合,每个汉字数据集合包括字表难度等级和一组相似汉字数据,共有P个字表难度等级,每个字表难度等级对应至少一个汉字数据集合,每个汉字数据集合的字表难度等级由所包括的汉字数据的字难度等级确定;具有相同相似字属性的汉字数据属于相似汉字数据;匹配字词确定模块,用于遍历每个汉字数据集合中的汉字数据,针对每个汉字数据集合中的每个汉字数据,确定能够与该汉字数据组词的匹配汉字数据及对应的词数据;词难度等级确定模块,用于至少根据对应汉字数据所在汉字数据集合的字表难度等级确定每个词数据的词难度等级;匹配汉字数据集合创建模块,用于创建每个汉字数据集合各自对应的匹配汉字数据集合,所述匹配汉字数据集合包括对应的汉字数据集合中的每个汉字数据的匹配汉字数据;词数据集合创建模块,用于创建每个汉字数据集合各自对应的词数据集合,所述词数据集合包括对应的汉字数据集合中的每个汉字数据对应的词数据;其中,每个组词训练题目对应一个目标汉字数据、与所述目标汉字数据组词的匹配数据和所组的目标词数据,所述目标汉字数据所在汉字数据集合中的全部或部分汉字数据作为对应的组词训练题目的候选汉字数据,所述目标词数据的词难度等级与对应的组词训练题目的难度等级正相关。
全文数据:
权利要求:
百度查询: 北京智精灵科技有限公司 北京喜阅童乐教育科技有限公司 组词训练数据生成装置、组词训练装置及方法、电子设备、存储介质及计算机程序
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。