首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

对长文本网络信息进行层级分类的方法、系统和服务器 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:浙江孚临科技有限公司

摘要:本发明公开的对长文本网络信息进行层级分类的方法、系统和服务器,在对获取的待处理的长文本网络信息进行数据清洗,获得预处理后的初步文本信息后,调用预设的模型提示词格式根据所述初步文本信息生成对应的模型提示语句,输入第一模型中对初步文本信息进行摘要提取和文本指定关键词提取,获取文本摘要和场景关键词组,最后使用已训练好的文本分类模型根据所述文本摘要和场景关键词组进行多层级的分类打标,选取预测概率最大的候选标签作为样本的多层级分类结果,以提升长文本网络信息的分类效果和训练速度,有效处理低质量、超长文本、层级标签之间关系不明显的文本分类任务。

主权项:1.对长文本网络信息进行层级分类的方法,其特征在于,包括如下步骤:S1,对获取的待处理的长文本网络信息进行数据清洗,获得预处理后的初步文本信息;S2,调用预设的模型提示词格式根据所述初步文本信息生成对应的模型提示语句,输入第一模型中对初步文本信息进行摘要提取和文本指定关键词提取,获取文本摘要和场景关键词组;S3,使用已训练好的文本分类模型根据所述文本摘要和场景关键词组进行多层级的分类打标,选取预测概率最大的候选标签作为样本的多层级分类结果。

全文数据:

权利要求:

百度查询: 浙江孚临科技有限公司 对长文本网络信息进行层级分类的方法、系统和服务器

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。