恭喜北京火山引擎科技有限公司杨力源获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜北京火山引擎科技有限公司申请的专利分类模型训练方法、文本分类方法、介质、设备及产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119046691B 。
龙图腾网通过国家知识产权局官网在2025-03-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411525748.3,技术领域涉及:G06F18/214;该发明授权分类模型训练方法、文本分类方法、介质、设备及产品是由杨力源;李文波;本妍妍设计研发完成,并于2024-10-29向国家知识产权局提交的专利申请。
本分类模型训练方法、文本分类方法、介质、设备及产品在说明书摘要公布了:一种分类模型训练方法、文本分类方法、介质、设备及产品。文本分类模型包括第一模型和激活函数层,第一模型是经过预训练的大语言模型,训练方法包括:获取训练样本集和提示文本,训练样本集中的训练样本包括文本样本和文本样本对应的分类标签;通过将提示文本和文本样本作为第一模型的输入,将第一模型输出的第一个生成词的第一嵌入向量矩阵作为激活函数层的输入,并将文本样本对应的分类标签作为激活函数层的目标输出的方式对文本分类模型进行训练。这样,能支持长文本的分类,提升长文本的分类效果。将第一模型输出的第一个生成词的第一嵌入向量矩阵作为激活函数层的输入,可保证文本分类模型的输出内容的可控性,进一步提升模型的分类能力。
本发明授权分类模型训练方法、文本分类方法、介质、设备及产品在权利要求书中公布了:1.一种文本分类模型训练方法,其特征在于,所述文本分类模型包括第一模型和激活函数层,所述第一模型是经过预训练的大语言模型,所述文本分类模型训练方法包括:获取训练样本集和提示文本,其中,所述训练样本集中的训练样本包括文本样本和所述文本样本对应的分类标签,所述提示文本包括所述文本分类模型的分类任务描述信息;通过将所述提示文本和所述文本样本作为所述第一模型的输入,将所述第一模型输出的第一个生成词的第一嵌入向量矩阵作为所述激活函数层的输入,并将所述文本样本对应的分类标签作为所述激活函数层的目标输出的方式对所述文本分类模型进行训练,以得到目标文本分类模型;其中,所述文本分类模型还包括第一全连接层、拼接层以及第二全连接层;所述文本分类模型训练方法还包括:获取所述文本样本的第一统计特征;其中,所述第一模型,用于根据所述提示文本和所述文本样本,生成所述第一嵌入向量矩阵,并将所述第一嵌入向量矩阵输入至所述拼接层;所述第一全连接层,用于将所述第一统计特征升维至所述第一嵌入向量矩阵的大小,并将升维后所得的第一统计特征输入至所述拼接层;所述拼接层,用于将所述升维后所得的第一统计特征与所述第一嵌入向量矩阵进行拼接,得到第一拼接特征,并将所述第一拼接特征输入至所述第二全连接层;所述第二全连接层,用于对所述第一拼接特征进行特征融合,得到第一融合特征,并将所述第一融合特征输入至所述激活函数层;所述激活函数层,用于根据所述第一融合特征,生成所述文本样本的分类结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京火山引擎科技有限公司,其通讯地址为:100190 北京市海淀区紫金数码园4号楼13层1309;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。