买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明涉及人工智能技术领域,公开了一种文本分类方法、装置、设备及存储介质,其中包括:利用文本分类模型的输入层从待分类文本数据中提取嵌入特征向量;利用卷积层进行卷积,得到每个预设维度对应的多个第一卷积特征向量,卷积层包括多个预设维度的卷积核;利用卷积核对应的权重参数对多个第一卷积特征向量进行敏感度优化计算,得到多个第二卷积特征向量;利用池化层选取每个第二卷积特征向量中的最大值并进行拼接,得到池化特征向量;利用文本分类模型的全连接层根据池化特征向量进行分类预测,得到文本分类结果。本发明通过对卷积层得到的向量进行敏感度优化,以致各维度卷积层增强对目标特征的敏感程度,使得最终分类结果更为准确。
主权项:1.一种文本分类方法,其特征在于,所述方法包括:利用预先训练好的文本分类模型的输入层从待分类文本数据中提取得到嵌入特征向量;所述预先训练所述文本分类模型,包括:获取样本数据并按照预设比例将所述样本数据划分为训练集和测试集;输入预先标注的训练集至待训练的文本分类模型,利用所述文本分类模型的多个预设维度的卷积核进行卷积得到每个预设维度对应的多个第一样本卷积特征;基于每个预设维度的卷积核对应的待训练权重参数对所述多个第一样本卷积特征进行计算,得到多个第二样本卷积特征;利用所述文本分类模型的池化层和全连接层进行分类预测,得到样本预测结果;基于所述样本预测结果、所述多个第一样本卷积特征向量和预先构建的目标损失函数反向更新所述文本分类模型,所述目标损失函数包括采用多元交叉熵定义的第一损失函数和更新每个预设维度的卷积核对应的权重参数的第二损失函数;输入预先标注的测试集至训练完成的文本分类模型,且当所述文本分类模型达到预设预测精准度时,确认所述文本分类模型已训练好;利用所述文本分类模型的卷积层对所述嵌入特征向量进行卷积,得到每个预设维度对应的多个第一卷积特征向量,所述卷积层包括多个预设维度的卷积核;利用预先训练得到的每个预设维度的卷积核对应的权重参数对所述多个第一卷积特征向量进行敏感度优化计算,得到多个第二卷积特征向量;所述敏感度优化计算包括:利用对应的权重参数对各自对应所述第一卷积特征向量的值进行优化计算,使得在对应的尺寸下,数值大的值更大,数值小的值更小,而数值越大,则卷积核越敏感,通过该权重参数的优化计算,使得卷积核敏感的目标特征更能够得到凸显;利用所述文本分类模型的池化层选取每个第二卷积特征向量中的最大值并进行拼接,得到池化特征向量;利用所述文本分类模型的全连接层根据所述池化特征向量进行分类预测,得到文本分类结果。
全文数据:
权利要求:
百度查询: 平安科技(深圳)有限公司 文本分类方法、装置、设备及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。