首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

电力操作票文本智能分类方法、装置、设备及介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:广东电网有限责任公司;广东电网有限责任公司电力调度控制中心

摘要:本发明公开了一种电力操作票文本智能分类方法、装置、设备及介质,该方法包括将第一操作票文本输入至DNN深度神经网络模型进行训练,得到第一操作票文本的深层次语义特征及语义特征向量;计算语义特征向量与训练操作票样本之间的相似度,并根据相似度筛选出与训练操作票样本的匹配度大于预设值的多条操作票文本,作为第二操作票文本;获取第二操作票文本的操作票等级,若操作票等级不一致,利用KNN加权算法计算第二操作票文本中每条文本对总分类操作票文本的影响权重,并根据影响权重与相似度的叠加,得到第二操作票文本的目标操作票等级。本发明不仅提高了文本分类识别的准确率和召回率,同时能够对分类依据进行展示,增强了分类结果的可解释性。

主权项:1.一种电力操作票文本智能分类方法,其特征在于,包括:将第一操作票文本输入至DNN深度神经网络模型进行训练,得到所述第一操作票文本的深层次语义特征及语义特征向量;计算所述语义特征向量与训练操作票样本之间的相似度,并根据所述相似度筛选出与所述训练操作票样本的匹配度大于预设值的多条操作票文本,作为第二操作票文本;获取所述第二操作票文本的操作票等级,若所述操作票等级不一致,利用KNN加权算法计算所述第二操作票文本中每条文本对总分类操作票文本的影响权重,并根据所述影响权重与所述相似度的叠加,得到所述第二操作票文本的目标操作票等级;所述影响权重与所述相似度叠加时采用的模型为: 式中,i表示词性;j为训练集中按相似度大小排序的操作票文本序列,wj表示第j条文本的权重;k根据测试集遍历寻优的方式获取,即在测试集依次计算当k=1、2、…10时的分类准确率,取分类准确率最高的k值作为在线分类模型的参数;leveli为第k条待分类文本的操作票等级;Similarityij表示第i条待分类文本的语义向量Vi与训练库中各文本的综合向量Vj之间的相似度;将第一操作票文本输入至DNN深度神经网络模型进行训练之前,还包括:利用改进分词分类算法对初始操作票文本进行分词处理,得到所述第一操作票文本,所述改进分词分类算法为: 式中,J表示分词分类算法的目标函数,N表示分词总个数,i表示词性,表示向量参数,c表示迭代次数,S表示聚类中心,xr表示模糊指数,vk表示聚类自适应参数,Air表示分类因子,r、Ni均表示常数系数,Nr表示聚类系数;将第一操作票文本输入至DNN深度神经网络模型进行训练,包括:以极大似然估计函数最小作为训练目标对所述第一操作票文本进行训练,利用SGD随机梯度下降算法更新网络参数直至收敛,得到DNN神经网络的结构参数。

全文数据:

权利要求:

百度查询: 广东电网有限责任公司 广东电网有限责任公司电力调度控制中心 电力操作票文本智能分类方法、装置、设备及介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。