买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明提供了用于动态流标签的偏标签特征选择方法、装置、设备及介质,包括:根据样本的概率分布动态调整候选标签为真标签的置信度,以实现标记的动态消歧;分析新到达标签与已消歧标签之间的动态关系,评估其对特征质量的影响,定义特征增强项,量化上述影响,减轻噪声标签对特征评估的误差;在此基础上,设计了基于最大条件相关和最小条件冗余的特征评估准则,该准则同时权衡了特征相对于当前标签和消歧后标签的重要性;构建一种特征融合策略,将动态流标签对应的特征集合进行融合,以获得最终的一组高质量特征。旨在处理标签动态到达的情况,消除标签噪声,并通过最大条件相关和最小条件冗余策略评估特征质量,从而提高学习模型的分类性能。
主权项:1.一种用于动态流标签的偏标签特征选择方法,其特征在于,包括:当判断标签动态到达时,在动态标签空间中,根据样本的邻域信息评估候选标签集中各标签为真值标签的置信度,并根据预设的约束标准判断是否进行标签消岐处理;分析特征和已消岐标签、以及新到达的标签之间的动态关系,并量化不同时间到达的标签对特征的影响,得到特征增强项;结合所述特征增强项构建考虑相关项和冗余项的目标函数,为每个到达的标签选择最优特征;根据所述目标函数,对不同标签对应的特征集合进行融合,融合生成最终特征集合;当判断标签动态到达时,在动态标签空间中,根据样本的邻域信息评估候选标签集中各标签为真值标签的置信度,并根据预设的约束标准判断是否进行标签消岐处理,具体为:对当前已知的标签集构造标记置信度矩阵计算每个样本各标签的真实置信度,其中,每个元素Pij表示潜在真实标签lj成为xi的真值标签的估计置信度,并对其进行初始化,公式为: 其中,|Si|表示Si的基数,Si为候选标签的集合,n为标记置信度矩阵Pt-1的行数,qt-1为标记置信度矩阵Pt-1的列数,同时标签估计置信度Pij满足下列条件: 计算样本候选标签中各标签为真的概率,并根据邻域样本的候选标签信息对当前到达标签为真的概率进行评估,真值标签概率的计算公式为: 其中,若条件lj∈Sa成立,[[lj∈Sa]]返回1,否则返回0,lj代表潜在真实标签,Sa是实例xa的候选标签集,N是每个标签对应的类数,λ是一个平滑参数,λ=1,Nxi为实例xi的近邻样本集合;在计算真值标签概率的同时,根据样本的邻域信息考虑候选标签中各标签为噪声标签的概率,计算公式为: 其中,lk是移除潜在真实标签lj后候选标签集Sa中的其他候选标签;根据预设的约束标准判断是否对候选标签进行消歧,公式为:μij=MaxPt-1-Pij其中,通过约束参数η,0<η<1,确定约束判断结果μij的大小,若0≤μij≤η,潜在真实标签lj将被视为实例xi的不确定噪声标签,暂不对潜在真实标签lj进行消歧处理,若μij>η,潜在真实标签lj是实例xi的不确定噪声标签,并及时消除潜在真实标签lj的不确定性;重复上述步骤,直至没有新的标签到达。
全文数据:
权利要求:
百度查询: 华侨大学 用于动态流标签的偏标签特征选择方法、装置、设备及介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。