恭喜华侨大学刘景华获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜华侨大学申请的专利偏多标签特征选择方法、装置、设备和介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119312070B 。
龙图腾网通过国家知识产权局官网在2025-03-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411855277.2,技术领域涉及:G06F18/2113;该发明授权偏多标签特征选择方法、装置、设备和介质是由刘景华;黄姝琦;张洪博;缑锦设计研发完成,并于2024-12-17向国家知识产权局提交的专利申请。
本偏多标签特征选择方法、装置、设备和介质在说明书摘要公布了:本发明提供一种偏多标签特征选择方法、装置、设备和介质,涉及数据预处理技术领域。方法包含S1、获取偏多标签的原始训练数据集,并根据原始训练数据集,初始化标签置信度矩阵,以及构建标签的分布区域。S2、根据近邻的分布,更新标签置信度矩阵,对不可信标签的分布区域进行消歧,以及对不确定标签的分布区域进行迭代更新,直至达到最大迭代次数,获取消歧后的标签。S3、根据消歧后的标签,结合粒度计算与图论,将标签从细粒度聚合到粗粒度,并构造虚拟粗粒度标签。S4、根据虚拟粗粒度标签,结合从样本数据中获取的多个特征,构建适用于偏多标记数据的邻域粗糙集模型,并采用前向贪婪搜索算法选择重要性最高的特征。
本发明授权偏多标签特征选择方法、装置、设备和介质在权利要求书中公布了:1.一种偏多标签特征选择方法,其特征在于,包含:获取偏多标签的原始训练数据集,并根据原始训练数据集,初始化标签置信度矩阵,以及构建可信标签、不可信标签与不确定标签的分布区域;根据近邻的分布,更新标签置信度矩阵,对不可信标签的分布区域进行消歧,以及对不确定标签的分布区域进行迭代更新,直至达到最大迭代次数,获取消歧后的标签;根据消歧后的标签,结合粒度计算与图论,将标签从细粒度聚合到粗粒度,并构造虚拟粗粒度标签;根据所述虚拟粗粒度标签,结合从样本数据中获取的多个特征,构建适用于偏多标记数据的邻域粗糙集模型,并采用前向贪婪搜索算法选择重要性最高的特征;获取偏多标签的原始训练数据集,并根据原始训练数据集,初始化标签置信度矩阵,以及构建可信标签、不可信标签与不确定标签的分布区域,具体包括:获取偏多标签的原始训练数据集;根据所述原始训练数据集,构建在候选标签集上均匀分布的标签置信度矩阵; ; ;式中,表示第个样本数据的第个标签的均匀分布的标签置信度、为样本数据的数量、为标签的数量、为样本数据的候选标签集;使用桶式KD-Tree算法有效搜索样本数据的个近邻; ;式中,表示样本数据的个近邻、表示样本数据的近邻、表示样本数据的第个近邻、表示样本空间;根据所述个近邻,获取概率矩阵; ; ;式中,为第个样本数据的第个标签的概率、表示样本数据的个近邻、代表原始噪声标签上的正例集合、表示集合的元素个数、是为避免出现零概率情况的平滑参数、表示每个标签对应的类数;根据所述标签置信度矩阵和所述概率矩阵,初始化标签置信度矩阵;根据初始化后的标签置信度矩阵,基于“准则”将候选标签划分为3个不相交的区域,获取消歧标签置信度矩阵;其中,3个不相交的区域分别为可信标签区域、不可信标签区域和不确定标签区域;根据消歧后的标签,结合粒度计算与图论,将标签从细粒度聚合到粗粒度,并构造虚拟粗粒度标签,具体包括:根据消歧后的标签,取标签和作为顶点,建立一个完全无向图;其中,,是顶点的集合,是边集合;定义标签和连接的边的权重为标签不相似性; ;式中,是在可信标签诱导阶段完成后生成的消歧标签的正例集合,是在可信标签诱导阶段完成迭代后标签的正例集合;根据所述完全无向图,先使用Prim算法构造最小生成树,然后去除部分边将最小生成树划分为多个子树;移除边的阈值为: ;式中,为标签的数量;将每个子树视为一个由多个细粒度标签聚合而成的粗粒度标签,根据粗粒度标签内标签的共现频率,将细粒度标签的值聚合成一个新的粗粒度标签,获取虚拟粗粒度标签;虚拟粗粒度标签下的值为: ;式中,为样本数据的第个标签、是一个由一个或多个标签组成的粗粒度标签、表示内的标签个数、表示标签下样本的值、ξ为用以控制实例是否属于虚拟粗粒度标签的参数、表示如果条件满足则返回1,否则返回0。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华侨大学,其通讯地址为:362000 福建省泉州市丰泽区城华北路269号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。