恭喜湖北蔚蓝通用航空科技股份有限公司朱抗获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜湖北蔚蓝通用航空科技股份有限公司申请的专利一种基于加权相对密度的众包标记噪声过滤方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114781519B 。
龙图腾网通过国家知识产权局官网在2025-05-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210432916.9,技术领域涉及:G06V10/30;该发明授权一种基于加权相对密度的众包标记噪声过滤方法是由朱抗;蒋良孝;张文钧;杨锦云;范亚军;徐明星;周斌设计研发完成,并于2022-04-24向国家知识产权局提交的专利申请。
本一种基于加权相对密度的众包标记噪声过滤方法在说明书摘要公布了:本发明提供了一种基于加权相对密度的众包标记噪声过滤方法,依据众包数据的多噪声标记生成数据子集,然后计算每个样本对于这些数据子集的相对密度,最后依据相对密度对原始数据进行过滤。本发明提供的一种基于加权相对密度的众包标记噪声过滤方法不仅利用了样本的属性特征信息,还利用到了众包标记中的信息,更精准地过滤出原始数据中的干净样本,同时能够通过实验验证本发明的有效性。
本发明授权一种基于加权相对密度的众包标记噪声过滤方法在权利要求书中公布了:1.一种基于加权相对密度的众包标记噪声过滤方法,其特征在于包括以下步骤:S1、对于一个标记集成后的文本或图像的众包数据集,其中每个样本由样本属性、该样本属性对应的多噪声标记集以及集成标记组成,根据各样本的多噪声标记集获取每个样本在所有类别上的类概率分布;众包数据集由N个样本组成,用表示,其中第i个样本由样本属性xi、多噪声标记集Li和集成标记三部分组成,Li={li1,li2,…,liM},M为工人个数,lij代表第j个工人给样本i打的标记,lij∈{0,c1,c2,…,cP},其中ci代表第i个类别,数据集一共有P个类别,0代表第j个工人没有对样本属性xi进行标记;采用以下公式计算每个样本在所有类别上的类概率分布: 其中,Pxi,cj表示众包数据集中第i个样本属性xi属于第j个类别cj的概率,M为工人个数,lim表示第m个工人给样本属性xi标记的类别,δa,b是一个二元函数,当a和b的值相同时返回1,否则返回0;则每个样本的类概率分布满足S2、根据类概率分布将众包数据集划分为多个数据子集,每个数据子集对应一个类别;具体包括以下过程:对于任意第i个样本的样本属性xi和给定的类别cj,如果pxi,cj≠0,则将该样本的样本属性加入到数据子集Dj中,并将pxi,cj作为样本属性xi在Dj中的权重;完成对每个样本的处理后,得到数据子集的集合Dsub={D1,D2,…,DP},其中每个数据子集由样本属性和对应的权重组成,第j个数据子集Dj所对应的类别为cj,即同一个数据子集Dj中的样本具有相同的类别cj;S3、计算每个样本在各数据子集下的加权绝对密度;具体包括以下过程:S3.1、对于众包数据集D中每个样本属性,通过以下公式计算其与各个数据子集Dp中的每个样本属性的加权距离: 其中,wdxi,xj,Dp表示众包数据集D第i个样本属性xi与第p个数据子集Dp中的第j个样本属性xj的加权距离,wj为样本属性xj在第p个数据子集Dp中的权重,由步骤S2计算得到的类概率分布赋值;S3.2根据以下公式计算每个样本在各数据子集下的加权绝对密度: 其中,ADxi,Dp表示众包数据集D中第i个样本xi在第p个数据子集Dp下的加权绝对密度,kNeighborxi,Dp表示样本属性xi在数据集Dp中的k个近邻;S4、根据加权绝对密度计算每个样本相对于各数据子集的加权相对密度,得到相对密度向量;具体包括以下过程:S4.1、根据以下公式计算每个样本相对于每个数据子集的加权相对密度: 其中,RDxi,Dj表示众包数据集D中第i个样本xi在第j个数据子集Dj下的加权相对密度,Dlabeli为众包数据集D中第i个样本的集成标记的类别在数据子集的集合Dsub中所对应的数据子集,若则Dlabeli=Dj;S4.2、将加权绝对密度带入步骤S4.1的公式后,加权相对密度简化为: 其中,xp属于xi在数据子集Dlabeli中的k近邻,xq为xi在数据子集Dj中的k近邻,即D中第i个样本属性在其集成标记所对应的数据子集上的k近邻加权距离之和比上在每个数据子集上的k近邻加权距离之和;S5、利用相对密度向量进行噪声过滤,将众包数据集中被认定为噪声样本的样本加入到噪声集中,众包数据集中余下的样本加入到干净集中,完成过滤。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人湖北蔚蓝通用航空科技股份有限公司,其通讯地址为:430074 湖北省武汉市东湖新技术开发区珞喻路佳园路光谷国际大厦A-24楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。