恭喜华侨大学范宇凌获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜华侨大学申请的专利一种标记松弛的多主题文本数据特征选择方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119149982B 。
龙图腾网通过国家知识产权局官网在2025-04-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411658867.6,技术领域涉及:G06F18/211;该发明授权一种标记松弛的多主题文本数据特征选择方法是由范宇凌;柳培忠;唐加能;刘景华设计研发完成,并于2024-11-20向国家知识产权局提交的专利申请。
本一种标记松弛的多主题文本数据特征选择方法在说明书摘要公布了:本发明涉及一种标记松弛的多主题文本数据特征选择方法,涉及自然语言处理技术领域,方法包括:给定由特征空间和标记空间组成的多主题文本数据;使用非负标记松弛矩阵获得松弛后的标记空间;构建特征选择矩阵并进行分解得到结构化子空间和因子矩阵,挖掘特征之间和标记之间的结构化关系;构造损失函数并施加范数约束,对特征选择矩阵进行范数稀疏正则化,基于此构建总目标函数;再通过迭代求解总目标函数,获得最终特征选择矩阵;最后,利用最终特征选择矩阵选择特征以表征原始文本数据。本发明通过标记松弛、结构化子空间分解、稀疏正则化等技术手段,显著提高了多主题文本数据特征选择的准确性、解释性、泛化能力和计算效率。
本发明授权一种标记松弛的多主题文本数据特征选择方法在权利要求书中公布了:1.一种标记松弛的多主题文本数据特征选择方法,其特征在于,包括:S1,给定由特征空间和标记空间组成的多主题文本数据;S2,基于多主题文本数据,使用非负标记松弛矩阵,获得松弛后的标记空间;S3,构建特征选择矩阵并进行分解得到结构化子空间和因子矩阵;基于结构化子空间和因子矩阵,挖掘多主题文本数据中特征之间和标记之间的结构化关系;S4,构造损失函数,对构造的损失函数施加范数约束;基于损失函数对特征选择矩阵进行范数稀疏正则化;基于特征选择矩阵构建总目标函数;S5,基于松弛后的标记空间以及特征之间和标记之间的结构化关系求解总目标函数;对总目标函数的解进行迭代,获得最终特征选择矩阵;S6,通过最终特征选择矩阵选择特征表征原始文本数据;所述多主题文本数据,包括:带有d维特征的特征空间的及带有l个类别主题的标记空间其中,n表示多主题文本数据中文本的数量,表示第i个文本的特征描述;若第i个文本的特征描述xi与第j个主题相关联,则有Yij=1,反之,Yij=0;所述S2,具体包括:S21,设计一个方向牵引矩阵来确保松弛方向,Bij定义为: 其中,每个元素Bij代表松弛方向,值为“+1”表示松弛的正方向,“-1”表示松弛的负方向;S22,随机初始化非负标记松弛矩阵其中,Sij表示矩阵S的第i个文本与第j个主题相关联,且在非负标记松弛矩阵S中的位置为第i行第j列;S23,构造松弛后的标记空间计算公式如下: 所述S3,具体包括:S31,将构建的特征选择矩阵W分解为结构化子空间Q和因子矩阵A,得其中,F表示范数;S32,对结构化子空间Q施加正交约束QTQ=Il;其中,Il表示l*l的单位矩阵;S33,获取文本中特征与特征之间的关系即表示特征空间的拉普拉斯图;其中,若结构化子空间Q中qa和qb密切相关,得到以下正则化项: 其中,qa表示结构化子空间Q的第a行即结构化子空间Q中的第a个特征位置,qb表示结构化子空间Q的第b行,Q表示d*l的矩阵,d表示特征维度,表示特征空间的拉普拉斯图,表示对角矩阵,对角元素为表示一个基于特征空间的亲和力矩阵,其被热核函数构造如下: 其中,σ表示热核函数的带宽,表示由Xb.构建的k最近邻集;S34,获取文本中主题标记与主题标记之间的关系即标记空间的拉普拉斯图;其中,若结构化子空间Q中第c列qc和第f列qf密切相关,得到以下正则化项: 其中,表示标记空间的拉普拉斯图;表示对角矩阵,其对角元素为矩阵被热核函数构造如下: 其中,Y.c和Y.f表示标记空间中第c个标记向量和第f个标记向量,表示由Y.c构建的k最近邻集;所述S4,具体包括:S41,构造损失函数,并施加l2,1范数约束,计算公式如下: 其中,表示e2,1范数;S42,对特征选择矩阵W进行e2,1范数稀疏正则化,得到||W||2,1;S43,构成总目标函数,计算公式如下: s.t.QTQ=Il其中,α、β、γ和λ均表示权衡参数;所述S5,具体包括:S51,基于总目标函数,固定其他变量更新因子矩阵A,得: S52,设定W=[w1;w2;...;wd]和固定其他变量更新特征选择矩阵W,得: 其中,w1;w2;...;wd分别表示特征选择矩阵W的第1,2,...,d行;v1;v2;...;vn分别表示矩阵的第1,2,...,n行;表示一个对角矩阵,其对角元素为D表示一个对角矩阵,其对角元素为Dee=12||we||2;对中的W求导数得: 其中,G=C-αQQT,Id表示d*d的单位矩阵;S53,固定其他变量更新结构化子空间Q,公式如下: 根据谢尔曼-莫里森-伍德伯里公式,G-1=C-1+αC-1QIl-αQTCQ-1QTC-1,得: 其中,将Q的导数设为零,得: 再通过Matlab的Lyapunov函数求解Q;S54,假设XTW-Y=K,固定其他变量求解S,公式如下: 其中,K为中间变量,计算得到S的最优解为: S55,基于计算得到因子矩阵A、特征选择矩阵W、结构化子空间Q和非负标记松弛矩阵S,迭代执行S51-S55,获得最终特征选择矩阵。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华侨大学,其通讯地址为:362000 福建省泉州市丰泽区城东城华北路269号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。