首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

缺失表格数据公平预测方法及装置、电子设备 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:浙江大学

摘要:本发明公开了一种缺失表格数据公平预测方法,该方法包括:获取缺失表格数据特征矩阵、表格数据标签矩阵和特征缺失掩码矩阵;构建融合了注意力机制正则化计算的Transformer神经网络模型;对缺失表格数据特征矩阵进行掩蔽,计算重构误差;对缺失表格数据特征矩阵中敏感属性已知的样本生成正负样本,计算对比学习误差;将所述重构误差与对比学习误差进行加权,对神经网络模型进行预训练;将缺失表格数据特征矩阵与特征缺失掩码矩阵通过线形层映射至高维;构建微调模块,利用最小化预测标签误差对预训练后的神经网络模型进行微调,得到缺失表格数据公平预测模型;将缺失表格数据特征矩阵和特征缺失掩码矩阵输入预测模型得到最终预测结果。

主权项:1.一种缺失表格数据公平预测方法,其特征在于,包括:S1:获取缺失表格数据特征矩阵与表格数据标签矩阵,并生成相应的特征缺失掩码矩阵,所述缺失表格数据特征矩阵由敏感属性特征矩阵和非敏感属性特征矩阵组成,两者均存在缺失;S2:根据所述缺失表格数据特征矩阵和特征缺失掩码矩阵构建融合了注意力机制正则化计算的Transformer神经网络模型;S3:对所述缺失表格数据特征矩阵及特征缺失掩码矩阵进行掩蔽,将遮掩后的样本输入到所述神经网络模型中计算得到重构误差;S4:对所述敏感属性特征矩阵中敏感属性特征已知的样本进行敏感属性翻转与添加高斯噪声操作,生成正样本与负样本,将敏感属性特征已知的样本,以及正负样本输入所述神经网络模型中计算得到对比学习误差;S5:将所述重构误差和对比学习误差进行加权得到预训练误差,利用预训练误差对所述神经网络模型进行预训练,得到预训练后的神经网络模型;S6:将所述缺失表格数据特征矩阵划分为缺失表格数据分类特征矩阵和缺失表格数据连续特征矩阵,结合其对应的特征缺失掩码矩阵进行标记后,将标记后的缺失表格数据分类特征矩阵和缺失表格数据连续特征矩阵分别通过线形层映射到高维,并将结果进行拼接获得高维表征矩阵;S7:将所述高维表征矩阵输入到所述预训练后的神经网络模型中得到样本标签预测矩阵,基于样本标签预测矩阵与表格数据标签矩阵计算得到预测标签误差,利用最小化预测标签误差对所述预训练后的神经网络模型进行迭代更新,得到缺失表格数据公平预测模型;S8:将缺失表格数据特征矩阵和特征缺失掩码矩阵输入所述缺失表格数据公平预测模型中得到最终预测结果。

全文数据:

权利要求:

百度查询: 浙江大学 缺失表格数据公平预测方法及装置、电子设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术