首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

文本脱敏数据模型的训练方法、脱敏装置、设备 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:海南大学

摘要:本发明涉及敏感数据安全应用领域,尤其涉及文本脱敏数据模型的训练方法、脱敏装置、设备。训练方法所应用的模型包括生成器、判别器,训练流程包括预先搭建模型的流程、数据随机抽样流程、数据预处理流程、预训练流程、正式训练流程。本发明提出了Trans‑WTGAN的生成式对抗网络模型用于文本数据脱敏任务,是Transformer在GAN中应用的一种结合,且脱敏后的数据与原始数据复现率低,保证了数据脱敏后的安全性,证明了编码器解码器与卷积网络结合在文本处理上的可能性。

主权项:1.一种文本脱敏数据模型的训练方法,该训练方法所应用的模型包括生成器、判别器,其特征在于,包括预先搭建模型的流程、数据随机抽样流程、数据预处理流程、预训练流程、正式训练流程;预先搭建模型的流程用于搭建生成对抗网络的生成器和判别器,所述生成器是采用Transformer模型,所述判别器以文本式卷积神经网络为基础搭建;数据随机抽样流程用于将真实数据集内的各条数据随机抽样,得到生成器训练用真实训练数据集;数据预处理流程用于利用词嵌入模型将各条数据处理为词向量;预训练流程用于训练生成器的生成能力,修正生成器的损失函数;以及,训练判别器的判别能力,修正判别器的损失函数;正式训练流程用于实现生成器和判别器对抗训练,将生成器训练生成的数据传给判别器,根据判别结果更新生成器和判别器正式训练流程中的损失函数,再进行下一轮生成器的训练和判别器的训练,进行多轮来训练出最好的参数模型。

全文数据:

权利要求:

百度查询: 海南大学 文本脱敏数据模型的训练方法、脱敏装置、设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。