首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于NLP的通讯文本匿名方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:成都乐超人科技有限公司

摘要:本申请提供一种基于NLP的通讯文本匿名方法及系统,通过对原始通讯文本进行深度语义分析,生成精准的第一关键语义向量序列,不仅依据预设的匿名化规则库进行匹配,找到与原始通讯文本语义最为接近的第一参考匿名化规则,还进一步与对应于各匿名化规则的匿名化规则文本库进行匹配,确定第二参考匿名化规则,这种双重匹配机制显著提升了匿名化规则的选择精度,使得最终的匿名化处理更为贴合原始通讯文本的实际语义。此外,通过综合考虑第一参考匿名化规则和第二参考匿名化规则,来确定最终的目标匿名化规则,使得匿名化处理既能符合预设的匿名化规则要求,又能适应具体通讯文本的语境特点,大大提高了匿名处理的灵活性和适用性。

主权项:1.一种基于NLP的通讯文本匿名方法,其特征在于,所述方法包括:对原始通讯文本进行语义分析,生成所述原始通讯文本的第一关键语义向量序列;确定所述第一关键语义向量序列与预设的匿名化规则库各匿名化规则的匿名语义向量序列的第一匹配度,并依据每一所述第一匹配度,确定所述原始通讯文本所对应的第一参考匿名化规则;确定所述第一关键语义向量序列与对应于每一所述匿名化规则的各匿名化规则文本库的第二关键语义向量序列的第二匹配度,并依据每一所述第二匹配度,确定所述原始通讯文本所对应的第二参考匿名化规则;依据所述第一参考匿名化规则和所述第二参考匿名化规则,确定所述原始通讯文本所对应的目标匿名化规则,并根据所述目标匿名化规则对所述原始通讯文本进行匿名化处理;所述确定所述第一关键语义向量序列与预设的匿名化规则库各匿名化规则的匿名语义向量序列的第一匹配度之前,所述方法还包括:遍历每一所述匿名化规则,获取对应于所述匿名化规则的一个或多个目标匿名化规则文本库,并对每一所述目标匿名化规则文本库进行语义分析,生成所述匿名化规则的各目标第二关键语义向量序列;对所述匿名化规则的一个或多个所述目标第二关键语义向量序列进行特征交互,生成所述匿名化规则的第三关键语义向量序列;将所述匿名化规则的第三关键语义向量序列作为所述匿名化规则的匿名语义向量序列;其中,所述对所述匿名化规则的一个或多个所述目标第二关键语义向量序列进行特征交互,生成所述匿名化规则的第三关键语义向量序列的步骤,包括:遍历每一匿名化规则,获取对应于该匿名化规则的一个或多个目标匿名化规则文本库,对每一个目标匿名化规则文本库进行语义分析,生成该匿名化规则的各目标第二关键语义向量序列;对于每一个目标第二关键语义向量序列,提取所述目标第二关键语义向量序列的关键特征,所述关键特征包括词汇特征、短语特征、句法结构特征或语义角色特征中的至少一种;通过特征融合算法将所述关键特征融合成目标向量表示,所述目标向量表示用于捕捉各目标第二关键语义向量序列中的共有信息和差异信息;根据所述目标向量表示学习不同目标第二关键语义向量序列之间的相互关系,以识别出在不同的目标第二关键语义向量序列中的显著性相关特征,生成融合了多个目标第二关键语义向量序列信息的初始第三关键语义向量序列;基于梯度下降的优化算法微调所述初始第三关键语义向量序列,以确保其能更准确地捕捉原始匿名化规则的语义信息,将优化后的第三关键语义向量序列作为该匿名化规则的最终的第三关键语义向量序列;其中,所述根据所述目标向量表示学习不同目标第二关键语义向量序列之间的相互关系,以识别出在不同的目标第二关键语义向量序列中的显著性相关特征,生成融合了多个目标第二关键语义向量序列信息的初始第三关键语义向量序列的步骤,包括:对于所有的目标向量表示,计算各个所述目标向量表示之间的皮尔逊相关系数,并基于各个所述目标向量表示之间的皮尔逊相关系数构建对应的相互关系矩阵,其中所述相互关系矩阵中每个元素表示对应两个目标向量表示之间的相关性;分析所述相互关系矩阵,确定具有满足预设相关性的目标向量表示对;对于每个目标向量表示对,基于互信息算法识别所述目标向量表示对中不同目标向量表示之间的显著性相关特征,所述显著性相关特征表示所述目标向量表示对中都显著出现的词汇特征、短语特征或指定语义模式特征;创建一个空向量序列作为所述初始第三关键语义向量序列的基础,遍历所有识别出的显著性相关特征,将所述显著性相关特征按照对应的重要性得分进行排序,将排序后的显著性相关特征逐个添加到初始第三关键语义向量序列中,其中,在添加每个显著性相关特征时,通过使用预设加权机制以使得重要性得分更高的显著性相关特征在最终的第三关键语义向量序列中有更大的影响权重。

全文数据:

权利要求:

百度查询: 成都乐超人科技有限公司 基于NLP的通讯文本匿名方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。