恭喜深圳市迪博企业风险管理技术有限公司胡为民获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜深圳市迪博企业风险管理技术有限公司申请的专利一种大模型越狱攻击检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119377802B 。
龙图腾网通过国家知识产权局官网在2025-03-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411965796.4,技术领域涉及:G06F18/2415;该发明授权一种大模型越狱攻击检测方法是由胡为民;袁吉;郑喜;谢丽慧设计研发完成,并于2024-12-30向国家知识产权局提交的专利申请。
本一种大模型越狱攻击检测方法在说明书摘要公布了:本申请涉及一种大模型越狱攻击检测方法,该方法包括:S1:基于混合专家模型和Transformer架构构建越狱攻击检测模型,越狱攻击检测模型包括多层MoE‑Transformer结构,并采用正无标记学习方法训练越狱攻击检测模型;S2:获取输入的文本数据,并将文本数据转换为向量表示;S3:将向量表示输入至训练好的越狱攻击检测模型,经过多层MoE‑Transformer结构,输出高层特征向量;S4:高层特征向量经过全连接层,输出越狱攻击概率;基于越狱攻击概率确定越狱攻击情况。该方法在越狱攻击检测的准确性和效率上有显著提升,通过自动化的检测,确保了对大模型越狱攻击的实时防御,降低了潜在的安全风险。
本发明授权一种大模型越狱攻击检测方法在权利要求书中公布了:1.一种大模型越狱攻击检测方法,其特征在于,包括:S1:基于混合专家模型和Transformer架构构建越狱攻击检测模型,越狱攻击检测模型包括多层MoE-Transformer结构,并采用正无标记学习方法训练所述越狱攻击检测模型;每层MoE-Transformer结构的计算方式为: MoE-Transformerx=LayerNormMoELayerNormSelfAttentionx+x+x;其中,MoE-Transformer·表示MoE-Transformer结构;LayerNorm·表示层归一化;MoE·表示MoE前馈网络;SelfAttention·表示多头自注意力机制;x表示向量表示;所述MoE前馈网络包括K个专家网络,每个所述专家网络均采用两层前馈神经网络结构;MoE前馈网络的前向计算包括: ; ; ;其中,MoE·表示MoE前馈网络;x表示向量表示;表示门控网络,其用于选择某一个或多个专家网络处理向量表示;表示选择第i个专家网络处理向量表示的概率;表示第i个专家网络的输出;表示TopK机制函数,用于选择概率最高的前K'个专家网络,K'<K;表示softmax激活函数;表示门控网络的权重;表示门控网络的偏置;表示ReLU激活函数;表示第i个专家网络的第一层前馈神经网络的权重;表示第i个专家网络的第二层前馈神经网络的权重;表示第i个专家网络的第一层前馈神经网络的偏置;表示第i个专家网络的第二层前馈神经网络的偏置;S2:获取输入的文本数据,并将所述文本数据转换为向量表示;S3:将所述向量表示输入至训练好的越狱攻击检测模型,经过多层所述MoE-Transformer结构,输出高层特征向量;S4:所述高层特征向量经过全连接层,输出越狱攻击概率;基于所述越狱攻击概率确定越狱攻击情况。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳市迪博企业风险管理技术有限公司,其通讯地址为:518048 广东省深圳市福田区深南大道1006号国际创新中心A栋6楼西;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。