首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

相似域名查找方法、装置及电子设备 

申请/专利权人:山东伏羲智库互联网研究院;伏羲科技(菏泽)有限公司

申请日:2020-11-06

公开(公告)日:2024-06-28

公开(公告)号:CN112256838B

主分类号:G06F16/33

分类号:G06F16/33;G06F16/31;G06F16/35;G06F40/253

优先权:

专利状态码:有效-授权

法律状态:2024.06.28#授权;2021.02.09#实质审查的生效;2021.01.22#公开

摘要:本发明实施例提供一种相似域名查找方法、装置及电子设备,该方法包括:获取待查域名;提取待查域名的文本特征,并对文本特征进行向量化表示,得到待查域名特征向量;对待查域名特征向量进行编码,并根据编码结果从预设的全量域名数据库中匹配出目标域名特征向量组,其中,全量域名数据库中包括根据域名特征向量编码结果进行分类的多个域名特征向量组;计算待查域名特征向量与目标特征向量组中每一个域名特征向量之间的距离,并根据距离得到待查域名的相似域名。本方法将域名间相似性计算,转换成特征向量之间相似性的比较,具体转换成待查域名特征向量和目标域名特征向量组中每一个域名特征向量之间距离的计算,降低了计算难度,提升了计算速度。

主权项:1.一种相似域名查找方法,其特征在于,包括:获取待查域名;提取所述待查域名的文本特征,并对所述文本特征进行向量化表示,得到待查域名特征向量;对所述待查域名特征向量进行编码,并根据编码结果从预设的全量域名数据库中匹配出目标域名特征向量组,其中,所述全量域名数据库中包括根据域名特征向量编码结果进行分类的多个域名特征向量组;计算所述待查域名特征向量与所述目标域名特征向量组中每一个域名特征向量之间的距离,并根据所述距离得到所述待查域名的相似域名;在对所述待查域名特征向量进行编码,并根据编码结果从预设的全量域名数据库中匹配出目标域名特征向量组之前,还包括:构建所述全量域名数据库的步骤,具体包括:获取历史域名解析数据库中所有的历史域名;提取所述所有的历史域名的文本特征,并对所有的历史域名的文本特征进行向量化表示,得到多个域名特征向量,各域名特征向量分别与各历史域名一一对应;对所述多个域名特征向量进行编码,根据编码结果的不同,将所述多个域名特征向量分类为多个域名特征向量组,且为所述多个域名特征向量组构建自适应树形索引,其中,各域名特征向量组包括至少一个所述域名特征向量,所述树形索引采用单线程向量索引法,或所述树形索引采用多线程并行向量索引法,或所述树形索引采用内存型向量索引法。

全文数据:

权利要求:

百度查询: 山东伏羲智库互联网研究院;伏羲科技(菏泽)有限公司 相似域名查找方法、装置及电子设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。