买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:腾讯科技(深圳)有限公司
摘要:本公开提供一种聚类方法、聚类装置、电子设备以及计算机可读存储介质;涉及数据处理技术领域。所述聚类方法包括:获取包含多个数据点的待检测数据集,根据各数据点的位置信息确定与各数据点一一对应的密度值和目标距离;基于各密度值分别计算各数据点的离群参数,根据离群参数在待检测数据集中确定离群数据点,并将离群数据点外的数据点确定为待聚类数据点;根据各待聚类数据点对应的密度值和目标距离对待聚类数据点进行聚类以获取聚类结果。本公开可以基于密度值计算得到的离群参数识别离群数据点,因此在待检测数据集中的数据点密度分散情况迥异的情况下,也能够准确识别待检测数据点,避免待检测数据集中的离群数据点对最终聚类结果造成影响。
主权项:1.一种聚类方法,其特征在于,包括:获取包含多个数据点的待检测数据集,其中,所述待检测数据集中包含的是流量数据;针对每一所述数据点,分别获取与该所述数据点距离最近的n个最近数据点;其中,n为正整数;针对每一所述数据点,基于该所述数据点及其对应的n个所述最近数据点计算该所述数据点对应的密度值;判断各所述数据点对应的密度值与对应的n个所述最近数据点对应的密度值的大小关系;在所述数据点对应的密度值大于或等于对应的所述n个所述最近数据点对应的密度值时,根据第一预设规则计算所述数据点对应的目标距离;在各所述数据点对应的密度值小于对应的所述n个所述最近数据点中至少一个数据点对应的密度值时,计算所述数据点与目标最近数据点之间的距离值,并将各所述距离值的平均值确定为所述数据点对应的目标距离,其中所述目标最近数据点对应的密度值大于所述数据点对应的密度值;获取各所述数据点对应的密度值和对应的n个最近数据点对应的密度值;从各所述数据点中确定第二目标数据点;计算所述第二目标数据点对应的密度值与对应的n个最近数据点对应的密度值的差值的平均值作为所述第二目标数据点的离群参数;根据所述离群参数在所述待检测数据集中确定离群数据点,并将所述离群数据点外的所述数据点确定为待聚类数据点;根据各所述待聚类数据点对应的所述密度值和所述目标距离对所述待聚类数据点进行聚类以获取聚类结果;判定所述聚类结果中各聚类簇为异常流量或正常流量。
全文数据:
权利要求:
百度查询: 腾讯科技(深圳)有限公司 聚类方法及装置、存储介质、电子设备
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。