买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:罗家德;杨虎
摘要:本发明公开了一种基于聚类与综合评价的产业领袖识别方法,包括有数据收集模块、指标体系构建模块、聚类与排序模块、结果输出模块。该方法构造出刻画企业经验、规模和业务关系的指标,形成评估企业的指标体系;并混合使用加权k‑means聚类算法和TOPSIS综合评价方法,在聚类的过程中能够自动估计各指标的权重,进而使用该权重计算企业的综合得分;最后对企业综合得分降序排序,输出产业领袖识别结果。本发明在识别产业领袖时兼顾企业基本信息、行为信息与企业之间的合作关系,能够更准确有效地识别出产业领袖。
主权项:1.一种基于聚类与综合评价的产业领袖识别方法,其特征在于,包括数据收集模块、指标体系构建模块、排序与聚类模块、结果输出模块,具体流程如下:1数据收集模块1-1数据爬取首先,选取待评价的行业,确定信息来源,从信息来源网页中爬取企业信息,包括两类:一是企业基本信息,二是企业的合作事件,每一条合作事件都代表在某个时间节点,某个企业与其他企业的合作情况;1-2数据库构建对爬取到的原始数据进行汇总、重复值处理、缺失值处理、数据类型统一化操作,并将处理好的数据导入数据库,最终建立企业基本信息和合作事件数据库;所述企业包括风险投资公司,所述合作事件包括风险投资事件;1-3数据更新数据更新模块将实时采集数据,旨在企业信息发生改变时,更新企业信息,同时实时更新行业中新成立的企业列表;同时,系统将同步更新企业合作信息,一旦企业之间有新的合作关系,将触发数据爬取模块工作,实时获取相关数据并更新数据库;2指标体系构建模块指标体系构建模块将根据企业基本信息和合作事件数据库,构建企业基本信息、企业合作行为和企业合作网络三类指标;其中,合作的企业数量NoC,它表明了企业是否有资产和资源进行合作;同样,包括企业的规模和经验的指标还有:合作总额TNC,企业合作涉及的行业数量NoI,国家数量NoCoun、省份数量NoPR;同时,通过企业之间的合作关系,提取刻画企业社会关系的指标,用来刻画企业在产业网络中的地位,这些指标包括:中心度DC、接近中心度CC、核心度KC、特征向量中心度EC,HITs值,以及PageRank指标PR;3排序与聚类模块第一步,聚类、估计指标权重采用加权k-means聚类算法来计算指标的权重,根据企业的规模、经验指标和合作网络指标实现企业的分类;第二步,计算综合得分;第三步:对企业进行聚类并依据综合得分排序,结果输出;所述2指标体系构建模块中的三类指标基于产业网络的以下定义:定义1.无向合作网络Gu=vu,Eu,vu=v1,v2,…,vn是节点的集合,即待评价企业,是企业之间的连边的集合,即企业之间的合作关系;对于每条连边eij∈Eu,满足条件:即eij=eji,EU是对称矩阵,其中Iijt表示t时刻第i个节点和第j个节点是否有合作,如果有合作就是1,否则就是0;T是总时间;n是节点数即待评价企业的数量;设ti和tj分别为第i家企业和第j家企业投资同一项目的时间戳,如果第i家企业早于第j家企业投资该项目,则Iijti≤tj=1;如果它们同时投资该项目,则:Iijti=tj=Ijitj=ti=1;因此,定义有向合作网络;定义2.有向合作网络GD=vD,ED,vD=v1,v2,…,vn是节点的集合,即待评价企业,是企业之间的连边的集合,即企业之间的合作关系;对于每条连边eij∈ED,满足条件:ED是非对称矩阵;根据无向网络和有向网络的定义来计算企业的中心度指标,其中,根据无向合作网络Gu计算中心度DC、接近中心度CC、核心度KC、特征向量中心度EC和HITs值,这些指标表示待评估企业在无向网络中的重要性,根据有向合作网络GD则计算PageRank指标PR,该指标表示待评估企业在有向网络中的重要性;所述3排序与聚类模块第一步中,采用加权k-means聚类算法来计算指标的权重,具体如下:假设wj为特征j的权重,定义样本i与样本i′在特征j的距离为:di,i′,j=xij-xi′j2,其中xij和xi′j分别是样本i与样本i′的第j特征,i,i′=1,2,…,n,且i≠i′,n是节点数即待评价企业的数量;j=1,2,…,m;m是特征的数量,若K是聚类个数,C=C1,C2,…,CK是K个聚类中心,聚类中心Ck是样本的集合,那么定义加权的聚类算法,目标函数定义如下: 约束条件为:且∑其中s为超参数,是一个常数,取值范围为1,+∞,为LASSO惩罚,用来控制参数的个数,为二范数约束,用来控制权重的大小;令通过解带约束条件的目标函数1,解得聚类中心C,以及权重wj,由下面的公式来计算: 其中Saj,λ1是软间隔函数,定义为
全文数据:
权利要求:
百度查询: 罗家德 杨虎 一种基于聚类与综合评价的产业领袖识别方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。