买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明提供了一种基于个人特征信息的用户契合度的计算方法,包括如下步骤:显示与个人特征信息相关的问题,计算个人特征信息包括身份类信息、教育经历类信息、兴趣爱好类信息、生活圈类信息、阅读记录类信息及社交通讯类信息;获取并存储两人的个人特征信息;根据两人的个人特征信息分别生成每人的个人特征信息的类的集合,再分别计算两人个人特征信息中的同一类的集合之间的关系强度因子;根据关系强度因子计算两人的契合度,该契合度能准确地度量陌生用户间的关系强度,用户之间可以通过讨论个人特征信息的异同点以获知如何度量陌生用户间的关系强度的因素,从而帮助陌生用户寻找话题缓解气氛。
主权项:1.一种基于个人特征信息的用户契合度的计算方法,其特征在于,包括如下步骤:显示与个人特征信息相关的问题,所述个人特征信息包括身份类信息、教育经历类信息、兴趣爱好类信息、生活圈类信息、阅读记录类信息及社交通讯类信息;获取并存储两人的个人特征信息;根据两人的个人特征信息分别生成每人的个人特征信息的类的集合,再分别计算两人个人特征信息中的同一类的集合之间的关系强度因子;根据关系强度因子计算两人的契合度;所述获取并存储两人的个人特征信息,包括:当所述个人特征信息记录在文字文件中时,通过文字提取算法提取文字文件中的文字信息,和或当所述个人特征信息记录在图片文件中时,通过图像识别算法识别并提取图片中的文字信息,和或当所述个人特征信息记录在音频文件中时,通过语音识别算法识别并提取音频文件中的文字信息;所述获取并存储两人的个人特征信息,还包括:剔除个人特征信息中错误的和或重复的个人特征信息;所述根据两人的个人特征信息分别生成每人的个人特征信息的类的集合,再分别计算两人个人特征信息中的同一类的集合之间的关系强度因子,是指:根据预定义的语义目标分别解析两人的个人特征信息以获得多个单一词组;将每一单一词组分别归类到身份类信息、教育经历类信息、兴趣爱好类信息、生活圈类信息、阅读记录类信息或社交通讯类信息中;将两人同一类信息中的词组分别进行特征匹配,并计算每一词组的关联系数;根据每一类信息中所有词组的关联系数计算该类信息的关系强度因子;每一类信息的关系强度因子是指每一类信息中所有词组的关联系数之和;所述契合度=0.433AB+BC+CD+DE+EF+FA100,A为身份类信息中所有词组的关联系数之和,B为教育经历类信息中所有词组的关联系数之和,C为兴趣爱好类信息中所有词组的关联系数之和,D为生活圈类信息中所有词组的关联系数之和,E为阅读记录类信息中所有词组的关联系数之和,F为社交通讯类信息中所有词组的关联系数之和;根据第一预设公式计算两人基于身份类信息的第一关系强度因子A,身份类信息包括姓名信息和出生日期信息,姓名信息对应预设的姓分值和名分值,出生日期信息分值对应预设的生日分值,第一预设公式:第一关系强度因子A=姓分值+名分值+生日分值;姓分值的取值可设为:若两人的姓相同,则姓分值为26,否则姓分值为25减去两人姓的拼音的首字母在26个字母表中的间隔字母数;名分值的取值可设为:将两人名的拼音的首字母换算成在26个字母表中排名数,再将排名数中的二位数分别拆成单个数字,将所有单个数字中相同的单个数字相加即为名分值;根据第二预设公式计算两人基于教育经历类信息的第二关系强度因子B,教育经历类信息包括毕业院校和专业,其中,毕业院校对应于相应的办学形式和办学层次,专业对应于相应的学科范围,办学形式对应预设的办学形式分值,办学层次对应预设的办学层次分值,学科范围对应预设的学科范围分值,第二预设公式:第二关系强度因子B=办学形式分值+办学层次分值+学科范围分值;根据第三预设公式计算两人基于兴趣爱好类信息的第三关系强度因子C,每一单项兴趣爱好均对应相同的兴趣爱好分值,第三预设公式:第三关系强度因子C=相同的单项兴趣爱好数量×兴趣爱好分值;根据第四预设公式计算两人基于生活圈类信息的第四关系强度因子D,生活圈类信息包括出生地信息、同类型场所信息和互动信息,出生地信息对应出生地分值,同类型场所信息对应同类型场所分值,最后一次互动信息对应最近互动分值,第四预设公式:第四关系强度因子D=出生地分值+同类型场所分值+最近互动分值;根据第五预设公式计算两人基于阅读记录类信息的第五关系强度因子E,阅读记录类信息包括阅读内容和阅读内容类型,阅读内容对应内容分值,阅读内容类型对应类型分值,第五预设公式:第五关系强度因子E=内容分值+类型分值;根据第六预设公式计算两人基于社交通讯类信息的第六关系强度因子F,社交通讯类信息包括联系信息、共同联系人信息、好友信息、聊天信息及表情信息,第六预设公式:第六关系强度因子F=联系信息分值+共同联系人信息分值+好友信息分值+聊天信息分值+表情信息分值;联系信息对应联系信息分值,联系信息分值是指两人的联系信息是否存储在对方的移动终端,若存储在对方的移动终端,则联系信息分值为第六预设分值,否则联系信息分值为零分;共同联系人信息对应共同联系人信息分值,共同联系人信息分值是指2×两人的通讯录中共同的电话号码的个数;好友信息对应好友信息分值,好友信息分值是指两人是否为对方社交软件中的好友,若为对方社交软件中的好友,则好友信息分值为第七预设分值,否则好友信息分值为零分;聊天信息对应聊天信息分值,聊天信息分值是指两人通过社交软件聊天的时间重合的小时数×5;表情信息对应表情信息分值,表情信息分值是指两人通过社交软件聊天时使用了相同的表情的个数。
全文数据:一种基于个人特征信息的用户契合度的计算方法和装置技术领域本发明涉及信息处理技术领域,尤其涉及一种基于个人特征信息的用户契合度的计算方法和装置。背景技术用户关系在社交网络中的应用越来越广泛,如:视频推荐网站Clicker与亚马逊等基于用户关系的社会化推荐,各社交平台中的好友推荐等应用;因为将用户关系引入推荐系统可以增加推荐结果的信任度、解决推荐系统的冷启动问题。一般认为,两个用户间的互动越多则认为彼此间的关系越强,然而,两个用户在认识之初,如何考量其关系的强弱,尤其是对于一些以社交为目的的用户,如何准确地度量陌生用户间的关系强度就成为了一个重要问题。发明内容本发明提供了一种基于个人特征信息的用户契合度的计算方法和装置,旨在解决如何准确地度量陌生用户间的关系强度的问题。本发明的第一个方面,提供了一种基于个人特征信息的用户契合度的计算方法,包括如下步骤:显示与个人特征信息相关的问题,所述个人特征信息包括身份类信息、教育经历类信息、兴趣爱好类信息、生活圈类信息、阅读记录类信息及社交通讯类信息;获取并存储两人的个人特征信息;根据两人的个人特征信息分别生成每人的个人特征信息的类的集合,再分别计算两人个人特征信息中的同一类的集合之间的关系强度因子;根据关系强度因子计算两人的契合度。进一步地,所述获取并存储两人的个人特征信息,包括:当所述个人特征信息记录在文字文件中时,通过文字提取算法提取文字文件中的文字信息,和或当所述个人特征信息记录在图片文件中时,通过图像识别算法识别并提取图片中的文字信息,和或当所述个人特征信息记录在音频文件中时,通过语音识别算法识别并提取音频文件中的文字信息。进一步地,所述获取并存储两人的个人特征信息,还包括:剔除个人特征信息中错误的和或重复的个人特征信息。进一步地,所述根据两人的个人特征信息分别生成每人的个人特征信息的类的集合,再分别计算两人个人特征信息中的同一类的集合之间的关系强度因子,是指:根据预定义的语义目标分别解析两人的个人特征信息以获得多个单一词组;将每一单一词组分别归类到身份类信息、教育经历类信息、兴趣爱好类信息、生活圈类信息、阅读记录类信息或社交通讯类信息中;将两人同一类信息中的词组分别进行特征匹配,并计算每一词组的关联系数;根据每一类信息中所有词组的关联系数计算该类信息的关系强度因子。进一步地,每一类信息的关系强度因子是指每一类信息中所有词组的关联系数之和。进一步地,所述契合度=0.433AB+BC+CD+DE+EF+FA100,A为身份类信息中所有词组的关联系数之和,B为教育经历类信息中所有词组的关联系数之和,C为兴趣爱好类信息中所有词组的关联系数之和,D为生活圈类信息中所有词组的关联系数之和,E为阅读记录类信息中所有词组的关联系数之和,F为社交通讯类信息中所有词组的关联系数之和。本发明的另一个方面,提供了一种基于个人特征信息的用户契合度的计算装置,包括:显示模块,用于显示与个人特征信息相关的问题,所述个人特征信息包括身份类信息、教育经历类信息、兴趣爱好类信息、生活圈类信息、阅读记录类信息及社交通讯类信息;获取存储模块,用于获取并存储两人的个人特征信息;处理模块,用于根据获取的两人的个人特征信息分别生成每人的个人特征信息的类的集合,再分别计算两人个人特征信息中的同一类的集合之间的关系强度因子;计算模块,用于根据关系强度因子计算两人的契合度。进一步地,所述获取存储模块包括信息提取单元;所述信息提取单元用于当所述个人特征信息记录在文字文件中时,通过文字提取算法提取文字文件中的文字信息,和或当所述个人特征信息记录在图片文件中时,通过图像识别算法识别并提取图片中的文字信息,和或当所述个人特征信息记录在音频文件中时,通过语音识别算法识别并提取音频文件中的文字信息。进一步地,所述获取存储模块还包括删除单元;所述删除单元用于剔除个人特征信息中错误的和或重复的个人特征信息。进一步地,所述处理模块包括解析单元、分类单元、匹配处理单元及关联计算单元;所述解析单元,用于根据预定义的语义目标分别解析两人的个人特征信息以获得多个单一词组;所述分类单元,用于将每一单一词组分别归类到身份类信息、教育经历类信息、兴趣爱好类信息、生活圈类信息、阅读记录类信息或社交通讯类信息中;所述匹配处理单元,用于将两人同一类信息中的词组分别进行特征匹配,并计算每一词组的关联系数;所述关联计算单元,用于根据每一类信息中所有词组的关联系数计算该类信息的关系强度因子。本发明的有益效果如下:本发明通过显示与个人特征信息相关的问题,获取并存储两人的个人特征信息,根据两人的个人特征信息分别生成单个个人特征信息的类的集合,再分别计算两人同类个人特征信息的集合的关系强度因子,根据关系强度因子计算两人的契合度,该契合度能准确地度量陌生用户间的关系强度,因此,用户之间可以通过讨论个人特征信息的异同点以获知如何度量陌生用户间的关系强度的因素,从而帮助陌生用户寻找话题缓解气氛。本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。附图说明为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本发明实施例1中的一种基于个人特征信息的用户契合度的计算方法的流程示意图;图2为本发明实施例1中的计算两人个人特征信息中的同一类的集合之间的关系强度因子的流程示意图;图3为本发明实施例2中的一种基于个人特征信息的用户契合度的计算装置的结构示意图;图4为本发明实施例2中的获取存储模块的结构示意图;图5为本发明实施例2中的处理模块的结构示意图。具体实施方式下面将结合本发明中的说明书附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。应当理解,在本发明说明书中,术语“包括”和“包含”指示所描述特征、整体、元素和或组件的存在,但并不排除一个或多个其它特征、整体、元素、组件和或其集合的存在或添加。还应当理解,在本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。在本发明说明书及说明书附图中描述的一些流程中,包含了按照特定顺序出现的多个序号,但是应该清楚了解,这些序号如11、12等,仅仅是用于区分开各个不同的名称,序号本身不代表任何的执行顺序。本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语包括技术术语和科学术语,具有与本发明所属领域中的普通技术人员的一般理解相同的意义。实施例1本发明实施例提供了一种基于个人特征信息的用户契合度的计算方法,如图1所示,包括步骤S110-S140。S110显示与个人特征信息相关的问题,个人特征信息包括身份类信息、教育经历类信息、兴趣爱好类信息、生活圈类信息、阅读记录类信息及社交通讯类信息。S120获取并存储两人的个人特征信息。获取并存储两人的个人特征信息,包括如下两个方面:第一、当个人特征信息记录文字文件中时,通过文字提取算法提取在文字文件中的文字信息,和或当个人特征信息记录在图片文件中时,通过图像识别算法识别并提取图片中的文字信息,和或当个人特征信息记录在音频文件中时,通过语音识别算法识别并提取音频文件中的文字信息。其中,文字提取算法、图像识别算法和语音识别算法均为现有技术。第二、剔除个人特征信息中错误的和或重复的个人特征信息,该过程也可以利用现有技术基于规则的分类算法达成。例如:基于规则的分类算法包括RIPPERRepeatedIncrementalPruningtoProduceErrorReduction算法,RIPPER算法根据预设的规则,再根据添加信息的先后顺序一一与参照物匹配,若匹配成功则为正,若都不匹配则为负。错误的个人特征信息具体可体现为不确定信息和包含了错别字的信息,例如:不确定信息之一为打球,而打球包括打篮球、打排球、打羽毛球、打乒乓球、打网球等,因此,打球可设为剔除信息中的一个参照物;包含了错别字的信息之一为打蓝球,虽然乍一看蓝球是指篮球,但是,是否真实代表信息来源的真实性,有待商榷,也可作为剔除信息中的一个参照物。当然,剔除信息中也可不设定参照物,只需一一遍历每一个信息是否相同即可。S130根据两人的个人特征信息分别生成单个个人特征信息的类的集合,再分别计算两人同类个人特征信息的集合的关系强度因子。根据两人的个人特征信息分别生成每人的个人特征信息的类的集合,再分别计算两人个人特征信息中的同一类的集合之间的关系强度因子,如图2所示,计算两人个人特征信息中的同一类的集合之间的关系强度因子的步骤包括S131-S134。S131根据预定义的语义目标分别解析两人的个人特征信息以获得多个单一词组。S132将每一单一词组分别归类到身份类信息、教育经历类信息、兴趣爱好类信息、生活圈类信息、阅读记录类信息或社交通讯类信息中。S133将两人同一类信息中的词组分别进行特征匹配,并计算每一词组的关联系数。特征匹配也是现有技术在本发明中的应用。当然,特征匹配在不同类别信息中也会有所不同,以姓名为例的特征匹配为例进行说明,具体包括如下步骤:步骤一、对身份类信息中的文本内容进行分词处理,得到包含有多个第一词语的第一词语集合;步骤二、在第一词语集合中查找与姓氏特征匹配的词语,得到包含有多个第二词语的第二词语集合;步骤三、根据多个第二词语的分布信息,从第二词语集合中确定身份类信息中的主人公姓名。S134根据每一类信息中所有词组的关联系数计算该类信息的关系强度因子,每一类的关系强度因子是指每一类信息中所有词组的关联系数之和。具体的,分别以身份类信息、教育经历类信息、兴趣爱好类信息、生活圈类信息、阅读记录类信息及社交通讯类信息中的相关信息为例进行步骤S133-S134说明。1、根据第一预设公式计算两人基于身份类信息的第一关系强度因子A。身份类信息包括姓名信息和出生日期信息。姓名信息对应预设的姓分值和名分值。出生日期信息分值对应预设的生日分值。姓分值的取值可设为:若两人的姓相同,则姓分值为26,否则姓分值为25减去两人姓的拼音的首字母在26个字母表中的间隔字母数。例如:两人的姓名拼音为JiangYunFan和TangYuRou,则姓分值为25减去两人姓的拼音的首字母在26个字母表中的间隔字母数10,即姓分值为15。名分值的取值可设为:将两人名的拼音的首字母换算成在26个字母表中排名数,再将排名数中的二位数分别拆成单个数字,将所有单个数字中相同的单个数字相加即为名分值。例如:两人的姓名拼音为JiangYunFan和TangYuRou,两人名的拼音的首字母换算成在26个字母表中排名数分别为25与6、25与18,将四个数字中的二位数分别拆成单个数字2、5与2、5、1、8,再将所有单个数字2、5、6与2、5、1、8中相同的单个数字2、5相加2+5=7,即名分值为7。生日分值的取值可设为:若两人出生日期所对应生肖和星座相同,则生日分值为生肖对应的预设生肖分值和星座对应的预设星座分值;若两人出生日期所对应生肖或星座相同,则生日分值为生肖对应的预设生肖分值或星座对应的预设星座分值;若两人出生日期所对应生肖和星座均不相同,则生日分值为零。例如:两人出生日期分别为1989.4.10和2011.3.30,则两人出生日期所对应生肖均为蛇、对应的星座均为白羊座,且预设生肖分值和预设星座分值均设为10,则生日分值=10+10=20。第一预设公式:第一关系强度因子A=姓名分值+名分值+生日分值=15+7+20=42。2、根据第二预设公式计算两人基于教育经历类信息的第二关系强度因子B。教育经历类信息包括毕业院校和专业,其中,毕业院校对应于相应的办学形式和办学层次,专业对应于相应的学科范围。办学形式对应预设的办学形式分值:若两人的办学形式相同,则办学形式分值为第一预设分值,否则为零。例如:两个的毕业院校都属于985,且第一预设分值设为5,则办学形式分值为5。办学层次对应预设的办学层次分值:若两人的办学层次相同,则办学层次分值为第二预设分值,否则为零。例如:两个的毕业院校都属于普通高等教育,且第二预设分值设为5,则办学层次分值为5。学科范围对应预设的学科范围分值:若两人的学科范围相同,则学科范围分值为第三预设分值,否则为零。例如:两个的专业分别属于财经类和农林类,则办学层次分值为0。第二预设公式:第二关系强度因子B=办学形式分值+办学层次分值+学科范围分值=5+5+0=10。3、根据第三预设公式计算两人基于兴趣爱好类信息的第三关系强度因子C。第三预设公式:第三关系强度因子C=相同的单项兴趣爱好数量×兴趣爱好分值;每一单项兴趣爱好均对应相同的兴趣爱好分值。例如:两人均有游戏类的兴趣爱好,且兴趣爱好分值设为5,则第三关系强度因子C=5。4、根据第四预设公式计算两人基于生活圈类信息的第四关系强度因子D。生活圈类信息包括出生地信息、同类型场所信息和互动信息。出生地信息对应出生地分值,出生地分值是指若两人的出生地中国籍和行政区域是否相同,行政区域包括国籍、州省、城市、县区、镇街道、及村小区,若行政区域中项有相同的项,则出生地分值为相同的项分别对应的第四预设分值之和。当然,在最低行政区域划分等级最低的情况下,还可以补足中间缺失的行政区域,再进行对比以找出其中相同的项。例如:设定同一个国家对应的第四预设分值为1,同一个州省对应的第四预设分值为3,同一个城市对应的第四预设分值为5,同一个县区对应的第四预设分值为8,同一个镇街道对应的第四预设分值为10,同一个村小区对应的第四预设分值为15;若两人一个在陕西省西安市雁塔区科技二路枫林绿洲小区,一个在陕西省西安市临潼区群星莱骊小区,则出生地分值为1+3+5=9。同类型场所信息对应同类型场所分值,同类型场所分值为2l+2m+2n+…+2M,l表示两人在第一个同一类型场所出现的频次,m表示两人在第二个同一类型场所出现的频次,n表示两人在第三个同一类型场所出现的频次,M表示两人在第N个同一类型场所出现的频次。例如:两人一个某高中出现过12次,某商场出现过3次,某菜市场出现过5次;另一个在某大学出现过2次,商场出现过20次,菜市场没出现过,则同类型场所分值为22+23=12。互动信息包括最后一次互动信息;最后一次互动信息包括两人在最后一次互动时的直线距离;最后一次互动信息对应最近互动分值,最近互动分值为10-x200,x是指两人在最后一次互动时的直线距离,x的单位为km。例如:两人在最后一次互动时的直线距离为316公里,最近互动分值为10-x200,结果四舍五入取整数,最近互动分值为8。第四预设公式:第四关系强度因子D=出生地分值+同类型场所分值+最近互动分值=9+12+8=29。5、根据第五预设公式计算两人基于阅读记录类信息的第五关系强度因子E。阅读记录类信息包括阅读内容和阅读内容类型。阅读内容对应内容分值,内容分值是指:若两人在预设时间段内均阅读了同一条内容,则内容分值为将两人阅读同一条内容所花时间中的最少时间换算成秒数后的数值;若两人在预设时间段内均阅读了多个同一条内容,则内容分值为将两人阅读多个同一条内容所花时间中的最少时间换算成秒数且相加后的数值;若两人在预设时间段内均未阅读相同的内容,则内容分值为零。例如:两人在19年2月14日,两个人都浏览了西安年最中国这个数据,一个看了10秒,一个看了1分钟,则内容分值为10。阅读内容类型对应类型分值,类型分值是指若两人在一段时间内阅读的内容所属阅读内容类型最多的该类阅读内容类型相同,则类型分值为第五预设分值,否则类型分值为零分。例如:两人在19年2月,两个人都浏览了阅读的内容所属阅读内容类型最多的均为文学类,且第五预设分值为10,则类型分值为10。第五预设公式:第五关系强度因子E=内容分值+类型分值=10+10=20。6、根据第六预设公式计算两人基于社交通讯类信息的第六关系强度因子F。社交通讯类信息包括联系信息、共同联系人信息、好友信息、聊天信息及表情信息。联系信息对应联系信息分值,联系信息分值是指两人的联系信息是否存储在对方的移动终端,若存在储在对方的移动终端,则联系信息分值为第六预设分值,否则联系信息分值为零分。例如:两人的联系信息均存储在对方的移动终端,且第六预设分值为10,则联系信息分值为10。共同联系人信息对应共同联系人信息分值,共同联系人信息分值是指2×两人的通讯录中共同的电话号码的个数。例如:两人的通讯录中共同的电话号码的个数为1个,则共同联系人信息分值=2×1=2。好友信息对应好友信息分值,好友信息分值是指两人是否为对方社交软件中的好友,若为对方社交软件中的好友,则好友信息分值为第七预设分值,否则好友信息分值为零分。例如:两人均为对方社交软件中的好友,且第七预设分值为10,则好友信息分值为10。聊天信息对应聊天信息分值,聊天信息分值是指两人通过社交软件聊天的时间重合的小时数×5。例如:两人中其中一个在2019年1月20晚上18:20到20:30在聊天,另一个在2019年1月20日19:30到23:05在聊天,则聊天信息分值为5分。表情信息对应表情信息分值,表情信息分值是指两人通过社交软件聊天时使用了相同的表情的个数。例如:两人在聊天时均用了窘迫的表情,一个用了4次,另一个用了1次,则表情信息分值为1。第六预设公式:第六关系强度因子F=联系信息分值+共同联系人信息分值+好友信息分值+聊天信息分值+表情信息分值=10+2+10+5+1=28。S140根据关系强度因子计算两人的契合度,契合度=0.433AB+BC+CD+DE+EF+FA100=0.43342×10+10×5+5×29+29×20+20×28+28×42100=12.69123,A为身份类信息中所有词组的关联系数之和,B为教育经历类信息中所有词组的关联系数之和,C为兴趣爱好类信息中所有词组的关联系数之和,D为生活圈类信息中所有词组的关联系数之和,E为阅读记录类信息中所有词组的关联系数之和,F为社交通讯类信息中所有词组的关联系数之和。在实际使用时,还可以设定契合度的层次:例如,小于60分,说明两人关系强度较浅,不小于60且不大于80,则说明两人关系强度深厚,大于80则说明两人关系强度不可分割。因此,本发明能准确地度量陌生用户间的关系强度,因此,用户之间可以通过讨论个人特征信息的异同点以获知如何度量陌生用户间的关系强度的因素,从而帮助陌生用户寻找话题以缓解聊天气氛。实施例2本发明实施例提供了一种基于个人特征信息的用户契合度的计算装置,如图3所示,包括显示模块A210、获取存储模块A220、处理模块A230、及计算模块A240。显示模块A210,用于显示与个人特征信息相关的问题,所述个人特征信息包括身份类信息、教育经历类信息、兴趣爱好类信息、生活圈类信息、阅读记录类信息及社交通讯类信息。获取存储模块A220,用于获取并存储两人的个人特征信息。如图4所示,获取存储模块A220包括信息提取单元A221和删除单元A222。信息提取单元A221用于当个人特征信息记录在文字文件中时,通过文字提取算法提取文字文件中的文字信息,和或当个人特征信息记录在图片文件中时,通过图像识别算法识别并提取图片中的文字信息,和或当个人特征信息记录在音频文件中时,通过语音识别算法识别并提取音频文件中的文字信息。删除单元A222用于剔除个人特征信息中错误的和或重复的个人特征信息。处理模块A230,用于根据获取的两人的个人特征信息分别生成每人的个人特征信息的类的集合,再分别计算两人个人特征信息中的同一类的集合之间的关系强度因子。如图5所示,处理模块A230包括解析单元A231、分类单元A232、匹配处理单元A233及关联计算单元A234。解析单元A231,用于根据预定义的语义目标分别解析两人的个人特征信息以获得多个单一词组。分类单元A232,用于将每一单一词组分别归类到身份类信息、教育经历类信息、兴趣爱好类信息、生活圈类信息、阅读记录类信息或社交通讯类信息中。匹配处理单元A233,用于将两人同一类信息中的词组分别进行特征匹配,并计算每一词组的关联系数。关联计算单元A234,用于根据每一类信息中所有词组的关联系数计算该类信息的关系强度因子。计算模块A240,用于根据关系强度因子计算两人的契合度。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的模块、相关工作单元和装置的具体工作过程和计算方式,可以参考前述方法实施例中的对应过程和参考示例,在此不再赘述。以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
权利要求:1.一种基于个人特征信息的用户契合度的计算方法,其特征在于,包括如下步骤:显示与个人特征信息相关的问题,所述个人特征信息包括身份类信息、教育经历类信息、兴趣爱好类信息、生活圈类信息、阅读记录类信息及社交通讯类信息;获取并存储两人的个人特征信息;根据两人的个人特征信息分别生成每人的个人特征信息的类的集合,再分别计算两人个人特征信息中的同一类的集合之间的关系强度因子;根据关系强度因子计算两人的契合度。2.根据权利要求1所述的计算方法,其特征在于,所述获取并存储两人的个人特征信息,包括:当所述个人特征信息记录在文字文件中时,通过文字提取算法提取文字文件中的文字信息,和或当所述个人特征信息记录在图片文件中时,通过图像识别算法识别并提取图片中的文字信息,和或当所述个人特征信息记录在音频文件中时,通过语音识别算法识别并提取音频文件中的文字信息。3.根据权利要求1所述的计算方法,其特征在于,所述获取并存储两人的个人特征信息,还包括:剔除个人特征信息中错误的和或重复的个人特征信息。4.根据权利要求1-3任意一项所述的计算方法,其特征在于,所述根据两人的个人特征信息分别生成每人的个人特征信息的类的集合,再分别计算两人个人特征信息中的同一类的集合之间的关系强度因子,是指:根据预定义的语义目标分别解析两人的个人特征信息以获得多个单一词组;将每一单一词组分别归类到身份类信息、教育经历类信息、兴趣爱好类信息、生活圈类信息、阅读记录类信息或社交通讯类信息中;将两人同一类信息中的词组分别进行特征匹配,并计算每一词组的关联系数;根据每一类信息中所有词组的关联系数计算该类信息的关系强度因子。5.根据权利要求4所述的计算方法,其特征在于,每一类信息的关系强度因子是指每一类信息中所有词组的关联系数之和。6.根据权利要求5所述的计算方法,其特征在于,所述契合度=0.433AB+BC+CD+DE+EF+FA100,A为身份类信息中所有词组的关联系数之和,B为教育经历类信息中所有词组的关联系数之和,C为兴趣爱好类信息中所有词组的关联系数之和,D为生活圈类信息中所有词组的关联系数之和,E为阅读记录类信息中所有词组的关联系数之和,F为社交通讯类信息中所有词组的关联系数之和。7.一种基于个人特征信息的用户契合度的计算装置,其特征在于,包括:显示模块,用于显示与个人特征信息相关的问题,所述个人特征信息包括身份类信息、教育经历类信息、兴趣爱好类信息、生活圈类信息、阅读记录类信息及社交通讯类信息;获取存储模块,用于获取并存储两人的个人特征信息;处理模块,用于根据获取的两人的个人特征信息分别生成每人的个人特征信息的类的集合,再分别计算两人个人特征信息中的同一类的集合之间的关系强度因子;计算模块,用于根据关系强度因子计算两人的契合度。8.根据权利要求7所述的计算装置,其特征在于,所述获取存储模块包括信息提取单元;所述信息提取单元用于当所述个人特征信息记录在文字文件中时,通过文字提取算法提取文字文件中的文字信息,和或当所述个人特征信息记录在图片文件中时,通过图像识别算法识别并提取图片中的文字信息,和或当所述个人特征信息记录在音频文件中时,通过语音识别算法识别并提取音频文件中的文字信息。9.根据权利要求7所述的计算装置,其特征在于,所述获取存储模块还包括删除单元;所述删除单元用于剔除个人特征信息中错误的和或重复的个人特征信息。10.根据权利要求7-9任意一项所述的计算装置,其特征在于,所述处理模块包括解析单元、分类单元、匹配处理单元及关联计算单元;所述解析单元,用于根据预定义的语义目标分别解析两人的个人特征信息以获得多个单一词组;所述分类单元,用于将每一单一词组分别归类到身份类信息、教育经历类信息、兴趣爱好类信息、生活圈类信息、阅读记录类信息或社交通讯类信息中;所述匹配处理单元,用于将两人同一类信息中的词组分别进行特征匹配,并计算每一词组的关联系数;所述关联计算单元,用于根据每一类信息中所有词组的关联系数计算该类信息的关系强度因子。
百度查询: 西咸新区心灯软件科技有限公司 一种基于个人特征信息的用户契合度的计算方法和装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。