买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:王海泉
摘要:本发明提供了一种关联词调整方法及调整系统,该关联词调整方法通过设置多个关键词库,且将关键词库中的核心词和多个原始关键词赋予原始权重,并记录各关键词库中的各核心词和原始关键词的使用次数;可获取文章资源后查找文章资源给出的关键词集合包含的多个按顺序排列的关键词;还可依据首个关键词查找与核心词的关联度大于预设关联度阈值的关键词库;而将各关键词加入到查找到的关键词库中;并依据首个关键词和核心词的关联度,按各关键词的排列顺序,由高到低的顺次赋予各关键词权重。本发明的关联词调整方法,通过设置关键词库,在关键词库中不断增加关键词并赋予新增加的关键词权重,可使搜索工作快速高效,方便使用。
主权项:1.一种关联词调整方法,其特征在于该方法包括:设置多个关键词库,各所述关键词库中包含有与一核心词相互关联的原始关键词,所述核心词和多个所述原始关键词被赋予原始权重,并记录各所述关键词库中的各所述核心词和所述原始关键词的使用次数;获取文章资源;在所述文章资源中,查找所述文章资源给出的关键词集合,所述关键词集合中包含有多个按顺序排列的关键词;依据所述关键词集合中的首个所述关键词,查找与各所述关键词库中包含的所述核心词的关联度大于预设关联度阈值的所述关键词库;将所述关键词集合中的各所述关键词,加入到查找到的所述关键词库中;并依据该所述关键词集合的首个所述关键词和该所述关键词库中的所述核心词的关联度,按所述关键词集合中的各所述关键词的排列顺序,由高到低的顺次赋予所述关键词集合中的各所述关键词的权重。
全文数据:关联词调整方法及调整系统技术领域[0001]本发明涉及计算机技术领域,尤其涉及一种关联词调整方法,以及基于该方法下的关联词调整系统。背景技术[0002]随着互联网的迅猛发展、WEB信息的增加,移动互联网、物联网、人工智能、大数据、区块链等各种场景,使得信息越来越多,但是信息之间的关联度越来越差,用户要在信息海洋里查找自己所需的信息,就像大海捞针一样,用户面临的不是查找不到信息,而是干扰信息过多,找不到真正想要的信息。搜索系统和推荐系统的出现恰好解决了这一难题。它可以为用户提供智能、准确的信息检索服务,使用户真正搜索到想要的信息。[0003]然而,目前各行各业的推荐系统、搜索系统基本上都是基于关键词直接查询到结果或者基于用户行为找到不同词之间的关联关系,这种传统的方法只能满足简单的应用场景和基于大数据的分析才能实现。[0004]百度就是明显的基于关键词的搜索系统,但是其搜索出来的结果必须和输入的关键词匹配才可以。此外,基于用户行为分析的推荐算法必须基于海量的数据积累以及算法的训练,对于很多公司来说有很高的门槛,不能快速在企业达到效果。[0005]例如,用户输入腾讯,用户想要知道的结果肯定包括QQ、微信、企鹅等和这个词关联的信息,然而现有的搜索系统和推荐系统只会将和腾讯相关的内容推荐给客户,难以满足客户的需求。发明内容[0006]有鉴于此,本发明旨在提出一种关联词调整方法,以可使搜索工作更加快速且有效。[0007]为达到上述目的,本发明的技术方案是这样实现的:[0008]—种关联词调整方法,该方法包括:[0009]设置多个关键词库,各所述关键词库中包含有与一核心词相互关联的原始关键词,所述核心词和多个所述原始关键词被赋予原始权重,并记录各所述关键词库中的各所述核心词和所述原始关键词的使用次数;[0010]获取文章资源;[0011]在所述文章资源中,查找所述文章资源给出的关键词集合,所述关键词集合中包含有多个按顺序排列的关键词;[0012]依据所述关键词集合中的首个所述关键词,查找与各所述关键词库中包含的所述核心词的关联度大于预设关联度阈值的所述关键词库;[0013]将所述关键词集合中的各所述关键词,加入到查找到的所述关键词库中;并依据该所述关键词集合的首个所述关键词和该所述关键词库中的所述核心词的关联度,按所述关键词集合中的各所述关键词的排列顺序,由高到低的顺次赋予所述关键词集合中的各所述关键词的权重。[0014]进一步的,还包括调整步骤:依据各所述原始关键词、所述核心词以及补入的各所述关键词的使用次数,动态调整各所述原始关键词、所述核心词以及补入的各所述关键词的权重。[0015]进一步的,依据所述关键词集合中的首个所述关键词,查找与各所述关键词库中包含的所述核心词的关联度大于预设关联度阈值的所述关键词库时,是依据所述关键词集合中的首个所述关键词,查找该首个所述关键词对应的所述关键词库中的所述原始关键词,以查找到的所述原始关键词和所述核心词的关联度作为首个所述关键词和所述核心词的关联度。[0016]进一步的,将所述关键词集合中的各所述关键词,加入到查找到的所述关键词库中时,以查找到的所述原始关键词的权重,作为补入到所述关键词中的首个所述关键词的权重。[0017]进一步的,首个所述关键词和所述核心词的关联度=aIa-bI;[0018]其中,a为首个所述关键词对应的所述关键词库中的所述原始关键词的权重;[0019]b为核心词的权重。[0020]本发明的关联词调整方法,通过设置关键词库,在关键词库中不断增加关键词并赋予新增加的关键词权重,可以使搜索工作快速高效,方便使用。[0021]此外,本发明的关键词调整方法,适用于当今社会网络信息繁杂、不断变化的情况,其可随着社会热点的出现而动态调整关键词库,并且这种关联关系及动态调整过程是自动维护的,使用户可以在最少的时间内获得最有效的信息,节约用户时间,方便用户使用。[0022]此外,本发明同时提供一种关联词调整系统,包括:[0023]存储模块,用于存储多个关键词库,各所述关键词库中包含有与一核心词相互关联的原始关键词,所述核心词和多个所述原始关键词被赋予原始权重,并记录各所述关键词库中的各所述核心词和所述原始关键词的使用次数;[0024]获取模块,用于获取网络发布的文章资源;[0025]查找模块,查找所述文章资源给出的关键词集合,所述关键词集合中包含有多个按顺序排列的关键词;[0026]计算单元,依据所述关键词集合中的首个所述关键词,计算与各所述关键词库中包含的所述核心词的关联度大于预设关联度阈值的所述关键词库;[0027]添加模块,用于将所述关键词集合中的各所述关键词,加入到查找到的所述关键词库中;并依据该所述关键词集合的首个所述关键词和该所述关键词库中的所述核心词的关联度,按所述关键词集合中的各所述关键词的排列顺序,由高到低的顺次赋予所述关键词集合中的各所述关键词的权重。[0028]进一步的,还包括:[0029]记录模块,用于记录各所述原始关键词、所述核心词以及补入的各所述关键词的使用次数,以动态调整各所述原始关键词、所述核心词以及补入的各所述关键词的权重。[0030]本发明所述的关联词调整系统,可以将前述的关键词调整方法形成模块化结构,使得搜索工作更加简单。具体实施方式[0031]需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。[0032]下面将结合实施例来详细说明本发明。[0033]本实施例涉及一种关联词调整方法,该方法包括设置多个关键词库,各关键词库中包含有与一核心词相互关联的原始关键词,核心词和多个原始关键词被赋予原始权重,并记录各关键词库中的各核心词和原始关键词的使用次数。其中,权重可以采用分数计算,其代表原始关键词与核心词之间的关联度,10分是强关联,1分是弱关联。[0034]例如,其一关键词库中,核心词是“腾讯”,权重是10,使用次数为100,然后原始关键词1为“微信”,对应的权重是9,使用次数为20,原始关键词2为“QQ”,权重是8,使用次数为30等;[0035]再如,另一关键词库中,核心词是“麻省理工”,权重是10,使用次数为100,然后原始关键词1为“MIT”,对应的权重是10,使用次数为90,原始关键词2为“名校”,权重是5,使用次数为50等;[0036]以上两个例子,可综合列表如表1所示。[0037]表1关键词库中核心词和原始关键词权重及使用次数[0038][0039]为了使用户快速准确的得到需求的信息,本发明的关键词调整方法还包括通过获取文章资源,如网页文章、论文、期刊、博客、微博等中的关键词,动态的扩充关键词库的方法。[0040]比如,网页文章都有该文章的多个关健词,一般都是按照和文章的关联度进行排序。论文中也有关键词,关键词的选取也是按照和文章内容的关联度进行排序。可以获取不同类型文章资源的关键词,基本认为同一个文章资源中的关键词是高度相关的,并且可以配置默认第二个关键词,第三个关键词等的权重,这样就能实现动态的扩充关键词库和设置权重。[0041]具体来讲,可通过获取文章资源,在文章资源中,查找文章资源给出的关键词集合,关键词集合中包含有多个按顺序排列的关键词;依据关键词集合中的首个关键词,查找与各关键词库中包含的核心词的关联度大于预设关联度阈值的关键词库;将关键词集合中的各关键词,加入到查找到的关键词库中;并依据该关键词集合的首个关键词和该关键词库中的核心词的关联度,按关键词集合中的各关键词的排列顺序,由高到低的顺次赋予关键词集合中的各关键词的权重。[0042]以一篇文章资源为例,如果文章资源的关键字是腾讯、QQ、王者荣耀。则根据“腾讯”、“QQ”这两个关键词,可知将“王者荣耀”加入到核心词是“腾讯”的关键词库中。这样就动态的扩充了关键词库。结果如下表所示:[0043]表2动态扩充关键词库后关键词库中核心词和原始关键词权重及使用次数[0044][0045]以上方法中,首个关键词和核心词的关联度可采用如下公式计算:[0046]aIa-b|;[0047]其中,a为首个关键词对应的关键词库中的原始关键词的权重;b为核心词的权重。[0048]本实施例中,不同文章中有相同关键词,则认为两篇文章关联度比较大,则可以将关键词补充到对应的关键词库中。例如,第一篇文章的关键词是“腾讯”、“企鹅”;第二篇文章的关键词是“QQ"、“ICQ"“即时通讯”;因为第一篇文章的“腾讯”和第二篇文章的“QQ”在同一个关键词库中;则“腾讯”、“企鹳”、“QQ”、“ICQ"、“即时通讯”这几个词属于同一类,并入到关键词库中。[0049]此外,本实施例中,依据关键词集合中的首个关键词,查找与各关键词库中包含的核心词的关联度大于预设关联度阈值的关键词库时,是依据关键词集合中的首个关键词,查找该首个关键词对应的关键词库中的原始关键词,以查找到的原始关键词和核心词的关联度作为首个关键词和核心词的关联度。[0050]另外,将关键词集合中的各关键词,加入到查找到的关键词库中时,以查找到的原始关键词的权重,作为补入到关键词中的首个关键词的权重。[0051]举例来讲,比如预设关联度阈值为3,获取的某一文章资源的查找到的关键词依次为“微信”、“聊天软件”和“支付软件”,其中首个关键词为“微信”,“微信”在其对应的关键词库中的权重是8,其与核心词的关联度为8I8-10I=4,而4大于3,则将“聊天软件”和“支付软件”增加到含有“微信”的关键词库中,并将“聊天软件”和“支付软件”这两个关键词顺次赋予权重,由于“微信”的权重是8,则“聊天软件”和“支付软件”的权重分别是7和6。[0052]为了进一步提高用户搜索工作的快速有效性,本发明的关键词调整方法还包括动态权重调整步骤:依据各原始关键词、核心词以及补入的各关键词的使用次数,动态调整各原始关键词、核心词以及补入的各关键词的权重。[0053]使用次数的记录可以基于用户输入或点击。比如,用户是通过点击使用词语,则记录用户点击当前词语的次数。在用户使用词语“腾讯”的时候,出来的会是“腾讯”、“微信”、“QQ”等内容,如果20个用户点击“微信”,则记录微信的使用次数是20;如果30个用户点击“QQ”,则记录“QQ”的使用次数是30。[0054]记录用户点击量之后,采用冒泡排序法将当前词语和前一个词语的点击量进行排序,如果当前词语点击次数〉前一个词语的点击次数,则将两个词的权重互换。例如,“QQ”的点击量是30,“微信”的点击量是20,“QQ〃比“微信”的点击量大,则应将“QQ”和“微信”的权重互换,所以此时“QQ”的权重变成9,“微信”的权重变成8,动态变化之后,结果如下表所示:[0055]表3动态调整权重后关键词库中核心词和原始关键词权重及使用次数[0056][0057]以上方法中,通过对关键词库中核心词和原始关键词的权重进行动态调整,可根据社会热点的变换而对词库进行动态调整,有利于用户快速高效的得到需要的信息。[0058]本发明的关联词调整方法,可使搜索和推荐系统基于关键词库中的词语进行搜索和推荐,而非基于海量的互联网信息,通过设置关键词库,并根据用户搜索内容,在关键词库中不断增加关键词并赋予新增加的关键词权重,可以使搜索工作快速高效,方便使用。[0059]此外,本发明的关键词调整方法,适用于当今社会网络信息繁杂、不断变化的情况,其可随着社会热点的出现而动态调整关键词库,并且这种关联关系及动态调整过程是自动维护的,使用户可以在最少的时间内获得最有效的信息,节约用户时间,方便用户使用。[0060]同时,本实施例还涉及一种关联词调整系统,主要包括存储模块、获取模块、查找模块、计算单元和添加模块。[0061]其中:[0062]存储模块用于存储多个关键词库,各关键词库中包含有与一核心词相互关联的原始关键词,核心词和多个原始关键词被赋予原始权重,并记录各关键词库中的各核心词和原始关键词的使用次数;[0063]获取模块用于获取网络发布的文章资源。[0064]查找模块用于查找文章资源给出的关键词集合,关键词集合中包含有多个按顺序排列的关键词。[0065]计算单元用于依据关键词集合中的首个关键词,计算与各关键词库中包含的核心词的关联度大于预设关联度阈值的关键词库。[0066]添加模块用于将关键词集合中的各关键词,加入到查找到的关键词库中;并依据该关键词集合的首个关键词和该关键词库中的核心词的关联度,按关键词集合中的各关键词的排列顺序,由高到低的顺次赋予关键词集合中的各关键词的权重。[0067]本实施例的关联词调整系统,还包括记录模块,用于记录各原始关键词、核心词以及补入的各关键词的使用次数,以动态调整各原始关键词、核心词以及补入的各关键词的权重。[0068]本发明的关联词调整系统,可以将前述的关键词调整方法形成模块化结构,使得搜索工作更加简单。[0069]以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
权利要求:1.一种关联词调整方法,其特征在于该方法包括:设置多个关键词库,各所述关键词库中包含有与一核心词相互关联的原始关键词,所述核心词和多个所述原始关键词被赋予原始权重,并记录各所述关键词库中的各所述核心词和所述原始关键词的使用次数;获取文章资源;在所述文章资源中,查找所述文章资源给出的关键词集合,所述关键词集合中包含有多个按顺序排列的关键词;依据所述关键词集合中的首个所述关键词,查找与各所述关键词库中包含的所述核心词的关联度大于预设关联度阈值的所述关键词库;将所述关键词集合中的各所述关键词,加入到查找到的所述关键词库中;并依据该所述关键词集合的首个所述关键词和该所述关键词库中的所述核心词的关联度,按所述关键词集合中的各所述关键词的排列顺序,由高到低的顺次赋予所述关键词集合中的各所述关键词的权重。2.根据权利要求1所述的关联词调整方法,其特征在于还包括调整步骤:依据各所述原始关键词、所述核心词以及补入的各所述关键词的使用次数,动态调整各所述原始关键词、所述核心词以及补入的各所述关键词的权重。3.根据权利要求1所述的关联词调整方法,其特征在于:依据所述关键词集合中的首个所述关键词,查找与各所述关键词库中包含的所述核心词的关联度大于预设关联度阈值的所述关键词库时,是依据所述关键词集合中的首个所述关键词,查找该首个所述关键词对应的所述关键词库中的所述原始关键词,以查找到的所述原始关键词和所述核心词的关联度作为首个所述关键词和所述核心词的关联度。4.根据权利要求3所述的关联词调整方法,其特征在于:将所述关键词集合中的各所述关键词,加入到查找到的所述关键词库中时,以查找到的所述原始关键词的权重,作为补入到所述关键词中的首个所述关键词的权重。5.根据权利要求3所述的关联词调整方法,其特征在于:首个所述关键词和所述核心词的关联度=a|a_b|;其中,a为首个所述关键词对应的所述关键词库中的所述原始关键词的权重;b为核心词的权重。6.—种关联词调整系统,其特征在于包括:存储模块,用于存储多个关键词库,各所述关键词库中包含有与一核心词相互关联的原始关键词,所述核心词和多个所述原始关键词被赋予原始权重,并记录各所述关键词库中的各所述核心词和所述原始关键词的使用次数;获取模块,用于获取网络发布的资源;查找模块,查找所述文章资源给出的关键词集合,所述关键词集合中包含有多个按顺序排列的关键词;计算单元,依据所述关键词集合中的首个所述关键词,计算与各所述关键词库中包含的所述核心词的关联度大于预设关联度阈值的所述关键词库;添加模块,用于将所述关键词集合中的各所述关键词,加入到查找到的所述关键词库中;并依据该所述关键词集合的首个所述关键词和该所述关键词库中的所述核心词的关联度,按所述关键词集合中的各所述关键词的排列顺序,由高到低的顺次赋予所述关键词集合中的各所述关键词的权重。7.根据权利要求6所述的关联词调整系统,其特征在于还包括:记录模块,用于记录各所述原始关键词、所述核心词以及补入的各所述关键词的使用次数,以动态调整各所述原始关键词、所述核心词以及补入的各所述关键词的权重。
百度查询: 王海泉 关联词调整方法及调整系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。