首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于计算机数据处理的文学偏好内容推荐方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:济宁职业技术学院;山东理工职业学院

摘要:本发明涉及内容推荐技术领域,具体涉及一种基于计算机数据处理的文学偏好内容推荐方法及系统。首先,获取用户对文学关键词的行为数据,进而进行聚类分析,获得聚类簇。为更准确地反映用户偏好,进一步分析每个聚类簇的特征,包括关键词数量分布、行为数据分布混乱度得到簇内差异度,由于聚类簇的离群情况也可表征出用户的兴趣偏好,所以将簇内差异度结合聚类簇间的位置关系,得到离群程度值。同时,基于异常检测算法计算每个关键词的异常得分。最后,结合异常得分和离群程度值调整关键词对应的文学内容的推荐数量,获得更符合用户偏好的最终推荐数量。此方法能更精准、合理地为用户推荐文学内容,提高推荐效果。

主权项:1.一种基于计算机数据处理的文学偏好内容推荐方法,其特征在于,所述方法包括:获取待分析用户对每个文学关键词浏览时的预设第一数量种行为数据;根据所述行为数据对所有关键词进行聚类分析,得到聚类簇;在每个聚类簇中,根据关键词的数量分布以及所有关键词的行为数据的分布混乱情况,得到每个聚类簇的簇内差异度;根据每个聚类簇与其他聚类簇之间的关键词的位置关系以及簇内差异度的差异情况,获得每个聚类簇的离群程度值;基于异常检测算法获取每个聚类簇中每个关键词的异常得分;在每个聚类簇中,根据每个关键词的异常得分以及聚类簇的离群程度值,对关键词对应的文学内容的预设推荐数量进行调整,获得文学内容的最终推荐数量;根据所有关键词对应的文学内容的最终推荐数量以及关键词的行为数据对待分析用户进行文学内容推荐;所述在每个聚类簇中,根据关键词的数量分布以及所有关键词的行为数据的分布混乱情况,得到每个聚类簇的簇内差异度,包括:任选一种行为数据作为待测数据,在每个聚类簇中,将不同的关键词进行两两组合,得到所有关键词组合,并计算每个关键词组合中两个关键词在待测数据下的差异,作为差异因子;将聚类簇中的所有关键词组合在待测数据下的差异因子的均值作为平均差异值;计算聚类簇中每个关键词与聚类中心之间的待测数据的差异,作为差异参数;根据每个关键词在待测数据下对应的差异参数以及所述平均差异值,获得对应关键词在待测数据下的差异度因子,所述差异度因子与差异参数呈正相关,所述差异度因子与所述平均差异值呈负相关;计算每个关键词的所有种类行为数据的差异度因子的和值,作为对应关键词的波动特征值;将聚类簇中所有关键词的波动特征值的均值作为均值特征值,将聚类簇中包含的关键词的数量进行归一化后的值与所述均值特征值的和值作为聚类簇的簇内差异度;所述预设第一数量设置为2;所述根据所述行为数据对所有关键词进行聚类分析,得到聚类簇,包括:根据每个关键词的所有种行为数据得到每个关键词的坐标并将每个关键词作为一个数据点映射到二维坐标系中;基于手肘法根据所有关键词的行为数据获取所有关键词聚类时的最优K值;基于K-means聚类算法根据所述最优K值对所有关键词进行聚类分析,得到聚类簇,其中,距离度量为关键词的行为数据之间的欧式距离;所述根据每个聚类簇与其他聚类簇之间的关键词的位置关系以及簇内差异度的差异情况,获得每个聚类簇的离群程度值,包括:任选一个聚类簇作为待测聚类簇;根据待测聚类簇与其他聚类簇之间的关键词的位置关系获得待测聚类簇的离群因子;计算待测聚类簇的簇内差异度与其他所有聚类簇的簇内差异度的差异的均值,得到差异均值,将待测聚类簇的所述差异均值进行归一化后的值与对应的所述离群因子的乘积作为待测聚类簇的离群程度值;所述根据待测聚类簇与其他聚类簇之间的关键词的位置关系获得待测聚类簇的离群因子,包括:在待测聚类簇中,任选一个关键词对应的数据点作为待测数据点;将与待测数据点距离最近的预设第二数量个数据点作为待测数据点的临近数据点,将与待测数据点距离最近的预设第三数量个数据点作为待测数据点的邻域数据点,所述预设第二数量等于待测聚类簇中的关键词总数,所述预设第三数量为小于待测聚类簇中关键词总数的正整数;将待测数据点与距离最远的临近数据点之间的线段作为半径,以待测数据点为圆心,所得圆形区域的面积作为待测数据点对应的关键词的扩张面积值,将待测数据点与距离最远的邻域数据点之间的线段作为半径,以待测数据点为圆心,所得圆形区域的面积作为待测数据点对应的关键词的初始面积值;将待测聚类簇中所有关键词对应的扩张面积值均值与初始面积值均值的差异作为待测聚类簇的离群因子。

全文数据:

权利要求:

百度查询: 济宁职业技术学院 山东理工职业学院 基于计算机数据处理的文学偏好内容推荐方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。