买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:央广智能网联汽车数字媒体(上海)有限公司
摘要:本发明公开了一种用于车载场景下的流式收听音频内容的推荐系统,该系统包含实时数据收集子系统、离线模型训练子系统和在线内容投放子系统;实时数据收集子系统收集相关信息,录入到存储系统,离线模型训练子系统根据录入存储系统的原始数据,计算离线模型数据,最后由在线内容投放子系统根据离线模型数据进行投放。本发明提供的用于车载场景下的流式收听音频内容的推荐系统,解决了车载场景下,用户主动行为数据稀疏的问题;采用电台模式,流式收听,减少了对驾驶员的影响;而且融合了汽车信息和场景信息,使得推荐出来的音频内容更符合车载特性。
主权项:1.一种用于车载场景下的流式收听音频内容的推荐系统,配合客户端、服务器、本地文件系统以及存储系统使用,其特征在于,所述的推荐系统包含实时数据收集子系统、离线模型训练子系统和在线内容投放子系统;所述的实时数据收集子系统收集相关信息,录入到存储系统,离线模型训练子系统根据录入存储系统的原始数据,计算离线模型数据,最后由在线内容投放子系统根据离线模型数据进行投放;所述的相关信息包含用户行为数据、汽车信息、场景信息;所述的离线模型训练子系统的运行过程包含候选集生成和候选集排序两个环节,候选集生成分为用户主动行为和离线模型计算,候选集排序是计算用户对候选集喜欢的程度;所述的离线模型计算是离线模型训练子系统通过算法分析数据,从而得出用户会喜欢的内容标签,数据包含用户信息、用户行为、汽车信息和场景信息;离线模型计算由追剧、用户画像、用户属性推荐、热门内容四部分组成;所述的用户画像是首先获取用户行为数据和音频信息,再由离线模型训练子系统将两类数据根据音频唯一标示,进行关联,然后按照每个用户进行分组,计算每个用户的用户画像,通过用户标签权重=行为类型权重*时间衰减*TF-IDF,计算得到每个用户身上的标签权重*行为次数;用户行为数据包含音频收听时长、订阅、点击播单列表、搜索点击、专辑点播、下一首、负反馈;音频信息包含时长、所属专辑、专辑的标签、所属分类;用户画像标签权重的公式为:normWbehavior*Ft*C*TF*IDF,其中行为类型权重Wbehavior{订阅:5,播放列表点击:1.4*R,搜索:1.3*R,专辑点播:1.2*R,下一首:1*R,负反馈:0.1},专辑完播率R=∑PlayTimeaudio∑Durationaudio;时间衰减Ft=max1,1*e-0.8*max0,now-playtime24*3600,now为当前时间,playtime为行为发生的时间,单位ms;行为次数C,按天计算,是同一种行为类型针对同一个专辑的次数;标签重要性TF计算式的分子表示某标签在用户上出现的次数,分母表示用户标签总数,IDF计算式的幂的分子表示用户总数,分母表示包含某标签的用户数+1。
全文数据:
权利要求:
百度查询: 央广智能网联汽车数字媒体(上海)有限公司 一种用于车载场景下的流式收听音频内容的推荐系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。