买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京大学
摘要:本发明涉及一种基于非随机缺失数据处理结局测量误差的推荐方法和系统,属于物品推荐技术领域,解决了现有技术在收集到的数据同时具有MNAR和OME时推荐准确性低的问题。方法包括以下步骤:获取用户数据、物品数据,以及观测到的用户对物品的评分,构建训练样本集;构建噪声预测模型,基于训练样本集训练噪声预测模型;构建去噪误差插补模型和去噪预测模型,基于所述训练样本集和训练好的噪声预测模型对所述去噪误差插补模型和去噪预测模型进行联合训练,得到训练好的去噪预测模型;基于训练好的去噪预测模型对未观测到的用户对物品的评分进行去噪预测,基于用户对物品的评分进行推荐。实现了同时具有MNAR和OME时的准确推荐。
主权项:1.一种基于非随机缺失数据处理结局测量误差的推荐方法,其特征在于,包括以下步骤:获取用户数据、物品数据,以及观测到的用户对物品的评分,构建训练样本集;构建噪声预测模型,基于训练样本集训练噪声预测模型;构建去噪误差插补模型和去噪预测模型,基于所述训练样本集和训练好的噪声预测模型对所述去噪误差插补模型和去噪预测模型进行联合训练,得到训练好的去噪预测模型;基于训练好的去噪预测模型对未观测到的用户对物品的评分进行去噪预测,基于用户对物品的评分进行推荐;噪声预测模型用于基于用户-物品对的特征预测用户对物品评分为正向评分的概率;采用以下公式计算去噪预测模型的损失: 其中,表示当前训练批次的用户-物品对,表示当前训练批次的用户-物品对的数量,ru,i表示观察到的第u个用户对第i个物品的评分,ou,i表示是否观测到第u个用户对第i个物品的评分,表示预测的观测到第u个用户对第i个物品的评分的概率,xu,i表示第u个用户和第i个物品构成的用户-物品对的特征,fθxu,i表示去噪预测模型预测的第u个用户对第i个物品的评分,l·,·表示损失函数,ρ10表示假阳性率,ρ01表示假阴性率,表示去噪误差插补模型的插补误差;采用以下公式计算去噪误差插补模型的损失: 其中,表示去噪误差插补模型的插补误差,表示代理损失,表示预测的观测到第u个用户对第i个物品的评分的概率,表示当前训练批次的用户-物品对,表示当前训练批次的用户-物品对的数量,ou,i表示是否观测到第u个用户对第i个物品的评分;采用以下公式计算代理损失: 其中,ru,i表示观察到的第u个用户对第i个物品的评分,xu,i表示第u个用户和第i个物品构成的用户-物品对的特征,fθxu,i表示去噪预测模型预测的第u个用户对第i个物品的评分,l·,·表示损失函数,ρ10表示假阳性率,ρ01表示假阴性率,表示去噪误差插补模型的插补误差。
全文数据:
权利要求:
百度查询: 北京大学 基于非随机缺失数据处理结局测量误差的推荐方法和系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。