买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:腾讯科技(深圳)有限公司
摘要:本申请提供了一种文章特征生成方法、装置、设备和存储介质,获得文章的评论;将评论分别输入到至少一种特征评价维度的特征分类器,得到评论分别在各个特征评价维度上的特征类型;针对每种特征评价维度,依据文章已有的至少一条评论以及每条评论分别在各特征评价维度上的特征类型,确定文章在特征评价维度的各特征类型上的评论分布情况;将文章在至少一种特征评价维度上各自的评论分布情况存储为文章的文章特征。本申请的方案可以实现基于文章的评论数据提取文章的文章特征,从而可以扩充用于描述文章画像的文章特征。
主权项:1.一种文章特征生成方法,其特征在于,包括:获得文章的评论;获得所述评论的基础属性信息;所述评论的基础属性信息包括评论长度、评论来源、发表评论的用户以及所述用户的特征;依据所述评论与所述文章已有的其他评论,构建包含多个评论之间父子关系的评论关系树;将所述评论分别输入到多种特征评价维度的特征分类器,得到所述评论分别在各个特征评价维度上的特征类型,其中,每种特征评价维度包括多种不同的特征类型,每种特征评价维度的特征分类器为利用标注有该特征评价维度上的特征类型的多个文章评论样本训练得到的;针对每种特征评价维度,依据所述文章已有的至少一条评论以及每条评论分别在各特征评价维度上的特征类型,确定所述文章在所述特征评价维度的各特征类型上的评论分布情况;将所述文章在所述多种特征评价维度上各自的所述评论分布情况存储为所述文章的文章特征;将所述评论的基础属性信息和所述评论关系树存储为所述文章的文章特征;其中,所述多种特征评价维度包括:属于分析低质量特征的特征评价维度,具体包括:广告识别、谩骂识别、低俗识别与骗赞识别;属于分析情感倾向特征的特征评价维度,具体包括:评论表达出的情感倾向、对文章的表态倾向以及子评论对父评论的表态倾向;属于分析负反馈特征的特征评价维度,具体包括:对文章的负反馈和对作者的负反馈。
全文数据:
权利要求:
百度查询: 腾讯科技(深圳)有限公司 文章特征生成方法、装置、设备和存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。