买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:成都易书桥科技有限公司
摘要:本发明公开来了一种利用外积的众包任务推荐算法,为众包中工人推荐任务。本发明根据众包场景较主流场景的特殊性,在改进传统基于物品的协同过滤神经网络算法的基础上,设计了一种利用外积的注意力机制。该模型针对众包场景下任务的时效性和多角色用户,分别提出众包任务属性级的特征学习方式以及带强弱负样本带权交叉熵,提出引入任务发布方序列的两种方式。该模型还提出一种外积注意力机制,为用户序列分配重要性权重。针对众包场景改进的协同过滤算法和外积注意力共同组成本发明的众包任务推荐算法,该算法在二分类指标上超过改进前的协同过滤神经网络算法,在二分类指标和推荐列表指标超过利用内积的注意力机制,并且时间消耗在可接受范围内。
主权项:1.利用外积注意力的众包任务推荐方法,其特征在于:首先通过众包任务中的属性级学习方式学习任务特征,随后引入众包角色发布方利用基于物品协同过滤思想学习发布方和工人特征,随后将任务、发布方和工人特征输入外积注意力机制,最后利用引入带强弱负样本的交叉熵损失函数对工人能否中标进行预测;具体做法是:第一步,对用于特征学习的输入数据进行预处理;将任务形式和任务分类作为类别型特征,以整数0-N,以及0-M标识,其中N为任务形式类别数,M为任务分类类别数;将报酬总额除以参与中威客中标人数得到单人赏金,单人赏金为数值型特征,进行分桶处理后映射到0-40;将发布方id、工人id、任务id转换成数字id后转换成one-hot编码;将任务形式和任务分类也转换成数字编号,将任务名称作为文本型特征,使用中文分词工具JIEBA进行分词,将任务名称拆分成许多独立个体的词,这样能够方便后面将词转化成向量;分词后去除停用词;使用Word2vec模型预训练了词向量;在得到词向量后,将标题中分好词的词向量拼接后,得到标题的输入矩阵;对拼接后词向量长度不够的补0到最大长度;第二步,用第一步中预处理完成的输入特征通过属性级任务特征学习方式学习任务特征,用工人中标过任务特征表示工人特征,用发布方发布过的任务特征组成发布方特征;第三步,将第二步中得到的任务、工人和发布方特征输入特征融合模块,将经特征融合后的工人和发布方特征输入外积注意力机制,外积注意力机制输出分配过注意力权重的工人和发布方序列特征;第四步,将第三步中分配过注意力权重的工人和发布方序列特征分别相加后,得到工人和发布方特征作为预测模块的输入,训练时以改进后的带权交叉熵作为损失函数,预测工人的投标行为能否中标,得到预测分数;第五步,用第四步得到的预测分数按降序生成推荐列表。
全文数据:
权利要求:
百度查询: 成都易书桥科技有限公司 利用外积注意力的众包任务推荐方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。