首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于大语言模型的分层众包标注方法 

申请/专利权人:深圳大学;香港科技大学(广州)

申请日:2024-03-11

公开(公告)日:2024-06-28

公开(公告)号:CN118260591A

主分类号:G06F18/214

分类号:G06F18/214

优先权:

专利状态码:在审-公开

法律状态:2024.06.28#公开

摘要:本发明公开了一种基于大语言模型的分层众包标注方法。该方法包括:获取数据集,所述数据集包含未标注标签;利用开源的语言模型的效用作为众包标注者,独立地为所述数据集提供标签,并采用设定的聚合策略合并标签,获得初步标注的数据集;调用大语言模型对所述初步标注的数据集进行重新标注,获得重新标注数据集,该重新标注过程包括重新标注任务选择、答案收集和标签分布更新的循环序列,直到满足设定的预算约束。本发明提供了层次结构框架,通过多个语言模型的协同工作和标签分布更新,实现了有限资源下对数据进行高效标注,并提升了标注质量。

主权项:1.一种基于大语言模型的分层众包标注方法,包括以下步骤:获取数据集,所述数据集包含未标注标签;利用开源的语言模型的效用作为众包标注者,独立地为所述数据集提供标签,并采用设定的聚合策略合并标签,获得初步标注的数据集;调用大语言模型对所述初步标注的数据集进行重新标注,获得重新标注数据集,该重新标注过程包括重新标注任务选择、答案收集和标签分布更新的循环序列,直到满足设定的预算约束。

全文数据:

权利要求:

百度查询: 深圳大学;香港科技大学(广州) 一种基于大语言模型的分层众包标注方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。