首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于众包的文本类数据标定任务的自动审核方法 

申请/专利权人:深圳莫比嗨客树莓派智能机器人有限公司

申请日:2020-05-19

公开(公告)日:2024-07-02

公开(公告)号:CN111667152B

主分类号:G06Q10/0639

分类号:G06Q10/0639;G06F16/33;G06F16/35

优先权:

专利状态码:有效-授权

法律状态:2024.07.02#授权;2021.01.05#专利申请权的转移;2020.12.11#实质审查的生效;2020.09.15#公开

摘要:本发明提供一种基于众包的文本类数据标定任务的自动审核方法,包括:S1:确定待标定文本任务集、众包工人对待标定文本任务集的标定质量的阈值及公共待标定文本任务项;S2:定义待标定文本任务集中待标定文本任务项的标定类别,执行步骤S4;未定义待标定文本任务集中待标定文本任务项的标定类别,执行步骤S3;S3:利用公共待标定文本任务项计算标定类别;S4:根据众包工人的标定结果计算众包工人对待标定文本任务集的标定质量,并与阈值进行比较,并判断众包工人的标定结果是否审核通过;本发明自动审核众包工人对文本数据的标定结果,极大缓解审核人员对众包工人标定结果的繁重的审核工作,弥补了基于机器学习算法标定策略不适用的情况。

主权项:1.一种基于众包的文本类数据标定任务的自动审核方法,其特征在于,包括如下步骤:S1:确定待标定文本任务集、众包工人对待标定文本任务集的标定质量的阈值及公共待标定文本任务项;S2:定义待标定文本任务集中待标定文本任务项的标定类别,执行步骤S4;未定义待标定文本任务集中待标定文本任务项的标定类别,执行步骤S3;S3:利用所述公共待标定文本任务项计算所述标定类别;所述步骤S3中所述利用所述公共待标定文本任务项计算所述标定类别采用如下公式: 其中,Slpt为计算得到的所述标定类别的认可度;W为众包工人的集合,|W|为众包工人个数;对于单个公共待标定文本任务项pt,多个众包工人对单个公共待标定文本任务项的标定结果的集合记为Lpt,lpt∈Lpt为单个公共待标定文本任务项的一种标定结果,wlpt为单个众包工人对单个公共待标定文本任务项的标定结果;若Slpt>0,lpt为最后一个标定结果,pt为最后一个公共待标定文本任务项,则所述lpt为最终的标定类别;S4:根据众包工人的标定结果计算众包工人对待标定文本任务集的标定质量,并与所述阈值进行比较,并判断众包工人的标定结果是否审核通过;所述步骤S4中所述根据众包工人的标定结果计算众包工人对待标定文本任务集的标定质量采用以下公式: 其中,Sw为标定质量;T为待标定文本任务集;PT为公共待标定文本任务项集;pt∈PT为单个公共待标定文本任务项;tlpt为定义的标定类别,w为单个众包工人;wlpt为单个众包工人对单个公共待标定文本任务项的标定结果;|PT|为公共待标定文本任务项个数。

全文数据:

权利要求:

百度查询: 深圳莫比嗨客树莓派智能机器人有限公司 一种基于众包的文本类数据标定任务的自动审核方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。