Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜集智学园(北京)科技有限公司徐恩峤获国家专利权

恭喜集智学园(北京)科技有限公司徐恩峤获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜集智学园(北京)科技有限公司申请的专利动态维护优质科技概念库的人机合作系统及方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114462602B

龙图腾网通过国家知识产权局官网在2025-03-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210115240.0,技术领域涉及:G06N5/022;该发明授权动态维护优质科技概念库的人机合作系统及方法是由徐恩峤;胡乔;林嘉琦设计研发完成,并于2022-02-06向国家知识产权局提交的专利申请。

动态维护优质科技概念库的人机合作系统及方法在说明书摘要公布了:本发明公开了动态维护优质科技概念库的人机合作系统,基于性能优异的自动术语提取ATE算法TERMATE,针对科技概念更新快与优秀算法耗时长的矛盾和痛点,设计了一套基于增量运转和人机合作的完备科技概念库维护框架,并且最终在此基础上实现了线上闭环语料利用系统。上述系统中:定制化提取算法对涌入的语料进行有机整合式ATE,以富集出术语候选并汇报日志;汇集众智的众包平台对候选进行确认与完善,以得到术语与概念并自适应结算奖励;确认的候选将反过来增益ATE性能。整套系统名为ConceptEST或最概念,无缝整合机器智能与群体智慧、富集优质科技知识,方便领域术语、概念管理,从而能低成本、高效率地跟进所关注的领域变化,方便领域从业者。

本发明授权动态维护优质科技概念库的人机合作系统及方法在权利要求书中公布了:1.动态维护优质科技概念库的人机合作系统,包括提取算法模块和众包平台模块,所述提取算法模块由作为运行入口的总控模块控制,由数据导入模块、语料加工模块、窗口生成模块、短语提取模块、先导识别模块、特征计算模块、候选评估模块、元素扩充模块、数据导出模块子模块依序构成;所述平台包含文本类任务与数值类任务两大子模块,所述文本类任务子模块包括候选标定、学科分配、概念定义任务,所述数值类任务子模块包括关联确认、指数评估任务;其特征在于,在提取算法模块的语料加工模块中,新老语料在进行语料总词频统计即语料加工中间步骤、窗口生成、短语提取、统计先导词数量即先导识别过程中,均会涉及到频率的计算;增量提取,直接采用老语料的频率统计结果结合上新语料的频率统计结果,采用如下的更新规则即所有频率统计新老增量整合时的计数更新方法: 上式中,csum为更新后计算的折合频率,cold、cnew分别为旧、新的频率统计部分,decay为衰减系数,根据实际情况或期望的行业概念迭代快慢进行调整,Δdate为两频率的统计日期间隔,nold、nnew分别为旧、新的文档数量;1a总控模块termate,bash语言运行文件,命令行界面下运行即开展一次提取工作,依次运行数据导入、语料加工、窗口生成、短语提取、先导识别、候选评估、元素扩充、词表更新模块,中途将进行新老数据合并与替换;1b数据导入模块documents_update.py,通过UUID数据库内唯一标识识别哪一些文档是新近增加的,将之分离出来构建待处理语料库;1c语料加工模块process_corpus.py,在词语的尺度上进行形式统一,为每个词语标注词性;增量模式时导入语料库文件,按衰减计数合并后导出;1d窗口生成模块generate_windows.py,按照设定的n-grams长度截止或者自适应的方式为每个文档分别使用滑动窗口进行词频统计,并按照设定好的统计阈值过滤;增量模式时导入老滑动窗口统计文件,按衰减计数合并后导出;1e短语提取模块extract_phrases.py,调用名词短语识别工具以允许嵌套的方式识别各个文档中的名词短语;增量模式时导入老名词短语统计文件,按衰减计数合并后导出;常用可调节参数:短语词元长度,为一正整数,默认5;1f_先导识别模块recognize_leads.py,合并新得到的滑动窗口与名词短语统计文件中出现的词语确认一组新的先导词;以增量的方式统计语料库中新的先导词的分布情形,即在所有文档中识别新文档发现的新先导词,在新文档中额外识别先前已有的老先导词;无可调节参数;1g特征计算模块compute_features.py,利用先导词的结果进行基于统计的一系列特征计算,得到的特征向量作为后续分类的依据;1h候选评估模块evaluate_candidates.py,导入先前训练过的模型,利用新计算的特征进行设定轮次的训练,并将模型应用到所有需要预测的先导词上以得到候选,导出方才训练好的模型;1i元素扩充模块enrich_elements.py,对新增的候选进行形式分布统计、缩写分析,并分别得到全称和缩写的最常用形式;进行API调用翻译中文及其它操作获得更多元素,处理后合并入老候选库;常用调节参数:翻译接口调用,设定链接,默认为彩云小译、令牌;1j数据导出模块vocabulary_update.py,将元素扩充后的新增候选条目写入服务器供众包平台调用;所述众包平台模块的方法包括文本类任务和数据类任务:2a文本类任务的工作机制是,每条材料经过连续n次即权衡人力资源与准确性无修改提交则被认定正确,不再分配;文本类任务中,用户选择增、删、改已有义项;评分机制上,用户给出最终答案中承认的每个义项均获得一个较高的分数,无修改确认最终答案的用户获得一个较低的分数,其余行为不得分;候选标定是所有众包任务中最基础的任务,完成方能进行后续任务;2b数值类任务的工作机制是,每条材料按频率对数为随机权重分配评分者,设定截止,越多人参与则准确性越高;数值类任务中,用户选择一个离散化、可定值的选项,统合不同用户的选项则得到最终的条目评分;设重要为1、不重要为0,取均值,增加评分级数;评分机制上,用户只要参与了评价,就被认为提供了其见解与注意力,将获得一个一致的参与分。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人集智学园(北京)科技有限公司,其通讯地址为:102399 北京市门头沟区西山艺境别墅1号院7-2-101;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。