买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京领雁科技股份有限公司
摘要:公开一种智能文档管理检索方法及系统。方法包括:根据用户输入问题,从存储库获得与之关联的标签;根据标签,从存储库获得第一数量的大文本块;将用户输入问题的向量表示和存储库的多个小文本块的向量表示进行向量匹配计算,并根据计算结果获得第二数量的小文本块;根据第二数量的小文本块,从存储库中获取与之关联的第三数量的大文本块;将第一数量的大文本块与第三数量的大文本块的合集或交集作为补充语料提供给语义检索模型,以便语义检索模型给出查询结果,其中,存储库预先建立并存储相关数据。该方法及系统采用文本块分层管理模式,并通过双路召回机制提高了文档召回效率和准确率。
主权项:1.一种智能文档管理检索方法,包括:根据用户输入问题,从存储库获得与之关联的标签;根据所述标签,从所述存储库获得第一数量的大文本块;将所述用户输入问题的向量表示和所述存储库的多个小文本块的向量表示进行向量匹配计算,并根据计算结果获得第二数量的小文本块;根据所述第二数量的小文本块,从所述存储库中获取与之关联的第三数量的大文本块;将所述第一数量的大文本块与所述第三数量的大文本块的合集或交集作为补充语料提供给语义检索模型,以便所述语义检索模型给出查询结果,其中,所述存储库预先建立并用于存储各种规章制度文档的大文本块、小文本块、小文本块的向量表示、大文本块与小文本块之间的对应关系以及大文本块与标签之间的关系。
全文数据:
权利要求:
百度查询: 北京领雁科技股份有限公司 智能文档管理检索方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。