首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

文本检索方法、装置、设备及存储介质 

申请/专利权人:平安国际智慧城市科技股份有限公司

申请日:2022-01-21

公开(公告)日:2024-07-05

公开(公告)号:CN114416954B

主分类号:G06F16/332

分类号:G06F16/332;G06F40/247

优先权:

专利状态码:有效-授权

法律状态:2024.07.05#授权;2022.05.20#实质审查的生效;2022.04.29#公开

摘要:本申请涉及人工智能技术领域,公开了一种文本检索方法、装置、设备及存储介质,方法包括:当接收到文本检索请求时,根据文本检索请求获取第一检索文本;从第一检索文本中获取与预设的词库中的词语相匹配的匹配词集,其中,词库中的各个词语均设置有对应的语义标签;从匹配词集中选择目标匹配词,并获取与目标匹配词所匹配的目标语义标签;根据目标语义标签,从词库中获取与目标匹配词匹配的同义词;获取目标匹配词在第一检索文本的位置信息;根据位置信息将同义词插入第一检索文本,得到第二检索文本;根据第一检索文本进行检索,得到第一检索结果;根据第二检索文本进行检索,得到第二检索结果;从第一检索结果以及第二检索结果中筛选目标文件。

主权项:1.一种文本检索方法,其特征在于,包括:当接收到文本检索请求时,根据所述文本检索请求获取第一检索文本;从所述第一检索文本中获取与预设的词库中的词语相匹配的匹配词集,其中,所述词库中的各个所述词语均设置有对应的语义标签;从所述匹配词集中选择目标匹配词,并获取与所述目标匹配词所匹配的目标语义标签;根据所述目标语义标签,从所述词库中获取与所述目标匹配词匹配的同义词;获取所述目标匹配词在所述第一检索文本的位置信息;根据所述位置信息将所述同义词插入所述第一检索文本,得到第二检索文本;根据所述第一检索文本进行检索,得到第一检索结果;根据所述第二检索文本进行检索,得到第二检索结果;从所述第一检索结果以及所述第二检索结果中筛选目标文件;其中,所述根据所述第一检索文本进行检索,得到第一检索结果,包括:根据构成所述第一检索文本的第一字符,及构成数据库中各个资源文件的文件字符,得到第一字库;从所述第一字库中识别与预设的特殊字符集中的字符相匹配的特殊字符,并将所述特殊字符从所述第一字库中移除,得到第二字库;根据所述第二字库,计算各个所述资源文件与所述第一检索文本的相似度,得到各个所述资源文件对应所述第一检索文本的第一得分;根据所述第一得分筛选所述资源文件,得到第一检索结果;其中,所述根据所述第二字库,计算各个所述资源文件与所述第一检索文本的相似度,得到各个所述资源文件对应所述第一检索文本的第一得分,包括:计算所述第一检索文本对应所述第二字库中的字符的TF-IDF值,以获得所述第一检索文本对应的第一向量;计算所述各个所述资源文件对应所述第二字库中的字符的TF-IDF值,以获得各个所述资源文件对应的第二向量;从各个所述资源文件中选择目标资源文件,并获取与所述目标资源文件对应的目标第二向量;计算所述目标第二向量与所述第一向量的余弦相似度,得到所述目标资源文件对应所述第一检索文本的第一得分;其中,所述根据所述第二检索文本进行检索,得到第二检索结果,包括:根据构成所述第二检索文本的第二字符,及构成各个所述资源文件的文件字符,得到第三字库;从所述第三字库中识别与所述特殊字符集中的字符相匹配的特殊字符,并将所述特殊字符从所述第三字库中移除,得到第四字库;根据所述第四字库,计算各个所述资源文件与所述第二检索文本的相似度,得到各个所述资源文件对应所述第二检索文本的第二得分;根据所述第二得分筛选所述资源文件,得到临时文件数组;从所述临时文件数组中筛选包含所述同义词的所述资源文件,得到第二检索结果。

全文数据:

权利要求:

百度查询: 平安国际智慧城市科技股份有限公司 文本检索方法、装置、设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。