买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:永中软件股份有限公司
摘要:本申请涉及一种基于数据清洗及查询重排序的大模型输入量生成方法,涉及大模型应用技术领域。该方法包括基于输入文本确定与输入文本对应的原始语料;对原始语料进行数据切分,得到原始语料数据集合;对至少两条原始语料数据进行过滤,得到清洗语料集合;确定与清洗语料集合对应的高相似度结果集;基于高相似度结果集以及输入文本生成输入数据,输入数据用于输入至大模型。在生成作为大模型输入量的过程当中,对原始的输入文本进行语料提取处理,并基于提取到的语料进行数据过滤以及相似度判断,生成与原始语料相似度较高的结果数据集,以作为大模型的输入量,实现更为准确的数据输入生成,进而得到更为准确的检索结果。
主权项:1.一种基于数据清洗及查询重排序的大模型输入量生成方法,其特征在于,所述方法应用于计算机设备中,所述方法包括:基于所述输入文本确定与所述输入文本对应的原始语料;对所述原始语料进行数据切分,得到原始语料数据集合,所述原始语料数据集合中包括至少两条原始语料数据;对所述至少两条原始语料数据进行过滤,得到清洗语料集合,所述清洗语料集合中包括至少两条清洗语料数据;基于相似度,确定与所述清洗语料集合对应的高相似度结果集;基于所述高相似度结果集以及所述输入文本生成输入数据,所述输入数据用于输入至大模型。
全文数据:
权利要求:
百度查询: 永中软件股份有限公司 基于数据清洗及查询重排序的大模型输入量生成方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。