买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:成都信通信息技术有限公司
摘要:本发明公开了基于LLM和文本相似度分析的产品描述生成方法及系统;涉及产品信息生成技术领域;在传统的产品描述生成技术上进行方法上的改进,基于LLM模型(大语言模型)和文本相似度分析方法,一方面将预处理后的产品描述语句输入已训练好的LLM模型确定出产品关键词,并重组产品关键词得到多组新产品描述语句,减少人为调整工作,并提高产品描述生成效率和准确率;另一方面,本方案还结合各产品描述关键词的流量对所有新产品描述语句进行文本相似度分析,筛除重复的新产品描述语句,提高产品描述的准确性。
主权项:1.基于LLM和文本相似度分析的产品描述生成方法,其特征在于,包括:获取不同平台对标的产品描述语句,并对所述产品描述语句进行预处理;包括方法:获取待描述产品的产品名称或关键名称;所述关键名称由产品名称和产品属性特征描述组合而成;基于产品名称或关键名称,在不同平台进行检索筛选出所有包含产品名称或关键名称的产品描述语句,按照相关度进行排名,并筛选出各平台种排名前N的产品描述语句;将筛选出的所有产品描述语句进行拆词处理得到多个描述词语,记录各产品描述语句中各描述词语的热度;集合所有产品描述语句的描述词语构成描述词语总集,删除描述词语总集中重复的描述词语,并记录各描述词语的出现次数;将预处理后的产品描述语句输入已训练好的LLM模型生成预测描述词语集,去除所述预测描述词语集中的深海描述词语以确定出产品关键词,并重组所述产品关键词输出多组新产品描述语句;包括方法:将描述词语总集输入已训练好的LLM模型,所述LLM模型根据描述词语总集中的描述词语生成预测描述词语集;具体的:根据产品名称或关键名称,对描述词语总集中的各描述词语分别进行拓展预测,生成n个替换描述词语构成对应的替换描述词语集;n为自然数;集合描述词语总集和所有替换描述词语集生成预测描述词语集;剔除预测描述词语集中的深海描述词语,以预测描述词语集中剩余的描述词语作为产品关键词;所述剔除预测描述词语集中的深海描述词语,还包括方法:根据下式计算各描述词语与产品名称之间的相关性P;设置第一相关性阈值Pe1,对于相关性P小于第一相关性阈值Pe1的描述词语,删除描述词语及对应的替换描述词语集;设置第二相关性阈值Pe2,对于相关性P在第一相关性阈值Pe1与第二相关性阈值Pe2之间的描述词语,删除描述词语对应的替换描述词语集;其中: ;式中,B表示替换描述词语集c中与替换描述词语集m中相同替换描述词语的个数;Dm表示替换描述词语集m中的替换描述词语总数,Dc表示替换描述词语集c中的替换描述词语总数;其中替换描述词语集c为产品名称的对应替换描述词语集;重组产品关键词输出多组新产品描述语句;对各新产品描述语句进行文本相似度分析,并基于文本相似度分析结果结合各产品描述关键词的热度对新产品描述语句进行去重处理;输出去重处理后的新产品描述语句。
全文数据:
权利要求:
百度查询: 成都信通信息技术有限公司 基于LLM和文本相似度分析的产品描述生成方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。