首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于LSTM的智能检索API推荐方法 

申请/专利权人:南通大学

申请日:2024-03-25

公开(公告)日:2024-07-05

公开(公告)号:CN118296220A

主分类号:G06F16/953

分类号:G06F16/953;G06F16/903;G06N3/0455;G06N3/0442;G06N3/084;G06F8/75

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.07.23#实质审查的生效;2024.07.05#公开

摘要:本发明提供一种基于LSTM的智能检索API推荐方法,包括如下步骤:S1、收集一个包含源代码片段及其相关API的大型语料库,训练注意力编码器‑解码器模型;S2、捕获源代码的语法结构;S3、建立语法级和语义级信息检索库;S4、获取前k个相似的代码片段;S5、捕捉代码片段之间的语境信息和关联性;S6、融合条件概率和相似度对其进行解码,从而预测API。本发明基于LSTM和信息检索的方法可以有效缓解区分词汇相似性查询的语义差异,从而提高API推荐的有效性,选用无监督学习的方法,在没有训练的情况下,基于抽象语法树的单词序列利用其自动学习的性质,有效地度量了代码片段的语法相似性,从而更好地预测API。

主权项:1.一种基于LSTM的智能检索API推荐方法,其特征在于,包括以下步骤:S1、获取包含有源代码片段及其相关API的数据集,将数据集划分为训练集、验证集和测试集,并通过训练集构建并训练一个注意力编码器-解码器模型;S2、将训练集中的所有代码片段解析为AST,并通过树遍历转换为语法级单词序列;S3、使用步骤S1训练后得到的注意力编码器-解码器模型,通过池化层将代码嵌入到语义向量中,并将步骤S2得到的代码序列和池化后的语义向量存储到代码检索库中;S4、测试阶段:给定一个输入代码片段,从代码检索库中筛选出前k个相似代码片段,使用相似代码片段对步骤S1中的注意力编码器-解码器模型进行增强;S5、将测试代码段及其相似的k个代码片段同时进行编码,利用注意力机制获取上下文向量;S6、将上下文向量进行解码,使用检索到的代码片段中的条件概率和相似度调整下一个单词的条件概率,得到预测的API序列。

全文数据:

权利要求:

百度查询: 南通大学 一种基于LSTM的智能检索API推荐方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。