买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:广西电网有限责任公司
摘要:本发明公开了一种融合主题信息的电力数据推荐方法。该方法包括:利用LDA模型对电力文本以及检索文本进行学习,得到文档的主题分布,每个主题包含一组相关的词汇,将主题分布表示为固定长度的向量,每个维度对应一个主题;将LDA模型得到的主题向量嵌入BERT预训练语言模型,得到融合主题信息的增强文本表示;通过LSTM模型对输入的文本时序数据进行特征提取并预测下一个与主题相关的文本,返回与该主题文本相关的电力数据作为推荐数据;本发明融合了主题信息的电力数据推荐方法,相比于在社交媒体环境下的基于内容或协同过滤的传统推荐方法,不仅在应用场景下更贴近实际工作环境中面向主题的数据检索,而且对大规模数据的使用效率更高。
主权项:1.一种融合主题信息的电力数据推荐方法,其特征在于,包括以下步骤:S1:数据获取:从电力管理系统中获取电力文本、数据搜索文本记录,形成文本数据集;S2:对数据集进行预处理,并拆分为训练集与测试集:预处理包括文本分词、构建词汇表、序列填充、文本向量化;S3:主题模型构建:使用电力文本、搜索文本对主题模型进行训练,学习潜在的主题信息,得到电力文档的主题分布,将主题分布转换为主题特征向量;S4:融合主题信息的文本语义增强表示:在BERT预训练语言模型的词嵌入层、位置嵌入层后新增主题嵌入层,使用掩码任务重新训练后得到融合主题信息的语言表示模型;S5:构建LSTM长短期记忆网络模型,对融合主题信息文本进行学习,得到主题文本特征;并使用随机梯度下降法进行优化,计算下一个词语的概率分布,返回最大概率的词语作为预测文本;S6:根据预测文本进行检索,返回相关主题的电力数据作为推荐。
全文数据:
权利要求:
百度查询: 广西电网有限责任公司 一种融合主题信息的电力数据推荐方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。