首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于FC-SAE的多源异构数据融合方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:兰州理工大学

摘要:本发明公开了一种基于FC‑SAE的多源异构数据融合方法,包括FC‑SAE数据融合模型,所述的FC‑SAE数据融合模型包括文本特征提取模块、时间序列建模模块以及异构数据特征融合模块,所述的文本特征提取模块包括GloVe词嵌入模型和卷积神经网络,所述的时间序列建模模块使用多层全连接神经网络进行建模,所述的异构数据特征融合模块包括稀疏自动编码器。本发明优点在于:本申请在对时间序列数据进行去趋势的基础上,采用FC对时间序列进行建模,减小在某些时间序列预测问题上的误差,通过深度稀疏自动编码器作为融合模型,在保留最大信息量的同时充分挖掘时间序列数据与文本数据之间的关联关系,充分利用多源异构数据隐藏的各种信息,提高信息利用率。

主权项:1.一种基于FC-SAE的多源异构数据融合方法,包括FC-SAE数据融合模型,其特征在于:所述的FC-SAE数据融合模型包括文本特征提取模块、时间序列建模模块以及异构数据特征融合模块,所述的文本特征提取模块包括GloVe词嵌入模型和卷积神经网络,所述的时间序列建模模块使用多层全连接神经网络进行建模,所述的异构数据特征融合模块包括稀疏自动编码器,所述的融合方法步骤如下:Step1:对文本数据预处理,删除HTML标签和停用词,并进行大小写转换;Step2:使用Tokenizer分词器对文本进行分词,生成不定长文本序列V,对不定长文本序列V进行零填充,使其成为等长文本向量VT,VT∈Rn×S,n为文本数据样本量,S为最大文本向量长度;Step3:使用GloVe词嵌入模型对文本向量VT进行词嵌入,生成词向量矩阵X[i:j],i为词嵌入矩阵维度;Step4:卷积神经网络进一步提取词向量矩阵X[i:j]特征,获得文本数据特征Ztext;Step5:时间序列数据预处理,并根据事件描述数据生成事件存在数据;Step6:采用历史平均法对时间序列数据进行去趋势,生成去趋势数据如下式所示: Step7:多层全连接神经网络提取时间序列特征Zts;Step8:将文本数据特征Ztext和时间序列特征Zts进行拼接,并通过稀疏自动编码器进行融合,输出多源异构数据特征y;所述的GloVe词嵌入模型是利用词向量vi、vj和构造函数所述的GloVe词嵌入模型损失函数见下式: 其中,N为语料库中词数量,共现矩阵X为N×N矩阵;Xi,j表示词i和词j在同一个窗口内出现的次数;表示以词i作为上下文单词时,词i所对应词向量的转置;表示以词j作为上下文的中心词时,词j所对应词向量;bi和bj为偏置项;f为自定义权重函数,所述的权重函数常用形式为: xmax=100,α=0.75,通过最小化损失函数获得词向量模型与词向量;所述的词向量矩阵X[i:j]通过卷积层进行卷积运算获得特征映射C,并通过最大池化层获得特征映射中的最大值所述的获得文本数据特征Ztext过程如下所示:Ci=fwX[i:j]+bC=[C1,C2,…,Cn] 其中,n为特征映射数量,m为卷积核个数;所述的多层全连接神经网络由输入层、隐藏层和输出层三层组成,所述的多层全连接神经网络的计算步骤如下:首先计算输入的加权和,如下式所示: 其中,Wab表示为输入层中第a个节点到隐藏层第b个节点的连接权重,θb为第b个隐藏节点的偏置项,Xa为第a个输入,每个隐藏层节点的输出按照下式进行计算: 其中,Wbk为从第b个隐藏节点到第k个输出节点之间的连接权重,θk是第k个输出节点的偏置项;所述的多层全连接神经网络的输入向量采用滞后观察的形式作为固定输入向量,如下式所示:Zts=fwT+b其中,Zts为时间序列特征,T=t1,t2,…,tL,L为滞后观察长度;所述的稀疏自动编码器是一种无监督深度学习模型,稀疏自动编码器的工作步骤为:首先将文本数据特征Ztext和时间序列特征Zts进行合并获得合并后的特征x,将合并后的特征x作为融合模型的输入,通过非线性映射到隐藏层输出,表示为y,最后再将其映射回输入空间x′,表示如下:y=hWx+bx′=h′W′y+b′其中,h与h′分别为编码器和解码器的激活函数,W和W′分别为编码器和解码器的权重矩阵,b和b′为编码器和解码器的偏置项;所述的稀疏自动编码器通过对损失函数最小化来对参数进行优化,所述的稀疏自动编码器的损失函数可表达如下: 其中,L为隐藏层节点数目,n为数据样本数量,k为输入向量维度,λ和β为给定系数,分别控制权重系数正则项和稀疏正则项,为隐藏层神经元平均激活值,ρ为稀疏性参数。

全文数据:

权利要求:

百度查询: 兰州理工大学 一种基于FC-SAE的多源异构数据融合方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。