首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种标准文件档案一体化管理的编码与展示方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中国标准化研究院

摘要:本发明公开了一种标准文件档案一体化管理的编码与展示方法,包括获取待编码文件档案,对所述待编码文件档案进行预处理,提取相关信息,提取所述相关信息的标准特征,根据所述标准特征获取所述待编码文件档案的分类数据,将所述程序等级和所述分类数据关联获得标准分类数据,使用所述标准分类数据构建信息树,制定编码方案,根据所述编码方案构建标准文件档案编码模型,根据编码类型优化所述标准文件档案编码模型,将所述信息树输入优化后的所述标准文件档案编码模型,输出编码结果并展示。该方法不仅可以提高编码的精度,同时具有较好的可解释性,可以直接应用于标准文件档案系统中。

主权项:1.一种标准文件档案一体化管理的编码与展示方法,其特征在于,包括以下步骤:A获取待编码文件档案,对所述待编码文件档案进行预处理,提取预处理后的所述待编码文件档案的材料类型、项目类别和程序等级获得相关信息;B提取所述相关信息的标准特征,根据所述标准特征获取所述待编码文件档案的分类数据,将所述程序等级和所述分类数据关联获得标准分类数据;C使用所述标准分类数据构建信息树,制定编码方案;包括:将标准分类数据划分成子集,计算标准分类数据的经验熵: 其中标准分类数据为u,标准分类数据的样本数量为|u|,标准分类数据的特征为i,第i个类别的样本数量为|bi|,标准分类数据的类别数量为g,计算标准特征对标准分类数据的经验条件熵: 其中标准分类数据的子集为s,第s个子集的标准分类数据数量为us,第s个子集中包含类别k的标准分类数据集合为bsi,标准分类数据集合bsi的数量为|bsi|,子集s的数量为n,特征为e,计算信息增益:qu,e=Hu|e设定信息增益的阈值,如果标准分类数据中所有标准分类信息属于同一类别,则决策树为单节点树,将类别作为节点的标记,返回信息树;如果特征集合为空,则决策树为单节点树,将集合忠诚出现频次最多的类别作为节点的标记,返回信息树;否则计算特征集合中标准特征对标准分类数据的信息增益,选择信息增益最大的标准特征;如果标准特征对应最大的信息增益小于阈值,则决策树为单节点树,将集合中出现频次最多的类别作为结点的标记,返回信息树;否则,对标准特征对应最大的信息增益的每一个可能值,将标准分类数据分割为多个非空集合,将非空集合中出现频次最多的类别作为标记,构造子结点,由结点及子节点构成信息树;D根据所述编码方案构建标准文件档案编码模型,根据编码类型优化所述标准文件档案编码模型;根据所述编码方案构建标准文件档案编码模型的方法,包括:a、按照网络中链路的拓扑顺序设置编码类型,将信源节点输出链路对应的基因排在首位,对于网络中的任意节点将各输入链路对应的基因排在所有输出链路对应的基因之前;种群初始化,按照链路的拓扑顺序,设置编码类型基因,为基因随机赋值,给出适应度函数,适应度函数的计算公式为:fβ=∑t∈TKtβ其中编码类型β代表的层级编码分配状态t获得的吞吐量为Ktβ,β为信宿获得的总吞吐量为fβ,信宿的数量为T,根据适应度值对编码类型进行优劣排序,计算编码类型的选择概率: 其中编码类型为i,编码类型的数量为psz,概率为θ,将选择概率按照顺序累加,获得累加概率序列,采用随机数选择编码类型进入下一代,重复操作直到选择出足够数量的编码类型,选择两个编码类型作为交叉对象,对信源节点输出链路的基因,选择一个进行交叉操作获得两个新的编码类型,从各链路的基因中选择一个进行变异操作,计算新生成的编码类型的适应度值,将新的编码类型和原来的编码类型合并为一个种群,根据适应度值对种群中的编码类型进行排序,选择适应度最高的编码类型作为最优编码类型,根据轮盘赌选择编码类型进入下一代,当最优编码类型的适应度函数值保持不变时停止迭代;b、标准文件档案编码模型采用分层编码算法、哈希查找算法和插入算法构建,采用插入算法进行标准文件档案的更新和去重,其中计算标准文件档案内容的相似度: 其中第i个标准文件档案为di,第j个标准文件档案为dj,特征向量的维数为h,特征向量h维数的数量为q,第i个标准文件档案第h个特征项的权重值为ωih,第j个标准文件档案第h个特征项的权重值为ωjh,通过相似度进行标准文件档案的数据更新和去重,根据所述编码方案采用分层编码算法对更新去重后的标准文件档案进行编码,采用哈希查找算法对编码后的标准文件档案建立索引,使用随机森林算法将信息树按照4:1随机分成训练集和测试集,通过训练集训练标准文件档案编码模型,采用测试集对训练后的标准文件档案编码模型进行结果测试;E将所述信息树输入优化后的所述标准文件档案编码模型,输出编码结果并展示。

全文数据:

权利要求:

百度查询: 中国标准化研究院 一种标准文件档案一体化管理的编码与展示方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术