买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:山东大国治礼教育科技集团有限公司
摘要:本发明涉及政务数据管理领域,公开了一种基于人工智能的政务服务数据处理方法及系统,通过从各个政务服务部门收集政务服务数据,对政务服务数据进行数据整合,得到待处理服务数据;对待处理服务数据进行预处理,得到标准化数据,将标准化数据输入高斯混合模型,采用EM算法迭代更新高斯混合模型输出第一样本服务数据;对第一样本服务数据进行异常值检测,得到第二样本服务数据,基于t‑SNE算法对第二样本服务数据进行降维处理,得到目标特征数据;将目标特征数据输入数据分析模型中,通过数据分析模型进行预测,输出政务分析结果;将政务分析结果推送至对应的政务服务部门,通过数据可视化技术展示政务分析结果;本发明使政务服务更加智能化和自动化。
主权项:1.一种基于人工智能的政务服务数据处理方法,其特征在于,所述基于人工智能的政务服务数据处理方法包括以下步骤:从各个政务服务部门收集政务服务数据,对所述政务服务数据进行数据整合,得到待处理服务数据;对所述待处理服务数据进行预处理,得到标准化数据,将所述标准化数据输入高斯混合模型,采用EM算法迭代更新高斯混合模型以输出第一样本服务数据;对所述第一样本服务数据进行异常值检测,得到第二样本服务数据,基于t-SNE算法对所述第二样本服务数据进行降维处理,得到目标特征数据;将所述目标特征数据输入数据分析模型中,以通过所述数据分析模型进行预测,并输出政务分析结果,其中所述政务分析结果至少包括服务需求预测、政策方案预测和风险预警;将所述政务分析结果推送至对应的政务服务部门,并通过数据可视化技术展示所述政务分析结果;对所述待处理服务数据进行预处理,得到标准化数据,将所述标准化数据输入高斯混合模型,采用EM算法迭代更新高斯混合模型以输出样本服务数据,包括:获取待处理服务数据,对所述待处理服务数据进行数据清洗,得到清洗后的待处理服务数据;采用Z-score标准化对清洗后的待处理服务数据进行归一化处理,将清洗后的待处理服务数据的数据值范围缩放到[0,1]或[-1,1]之间,得到标准化数据;对所述标准化数据的每个数据点计算来自每个高斯分布的后验概率,采用加权最小二乘法基于后验概率得到每个高斯分布的参数;重复迭代EM算法的E步骤和M步骤,直至算法收敛,结束迭代,对每个簇中的数据点的后验概率进行加权,再将得到的加权后的数据点作为第一样本服务数据;对所述第一样本服务数据进行异常值检测,得到第二样本服务数据,包括:确定K-means聚类算法的聚类簇个数,选择初始化k个样本作为初始聚类中心;获取第一样本服务数据,计算所述第一样本服务数据中每个数据点到初始聚类中心的欧式距离,并将每个数据点分到距离最小的初始聚类中心所属的簇上;对得到的簇重新确定聚类中心,重新计算,直至收敛,判断所述第一样本服务数据中的数据点到聚类中心的距离是否大于阈值,若该数据点不属于聚类簇或距离大于阈值,则确定该数据点为异常数据点;剔除所述第一样本服务数据中的异常数据点,得到第二样本服务数据;所述基于t-SNE算法对所述第二样本服务数据进行降维处理,得到目标特征数据,包括:获取第二样本服务数据,设置t-SNE算法损失函数,初始化t-SNE算法迭代次数、学习率和动量;计算所述第二样本服务数据中两两数据点的条件概率,基于两两数据点的条件概率计算联合概率分布并进行归一化处理;随机生成低维随机数,并计算t分布中低维样本空间点的联合概率分布,利用梯度下降,计算优化后的梯度,并得到当前低维数据,循环迭代使得损失函数达到最小值,得到目标特征数据;所述数据分析模型的构建过程包括以下步骤:获取政务服务部门的历史服务数据,将所述历史服务数据拆分为训练样本数据集和测试样本数据集,使用贝叶斯方法补齐缺失的所述训练样本数据集中的样本数据,并对所述训练样本数据集中的样本数据进行离散化处理;构建决策树模型,将处理后的训练样本数据集输入决策树模型进行训练,计算决策树根节点的每个属性的信息增益,选择对应最大值的属性作为根节点的属性,再从上到下递归计算其他子节点的属性;在父节点和子节点之间添加贝叶斯节点,检验父节点的属性,并对决策树进行剪枝处理,采用双层协同校正方法构建基准层和实时层,得到基于双层XGBoost算法的决策树模型;采用测试样本数据集和鹈鹕算法对得到的基于双层XGBoost算法的决策树模型进行参数优化,建立数据分析模型;所述采用测试样本数据集和鹈鹕算法对得到的基于双层XGBoost算法的决策树模型进行参数优化,建立数据分析模型,包括:设置种群数量、搜索空间维度和最大迭代次数,初始化鹈鹕种群,基于测试样本数据集构造适应度值函数,对初始鹈鹕种群中每个个体的适应度值进行计算,并记录当前最佳个体的位置为全局最优解;对鹈鹕种群进行反向差分进化,对比进化前后个体的适应度值,择优保留个体组成更新后的鹈鹕种群;重新计算更新后种群个体的适应度值,并选出当前的最优个体,并进行最优个体自适应变异,对鹈鹕种群中个体的位置进行更新;确认是否满足最大迭代次数,若不满足则继续进行迭代,若满足则将最优超参数分配基于双层XGBoost算法的决策树模型,并利用最优超参数建立数据分析模型;将所述目标特征数据输入数据分析模型中,以通过所述数据分析模型进行预测,并输出政务分析结果,包括:将目标特征数据输入数据分析模型中,将所述目标特征数据作为所述数据分析模型的基准层输入,沿着树形结构进行决策,最终到达一个叶节点,计算基准预测值,得到基准层的输出结果;将基准层的输出结果作为实时层的输入,对输入的基准预测值进行校验,迭代计算误差预测值,得到实时层的输出结果,将基准层和实时层两层输出结果汇总,得到最终的预测结果,以输出政务分析结果。
全文数据:
权利要求:
百度查询: 山东大国治礼教育科技集团有限公司 一种基于人工智能的政务服务数据处理方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。