买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本申请公开了一种以算子为核心的数据科学实验方法和系统,数据科学实验新方法包括:响应于接收到第一类用户对配套实验任务的选择,将选择的所述配套实验任务发送至第二类用户;展示所述配套实验任务对应的学习课件;调用所述配套实验任务对应的基本实验功能,以对所述第二类用户的基本实验操作进行处理;展示所述配套实验任务对应的业务问题,接收所述第二类用户基于多个算子的分析流编排;根据所述分析流编排的结果,生成对应所述业务问题的应用程序。本申请深刻体现大数据的价值在于实际业务问题的解决应用,极大提高了数据科学实验实战的质量和效果。
主权项:1.一种以算子为核心的数据科学实验方法,其特征在于,包括:响应于接收到第一类用户对配套实验任务的选择,将选择的所述配套实验任务发送至第二类用户;当接收到第二类用户的学习信号时,展示所述配套实验任务对应的学习课件;当接收到所述第二类用户的实验信号时,调用所述配套实验任务对应的基本实验功能,以对所述第二类用户的基本实验操作进行处理;展示所述配套实验任务对应的业务问题,接收所述第二类用户基于多个算子的分析流编排;根据所述分析流编排的结果,生成对应所述业务问题的应用程序;所述响应于接收到第一类用户对配套实验任务的选择,将选择的所述配套实验任务发送至第二类用户的步骤包括以下至少一项:接收并存储所述第一类用户提交的算子至算子库;接收并存储所述第一类用户提交的实验手册至手册库;接收并存储所述第一类用户提交的分析流案例至案例库;接受并存储所述第一类用户对所述算子库的修改;接受并存储所述第一类用户对所述手册库的修改;接受并存储所述第一类用户对所述案例库的修改;所述学习信号包括技术学习信号、算子学习信号和分析流学习信号;所述当接收到第二类用户的学习信号时,展示所述配套实验任务对应的学习课件的步骤包括:响应于接收到所述技术学习信号,展示大数据环境搭建的知识内容和或语言开发的知识内容;响应于接收到所述算子学习信号,展示算子的知识内容;响应于接收到所述分析流学习信号,展示分析流案例的知识内容和或分析流配置结果;所述配套实验任务包括技术实验;所述实验信号包括技术实验信号;所述当接收到所述第二类用户的实验信号时,调用所述配套实验任务对应的基本实验功能,以对所述第二类用户的基本实验操作进行处理的步骤包括:响应于接收到所述第二类用户的所述技术实验信号,调用基础环境部署实验或编程语言开发实验,以处理所述第二类用户的技术实验操作;所述配套实验任务包括算子实验,所述实验信号包括算子实验信号;所述当接收到所述第二类用户的实验信号时,调用所述配套实验任务对应的基本实验功能,以对所述第二类用户的基本实验操作进行处理的步骤包括:响应于接收到所述第二类用户的所述算子实验信号,调用黑盒化或白盒化实验模式,以处理所述第二类用户的算子实验操作;所述多个算子包括数据读取算子、主成分分析算子、数据编辑算子、提取标签算子、数据合并算子、线性回归算子、类型转换算子、数据拆分算子和随机森林回归算子;所述展示所述配套实验任务对应的业务问题,接收所述第二类用户基于多个算子的分析流编排的步骤中包括:响应于开始所述分析流编排,创建并命名分析流;调用所述数据读取算子,以读取所述业务问题对应的采样数据;在所述数据读取算子基础上调用所述主成分分析算子,以对所述采样数据构建主成分分析部分,以获取预处理数据;在所述主成分分析算子的基础上调用所述数据编辑算子,以对所述预处理数据增加一列序列号,并提取所述预处理数据的标签列;在所述数据编辑算子的基础上调用所述数据合并算子,以根据所述标签列,对增加序列号后的预处理数据进行合并,并记录合并后的排列顺序,以获取合并数据集;在所述数据合并算子的基础上调用所述类型转换算子,以对所述合并数据集进行第一数值类型转换,以获取第一类型数据集;在所述类型转换算子的基础上调用所述数据拆分算子,以将所述第一类型数据集拆分为第一训练数据和第一测试数据,以使用所述第一训练数据对线性回归模型进行深度学习训练;在所述数据拆分算子的基础上调用所述线性回归算子,以使用训练后的线性回归模型对所述第一测试数据进行预测,以获取第一阶段预测数据;在所述线性回归算子的基础上调用所述类型转换算子,以对所述合并数据进行第二数据类型转换,以获取第二类型数据集;在所述类型转换算子的基础上调用所述数据拆分算子,以将所述第二类型数据集拆分并增加一列序列号,以获取第二训练数据和第二测试数据;在所述数据拆分算子的基础上调用所述随机森林回归算子,以使用所第二训练集对随机森林模型进行深度学习训练,并使用训练后的随机森林模型对所述第二测试数据进行预测,获取第二阶段预测结果;在所述随机森林回归算子的基础上调用所述数据编辑算子,以对所述第二阶段预测结果增加一列序列号,从而能够展示所述预测结果。
全文数据:
权利要求:
百度查询: 上海直真君智科技有限公司 一种以算子为核心的数据科学实验方法和系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。