买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明实施例公开了一种分布式机器学习算法库的封装方法、装置、设备及介质。该方法包括:将待封装机器学习算法封装在本地建模模块中,本地建模模块用于基于分布式计算框架以RSP数据分区为单位执行待封装机器学习算法,得到一组机器学习模型;根据待封装机器学习算法在数据封装模块中封装数据封装算法,数据封装模块用于应用数据封装算法将分布式数据文件读入内存后的数据类型转换为待封装机器学习算法要求的输入数据类型;根据待封装机器学习算法在全局集成模块中封装模型集成算法,全局集成模块用于应用模型集成算法将一组机器学习模型合并为单个机器学习模型。从而可将任意串行机器学习算法在分布式环境下运行,还可保证各算法的计算效率。
主权项:1.一种分布式机器学习算法库的封装方法,其特征在于,包括:将待封装机器学习算法封装在本地建模模块中,所述本地建模模块用于基于分布式计算框架以随机样本划分数据分区为单位执行所述待封装机器学习算法,得到一组机器学习模型;其中,以LO_Algorithm库函数的形式对所述待封装机器学习算法进行封装;根据所述待封装机器学习算法在数据封装模块中封装相应的数据封装算法,所述数据封装模块用于应用所述数据封装算法将分布式数据文件读入内存后的数据类型转换为所述待封装机器学习算法要求的输入数据类型;其中,以WrapperMethod库函数的形式对所述数据封装算法进行封装;根据所述待封装机器学习算法在全局集成模块中封装相应的模型集成算法,所述全局集成模块用于应用所述模型集成算法将所述一组机器学习模型合并为单个机器学习模型;其中,以GO_Strategy库函数的形式对所述模型集成算法进行封装;所述数据封装模块由LOGO算子dataWrapper(func)执行,所述LOGO算子dataWrapper(func)以传入的目标函数作为参数,所述目标函数输入参数的数据类型为分布式数据文件读入内存后的数据类型,所述目标函数返回值的数据类型为所述待封装机器学习算法要求的输入数据类型。
全文数据:
权利要求:
百度查询: 深圳大学 分布式机器学习算法库的封装方法、装置、设备及介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。