买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:量子数聚(北京)科技有限公司
摘要:本申请公开了一种数据导入方法、装置、系统及计算机可读存储介质。所述方法包括以下步骤:获取文本数据;基于预设的Elasticsearch搜索服务器的字段映射对文本数据进行逐行字段处理,得到各行的字段数据;依次对各行的字段数据进行解析处理,得到对应各行的字段数组;依次对各字段数组进行数据校验,得到各校验后字段数据;并将各校验后字段数据依次进行格式转换,得到对应各行的JSON数据;在JSON数据的数量达到预设阈值时,将对应预设阈值数量的JSON数据批量导入Elasticsearch搜索服务器,实现将文本数据导入Elasticsearch搜索服务器,提高了数据导入方式的效率,缩短了执行时间长,且满载时不易造成服务器宕机。
主权项:1.一种数据导入方法,其特征在于,包括以下步骤:获取文本数据;基于预设的Elasticsearch搜索服务器的字段映射对所述文本数据进行逐行字段处理,得到各行的字段数据;依次对各行的所述字段数据进行解析处理,得到对应各行的字段数组;依次对各所述字段数组进行数据校验,得到各校验后字段数据;并将各所述校验后字段数据依次进行格式转换,得到对应各行的JSON数据;将JSON数据放入系统队列中;在放入系统队列中的所述JSON数据的数量达到预设阈值时,将对应所述预设阈值数量的所述JSON数据批量导入所述Elasticsearch搜索服务器;所述依次对各行的所述字段数据进行解析处理,得到对应各行的字段数组,包括:基于字段数据中各个字段之间的分隔符,对各个字段进行分段处理,进而得到对应各行的字段;将各行包含的字段进行数组处理,进而得到对应各行的字段数组;其中,所述字段数据包括多个字段;各个字段之间通过分隔符连接;所述依次对各所述字段数组进行数据校验,得到各校验后字段数据的步骤包括:依次对各所述字段数组进行数据校验,若所述字段数组中的字段存在非法字符,则根据相应字段对所述非法字符进行修正,得到各所述校验后字段数据;所述方法还包括:采用可配置的方式,在工具调起的同时,通过传参的方式,告知服务启动的执行线程,根据运行服务器的具体配置,调整工作参数。
全文数据:
权利要求:
百度查询: 量子数聚(北京)科技有限公司 数据导入方法、装置、系统及计算机可读存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。