基于拉丁超立方的数据抽样方法、装置、电子设备及介质

导航：龙图腾网> 最新专利技术> 基于拉丁超立方的数据抽样方法、装置、电子设备及介质

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：北京远舢智能科技有限公司

摘要：本申请提供了一种基于拉丁超立方的数据抽样方法、装置、电子设备及介质，数据抽样方法包括：获取预先确定的预处理数据以及抽样数量；确定预处理数据的数据总数，利用数据总数确定每个预处理数据对应的立方体的位置标签；基于每个预处理数据对应的立方体的位置标签，对每个立方体进行预设次数的切分，更新每个预处理数据对应的立方体，并将最后一次切分所更新的立方体确定为目标立方体；在每个预处理数据对应的目标立方体中，确定出每个目标立方体对应的待抽取的预处理数据，并在待抽取的预处理数据中按照所述抽样数量抽取对应的预处理数据作为拉丁超立方抽样数据。采用本申请提供的技术方案能够提高拉丁超立方抽样的抽样效率以及适用性。

主权项：1.一种基于拉丁超立方的数据抽样方法，其特征在于，所述数据抽样方法包括：获取预先确定的预处理文本数据以及抽样数量；确定所述预处理文本数据的数据总数，利用所述数据总数确定每个预处理文本数据对应的立方体的位置标签；基于每个预处理文本数据对应的立方体的位置标签，对每个立方体进行预设次数的切分，更新每个预处理文本数据对应的立方体，并将最后一次切分所更新的立方体确定为目标立方体；在每个预处理文本数据对应的目标立方体中，确定出每个目标立方体对应的待抽取的预处理文本数据，并在待抽取的预处理文本数据中按照所述抽样数量抽取对应的预处理文本数据作为拉丁超立方抽样数据；通过以下步骤确定预处理文本数据：获取原始文本数据，将所述原始文本数据按照预设属性进行拆分，得到每个分区的原始文本数据；针对每个分区，将该分区的原始文本数据进行向量转换，得到该分区的所述原始文本数据的第一向量；其中，针对每个分区，使用模型bert对该分区每个原始文本数据进行向量转换，得到每个原始文本数据的第一向量；将该分区的所述原始文本数据的第一向量进行降维，得到该分区的所述原始文本数据的第二向量；将该分区的所述原始文本数据的第二向量进行归一化，得到该分区的所述原始文本数据的目标向量；将每个分区的每个原始文本数据的目标向量的组合，确定为预处理文本数据。

全文数据：

权利要求：

百度查询：北京远舢智能科技有限公司基于拉丁超立方的数据抽样方法、装置、电子设备及介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种气凝胶隔热垫复合封装结构

下一篇：一种外脚手架拉结点构件

相关技术

一种气凝胶隔热垫复合封装结构

一种外脚手架拉结点构件

食品加工灌装机

果丹皮蒸汽融糖车间

一种平面打磨装置

一种调节阀阀芯研磨装置

一种材料转运用可调节式托盘架

一种园林养护用修枝装置

一种高强度的防冲击变压器外壳

一种可切换光源的光学检测设备

一种公路转孔取芯装置

一种防跑偏的3D打印材料输送装置

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于拉丁超立方的数据抽样方法、装置、电子设备及介质

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务