一种烟草专卖市场监管大数据E-R模型的构建方法

导航：龙图腾网> 最新专利技术> 一种烟草专卖市场监管大数据E-R模型的构建方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：中国烟草总公司四川省公司

摘要：本发明公开了一种烟草专卖市场监管大数据E‑R模型的构建方法，包括如下步骤：步骤一：以烟草专卖市场历史涉烟数据为对象，构建用于涉烟数据元聚类的涉烟数据样本集；步骤二：利用基于涉烟关键词的信息熵，从样本数据集中抽取并生成涉烟数据元；步骤三：通过烟草专卖领域的内容结构视图，为数据元代入涉烟语义；步骤四：通过涉烟数据元，构建烟草专卖市场监管大数据E‑R模型；步骤五：通过大数据E‑R模型指导并生成对应的涉烟大数据数据管理系统，为市场监管和涉烟案件信息化研判提供数据支持。通过本发明，可以为烟草市场监管和公安部门涉烟违法犯罪的数据分析、各级烟草专卖行政执法部门的信息化监管，提供数据。

主权项：1.一种烟草专卖市场监管大数据E-R模型的构建方法，其特征在于，包括如下步骤：步骤一：以烟草专卖市场历史涉烟数据为对象，构建用于涉烟数据元聚类的涉烟数据样本集；步骤二：利用基于涉烟关键词的信息熵，从样本数据集中抽取并生成涉烟数据元；步骤三：通过烟草专卖领域的内容结构视图，为数据元代入涉烟语义；步骤四：通过涉烟数据元，构建烟草专卖市场监管大数据E-R模型；步骤五：通过大数据E-R模型指导并生成对应的涉烟大数据数据管理系统，为市场监管和涉烟案件信息化研判提供数据支持；所述的涉烟数据样本集构建包括如下步骤：采集涉烟数据，对数据进行清洗，将数据中的空白数据进行去除，得到清洗后的数据；判断清洗后的数据的时间戳是否有效，若有效，则按照时间先后进行排序；对排序后的数据进行噪声数据修正，对修正后的数据进行格式转换并对齐，得到涉烟数据集；建模方法包括如下步骤：Step1：以涉烟样本数据集为对象，通过Elasticsearch引擎的涉烟敏感词结构化检索库，进行关键字检索和统计，构建涉烟词云；Step2：将词云中的关键词聚合为涉烟数据元，通过ANSJ中文分词算法对关键词进行提取和聚类；Step3：计算涉烟关键词的信息熵，采用的信息熵计算公式如下所示：Hw＝-∑plogp其中w代表关键词；Hw为关键词的信息熵；p代表关键词左侧或右侧出现不同词的统计数；Step4：Hw表征ANSJ算法抽取出的关键词的信息熵，不同的关键词所构成的信息熵值序列，通过熵值序列的泛函空间距离对不同的涉烟数据进行聚类，得到涉烟大数据模型中的基本数据元，熵值聚类算法如下所示：其中Xt，Yt为关键词集合中的两个同类关键词序列的熵值；t为同一类型中不同的关键词序号；P为关键词出现频数；a，b为同类关键词序列的下确界和上确界；dpxt，Yt为两个涉烟关键词在样本空间中的泛函空间距离；Step5：选取临界值r＝0.5，对Step4中的熵值序列进行聚类，抽取出涉烟数据元；Step6：采用delphi法，将涉烟数据中具有某一共同特性的信息集合，构建内容结构视图；Step7：按照完整性和合理性约束，内容结构视图中的语义代入到step5中抽取出的数据元中，并利用E-R建模技术，生成数据元体系对应的逻辑模型和物理模型，得到涉烟大数据模型。

全文数据：

权利要求：

百度查询：中国烟草总公司四川省公司一种烟草专卖市场监管大数据E-R模型的构建方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：App自测试系统、方法、电子设备及存储介质

下一篇：为牵引电池充电的充电电路和方法、电动车辆

相关技术

App自测试系统、方法、电子设备及存储介质

为牵引电池充电的充电电路和方法、电动车辆

一种玻璃瓶裂纹检测装置

一种用于多弯曲半径的数控弯曲连接装置及使用方法

一种内陆区域地下水封洞设计水位的确定方法

电信网元实时处理方法、装置、设备、介质及程序产品

一种沙门氏菌预富集培养基及其制备方法和在即食调味品中的应用

一种炉头自动生产线及其工艺

一种商用电动汽车充电效率提升的装置及方法

超临界CO₂腐蚀测试系统的样品加载装置

路径规划方法、系统、设备及计算机可读存储介质

马达

数据相关技术

数据写入方法、数据写入组件和数据写入装置_杭州长川科技股份有限公司_202410867512.1

数据处理方法、数据处理装置、数据采集装置与车辆_小米汽车科技有限公司_202411449246.7

一种基于数据模型的跨数据库数据同步方法_中科天玑数据科技股份有限公司_202411228573.X

构建数据的方法和装置以及数据库之间同步数据的系统_北京沃东天骏信息技术有限公司_202010181867.7

数据匿名方法与数据匿名系统_财团法人工业技术研究院_202010401584.9

数据开发中的增量数据离线同步方法_杭州观远数据有限公司_202411110714.8

数据处理方法及数据处理装置_联想(北京)有限公司_202411139414.2

数据收集装置、程序及数据收集方法_古河电气工业株式会社_202380032073.6

数据的写入方法及其数据存储装置_慧荣科技股份有限公司_202010777138.8

地图数据以及地图数据的生成方法_爱知制钢株式会社_202080079988.9

监管相关技术

一种基于大数据的医疗废物在线监管方法及监管平台_北京争上游科技有限公司_202410971899.5

一种基于区块链的建筑材料监管系统与监管方法_中建五局第三建设有限公司_202410490153.2

建筑施工智能监管系统及其方法_湖南沐达建筑工程有限公司_202411035938.7

一种车辆监管装置_卡司安智能科技(苏州)有限公司_202420813463.9

核算数据的监管方法、系统及相关设备_中云智控(深圳)软件研发有限公司_202411064658.9

基于人工智能的碳减排监管方法_厦门易居达集团有限公司_202411307790.8

基于大数据的食品销售监管平台_北京兰德马品牌管理有限公司_202411001109.7

一种基于智能治理的数字监管系统_建元未来城市投资发展有限公司_202411437652.1

校车一车一档监管系统_福建丰业旅游有限公司_202411019368.2

一种森林防火道路出入口用监管设备_福州绿盾生态有限公司_202420562560.5

E-R相关技术

一种low-e玻璃表面处理设备_东莞市银建玻璃工程有限公司_202310136201.3

E形环自动化安装装置_重庆成田科技有限公司_202411094067.6

一种保证3R芯杆焊接同轴度的焊接工装_成都工具研究所有限公司_202411382773.0

一种基于波导E面介质集成的同轴-径向波导功分器_电子科技大学_202411275457.3

与延伸起始因子4E结合的肽和化合物_新加坡科技研究局_202080025505.7

以逐个零件为基础的电泳涂覆(E-COATING)_戴弗根特技术有限公司_202380031120.5

抗干扰的载脂蛋白E测定试剂盒、制备方法及检测方法_桂林优利特医疗电子有限公司_202411029965.3

一种圆柱谐振腔E型波导振荡器_西南交通大学_202310628276.3

利用E-SMR将二氧化碳转化为汽油_托普索公司_202380029448.3

一种飞腾E2000软件环境验证平台装置及验证方法_中国兵器装备集团自动化研究所有限公司_202411099983.9

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种烟草专卖市场监管大数据E-R模型的构建方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务