恭喜上海普洛斯普新数字科技有限公司蔡毅辉获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜上海普洛斯普新数字科技有限公司申请的专利一种提取识别线上或系统商品特征信息的系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113570427B 。
龙图腾网通过国家知识产权局官网在2025-03-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202110829138.2,技术领域涉及:G06Q30/0601;该发明授权一种提取识别线上或系统商品特征信息的系统是由蔡毅辉;陈明君;贾艺璇设计研发完成,并于2021-07-22向国家知识产权局提交的专利申请。
本一种提取识别线上或系统商品特征信息的系统在说明书摘要公布了:本发明公开一种提取识别线上或系统商品特征信息的系统,所述商品特征信息识别是将描述特定商品的属性字段进行提取,涉及商品信息特征识别领域。所述的特征提取模块包括:标题模块301、文字描述模块302、图片描述模块303、符号分隔模块304,标题模块301获取商品标题文字,将标题进行分词,计算词组权重,输出品牌名称和商品特征属性;本发明通过设置深度神经网络模型,可以根据类别预测描述商品特征信息,增强商品本身特征信息计算的权重,提高准确率。
本发明授权一种提取识别线上或系统商品特征信息的系统在权利要求书中公布了:1.一种提取识别线上或系统商品特征信息的系统,其特征在于:所述商品特征信息识别是将描述特定商品的属性字段进行提取,其具体的步骤为:步骤S10:收集电商平台商品特征信息,通过人工数据校对、标注,使数据为字典形式,字典格式为:{类别,特征属性},将商品特征信息放入循环神经网络模型中进行训练,计算类别与特征属性的相关度,并保存网络模型参数;步骤S20:输入商品地址或推送商品信息系统,特征提取模块获取商品详情状态,判断文字描述信息和图片描述信息的存在状态,选择不同的工作模式:1只存在文字描述信息;2文字描述信息和图片描述信息同时存在;步骤S30:基于步骤S20的工作模式,利用特征提取模块,对商品的特征信息进行识别并提取,将提取的特征信息保存到原始信息库中;步骤S40:将原始信息库中的特征信息进行数据处理,通过分词、清洗、预测、整理步骤,使原始信息库中的特征信息转化为标准信息库中的特征信息,对商品的特征信息进行格式化处理;步骤S50:将提取到的特征信息进行格式化组合:首先计算提取到的每一项特征信息与已知商品的特征信息计算相关度,得出该特征信息可以描述商品的置信度,然后将高置信度的特征信息进行有序组合,使特征信息能够完整的描述商品,此特征信息包含描述商品的所有字段;步骤S10中训练循环神经网络模型的具体步骤为:步骤S101:首先爬取商品销售平台的公开数据,提取商品类别及商品的各种描述特征,并以表格形式存储;步骤S102:通过人工对数据校对、标注,使数据形成{类别,特征属性}的形式,建立词表,类别为商品在电商平台的上位分类,特征属性为多个描述商品的属性;步骤S103:将人工标注过的数据输入到长短期记忆网络模型中,建立特征与形与类别的损失函数,优化损失函数,通过输入商品的特征信息,学习并预测商品的类别,构成编码器;网络模型通过反向传播更新参数;步骤S104:训练长短期记忆网络模型为解码器用于输出:当输入商品类别时,商品的特征属性,通过反向传播更新参数计算;将编码器和解码器组合,构建可以预测商品特征信息的神经网络系统;所述的特征提取模块包括:标题模块301、文字描述模块302、图片描述模块303、符号分隔模块304,标题模块301获取商品标题文字或系统推荐信息,将标题进行分词,计算词组权重,输出品牌名称和商品特征属性;通过判断是否存在图片描述信息来决定图片描述模块是否工作,图片描述模块通过对图片进行OCR识别,提取图片描述的文字信息;文字描述模块和图片描述模块获取到的文字,通过字符分割模块的作用,将获取到的文字通过段落,特殊符号分割信息进行分割,按特征信息的划分段落,使数据格式对齐;通过对比文字描述模块和图片描述模块提取的信息,补全商品特征信息;步骤S40中进行数据处理的具体步骤为:步骤S401:首先将标题进行分词处理,将分词结果以词表的形式保存,然后去除营销标题热词,消除对商品描述的高频无用信息;步骤S402:将清洗后的数据传入到长短期记忆网络模型中,通过模型计算该商品类别下描述该商品相关度高的特征信息,计算已知商品特征信息与清洗后的数据之间的置信度,进而在通过数据计算特征信息权重时,提高清洗后数据的商品特征信息的权重;步骤S403:输出权重高的特征信息,特征信息包含描述该商品的所有特征信息字段,根据特征信息字段可以确定商品本身;所述的输出的特征信息可作为用于扩充训练网络模型的数据存储在数据库中;所述的系统包含深度神经网络模型和存储数据的数据库。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海普洛斯普新数字科技有限公司,其通讯地址为:200135 上海市浦东新区张扬路2389弄3号普洛斯大厦11楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。