买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:国网江苏省电力有限公司南京供电分公司
摘要:一种基于NLP与热点词元分析的用电诉求辨析方法和系统,所述方法包括:基于NLP提取用户用电诉求工单上的文字并对文字进行语义识别;通过上下文语义对工单上的文字进行基础词元的分割,将分割得到的基础词元与专业词元数据库中专业词元进行对比,合并专业基础词元;筛选基础词元中的热点词元,将筛选得到的热点词元与数据库中的多维热点词元进行相关度对比,得出若干关键词;将关键词按照不同语序拼接得到若干关键词拼接句,将关键词拼接句与诉求分类库中的诉求数据进行关联度计算,将关联度最高的诉求分类库中的诉求作为用电诉求辨析结果。
主权项:1.一种基于NLP与热点词元分析的用电诉求辨析方法,其特征在于:所述方法包括以下步骤:S101、基于NLP提取用户用电诉求工单上的文字并对文字进行语义识别;S102、通过上下文语义对工单上的文字进行基础词元的分割,将分割得到的基础词元与专业词元数据库中专业词元进行对比,将属于专业词元的基础词元进行合并;S103、筛选基础词元中的热点词元,将筛选得到的热点词元与数据库中的多维热点词元进行相关度对比,得出若干关键词;S103中,所述数据库包括方言词汇数据库、词汇拼音数据库和热点词汇数据库;所述方言词汇数据库,用于对本地区中含有热点词汇的方言词汇数据进行提取储存;所述热点词汇数据库,用于将普通话中对于诉求的热点词汇数据进行提取储存;所述词汇拼音数据库,用于对热点词汇数据的拼音相近词汇数据进行提取储存;将筛选得到的热点词元与数据库中的多维热点词元进行相关度对比,得出若干关键词,具体包括:1将方言词汇数据库、热点词汇数据库和词汇拼音数据库在维度向量上进行组合,得到多维热点词元组合集合:fn4=Nxk1,xk1cks,xk1okm其中,N为热点词元组合维度值;xk1为热点词汇数据库中诉求的第k项热点词汇数据的普通话表示;xk1cks表示词汇拼音数据库中诉求的第k项热点词汇数据的普通话表示拼音一样的s种相近词汇;xk1okm表示方言词汇数据库方言词汇中用于表示第k项热点词汇的m种形式;2热点词元集合中依次提取单个词元,与多维热点词元组合集合中的单个维度向量之间进行单个词元相关度计算;3将求的单个词元相关度与相关度阈值对比,若单个词元相关度小于相关度阈值,则对应词元不设置为关键词,否则取最大相关值对应的集合xk1,xk1cks,xk1okm中的词元xk1作为关键词,依次代入多维热点词元组合集合中的元素和热点词元集合中的元素,得到若干个关键词;S104、将关键词按照不同语序拼接得到若干关键词拼接句,将关键词拼接句与诉求分类库中的诉求数据进行关联度计算,将关联度最高的诉求分类库中的诉求作为用电诉求辨析结果。
全文数据:
权利要求:
百度查询: 国网江苏省电力有限公司南京供电分公司 一种基于NLP与热点词元分析的用电诉求辨析方法和系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。