买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:深圳证券信息有限公司
摘要:本申请公开了一种公告内容分析方法,所述公告内容分析方法包括:对目标公告中的元素进行标注得到所述目标公告的篇章结构;根据所述篇章结构提取所述目标公告的元素特征得到每一所述元素的特征工程;根据所述特征工程生成所述目标公告的知识图谱;若接收到公告内容分析请求,则利用所述知识图谱输出所述公告内容分析请求对应的分析结果。本申请能够提高对公告的处理精度,实现高准确性的公告内容分析。本申请还公开了一种公告内容分析系统、一种电子设备及一种存储介质,具有以上有益效果。
主权项:1.一种公告内容分析方法,其特征在于,包括:对目标公告中的元素进行标注得到所述目标公告的篇章结构;其中,所述目标公告为包含目录的公告;根据所述篇章结构提取所述目标公告的元素特征得到每一所述元素的特征工程;根据所述特征工程生成所述目标公告的知识图谱;其中,所述知识图谱中嵌入有所述篇章结构的语义知识;若接收到公告内容分析请求,则利用所述知识图谱输出所述公告内容分析请求对应的分析结果;其中,所述对目标公告中的元素进行标注得到所述目标公告的篇章结构,包括:对所述目标公告中的目录、段落、表格和自定义元素进行标注得到所述目标公告的篇章结构;其中,根据所述篇章结构提取所述目标公告的元素特征得到每一所述元素的特征工程,包括:根据所述篇章结构对所述目标公告进行预处理,得到元素特征;其中,所述元素特征包括元素实体、实体关系、关键词、关键词的TF-IDF值、段落位置信息、段落的文本语义向量、段落与每一级标题的相似度;按照所述元素特征与所述元素的对应关系存储所述元素特征,得到每一所述元素对应的特征工程;其中,根据所述特征工程生成所述目标公告的知识图谱,包括:构建所述目标公告的公告内容分析模型;其中,所述公告内容分析模型包括定位功能模块、抽取功能模块、分类功能模块和计算功能模块,所述定位功能模块用于对查询内容进行定位,所述抽取功能模块用于抽取查询条件对应的信息,所述分类功能模块用于输出查询问题对应的分类结果,所述计算功能模块用于计算查询问题对应的计算结果;将每一所述元素和相邻元素的特征工程输入所述公告内容分析模型,对所述公告内容分析模型进行训练,得到模型处理结果;根据所述模型处理结果生成所述知识图谱;其中,还包括:将定位、抽取、分类和计算流程构建为可视化的pipline过程,以实现可视化预测结果;在修正预测结果后将数据加载回语料及模型实现增量训练;该过程产生的数据包括篇章结构表、要素预处理特征表、表格内容表、文本实体和关系表、要素标注表以及预测结果;所述篇章结构表包括目录、段落和表格的位置和索引;按照金融证券领域知识和篇章结构构建一个领域本体库,将处理结果加载到知识图谱中,通过知识图谱及图计算判定公告中蕴含的风险;本体库指元素和对应的特征工程中的列,处理结果指每个公告里的元素和特征工程中的行,图计算的对象是本体库和处理结果。
全文数据:
权利要求:
百度查询: 深圳证券信息有限公司 一种公告内容分析方法、系统、电子设备及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。