一种结构化自监督的医患对话摘要方法

导航：龙图腾网> 最新专利技术> 一种结构化自监督的医患对话摘要方法

申请/专利权人：杭州电子科技大学

申请日：2021-12-31

公开（公告）日：2024-07-02

公开（公告）号：CN114334189B

主分类号：G16H80/00

分类号：G16H80/00;G06F16/35;G06F40/126;G06F40/216;G06F40/284;G06F40/295;G06N3/0442;G06N3/045;G06N3/084

优先权：

专利状态码：有效-授权

法律状态：2024.07.02#授权;2022.04.29#实质审查的生效;2022.04.12#公开

摘要：本发明公开了一种结构化自监督的医患对话摘要方法。本发明包括：1、对医患对话语料库中指定对话的诊断结果抽取疾病实体词Ⅰ；2.通过SOAP模型判断指定对话中每一句话对应主题类型并进行分类，得到初步的结构化内容；对结构化内容抽取摘要；通过抽取的摘要预测疾病实体词Ⅱ；3、基于抽取的摘要需近似于原始指定对话的替换假设，通过辅助任务进行摘要指导生成:对结构化内容进行编码过程中对结构化内容中的每个词进行下采样，然后通过文本分类从候选疾病词中选择正确的疾病实体词Ⅱ；调整编码参数直至辅助任务中疾病实体词Ⅰ和疾病实体词Ⅱ的差异收敛。本发明解决了医患对话数据集有限、显著的领域转移、摘要不准确的问题。

主权项：1.一种结构化自监督的医患对话摘要方法，其特征在于：该方法包括以下步骤：S1、对医患对话语料库中指定对话的诊断结果抽取疾病实体词I；S2、通过SOAP模型判断指定对话中每一句话对应主题类型并进行分类，得到初步的结构化内容；对结构化内容抽取摘要；通过抽取的摘要预测疾病实体词II；S3、基于抽取的摘要需近似于原始指定对话的替换假设，通过辅助任务进行摘要指导生成：首先对结构化内容进行编码，编码过程中对结构化内容中的每个词进行下采样，下采样后将它们编码；然后通过文本分类从候选疾病词中选择正确的疾病实体词II；采用RepSum策略调整编码参数，直至辅助任务中疾病实体词I和疾病实体词II的差异收敛；步骤S1文本生成TG采用编码器-解码器结构，整个诊断结果由双向LSTM连接和编码；每个词的表示是前向和后向LSTM状态的串联，表示编码中第i个词；解码器采用具有注意力机制的单向LSTM，在t时刻的注意力分布at和上下文向量ct被公式化为：其中，Wa是可学习的参数，σ是softmax函数，n表示诊断结果词的数量；st表示当前解码器状态；表示第i个词在t时刻的注意力分布；ai表示第i个词的注意力分布；看上下文向量和当前解码器状态st用于预测输出词在所有词汇表上的概率分布：pyt＝σWpφWk[yt-1；st；ct]+bk+bp3其中，Wp、Wk、bk、bp是可学习的参数；σ是softmax函数，φ是tanh函数，yt表示预测输出词，yt-1表示前一个预测输出词；pyt表示yt的概率分布；采用负对数似然作为损失函数，并通过路径encres→decres得到生成的损失表示为：其中，encres表示编码器；decres表示解码器，l＝{l1，l2，...，lq}是生成的词，q表示生成的词数量；通过encsum→decsum计算得到生成摘要的损失其中，encsum表示编码器，decsum表示解码器；为了保证基于原始指定对话和生成的摘要的结果相似性，解码器中添加KL散度以减少每个时间预测的概率分布之间的差异损失：因此，最终生成摘要的任务损失表示为：其中，α0、α1、α2是每个损失部分的权重；步骤S2所述的主题类型包括症状、用药、个人属性、检查结果、过往病史；使用SOAP模型对每一句话进行计算并标注对应主题，形成初步的结构化内容；步骤S3具体实现如下：对结构化内容进行编码，编码过程中对结构化内容中的每个词进行下采样，并将它们经过编码器编码；在前向训练和测试过程中，使用argmax采样进行离散化，简化为： g＝-log-logξ，ξ～U0，19其中，g是Gumble函数的贡献，U是统一化后的贡献；计算反向传播中的梯度，使用argmax采样的连续可微近似：其中，|V|是词汇大小，τ∈0，∞是临时参数；gj表示第j个词的贡献；表示第i个词在t时间步骤的概率；编码器encsum的输入表示为：其中，ewi是第i个词wi嵌入；辅助任务：文本分类TC从K个候选疾病词中选择正确的疾病实体词II；与任务TG中的编码类似，使用Bi-LSTM作为编码器；文本表示hd是每个词的隐藏状态的平均值；每个候选词也由Bi-LSTM编码，并由逻辑层f投影到一个密集向量，然后连接到hd；每个词属于正确答案的概率由逻辑层计算，其损失公式为：其中，zn表示真实得到的第n个候选疾病词；表示预测得到的第n个候选疾病词；使用KL散度来衡量疾病实体词I和疾病实体词II之间的差异：其中，pucres和pucsum是在K个候选者中的概率分布；采用RepSum策略调整编码参数，直至辅助任务中两个疾病实体词差异收敛。

全文数据：

权利要求：

百度查询：杭州电子科技大学一种结构化自监督的医患对话摘要方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种基于stm32的多功能监测装置

下一篇：一种凸轮分割器凸轮检测工装

相关技术

一种基于stm32的多功能监测装置

一种凸轮分割器凸轮检测工装

一种定位锁紧装置

阴离子合成洗涤剂标准样品制备容器

音柱系统

CCS电池盖板镍片偏移缺陷的检测方法、装置及电子设备

一种旋钮开关

一种乳腺肿瘤检查用显像装置

一种电缆生产批量切割装置

一种光塑料制品粉碎机

一种基于RFID的智能冷藏柜

一种铁路货车下侧门密封结构

患相关技术

一种患肢功能锻炼的爬墙架_郑州大学第二附属医院_202322976078.4

一种智能医护患呼叫对讲系统及方法_深圳市麦驰物联股份有限公司_202410450955.0

医用支撑患肢手枕装置_东莞东华医院有限公司_202322470071.5

一种化疗药物外渗护理用的抬高患肢结合型冷热敷带_中国医学科学院北京协和医院_202420157593.1

一种用微生物发酵无患子浸提液进行蚕丝脱胶的方法_浙江理工大学_202410466763.9

一种以健带患手部功能康复训练手套_河南中医药大学_202420194503.6

一种移动式起搏器患肢术后制动加压马甲_上海市同济医院_202322150202.1

治疗患1型肝肾综合征的患者的方法_马林克罗特医疗产品知识产权公司_202111342532.X

一种高效检测功能的人畜共患传染病病原体试剂盒_济南海关技术中心_202410551125.7

护患手环组件_首都医科大学附属北京同仁医院_202323436978.6

医相关技术

一种基于互联网的医链教学管理系统_杭州卓健信息科技股份有限公司_202110758277.0

一种壮医莲花针_广西中医药大学_201810158062.3

一种用于医美注射的注射器_红色未来生物科技(北京)有限公司_202322674905.4

蒙医温针针刺髋穴的虚实结合训练系统_内蒙古医科大学_202410576329.6

一种医养康护一体化个人照顾的管理方法及系统_广州市老人院(加挂广州市第二老人院和广州市老年医院牌子)_202410541592.1

一种柔性医美灯罩和医美灯具_深圳市光脉电子有限公司_202323068470.5

一种医工交互方法、装置及设备_广东健齿生物科技有限公司_202110742330.8

一种特医食品生产设备清洗装置_深圳市捷利康生物科技有限公司_202323221291.0

一种血糖医废收集分离装置_复旦大学附属中山医院_202322116587.X

一种医美用胶原蛋白混合装置_宁波孵瑞控股有限公司_202323336254.4

监督相关技术

一种设有安全接入服务结构的区块链监督系统_成都枉锦舫网络科技有限公司_202310157745.8

一种电网设备检测程序监督管理方法及系统_山东恒茂电力科技有限公司_202410495115.6

一种基于自监督特征学习的暗光场景目标检测方法_南昌航空大学_202410228499.5

基于联邦学习和双重监督对比学习的故障诊断方法及系统_山东大学_202410501155.7

一种基于盲点网络的SAR图像自监督去噪方法和系统_北京理工大学_202410505245.3

城市Mesh数据的半监督语义分割方法、装置和设备_中国人民解放军国防科技大学_202410892756.5

基于非理想监督的恶劣天气图像复原系统_哈尔滨工业大学_202311358237.2

一种基于自监督学习的快速磁共振扩散成像重建方法_贵州大学_202410688048.X

基于对比学习的无监督高效视频检索方法、装置及设备_杭州海康威视数字技术股份有限公司_202410875356.3

一种基于自监督迁移学习的无创血压估计方法_北京航空航天大学_202211609290.0

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种结构化自监督的医患对话摘要方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务