获取对话语义表示的方法和语义表示模型训练方法及装置

导航：龙图腾网> 最新专利技术> 获取对话语义表示的方法和语义表示模型训练方法及装置

申请/专利权人：阿里巴巴达摩院(杭州)科技有限公司

申请日：2021-09-15

公开（公告）日：2024-07-05

公开（公告）号：CN113743128B

主分类号：G06F40/35

分类号：G06F40/35;G06N3/0499;G06N3/0895

优先权：

专利状态码：有效-授权

法律状态：2024.07.05#授权;2021.12.21#实质审查的生效;2021.12.03#公开

摘要：本申请公开了一种获取对话语义表示的方法和语义表示模型训练方法及装置，通过引入角色级响应选择自监督任务，实现了多角色对话在无标注的情况下的自监督训练和优化，摆脱了对话表示学习对于标签的依赖；通过引入角色级自注意力机制，实现了语义表示模型自动学习，对多角色对话表示具有更加重要意义的发言，使得对话语义表示具备了更加良好的效果。本申请实施例中，将利用数据中的固有特征实现的自监督学习应用于多角色对话的实现中，摆脱了对监督学习中的标签的依赖的，不仅降低了实现成本，而且也提升了实现多角色对话的效果，简单、有效地实现了多角色对话。

主权项：1.一种获取对话语义表示的方法，所述方法通过训练完成的语义表示模型实现，包括：获得至少两个角色之间的对话文本，所述对话文本包括多个对话语句；获得每个角色的对话语句的句向量组，并根据所述句向量组获得每个角色的语义表示；根据不同角色的语义表示，得到所述对话语义表示；所述语义表示模型通过如下方法训练得到：待训练的至少两个角色之间的样本对话文本进行嵌入操作，获得每个角色的样本对话文本的嵌入表示向量样本，其中，所述样本对话文本包括正样本和负样本；其中，所述正样本为所述样本对话文本本身，所述负样本为通过以下方式构建的样本：对于该待训练的对话的正样本，随机选择一个角色，随机抽取选择出的角色的另一个对话的对话文本与该正样本的另一个角色的对话文本组成新对话的样本对话文本；将新对话的样本对话文本作为负样本；对同一个角色嵌入表示向量样本进行编码，得到每个角色对应的句向量样本；通过自注意力机制对每个角色对应的句向量样本进行聚合，获得每个角色对应的语义表示样本；将不同角色对应的语义表示样本进行拼接，得到匹配特征；根据所述匹配特征对所述语义表示模型的网络参数进行调整；其中，所述通过自注意力机制对每个角色对应的句向量样本进行聚合，获得每个角色对应的语义表示样本包括：为所述待训练的某个角色的一组文本中的每个句子分配一个权重；计算每个句子的句向量样本与其对应的权重的乘积后聚合，得到一个对话的某个角色对应的分布式高维向量，作为所述语义表示样本；其中，所述根据所述匹配特征对所述语义表示模型的网络参数进行调整包括：将所述正样本对应的匹配特征的预测值预测为1，以及将所述负样本对应的匹配特征的预测值预测为0；基于预测值与真实值的损失更新所述语义表示模型的网络参数。

全文数据：

权利要求：

百度查询：阿里巴巴达摩院(杭州)科技有限公司获取对话语义表示的方法和语义表示模型训练方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种洗衣粉仓储自动取料机

下一篇：一种太阳高度角演示仪

相关技术

一种洗衣粉仓储自动取料机

一种太阳高度角演示仪

电池端面检测装置

点云数据处理设备和方法

一种前列腺支架

一种球形石墨成型装置

一种通信工程用便携式光缆切割装置

CCS电池盖板镍片偏移缺陷的检测方法、装置及电子设备

一种透气式指尖血氧仪

一种智能电表远程监测系统及方法

工业控制器的数字孪生的自动设置

一种基于stm32的多功能监测装置

表示相关技术

转辙机外表示杆的连接机构_西门子信号有限公司_201711242545.3

一种基于网络表示学习的域间路由异常检测方法_清华大学_202410563992.2

一种基于量子表示学习的致病circRNA预测方法_郑州轻工业大学_202211136191.5

基于临床文本增强的患者表示方法及序列疾病预测装置、电子设备_齐鲁工业大学(山东省科学院)_202410553838.7

一种基于对比增强下翻译转置的多模态知识图谱表示方法_北京科技大学_202410442524.X

用于编码和解码表示至少一个图像的数据流的方法和设备_奥兰治_201980061935.1

知识图谱的表示学习方法及装置_腾讯科技(深圳)有限公司_202110182294.4

触觉信号的基于时间线的表示_交互数字CE专利控股有限公司_202280082566.6

一种指针式仪表示值识别装置及使用方法_江西省检验检测认证总院计量科学研究院_202410476140.X

一种隧道锚杆压力数据表示预警方法及相关设备_西南交通大学_202310527275.X

方法相关技术

上车点推荐方法及交互方法_北京嘀嘀无限科技发展有限公司_202311396150.4

用户设备及其方法、基站及其方法_夏普株式会社_201811515628.X

研磨垫用修整器、修整方法、研磨方法以及工件的制造方法_株式会社则武_202280083872.1

水路切换阀及校准方法、反洗控制方法、过滤控制方法_南京天河水环境科技有限公司_201710852707.9

图像编码方法、图像解码方法以及装置_株式会社KT_202210143470.8

辐射探测芯片及其制备方法、辐射探测方法_陕西迪泰克新材料有限公司_202410890139.1

信息处理方法、问答方法及问答系统_阿里云飞天(杭州)云计算技术有限公司_202410874305.9

动态加载方法、装置及应用模块拔插方法_中国平安人寿保险股份有限公司_201810931288.2

粒子的制造方法和成形体的制造方法_AGC株式会社_201980086649.0

高空警示装置、安装方法及拆卸方法_浙江通明电器股份有限公司_202410874153.2

语义相关技术

多语义识别方法、装置、设备和介质_北京百度网讯科技有限公司_202110298215.6

语义分割方法、装置、电子设备及存储介质_重庆长安科技有限责任公司_202410569544.3

一种融合视觉表观与边缘结构信息的语义分割方法_西安理工大学_202410504955.4

基于语义和标签结构挖掘的遥感图像多标签分类方法_西安理工大学_202410650288.0

一种基于语义思维链的代码生成方法、装置、终端及介质_粤港澳大湾区数字经济研究院(福田)_202410487323.1

语义数据处理、内容推荐方法、装置和计算机设备_腾讯科技(深圳)有限公司_202210111933.2

基于视觉语义分割和轨迹指引的端到端运动规划方法及系统_南京晓庄学院_202410538271.6

一种对话系统语义分析方法、系统、电子装置及存储介质_厦门快商通科技股份有限公司_202111271655.9

基于运动目标语义增强的多模态中学实验步骤检测方法及系统_南京师范大学_202410655427.9

基于语义强化的无人机视角下人体目标检测方法及系统_齐鲁空天信息研究院_202410873754.1

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

获取对话语义表示的方法和语义表示模型训练方法及装置

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务