买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本文中描述了一种用于生成提供输入文本的分布表示的密集嵌入向量的计算机实现的技术。在一种实现中,该技术包括:生成维度为g的输入词条频率TF向量,该输入TF向量包括与输入文本的实例中的词条的出现频率相关的频率信息;使用TF修改通过相应机器训练加权因子来修改输入TF向量中的词条特定频率信息,以产生维度为g的中间向量;使用投影组件将维度为g的中间向量投影到维度为k的嵌入向量中,其中k小于g。TF修改组件和投影组件都可以使用相应机器训练神经网络。应用组件可以基于嵌入向量来执行基于取回的功能、基于识别的功能、基于推荐的功能、基于分类的功能等中的任何功能。
主权项:1.一种或多种计算设备,用于处理文本的实例,包括:硬件逻辑电路,所述硬件逻辑电路包括:a一个或多个硬件处理器,通过执行被存储在存储器中的机器可读指令来执行操作,和或b一个或多个其他硬件逻辑单元,使用逻辑门的任务特定集合来执行操作,所述操作包括:响应于使用用户计算设备采取的动作而接收输入文本的实例;生成输入词条频率TF向量,所述输入TF向量包括与所述输入文本中的词条的出现频率相关的频率信息,所述输入TF向量对应于具有规定维数并且具有多个TF值的向量,所述输入TF向量的每个维度对应于预定大小的词汇表中的词条;使用TF修改神经网络通过与所述输入TF向量的相应维度相关联的相应机器训练加权因子修改所述输入TF向量中的与所述词汇表中的相应词条相关联的所述频率信息,以产生中间向量,所述中间向量具有与所述输入TF向量相同的维数,所述TF修改神经网络通过经由与所述输入TF向量中的特定TF值具体相关联的对应机器训练加权因子修改所述输入TF向量中的每个特定TF值来操作,所述TF修改神经网络由所述硬件逻辑电路实现并且包括至少一层神经元;使用投影神经网络将所述中间向量投影到维数小于所述输入TF向量的所述维数的嵌入向量中,所述嵌入向量提供所述输入文本中的语义信息的分布式紧凑表示,所述投影神经网络由所述硬件逻辑电路实现并且包括至少一层神经元;以及利用所述嵌入向量产生输出结果,所述输出结果能够由所述用户计算设备访问。
全文数据:
权利要求:
百度查询: 微软技术许可有限责任公司 使用机器训练词条频率加权因子的产生密集嵌入向量的编码器
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。