首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

通过选择性索引进行的搜索引擎优化 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:电子湾有限公司

摘要:示例实施例涉及识别有价值的查看项目页面以用于搜索引擎优化的系统和方法。该系统和方法提供了对现有系统的改进,现有系统不会识别或选择用于驱动来自显示站点的流量的有价值的查看项目页面。本文描述的系统和方法通过如下方式来改善较早的系统:基于作为输入变量的多个产品等级因子,预测给定产品的未来流量的概率,并且识别对对应于具有最高未来流量的概率的产品的视图项目页面的选择,以便最大化去往对应视图项目页面的链接站点的驱动自然搜索流量。

主权项:1.一种系统,包括:一个或多个处理器;以及存储指令的存储器,所述指令在由所述一个或多个处理器中的至少一个处理器执行时,使所述系统执行包括以下各项的操作:从数据库收集输入变量,所述输入变量包括产品的项目等级因子;基于所述输入变量生成机器学习模型数据对象;将目标变量指派给所述机器学习模型数据对象;基于所述目标变量和所述输入变量来训练所述机器学习模型数据对象;至少部分地基于已训练的机器学习模型数据对象来计算产品的项目列表的自然搜索流量值,其中所述自然搜索流量值指示将所述产品的项目列表作为自然搜索结果返回而不是作为广告呈现而返回的概率;基于所述自然搜索流量值和项目等级因子为所述产品的项目列表建立索引,以及基于所述索引识别与所述产品的项目列表对应的有价值的项目页面。

全文数据:通过选择性索引进行的搜索引擎优化[0001]要求优先权[0002]本申请要求2016年4月18日提交的美国申请No.15131,139的权益,该美国申请要求2015年6月30日提交的美国临时申请No.62187,016的优先权权益,其各自通过引用整体并入本文。技术领域[0003]本申请涉及用于搜索引擎优化的系统和方法。背景技术[0004]搜索引擎索引收集、分析和存储数据,以促进快速和准确的信息检索。存储索引的目的是优化在寻找搜索查询的相关文档时的速度和性能。如果没有索引,搜索引擎会扫描语料库中的每个文档,这将需要相当多的时间和计算能力。例如,虽然可以在毫秒内查询10,000个文档的索引,但是对10,000个大文档中的每个词的顺序扫描可能需要几个小时。为了在信息检索期间节省时间,对存储索引所需的额外计算机存储器以及进行更新所需的显著增加的时间进行了折中。附图说明[0005]在附图中通过举例说明而非限制性的方式示出了一些实施例,在附图中:[0006]图1是描绘可以在其中部署一个示例实施例的客户端-服务器系统的网络示图。[0007]图2是示出根据一些示例实施例的适用于针对选择性索引选择有价值的查看项目页面的选择性索引系统的组件的框图。[0008]图3是示出根据一些示例实施例的选择性索引系统在基于被索引的项目来识别有价值的查看项目页面时的操作的流程图。[0009]图4是机器学习ML模型的性能如何随决策阈值而变化的图示。[0010]图5是示出了具有计算机系统的示例形式的机器的示图表示,在所述计算机系统中,可以执行一组指令以使所述机器执行本文讨论的方法中的任意一个或多个方法。具体实施方式[0011]现在将具体参照用于执行本发明主题的具体示例实施例。实施例可以在没有这些细节中的一部分或全部的情况下被实施。将会理解,前述公开不旨在将权利要求的范围限制为所描述的实施例。相反,其旨在涵盖包括在所附权利要求所限定的本公开的范围内的备选方案、修改方案和等同方案。此外,可能没有详细描述公知的特征,以避免不必要地使主题模糊不清。[0012]示例实施例涉及一种用于识别有价值的查看项目页面VIP以改善例如,增加)从搜索引擎例如,G00GLE™、BING™去往链接到VIP的站点(例如,链接的站点、EBAY™等)的流量traffic的系统和方法。该系统和方法提供了对现有系统的改善,所述现有系统不会识别或选择在驱动来自显示站点的流量时使用的有价值的VIP。本文所述的系统和方法通过如下方式来改善较早的系统:基于作为输入变量的多个产品等级因子,预测给定产品的未来流量的概率,并且识别对与具有最高未来流量的概率的产品相对应的VIP的选择,以便最大化去往相应VIP例如EBAY的链接站点的驱动自然搜索流量。[0013]通过建立机器学习(ML模型来确定给定项目的未来流量的概率。ML模型基于一组输入来做出数据驱动的预测和决策。在一些示例实施例中,通过梯度提升机器学习技术GBM来产生ML模型。GBM是用于回归和分类的机器学习技术,其以弱预测模型(例如,决策树的组合体ensemble的形式产生预测模型。通过提供目标变量例如,自然搜索流量值)和作为输入数据的样本数据来训练和测试ML模型。ML模型然后可以在样本数据与目标变量输出之间做出相关。[0014]ML模型基于输入变量计算给定产品(或产品集合的未来流量的概率,该输入变量包括与产品或产品集合对应的VIP的项目等级因子和先前的搜索引擎优化SEO性能度量。先前的SEO性能度量包括:例如,自然搜索流量、查看计数、列表类型(例如,取消前有效、拍卖格式、荷式拍卖、现在购买等)、排名加权印象计数、元类别、观看计数、预测质量、类似产品的中间价格、价格、产品销售者列表的数量、在现场的时间、卖家反馈分数、退回计数例如,用户从入口页面离开站点而没有与页面交互的会话数量)、先前的退回计数、产品的数量、状况和销售数量。在一些实施例中,通过VIP的自然搜索流量被ML模型用作目标变量,以基于GBM技术来计算未来流量的概率。自然搜索流量是将产品作为自然搜索结果返回而不是作为广告呈现的频率。基于通过ML模型计算的自然搜索流量,所述系统被配置为对产品域产品集合做出索引或无索引决策。[0015]在计算了一组VIP的未来流量的概率,并且对产品(或产品集合做出索引和无索引决策之后,ML模型基于索引和无索引决策,从该组VIP中识别多个VIP中的一个,以最大化去往例如,VIP的)链接站点的流量。例如,系统可访问已经被分类为“索引”的产品的VIP,并且在VIP内插入HTML元标签,指示该VIP是索引页面。搜索引擎使用元标签来确定是否将页面作为搜索结果返回。因此,包括“索引”元标签的网页例如,产品列表页面,VIP将被检索并被包括在搜索结果集合中,而包括“无索引”标签的页面将不被示出在搜索结果集合中。因此,通过包括适当的标签索引或无索引),可以指定在搜索结果集合中是否可以返回页面例如,VIP。[0016]图1示出了高级的基于客户端-服务器的网络架构100的示例实施例。具有基于网络的发布或支付系统的示例形式的联网系统102经由网络104例如互联网或广域网WAN向一个或多个客户端设备110提供服务器侧功能。图1示出了例如在客户端设备110上执行的网络客户端112例如浏览器,比如由华盛顿州雷德蒙德的微软公司开发的IE㊣浏览器)、客户端应用114和VIP定位器应用116。[0017]客户端设备110可以包括但不限于:可穿戴设备、移动电话、台式计算机、膝上型计算机、便携式数字助理PDA、智能电话、平板计算机、超级本、上网本、笔记本计算机、多处理器系统、基于微处理器或可编程的消费电子产品、游戏机、机顶盒或用户可以用来访问联网系统102的任何其他通信设备。在一些实施例中,客户端设备110包括显示模块未示出)以显示信息例如,以用户界面的形式)。在另一些实施例中,客户端设备110包括触摸屏、加速度计、陀螺仪、相机、麦克风、全球定位系统GPS设备等中的一个或多个。客户端设备110可以是用于执行涉及联网系统102内的数字项目的交易的用户设备。在一个实施例中,联网系统102是基于网络的发布系统,该发布系统响应于对产品清单的请求,发布包括在基于网络的发布系统上可用的产品的项目清单的出版物,并且管理这些交易的支付。网络104的一个或多个部分可以是adhoc网络、内联网、外联网、虚拟专用网VPN、局域网LAN、无线LANWLAN、广域网WAN、无线WANWWAN、城域网(MAN、互联网的一部分、公共电话交换网PSTN的一部分、蜂窝电话网、无线网、WiFi网、WiMax网、另一类型的网络或两个或更多个这样的网络的组合。[0018]客户端设备110可以包括一个或多个客户端应用114也称作“app”),例如但不限于web浏览器、消息传送应用、电子邮件email应用、电子商务站点应用(也称作市场应用)等。在一些实施例中,如果电子商务站点应用被包括在客户端设备110中,则该客户端应用114被配置为本地提供用户界面以及功能中的至少一些,其中该客户端应用114被配置为根据需要与联网系统102通信,以获得本地不可用的数据或处理能力(例如,访问可供销售的项目的数据库、认证用户、验证支付方法)。相反,如果电子商务站点应用未被包括在客户端设备110中,则客户端设备110可以使用其web浏览器来访问联网系统102上容纳的电子商务站点或其变型)。[0019]—个或多个用户106可以是人、机器或与客户端设备110交互的其他装置。在示例实施例中,用户106不是网络架构100的一部分,但可以经由客户端设备110或其它装置与网络架构100进行交互。例如,用户106向客户端设备110提供输入例如,触摸屏输入或字母数字输入),并且该输入经由网络104传送给网络系统102。在该实例中,联网系统102响应于接收到来自用户106的输入,经由网络104将信息传送给客户端设备110以呈现给用户106。以这种方式,用户106可以使用客户端设备110与联网系统102交互。[0020]应用程序接口(API服务器120和web服务器122耦接至一个或多个应用服务器140,并分别向一个或多个应用服务器140提供编程和web接口。应用服务器140可以容纳一个或多个发布系统142和支付系统144,发布系统142和支付系统144中的每一个可以包括一个或多个模块或应用,并且可以以硬件、软件、固件或它们的任意组合来实现。相应地,应用服务器140被示为耦接到一个或多个数据库服务器124,所述数据库服务器便于对一个或多个信息存储库或数据库126的访问。在示例实施例中,数据库126是存储要被发布到发布系统142的信息例如,发布或列表的存储设备。根据示例实施例,数据库126还可以存储数字项目信息。[0021]另外,在第三方服务器130上执行的第三方应用132被示为具有经由API服务器120提供的编程接口对联网系统102的编程访问。例如,第三方应用132利用从联网系统102获取的信息,支持第三方所拥有的网站上的一个或多个特征或功能。例如,第三方网站提供由联网系统102的相关应用支持的一个或多个促销的发布、市场或支付功能。[0022]发布系统142向访问联网系统102的用户106提供多个发布功能和服务。支付系统144同样提供多个功能以执行或便于支付和交易。虽然发布系统142和支付系统144在图1中都被示为形成联网系统102的一部分,但是应当理解,在备选实施例中,每个系统142和144可以形成与联网系统102分离且不同的支付服务的一部分。在一些实施例中,支付系统144可以形成发布系统142的一部分。[0023]选择性索引系统150提供可操作来计算给定产品的未来流量的概率的功能,并且基于该概率,选择与具有最高流量的概率的产品对应的查看项目页面集合。例如,选择性索引系统150访问项目集合,生成ML模型,并且基于ML模型预测项目集合中的项目的未来流量的概率。在一些不例实施例中,选择性索引系统150是发布系统142的一部分。[0024]此外,虽然图1示出的基于客户端-服务器的网络架构100采用了客户端-服务器架构,但是本发明主题当然不限于此种架构,并且可以同样良好地应用于例如分布式或对等架构系统。各个发布系统142、支付系统144和选择性索引系统150还可以被实现为独立的软件程序,所述独立的软件程序不一定具有联网能力。[0025]web客户端112可以经由web服务器122所支持的web接口来访问各个发布系统142和支付系统144。类似地,VIP定位器应用116通过API服务器120提供的编程接口来访问由发布系统142和支付系统144提供的各种服务和功能。VIP定位器应用116可以例如生成ML模型以使用户能够预测项目集合中的特定项目的未来流量的概率,并且选择与具有最大未来流量概率的项目对应的查看项目页面,用于以离线的方式通过联网系统102在显示站点处显示,并且执行VIP定位器应用116和联网系统102之间的批量模式通信。[0026]图2是示出根据一些示例实施例的选择性索引系统150的组件的框图,其中将选择性索引系统150配置为识别针对选择性索引的有价值的查看项目页面。示出的选择性索引系统150包括数据收集模块202、建模模块204、索引模块206和项目页面选择模块208,全部模块被配置为彼此通信例如,经由总线、共享存储器、或交换机)。这些模块202-208中的任何一个或多个可以使用一个或多个处理器210来实现例如,通过配置这样的一个或多个处理器210来执行针对该模块描述的功能),并且因此可以包括一个或多个处理器210。[0027]所描述的模块202-208中的任何一个或多个可以单独使用硬件例如,机器的一个或多个处理器210或硬件和软件的组合来实现。例如,所描述的选择性索引系统150的任何模块可以物理地包括被配置为执行本文描述的针对该模块的操作的处理器210中的一个或多个的布置例如,机器的一个或多个处理器的子集或其中的部分)。作为另一个示例,选择性索引系统150的任何模块可以包括软件、硬件或两者,其配置具有一个或多个处理器210例如,机器的一个或多个处理器中的一个)的布置以执行本文描述的针对该模块的操作。因此,选择性索引系统150的不同模块可以包括并且配置这样的处理器210的不同布置或者在不同的时间点配置这样的处理器210的单个布置。此外,选择性索引系统150的任何两个或更多个模块可以被组合成单个模块,并且本文中针对单个模块描述的功能可以在多个模块之间进行细分。此外,根据各种示例实施例,本文描述为在单个机器、数据库或设备中实施的模块可以分布在多个机器、数据库或设备中。[0028]图3是示出根据一些示例实施例的选择性索引系统150在执行基于索引项目来识别有价值的查看项目页面的方法300时的操作的流程图。如图3所示,根据一些示例实施例,作为方法300的一部分例如前驱任务、子例程或部分),可以执行一个或多个操作302、304、306、308和310〇[0029]在操作302中,选择性索引系统150的数据收集模块202访问数据库(例如数据库126以收集与产品(或产品集合相关联的输入变量。输入变量包括项目等级因子。例如,所采集的项目等级因子包括产品的自然搜索流量(即,产品作为自然搜索结果被返回而不是作为广告来呈现的频率)、产品的查看计数(即产品列表获得多少“点击”)、价格、产品列表的数量(即在基于网络的发布系统内)、退回计数、提供产品的独家销售商的数量、销售产品的数量、产品在站点上的持续时间、以及搜索引擎优化因子例如在包括产品列表的发布的标题中的关键词)。[0030]在一些示例实施例中,项目等级因子可以位于本地数据库例如,数据库126内或位于第三方服务器130内。例如,数据收集模块202可以从转储例如数据库转储)中检索项目等级因子作为原始的未编辑数据。[0031]在操作304中,建模模块204使用梯度提升机器GBM建模技术来基于输入变量生成机器学习(ML模型数据对象,以计算产品的未来流量的概率。梯度提升是用于回归和分类问题的机器学习技术,其以弱预测模型(例如,决策树的组合体ensemble的形式产生预测模型。。梯度提升以互动的方式将弱学习者融合为单个强大的学习者。在一些示例实施例中,建模模块204可以另外使用产品的先前的SEO性能来计算概率。[0032]在操作306中,建模模块204基于由收集模块202采集的输入变量来训练ML模型。监督学习技术可以用来使用输入变量训练ML模型。在有监督的学习场景中,模型被提供有示例输入例如,输入变量及其期望的输出(例如目标变量),目标是将输入映射到期望的输出。收集模块202可以在预定的时间段例如,3个月)内访问并监测产品的样本集合在数据库126内或者在第三方服务器130处)以识别产品的样本集合的搜索流量值。产品的样本集合可以包括具有零搜索流量值完全没有流量)的产品的一部分以及具有大于零的搜索流量值任何流量)的一部分。然后可以基于产品的样本集合的搜索流量值来确定目标变量,并将其应用于ML模型。[0033]建模模块204向ML模型提供输入变量和作为目标变量的产品的自然搜索流量。基于输入变量和目标变量,建模模块204训练ML模型以通过识别对应于流量增加的项目等级因子在输入变量内)使将自然搜索驱动到链接站点的概率最大化。例如,建模模块204可以识别对应于自然搜索流量净增长的项目等级因子集合。[0034]在操作308中,索引模块206基于ML模型向(产品集合中的)产品指派索引状态(例如,“索引”或“无索引”)。例如,索引模块206可以基于由ML模型计算的自然搜索流量的概率将产品索引为“索引”或“无索引”。在一些示例实施例中,索引模块206接收阈值自然搜索流量值,并且基于产品的对应自然搜索流量值和项目等级因子对产品进行索引。例如,阈值自然搜索流量值可以基于由收集模块202监测的产品样本集合的自然搜索流量值。在进一步的示例实施例中,索引模块206可以接收指示该产品集合的自然搜索流量的值,并将该产品集合的自然搜索流量用作阈值。[0035]在操作310中,项目页面选择模块208基于索引的产品来选择有价值的项目页面VIPJIP可以对应于具有最大自然搜索流量概率的产品(根据基于ML模型计算的自然搜索流量值概率)。[0036]在操作312中,项目页面选择模块208向VIP指派“索引”HTML标签。例如,项目页面选择模块可以用“索引”HTML标签简单地标记VIP,其中“索引”HTML标签使VIP通过搜索引擎显示在搜索结果集合中。没有被项目页面选择模块208识别的页面被标记有“无索引”HTML标签,以便防止搜索引擎针对搜索请求来检索页面。[0037]图4是示出机器学习模型的性能如何随着决策阈值例如,阈值变化的图表400。如图4所示,X轴402对应于由建模模块204计算的阈值,并且y轴404对应于百分比(例如增益或损失)。如图表400所示,随着阈值增加,沿着y轴404的百分比增加。[0038]在一些实施例中,为了验证ML模型的性能,系统创建验证数据集。验证数据集是通过对产品的无差别随机采样其不同于产品样本组,不是产品样本集合的一部分产生的。为了测量ML模型的性能,考虑了验证度量,包括决策阈值,以及预测流量和实际流量之间的相关性。[0039]对于给定的决策阈值,可以从验证数据集中检索以下值:总VIP减少的百分比;由于减少造成的流量损失的百分比;错误否定百分比;购买项目损失的百分比;以及GBM损失的百分比。[0040]图5是示出根据一些示例实施例的识别和索引有价值的查看项目页面的方法500的处理流程的图。参考选择性索引系统150和数据库126之间的交互来描述图5的方法500。数据库126可以存储查看项目页面的语料库。[0041]模块、组件和逻辑[0042]某些实施例在本文中被描述为包括逻辑或多个组件、模块或机制。模块可以构成软件模块例如在机器可读介质上或在传输信号中体现的代码或硬件模块。“硬件模块”是能够执行某些操作并可以按特定物理方式来配置或布置的有形单元。在示例实施例中,一个或多个计算机系统例如独立计算机系统、客户端计算机系统或服务器计算机系统或计算机系统的一个或多个硬件模块例如处理器或处理器组可以由软件(例如,应用或应用部分配置为进行操作以执行本文描述的某些操作的硬件模块。[0043]在各实施例中,硬件模块可以用机械方式或电子方式来实现。例如,硬件模块可以包括永久地被配置为执行某些操作的专用电路或逻辑例如,硬件模块可以是专用处理器,例如现场可编程门阵列FPGA或专用集成电路ASIC。硬件模块还可以包括由软件暂时配置以执行某些操作的可编程逻辑或电路例如,包含在通用处理器或其它可编程处理器中的可编程逻辑或电路)。应理解:以机械方式、以专用和永久配置的电路或以临时配置的电路例如由软件配置实现硬件模块的决策可出于成本和时间的考虑。[0044]因此,短语“硬件模块”应当被理解为包含有形实体,应当是物理构成的、永久配置例如硬连线的)或暂时配置例如编程的)以在特定方式下工作或以执行本文描述的特定操作的实体。考虑临时配置例如编程硬件模块的实施例,无需在任一时刻配置或实例化硬件模块中的每一个。例如,在硬件模块包括由软件配置的通用处理器的情况下,通用处理器就可以在不同时间被配置为各自不同的硬件模块。因此,软件可以将处理器例如配置为在一个时刻构成特定硬件模块并在另一时刻构成不同的硬件模块。[0045]硬件模块可以向其他硬件模块提供信息并从其他硬件模块接收信息。因此,所描述的硬件模块可以被看作通信地耦接。在多个这种硬件模块同时存在的情况下,可以通过连接硬件模块的信号传输例如在适当的电路和总线上来实现通信。在多个硬件模块在不同时间配置或实例化的实施例中,可以例如通过存储并获取多个硬件模块可访问的存储器结构中的信息来实现这样的硬件模块之间的通信。例如,一个硬件模块可以执行操作并在与其通信耦接的存储设备中存储该操作的输出。另一硬件模块接着可以稍后访问存储器设备,以取得并处理所存储的输出。硬件模块还可以发起与输入或输出设备的通信,并且能够对资源例如信息的集合进行操作。[0046]此处描述的示例方法的各种操作可以至少部分地由临时配置例如通过软件或永久配置为执行相关操作的一个或多个处理器执行。无论是暂时地还是永久地配置,这样的处理器可以构成进行操作以执行一个或多个操作或功能的处理器实现的模块。在一些示例实施例中,本文中提及的“模块”包括处理器实现的模块。[0047]类似地,本文中描述的方法可以至少部分由处理器实现。例如,方法的至少一些操作可由一个或多个处理器或处理器实现的模块执行。某些操作的执行可以分布在一个或多个处理器中,并不只驻留在单个机器中,而是跨多个机器来部署。在一些示例实施例中,处理器可以位于单个位置例如在家庭环境、办公室环境或服务器群中),而在其他实施例中,处理器可以分布在多个位置。[0048]一个或多个处理器还可以操作以支持在“云计算”环境下的相关操作的执行或作为“软件即服务”(SaaS的相关操作的执行。例如,至少一些操作可以由一组计算机例如,包括处理器的机器来完成,这些操作是可经由网络例如,互联网)以及经由一个或多个适当的接口(例如,应用程序接口(API来访问的。[0049]电子装置和系统[0050]示例实施例可以用数字电子电路或者用计算机硬件、固件、软件或它们的组合来实现。示例实施例可以使用计算机程序产品(例如在信息载体中有形地表示的计算机程序)来实现,信息载体例如是由数据处理装置执行的机器可读介质或用于控制数据处理装置的操作的机器可读介质,数据处理装置例如是可编程处理器、计算机或多个计算机。[0051]可以用任何形式的编程语言来编写计算机程序,该编程语言包括:编译或解释语言,并且可以用任何形式来部署计算机程序,包括部署为独立的程序或者部署为适合用于计算环境的模块、子例程、或者其他单元。计算机程序可以被配置为在一个计算机执行或在位于一个地点处的多个计算机上执行或者在分布在多个地点上并通过通信网络互连的多个计算机上执行。[0052]在示例实施例中,操作可以通过一个或多个可编程处理器执行计算机程序来执行,以通过操作输入数据并产生输出来执行功能。方法操作还可以通过由专用逻辑电路例如,现场可编程门阵列FPGA或专用集成电路ASIC来执行,并且示例实施例的装置可以实现为专用逻辑电路。[0053]计算系统可以包括客户端和服务器。客户端和服务器一般相互远离并且通常通过通信网络进行交互。客户端和服务器的关系通过在相应计算机上运行并且相互具有客户端-服务器关系的计算机程序来产生。在使用可编程计算系统的实施例中,将清楚的是,需要考虑硬件架构和软件架构二者。具体地,将清楚的是,在永久配置的硬件例如ASIC中、在暂时配置的硬件中(例如软件与可编程处理器的组合)、或是在永久配置的与暂时配置的硬件的组合中实现特定功能可以是设计选择。下文阐述了可以在各种示例实施例中部署的硬件架构例如机器和软件架构。[0054]示例机器架构和机器可读介质[0055]图5是示出了根据一些示例实施例的能够从机器可读介质例如,机器可读存储介质)中读取指令并执行本文所讨论的方法中的任何一个或多个的机器500的组件的框图。具体地,图5示出了计算机系统的示例形式的机器500的示意图,其中可以执行指令516例如,软件、程序、应用、小应用、app或其他可执行代码)以使机器500执行本文讨论的任何一种或多种方法。另外或可选地,所述指令可以实现图2的模块。所述指令将通用的未编程的机器转换成被编程为以所描述的方式执行所描述和示出的功能的特定配置的机器。在备选实施例中,机器500作为独立设备操作或可以耦接例如,联网)到其他机器。在联网部署中,机器500可以在服务器-客户端网络环境中以服务器机器或客户端机器的能力进行操作,或者在对等或分布式网络环境中作为对等机器进行操作。[0056]机器500可以包括但不限于服务器计算机、客户端计算机、个人计算机PC、平板计算机、膝上型计算机、上网本、机顶盒STB、个人数字助理PDA、娱乐媒体系统、蜂窝电话、智能电话、移动设备、可穿戴设备例如智能手表)、智能家居设备例如智能家电)、其它智能设备、web设备、网络路由器、网络交换机、网络桥接器、或能够顺序地或以其它方式执行指定机器500要采取的动作的指令516的任意机器。此外,尽管仅示出了单个机器500,但是术语“机器”也将被认为包括机器500的集合,机器800单独地或联合地执行指令516以执行本文讨论的方法中的任何一个或多个。[0057]机器500包括可被配置为诸如经由总线502彼此通信的处理器510、存储器530和10组件550。在示例实施例中,处理器510例如,中央处理单元CPU、精简指令集计算RISC处理器、复杂指令集计算CISC处理器、图形处理单元GPU、数字信号处理器DSP、专用集成电路ASIC、射频集成电路RFIC、其他处理器或其任何适当组合可以包括例如可以执行指令516的处理器512和处理器514。术语“处理器”旨在包括可以包括可以同时执行指令的两个或更多个独立处理器有时称为“核”)的多核处理器。尽管图5示出了多个处理器,但是机器500可以包括具有单个核的单个处理器、具有多个核的单个处理器例如,多核处理)、具有单个核的多个处理器、具有多个核的多个处理器或其任意组合。[0058]存储器存储设备530可以包括存储器532比如,主存储器或其它存储储存设备)、以及存储单元536,存储器器932和存储单元936两者都可例如经由总线502由处理器510访问。存储单元536和存储器532存储体现本文所述的任何一种或多种方法或功能的指令516。在机器500执行指令516期间,指令516还可以完全地或部分地驻留在存储器532内、存储单元536内、处理器510例如,在处理器的高速缓存存储器内)的至少一个内、或其任何合适的组合内。因此,存储器532、存储单元536和处理器510的存储器是机器可读介质的示例。[0059]如本文所使用,“机器可读介质”是指能够暂时或永久地存储指令和数据的设备,并且可以包括但不限于随机存取存储器RAM、只读存储器ROM、缓冲存储器、闪速存储器、光学介质、磁性介质、高速缓冲存储器、其它类型的存储器例如,可擦除可编程只读存储器EEPROM和或其任何合适的组合。术语“机器可读介质”应被视为包括能够存储指令516的单个介质或多个介质例如集中式或分布式数据库、或相关联的缓存和服务器)。术语“机器可读介质”还将被认为包括能够存储被机器例如机器500执行的指令例如,指令516的任何介质或多个介质的组合,使得指令在被机器500的一个或多个处理器例如,处理器510执行时,使机器500执行本文所描述的方法中的任何一个或多个。因此,“机器可读介质”指单个存储装置或设备、以及包括多个存储装置或设备的“基于云”的存储系统或存储网络。[0060]IO组件550可以包括用于接收输入、提供输出、产生输出、发送信息、交换信息、捕获测量等的各种组件。包括在特定机器中的特定IO组件550将取决于机器的类型。例如,诸如移动电话的便携式机器可能会包括触摸输入设备或其它这样的输入机构,而无头服务器机器可能不包括这样的触摸输入设备。应当理解,IO组件550可以包括图5中未示出的许多其他组件。可以根据功能将IO组件550分组,以仅用于简化以下讨论,并且分组不以任何方式进行限制。在各种示例实施例中,IO组件550可以包括输出组件552和输入组件554。输出组件552可以包括可视组件例如显示器,比如等离子体显示面板PDP、发光二极管LED显示器、液晶显示器LCD、投影仪或阴极射线管CRT、声学组件(例如,扬声器)、触觉组件例如,振动马达、阻抗机构)、其他信号发生器等。输入组件554可以包括字母数字输入组件(例如,键盘、被配置为接收字母数字输入的触摸屏、光电键盘或其他字母数字输入组件)、基于点的输入组件(例如,鼠标、触摸板、轨迹球、操纵杆、运动传感器或其他定点仪器)、触觉输入组件例如,物理按钮、提供触摸或触摸手势的位置和力的触摸屏、或其他触觉输入组件)、音频输入组件例如,麦克风等。[0061]在另一些示例实施例中,IO组件550可以包括生物测定组件556、运动组件558、环境组件560或位置组件562、以及许多其他组件。例如,生物测定组件556可包括用于检测表达例如,手表达、面部表情、语音表达、身体姿势或眼睛跟踪)、测量生物信号例如,血压、心率、体温、汗水或脑波)、识别人例如,语音识别、视网膜识别、面部识别、指纹识别或基于脑电图的识别)等的组件。运动组件558可包括加速度传感器组件例如,加速度计)、重力传感器组件、旋转传感器组件(例如,陀螺仪等。环境组件560可以包括例如照度传感器组件例如,光度计)、温度传感器组件例如,检测环境温度的一个或多个温度计)、湿度传感器组件、压力传感器组件例如气压计)、声学传感器组件例如,检测背景噪声的一个或多个麦克风)、接近传感器组件例如,检测附近物体的红外传感器)、气体传感器例如,为安全而检测有害气体浓度或测量大气中的污染物的气体检测传感器)、或可以提供对应于周围物理环境的指示、测量或信号的其他组件。定位组件562可以包括位置传感器组件例如,全球定位系统GPS接收机组件)、高度传感器组件例如,高度计或检测气压的气压计根据气压可以导出高度)、取向传感器组件例如,磁力计等。[0062]可以使用各种各样的技术来实现通信。IO组件550可以包括通信组件564,通信组件564可操作以分别经由耦接582和耦接572来将机器500耦接到网络580或设备570。例如,通信组件564可以包括网络接口组件或与网络580接口连接的其他合适设备。在另一些示例中,通信组件564可以包括有线通信组件、无线通信组件、蜂窝通信组件、近场通信NFC组件、蓝牙⑧组件例如蓝牙®低能耗)、Wi-Fi⑧组件、以及经由其他模态提供通信的其他通信组件。设备570可以是另一机器或各种外围设备中的任一种(例如,经由通用串行总线USB耦接的外围设备)。[0063]此外,通信组件564可以检测标识符或包括可操作以检测标识符的组件。例如,通信组件564可以包括射频识别(RFID标签读取器组件、NFC智能标签检测组件、光学读取器组件例如,用于检测一维条形码如通用产品代码UPC条形码)、多维条形码如快速响应QR码)、Aztec码、数据矩阵(DataMatrix、数据字(Dataglyph、MaxiCode、PDF417、超级码、统一商业码缩减空间符号UCCRSS-2D条形码、以及其他光学代码)的光学传感器)、或声学检测组件例如,识别带标签的音频信号的麦克风)。此外,可以经由通信组件564来导出各种信息,例如经由互联网协议(IP地理位置的位置、经由—i-Fi®信号三角测量的位置、经由检测可以指示特定位置的NFC信标信号的位置等等。[0064]传输介质[0065]在各种示例实施例中,网络580的一个或多个部分可以是自组织网络、内联网、夕卜联网、虚拟专用网VPN、局域网LAN、无线LANWLAN、广域网WAN、无线WANWffAN、城域网MAN、互联网,互联网的一部分、公共交换电话网络PSTN的一部分、普通老式电话服务POTS网络、蜂窝电话网络、无线网络、1Wi-Fi⑧网络、另一类型的网络、或两个或更多个这样的网络的组合。例如,网络580或网络580的一部分可以包括无线或蜂窝网络,并且耦接582可以是码分多址CDMA连接、全球移动通信系统GSM连接或其他类型的蜂窝或无线耦接。在该示例中,耦接582可以实现各种类型的数据传输技术中的任何一种,例如单载波无线电传输技术(IxRTT、演进数据优化EVDO技术、通用分组无线电服务GPRS技术、GSM演进增强数据速率EDGE技术、包括3G的第三代合作伙伴计划3GPP、第四代无线4G网络、通用移动电信系统UMTS、高速分组接入HSPA、全球微波接入互操作性WiMAX、长期演进LTE标准、由各种标准设置组织定义的其他标准、其他远程协议或其他数据传输技术。[0066]指令516可以经由网络接口设备例如,包括在通信组件564中的网络接口组件使用传输介质并且利用多个公知的传输协议例如,超文本传输协议HTTP通过网络580发送或接收。类似地,可以使用传输介质经由耦接572例如,对等耦接)向设备570发送或从其接收指令516。术语“传输介质”应被认为包括能够存储、编码或承载用于被机器500执行的指令516的任意无形介质,并且包括用于促进该软件的通信的数字或模拟通信信号或其他无形介质。传输介质是机器可读介质的一个实施例。[0067]下面的编号示例是实施例。[0068]1.一种系统,包括:[0069]一个或多个处理器;以及[0070]存储指令的存储器,所述指令在由所述一个或多个处理器中的至少一个处理器执行时,使所述系统执行包括以下各项的操作:[0071]从数据库收集输入变量,所述输入变量包括产品的项目等级因子;[0072]基于所述输入变量生成机器学习模型数据对象;[0073]将目标变量指派给所述机器学习模型数据对象;基于所述目标变量和所述输入变量来训练所述机器学习模型数据对象;[0074]基于已训练的机器学习模型数据对象来计算产品的自然搜索流量概率;以及[0075]基于产品的所述自然搜索流量概率和所述项目等级因子对产品进行索引。[0076]2.根据示例1所述的系统,其中,所述机器学习模型数据对象是梯度提升的机器模型。[0077]3.根据示例1或示例2所述的系统,其中,所述项目等级因子包括:[0078]产品的先前自然搜索流量;[0079]产品的查看计数;[0080]产品的观看计数;[0081]产品的退回计数;以及[0082]售出的产品数量。[0083]4.根据示例1至3中任一项所述的系统,其中,所述目标变量包括自然搜索流量值。[0084]5.根据示例1至4中任一项所述的系统,其中,所述指令使得所述系统执行还包括以下各项的操作:基于产品的所述自然搜索流量概率和所述项目等级因子来识别与产品对应的有价值的项目页面。[0085]6.根据示例1至5中任一项所述的系统,根据权利要求1所述的系统,其中,基于产品的所述自然搜索流量概率和所述项目等级因子对产品进行索引的指令包括:基于产品的自然搜索流量和所述项目等级因子为产品指派索引状态。[0086]7.根据示例1至6中任一项所述的系统,根据权利要求1所述的系统,其中,基于所述目标变量和所述输入变量训练所述机器学习模型数据对象的指令包括:将所述输入变量中的一组输入变量与所述目标变量相关联。[0087]8.—种计算机实现的方法,包括:[0088]从数据库收集输入变量,所述输入变量包括产品的项目等级因子;[0089]基于所述输入变量生成机器学习模型数据对象;将目标变量指派给所述机器学习模型数据对象;[0090]基于所述目标变量和所述输入变量来训练所述机器学习模型数据对象;[0091]基于已训练的机器学习模型数据对象来计算产品的自然搜索流量概率;以及[0092]基于产品的所述自然搜索流量概率和所述项目等级因子对产品进行索引。[0093]9.根据示例8所述的方法,其中,所述机器学习模型数据对象是梯度提升的机器模型。[0094]10.根据示例8或示例9所述的方法,其中,所述项目等级因子包括:[0095]产品的先前自然搜索流量;[0096]产品的查看计数;[0097]产品的观看计数;[0098]产品的退回计数;[0099]售出的产品数量。[0100]11.根据示例8至10中任一项所述的方法,其中,所述目标变量包括自然搜索流量值。[0101]12.根据示例8至11中任一项所述的方法,其中,所述方法还包括:[0102]基于产品的所述自然搜索流量概率和所述项目等级因子来识别与产品对应的有价值的项目页面。[0103]13.根据示例8至12中任一项所述的方法,其中,基于产品的所述自然搜索流量概率和所述项目等级因子对产品进行索引包括:[0104]基于产品的自然搜索流量和所述项目等级因子为产品指派索引状态。[0105]14.根据示例8至13中任一项所述的方法,其中,基于所述目标变量和所述输入变量训练所述机器学习模型数据对象包括:[0106]将所述输入变量中的一组输入变量与所述目标变量相关联。[0107]15.—种承载指令的机器可读介质,所述指令在被机器的一个或多个处理器执行时使得所述机器执行包括以下各项的操作:[0108]从数据库收集输入变量,所述输入变量包括产品的项目等级因子;[0109]基于所述输入变量生成机器学习模型数据对象;[0110]将目标变量指派给所述机器学习模型数据对象;[0111]基于所述目标变量和所述输入变量来训练所述机器学习模型数据对象;[0112]基于已训练的机器学习模型数据对象来计算产品的自然搜索流量概率;以及[0113]基于产品的所述自然搜索流量概率和所述项目等级因子对产品进行索引。[0114]16.根据示例15所述的机器可读介质,其中,所述机器学习模型数据对象是梯度提升的机器模型。[0115]17.根据示例15或示例16所述的机器可读介质,其中,所述项目等级因子包括:[0116]产品的先前自然搜索流量;[0117]产品的查看计数;[0118]产品的观看计数;[0119]产品的退回计数;[0120]售出的产品数量。[0121]18.根据示例15至17中任一项所述的机器可读介质,其中,所述目标变量包括自然搜索流量值。[0122]19.根据示例15至18中任一项所述的机器可读介质,其中,所述指令使得所述系统执行还包括以下各项的操作:[0123]基于产品的所述自然搜索流量概率和所述项目等级因子来识别与产品对应的有价值的项目页面。[0124]20.根据示例15至19中任一项所述的机器可读介质,其中,用于基于产品的所述自然搜索流量概率和所述项目等级因子对产品进行索引的指令包括使所述系统执行包括以下各项的操作:[0125]基于产品的自然搜索流量和所述项目等级因子为产品指派索引状态。[0126]语言[0127]在整个说明书中,多个实例可以实现被描述为单个实例的组件、操作或构造。虽然一个或多个方法的各个操作被示意和描述为分离的操作,但是各个操作中的一个或多个可以同时执行,并且无需按所示顺序执行操作。在示例配置中被示为分离组件的结构和功能可以被实现为组合结构或组件。类似地,被示为单个组件的结构和功能可以被实现为分离的组件。这些和其他变型、修改、添加和改进落入本主题的范围内。[0128]尽管已经参考具体示例实施例描述了本发明主题的概述,但是在不脱离本公开的实施例的更宽范围的情况下,可以对这些实施例进行各种修改和改变。本发明主题的这些实施例在本文中可以单独地或共同地由术语“发明”提及,以仅仅为了方便,并且不旨在自动地将本申请的范围限制为任何单个公开或发明构思如果事实上公开了一个以上)。[0129]本文充分详细地描述了示出的实施例以使得本领域技术人员能够实现公开的教导。可以利用并根据这些实施例得出其他实施例,从而可以在不脱离本公开的范围的情况下做出结构和逻辑上的替换和改变。因此,该“具体实施方式”不应当看做是限制意义,并且各种实施例的范围仅通过所附权利要求以及权利要求的等同物的全部范围来限定。[0130]如本文所使用的,术语“或”可以被解释为包括性或排他性的意义。此外,可以针对本文中描述为单个实例的资源、操作或结构提供多个实例。另外,各种资源、操作、模块、弓丨擎和数据存储之间的边界在某种程度上是任何的,并且在具体说明性配置的上下文中示出了特定操作。设想了功能的其他分配,并且这些指派可以落入本公开的各种实施例的范围内。一般来说,在示例配置中作为单独资源呈现的结构和功能可以被实现为组合的结构或资源。类似地,作为单个资源呈现的结构和功能可以被实现为单独的资源。这些和其他变型、修改、添加和改进落入由所附权利要求表示的本公开的实施例的范围内。因此,说明书和附图应当被看做说明性的而不是限制意义的。

权利要求:1.一种系统,包括:一个或多个处理器;以及存储指令的存储器,所述指令在由所述一个或多个处理器中的至少一个处理器执行时,使所述系统执行包括以下各项的操作:从数据库收集输入变量,所述输入变量包括产品的项目等级因子;基于所述输入变量生成机器学习模型数据对象;将目标变量指派给所述机器学习模型数据对象;基于所述目标变量和所述输入变量来训练所述机器学习模型数据对象;基于已训练的机器学习模型数据对象来计算产品的自然搜索流量概率;以及基于产品的所述自然搜索流量概率和所述项目等级因子对产品进行索引。2.根据权利要求1所述的系统,其中,所述机器学习模型数据对象是梯度提升的机器模型。3.根据权利要求1所述的系统,其中,所述项目等级因子包括:产品的先前自然搜索流量;产品的查看计数;产品的观看计数;产品的退回计数;以及售出的产品数量。4.根据权利要求1所述的系统,其中,所述目标变量包括自然搜索流量值。5.根据权利要求1所述的系统,其中,所述指令使得所述系统执行还包括以下各项的操作:基于产品的所述自然搜索流量概率和所述项目等级因子来识别与产品对应的有价值的项目页面。6.根据权利要求1所述的系统,其中,基于产品的所述自然搜索流量概率和所述项目等级因子对产品进行索引的指令包括:基于产品的自然搜索流量和所述项目等级因子为产品指派索引状态。7.根据权利要求1所述的系统,其中,基于所述目标变量和所述输入变量训练所述机器学习模型数据对象的指令包括:将所述输入变量中的一组输入变量与所述目标变量相关联。8.—种计算机实现的方法,包括:从数据库收集输入变量,所述输入变量包括产品的项目等级因子;基于所述输入变量生成机器学习模型数据对象;将目标变量指派给所述机器学习模型数据对象;基于所述目标变量和所述输入变量来训练所述机器学习模型数据对象;基于已训练的机器学习模型数据对象来计算产品的自然搜索流量概率;以及基于产品的所述自然搜索流量概率和所述项目等级因子对产品进行索引。9.根据权利要求8所述的方法,其中,所述机器学习模型数据对象是梯度提升的机器模型。10.根据权利要求8所述的方法,其中,所述项目等级因子包括:产品的先前自然搜索流量;产品的查看计数;产品的观看计数;产品的退回计数;售出的产品数量。11.根据权利要求8所述的方法,其中,所述目标变量包括自然搜索流量值。12.根据权利要求8所述的方法,其中,所述方法还包括:基于产品的所述自然搜索流量概率和所述项目等级因子来识别与产品对应的有价值的项目页面。13.根据权利要求8所述的方法,其中,基于产品的所述自然搜索流量概率和所述项目等级因子对产品进行索引包括:基于产品的自然搜索流量和所述项目等级因子为产品指派索引状态。14.根据权利要求8所述的方法,其中,基于所述目标变量和所述输入变量训练所述机器学习模型数据对象包括:将所述输入变量中的一组输入变量与所述目标变量相关联。15.—种承载指令的机器可读介质,所述指令在被机器的一个或多个处理器执行时使得所述机器执行包括以下各项的操作:从数据库收集输入变量,所述输入变量包括产品的项目等级因子;基于所述输入变量生成机器学习模型数据对象;将目标变量指派给所述机器学习模型数据对象;基于所述目标变量和所述输入变量来训练所述机器学习模型数据对象;基于已训练的机器学习模型数据对象来计算产品的自然搜索流量概率;以及基于产品的所述自然搜索流量概率和所述项目等级因子对产品进行索引。16.根据权利要求15所述的机器可读介质,其中,所述机器学习模型数据对象是梯度提升的机器模型。17.根据权利要求15所述的机器可读介质,其中,所述项目等级因子包括:产品的先前自然搜索流量;产品的查看计数;产品的观看计数;产品的退回计数;售出的产品数量。18.根据权利要求15所述的机器可读介质,其中,所述目标变量包括自然搜索流量值。19.根据权利要求15所述的机器可读介质,其中,所述指令使所述系统执行还包括以下各项的操作:基于产品的所述自然搜索流量概率和所述项目等级因子来识别与产品对应的有价值的项目页面。20.根据权利要求15所述的机器可读介质,其中,用于基于产品的所述自然搜索流量概率和所述项目等级因子对产品进行索引的指令包括使所述系统执行包括以下各项的操作:基于产品的自然搜索流量和所述项目等级因子为产品指派索引状态。

百度查询: 电子湾有限公司 通过选择性索引进行的搜索引擎优化

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。