买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京国双科技有限公司
摘要:本发明公开了SMO中情感判断的方法、装置、存储介质和处理器。方法包括:每当构建完成一个子任务数据后,将子任务数据存储至存储系统,并发送第一指示消息;每当监测到第一指示消息,从存储系统中取出与第一指示消息相对应的子任务数据,依据子任务数据搜索并解析相应的平台内容获得解析结果,将解析结果存储至存储系统中,发送第二指示消息;每当监测到第二指示消息,从存储系统中取出与第二指示消息相对应的解析结果,依据解析结果爬取正文内容,将正文内容存储至存储系统中,发送第三指示消息;每当监测到第三指示消息,从存储系统中取出与第三指示消息相对应的正文内容,识别正文内容得到情感判断结果,将情感判断结果存储至存储系统中。
主权项:1.一种SMO中情感判断的方法,其特征在于,所述方法包括:在构建任务数据的过程中,每当构建完成一个子任务数据后,便将构建完成的子任务数据存储至存储系统中,发送第一指示消息,其中所述任务数据包括至少两个子任务数据;在搜索并解析平台内容的过程中,每当监测到所述第一指示消息,便从所述存储系统中取出与所述第一指示消息相对应的子任务数据,并依据取出的子任务数据搜索相应的平台内容;解析搜索到的平台内容获得解析结果,并将所述解析结果存储至所述存储系统中,发送第二指示消息;在爬取正文内容的过程中,每当监测到所述第二指示消息,便从所述存储系统中取出与所述第二指示消息相对应的解析结果,依据所述解析结果爬取正文内容,并将爬取到的正文内容存储至所述存储系统中,发送第三指示消息;在情感判断的过程中,每当监测到所述第三指示消息,便从所述存储系统中取出与所述第三指示消息相对应的正文内容,识别取出的正文内容得到相应的情感判断结果,将所述情感判断结果存储至所述存储系统中。
全文数据:SMO中情感判断的方法、装置、存储介质和处理器技术领域本发明涉及数据处理技术领域,尤其涉及一种SMO中情感判断的方法、装置、存储介质和处理器。背景技术SMOSocialMediaOptimization,社会媒体优化是利用社会媒体对外发布企业的新闻,其核心目的是优化企业社会化媒体传播。针对企业做SMO,都是通过服务器爬取全网的资料,然后筛选出与企业相关的信息,通过自然语义识别并判断该信息相对于企业是正面信息、负面信息还是中性信息。目前SMO中情感判断的方法包括以下5个步骤,如图1所示:步骤S100,构建任务数据。步骤S200,根据构建的任务数据搜索相应的平台内容,并解析平台内容获得相应的解析结果。步骤S300,依据解析结果爬取正文内容。步骤S400,识别正文内容,得到情感判断结果。步骤S500,将得到的情感判断结果发送至发起构建任务数据的发起方。目前SMO中情感判断的方法中,每一个步骤的输入都是依赖于上一个步骤的输出,在上一个步骤完成后,才能顺序执行下一个步骤。如,步骤S100中需要构建的任务数据包括10个,那么只有在步骤S100完成该10个任务数据的构建后,才能继续执行步骤S200。那么针对目前现有的SMO中情感判断的方法,当某个步骤的处理数据较大时,如步骤S100中需要构建的任务数据较多,或步骤S200中需要搜索并解析的平台内容较多,或步骤S300中需要爬取的正文内容较多等,会导致该步骤的运行时间增长,从而大大降低SMO中情感判断的处理效率。因此,如何提高SMO中情感判断的处理效率是本领域技术人员一个亟待解决的技术难题。发明内容鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的SMO中情感判断的方法及装置,方案如下:一种SMO中情感判断的方法,所述方法包括:在构建任务数据的过程中,每当构建完成一个子任务数据后,便将构建完成的子任务数据存储至存储系统中,发送第一指示消息,其中所述任务数据包括至少两个子任务数据;在搜索并解析平台内容的过程中,每当监测到所述第一指示消息,便从所述存储系统中取出与所述第一指示消息相对应的子任务数据,并依据取出的子任务数据搜索相应的平台内容;解析搜索到的平台内容获得解析结果,并将所述解析结果存储至所述存储系统中,发送第二指示消息;在爬取正文内容的过程中,每当监测到所述第二指示消息,便从所述存储系统中取出与所述第二指示消息相对应的解析结果,依据所述解析结果爬取正文内容,并将爬取到的正文内容存储至所述存储系统中,发送第三指示消息;在情感判断的过程中,每当监测到所述第三指示消息,便从所述存储系统中取出与所述第三指示消息相对应的正文内容,识别取出的正文内容得到相应的情感判断结果,将所述情感判断结果存储至所述存储系统中。可选地,所述方法还包括:在搜索并解析平台内容的过程中,当监测到所述第一指示消息,却无法从所述存储系统中取出与所述第一指示消息相对应的子任务数据时,将所述第一指示消息添加到第一预设消息队列中,等待重新执行依据所述第一指示消息,从所述存储系统中取出与所述第一指示消息相对应的子任务数据的步骤;其中所述第一预设消息队列用于存储第一指示消息;当执行依据所述第一指示消息,从所述存储系统中取出与所述第一指示消息相对应的子任务数据的步骤的执行次数大于预设的第一阈值时,丢弃所述第一指示消息,并记录第一日志信息,所述第一日志信息用于表示依据所述第一指示消息,无法从所述存储系统中取出与所述第一指示消息相对应的子任务数据。可选地,所述方法还包括:在爬取正文内容的过程中,当监测到所述第二指示消息,却无法从所述存储系统中取出与所述第二指示消息相对应的解析结果时,将所述第二指示消息添加到第二预设消息队列中,等待重新执行依据所述第二指示消息,从所述存储系统中取出与所述第二指示消息相对应的解析结果的步骤;其中所述第二预设消息队列用于存储第二指示消息;当执行依据所述第二指示消息,从所述存储系统中取出与所述第二指示消息相对应的解析结果的步骤的执行次数大于预设的第二阈值时,丢弃所述第二指示消息,并记录第二日志信息,所述第二日志信息用于表示依据所述第二指示消息,无法从所述存储系统中取出与所述第二指示消息相对应的解析结果。可选地,所述方法还包括:在完成构建任务数据的过程后,将分配给用于完成构建任务数据的第一处理程序的状态标记为第一状态;在完成搜索并解析平台内容的过程后,将分配给用于完成搜索并解析平台内容的第二处理程序的状态标记为第一状态;在完成爬取正文内容的过程后,将分配给用于完成爬取正文内容的第三处理程序的状态标记为第一状态;在完成情感判断的过程后,将分配给用于完成情感判断的第四处理程序的状态标记为第一状态。可选地,所述方法还包括:当监测到所述第一处理程序的状态、所述第二处理程序的状态、所述第三处理程序的状态标记、和所述第四处理程序的状态均为第一状态时,发送邮件信息至发起构建任务数据的发起方。一种SMO中情感判断的装置,所述装置包括:第一处理单元,用于在构建任务数据的过程中,每当构建完成一个子任务数据后,便将构建完成的子任务数据存储至存储系统中,并发送第一指示消息,其中所述任务数据包括至少一个子任务数据;第二处理单元,用于在搜索并解析平台内容的过程中,每当监测到所述第一指示消息,便从所述存储系统中取出与所述第一指示消息相对应的子任务数据,并依据取出的子任务数据搜索相应的平台内容;解析搜索到的平台内容获得解析结果,并将所述解析结果存储至所述存储系统中,发送第二指示消息;第三处理单元,用于在爬取正文内容的过程中,每当监测到所述第二指示消息,便从所述存储系统中取出与所述第二指示消息相对应的解析结果,依据所述解析结果爬取正文内容,并将爬取到的正文内容存储至所述存储系统中,发送第三指示消息;第四处理单元,用于在情感判断的过程中,每当监测到所述第三指示消息,便从所述存储系统中取出与所述第三指示消息相对应的正文内容,识别取出的正文内容得到相应的情感判断结果,将所述情感判断结果存储至所述存储系统中。可选地,所述第二处理单元还用于,在搜索并解析平台内容的过程中,当监测到所述第一指示消息,却无法从所述存储系统中取出与所述第一指示消息相对应的子任务数据时,将所述第一指示消息添加到第一预设消息队列中,等待重新执行依据所述第一指示消息,从所述存储系统中取出与所述第一指示消息相对应的子任务数据的步骤;其中所述第一预设消息队列用于存储第一指示消息;当执行依据所述第一指示消息,从所述存储系统中取出与所述第一指示消息相对应的子任务数据的步骤的执行次数大于预设的第一阈值时,丢弃所述第一指示消息,并记录第一日志信息,所述第一日志信息用于表示依据所述第一指示消息,无法从所述存储系统中取出与所述第一指示消息相对应的子任务数据。可选地,所述第三处理单元还用于,在爬取正文内容的过程中,当监测到所述第二指示消息,却无法从所述存储系统中取出与所述第二指示消息相对应的解析结果时,将所述第二指示消息添加到第二预设消息队列中,等待重新执行依据所述第二指示消息,从所述存储系统中取出与所述第二指示消息相对应的解析结果的步骤;其中所述第二预设消息队列用于存储第二指示消息;当执行依据所述第二指示消息,从所述存储系统中取出与所述第二指示消息相对应的解析结果的步骤的执行次数大于预设的第二阈值时,丢弃所述第二指示消息,并记录第二日志信息,所述第二日志信息用于表示依据所述第二指示消息,无法从所述存储系统中取出与所述第二指示消息相对应的解析结果。一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行如前文所述的SMO中情感判断的方法。一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行如前文所述的SMO中情感判断的方法。借由上述技术方案,本发明提供的SMO中情感判断的方法、装置、存储介质和处理器中,构建任务数据的处理步骤、搜索并解析平台内容的处理步骤、爬取正文内容的处理步骤和情感判断的处理步骤不再如现有SMO中情感判断的方法中必须由前一步骤完全完成后再去执行下一步骤,而是在每一个处理步骤中,只要完成一项子数据的处理,就去触发下一步骤针对该子数据的后续处理过程。尤其面对任务量较大的情况,本发明以子任务数据为单位,对大量子任务数据并行处理,大大提高了任务数据的处理效率,即提高了SMO中情感判断的处理效率。上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1示出了现有技术中SMO中情感判断的方法的流程示意图;图2示出了本发明实施例提供的一种SMO中情感判断的方法的流程示意图;图3示出了本发明实施例提供的一种SMO中情感判断的装置的结构示意图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。目前的SMO中情感判断的方法可大致分为5大步骤亦可称为5大阶段,分别为:步骤1构建任务数据;步骤2搜索并解析平台内容;步骤3爬取正文内容;步骤4情感判断;和步骤5发送邮件至发起方。然而现有的SMO中情感判断的方法中,由于每一个步骤的输入都是前一个步骤的输出,因此其要求,只有前一个步骤完全完成后,才能触发下一个步骤执行,如步骤1完成构建任务数据后,才能执行步骤2,步骤2完成搜索并解析平台内容后,才能执行步骤3,步骤3完成爬取正文内容后,才能执行步骤4,步骤4完成情感判断后,才能执行步骤5。显然这样的处理方式效率很低。本发明的申请人发现,在步骤1至步骤4中,其实每一个步骤里并非只是获得一个简单的结果,而是获得了一个由多个结果构成的结果集合。而是实际处理过程中,各结果间其实是没有影响的,每个结果在每个步骤中的处理流程也都是相互独立的。也就是说,假设步骤1构建的任务数据一共包括10个子任务数据,那么步骤2中依据该10个子任务数据分别搜索并解析相应的平台内容的这10个处理过程间是没有任何影响,相互独立的。进一步举例来说,假设步骤1并未完成构建第5、6、7、8、9、10的子任务数据,但这对于步骤2依据第1子任务数据搜索并解析相应的平台内容、依据第2子任务数据搜索并解析相应的平台内容、依据第3子任务数据搜索并解析相应的平台内容、以及依据第4子任务数据搜索并解析相应的平台内容,这4个处理过程是没有任何影响。基于此,本发明的申请人提出了一种SMO中情感判断的方法,如图2所示,方法包括:步骤101,在构建任务数据的过程中,每当构建完成一个子任务数据后,便将构建完成的子任务数据存储至存储系统中,并发送第一指示消息,其中所述任务数据包括至少两个子任务数据。其中存储系统优选为分布式缓存集群,其可以是独立于服务器的一个独立模块,也可与服务器集成一体。在本发明实施例中,发起方,如用户,通过用户界面向服务器发起SMO请求后,服务器会依据该SMO请求中的SMO配置表信息,获取需要构建的任务数据。其中任务数据例如包括关键词、地域、页码数即需要爬取多少页的数据、设备等。通过情况下,服务器需要构建的任务数据是由多个子任务数据构成的,即服务器需要依据SMO配置表信息构建多个子任务数据。举例来说,假设需要构建的任务数据包括10个关键词、3个地域如北上广、页码数如前3页、2个设备如PC和移动,那么需要构建的子任务数据一共包括3×3×2=18个子任务数据。现有的SMO中情感判断的方法会将该18个子任务数据都构建完成后,将该18个子任务数据作为下一步骤的输入。但本发明不同于现有的SMO中情感判断的方法,本发明在构建该18个子任务数据过程中,每当构建完成一个子任务数据后,便将构建完成的子任务数据存储至存储系统中,并同时发送第一指示消息。当服务器监测到该第一指示消息时,则可获知当前有一个子任务数据已成功构建完成并存储至存储系统中。其中,第一指示消息可以具体为search消息,第一指示消息与子任务数据一一对应,即不同的第一指示消息指示不同的子任务数据。步骤102,在搜索并解析平台内容的过程中,每当监测到所述第一指示消息,便从所述存储系统中取出与所述第一指示消息相对应的子任务数据,并依据取出的子任务数据搜索相应的平台内容;解析搜索到的平台内容获得解析结果,并将所述解析结果存储至所述存储系统中,发送第二指示消息。服务器在监测到第一指示消息后,获知当前有子任务数据已成功构建完成并存储至存储系统中,便触发搜索并解析平台内容的步骤。在本发明实施例中,服务器依据监测到的第一指示消息,从存储系统中取出与所述第一指示消息相对应的子任务数据,进而依据取出的子任务数据搜索相应的平台内容,具体地,本发明实施例可以通过调用搜索平台的API或通过爬虫爬取子任务数据相应的平台内容。其中平台内容可以包括搜索引擎的搜索结果列表,该搜索结果列表包含有超链接信息。为了保证后续发生问题时能够实现溯源分析,本发明优选将搜索到的平台内容进行存储。本发明实施例中,服务器搜索到的平台内容是html格式的,故而需要对平台内容进行解析,从而获得结构化数据格式的解析结果。进而将该解析结果存储至存储系统中,同时发送第二指示消息。其中第二指示消息可以具体为content消息,第二指示消息与解析结果一一对应,即不同的第二指示消息指示不同的解析结果。本发明实施例中,在步骤102的执行过程中,可能步骤101也仍处于执行过程中,如,步骤102正针对监测到的第3子任务数据对应的第一指示消息,对第3子任务数据执行搜索并解析平台内容的过程,而此时的步骤101正在构建第5子任务数据。因此,本发明以子任务数据为单位,实现了各子任务数据间的并行处理,相比于现有方法大大缩减了处理时间,效率大大提高。此外在本发明步骤102的实现过程中,如果当监测到第一指示消息,却无法从存储系统中取出与第一指示消息相对应的子任务数据时,本发明实施例可以将该第一指示消息添加到第一预设消息队列中,等待重新执行步骤102;其中所述第一预设消息队列用于存储第一指示消息。在本发明实际应用过程中,可以预先设置一用于存储第一指示消息的第一预设消息队列,该第一预设消息队列用于将接收到的第一指示消息顺序存储。服务器在执行步骤102时,则以该第一预设消息队列中顺序存储的第一指示消息依次进行处理。当发生依据第一指示消息,却无法从存储系统中取出与第一指示消息相对应的子任务数据时,则将该第一指示消息放到第一预设消息队列的末尾,等待重新处理。为了进一步提高数据的处理效率,防止数据处理陷入死循环过程,本发明可以预先设置步骤的执行次数的第一阈值,如10次,当服务器统计执行依据第一指示消息,从存储系统中取出与第一指示消息相对应的子任务数据的步骤的执行次数大于10次时,丢弃该第一指示消息,并同时记录第一日志信息,所述第一日志信息包括与该第一指示消息相关的信息,用于表示依据该第一指示消息,无法从存储系统中取出与该第一指示消息相对应的子任务数据。步骤103,在爬取正文内容的过程中,每当监测到所述第二指示消息,便从所述存储系统中取出与所述第二指示消息相对应的解析结果,依据所述解析结果爬取正文内容,并将爬取到的正文内容存储至所述存储系统中,发送第三指示消息。服务器在监测到第二指示消息后,获知当前有解析结果已成功存储至存储系统中,便触发爬取正文内容的步骤。在本发明实施例中,服务器依据监测到的第二指示消息,从存储系统中取出与所述第二指示消息相对应的解析结果,从该解析结果中可以得到urlUniformResourceLocator,统一资源定位符,利用该url可以爬取到正文内容,进而将爬取到的正文内容存储至存储系统中,同时发送第三指示消息。其中,第三指示消息可以具体为senti消息,第三指示消息与正文内容一一对应,即不同的第三指示消息指示不同的正文内容。本发明实施例中,在步骤103的执行过程中,可能步骤101和或步骤102也仍处于执行过程中。如,步骤103正针对第3个第二指示消息执行爬取正文内容的过程,而此时的步骤101正在构建第10子任务数据,步骤102正针对监测到的第8子任务数据对应的第一指示消息,对第8子任务数据执行搜索并解析平台内容的过程。因此,本发明以子任务数据为单位,实现了各子任务数据间的并行处理,相比于现有方法大大缩减了处理时间,效率大大提高。此外在本发明步骤103的实现过程中,如果当监测到第二指示消息,却无法从存储系统中取出与第二指示消息相对应的解析结果时,本发明实施例可以将该第二指示消息添加到第二预设消息队列中,等待重新执行步骤103;其中所述第二预设消息队列用于存储第二指示消息。在本发明实际应用过程中,可以预先设置一用于存储第二指示消息的第二预设消息队列,该第二预设消息队列用于将接收到的第二指示消息顺序存储。服务器在执行步骤103时,则以该第二预设消息队列中顺序存储的第二指示消息依次进行处理。当发生依据第二指示消息,却无法从存储系统中取出与第二指示消息相对应的解析结果时,则将该第二指示消息放到第二预设消息队列的末尾,等待重新处理。为了进一步提高数据的处理效率,防止数据处理陷入死循环过程,本发明可以预先设置步骤的执行次数的第二阈值,如10次,当服务器统计执行依据第二指示消息,从存储系统中取出与第二指示消息相对应的解析结果的步骤的执行次数大于10次时,丢弃该第二指示消息,并同时记录第二日志信息,所述第二日志信息与该第二指示消息相关的信息,用于表示依据该第二指示消息,无法从存储系统中取出与该第二指示消息相对应的解析结果。步骤104,在情感判断的过程中,每当监测到所述第三指示消息,便从所述存储系统中取出与所述第三指示消息相对应的正文内容,识别取出的正文内容得到相应的情感判断结果,将所述情感判断结果存储至所述存储系统中。服务器在监测到第三指示消息后,获知当前有正文内容已成功存储至存储系统中,便触发情感判断的步骤。在本发明实施例中,服务器依据监测到的第三指示消息,从存储系统中取出与所述第三指示消息相对应的正文内容,通过调用情感判断的接口或相应算法识别正文内容,从而得到该正文内容的情感判断结果,进而将得到的情感判断结果存储至存储系统中。本发明实施例中,在步骤104的执行过程中,可能步骤101、步骤102、或步骤103中的至少一个也仍处于执行过程中。如,步骤104正针对第4个第三指示消息执行情感判断的过程,而此时的步骤101正在构建第16子任务数据,步骤102正针对监测到的第13子任务数据对应的第一指示消息,对第13子任务数据执行搜索并解析平台内容的过程,步骤103正针对监测到的第8个第二指示消息执行爬取正文内容的过程。因此,本发明以子任务数据为单位,实现了各子任务数据间的并行处理,相比于现有方法大大缩减了处理时间,效率大大提高。因此应用本发明实施例提供的SMO中情感判断的方法,本发明实施例对于构建任务数据的处理步骤、搜索并解析平台内容的处理步骤、爬取正文内容的处理步骤和情感判断的处理步骤不再如现有SMO中情感判断的方法中必须由前一步骤完全完成后再去执行下一步骤,而是在每一个处理步骤中,只要完成一项子数据的处理,就去触发下一步骤针对该子数据的后续处理过程。尤其面对任务量较大的情况,本发明以子任务数据为单位,对大量子任务数据并行处理,大大提高了任务数据的处理效率,即提高了SMO中情感判断的处理效率。在本发明实施例应用过程中,只有在步骤101-步骤104中涉及的所有数据均处理完成后,将存储系统中存储的所有情感判断结果发送至发起构建任务数据的发起方。因此,为了能够清楚地判断出每个步骤中的数据是否均已处理完成,在上述实施例的基础上,本发明实施例进一步提出:在完成构建任务数据的过程后,将分配给用于完成构建任务数据的第一处理程序的状态标记为第一状态;在完成搜索并解析平台内容的过程后,将分配给用于完成搜索并解析平台内容的第二处理程序的状态标记为第一状态;在完成爬取正文内容的过程后,将分配给用于完成爬取正文内容的第三处理程序的状态标记为第一状态;在完成情感判断的过程后,将分配给用于完成情感判断的第四处理程序的状态标记为第一状态。其中第一状态可以为空闲状态等,用于表示对应的处理过程已完成。那么,当服务器监测到第一处理程序的状态、第二处理程序的状态、第三处理程序的状态标记、和第四处理程序的状态均为第一状态时,发送邮件信息至发起构建任务数据的发起方。在本发明实际应用过程中,服务器会将针对数据的不同处理阶段分别为其分配相应的处理程序,如,将第一处理程序分配为用于构建任务数据,将第二处理程序分配为用于搜索并解析平台内容,将第三处理程序分配为用于爬取正文内容,将第四处理程序分配为用于情感判断。不同的处理程序被分配为用于执行不同的操作。其中,第一状态例如用标识“1”表示,当第一处理程序完成所有任务数据的构建后,服务器将其状态标记为“1”;当第二处理程序完成所有平台内容的搜索并解析后,服务器将其状态标记为“1”;当第三处理程序完成所有正文内容的爬取后,服务器将其状态标记为“1”;当第四处理程序完成对所有正文内容的情感判断后,服务器将其状态标记为“1”。当服务器监测到该第一处理程序、第二处理程序、第三处理程序和四处理程序的状态均标记为“1”时,获知所有处理过程均已完成,此时发送邮件信息至发起构建任务数据的发起方,该邮件信息可以包括所有的情感判断结果、处理进程信息、第一日志信息、第二日志信息等。本发明实施例提供的SMO中情感判断的方法通过改进各步骤间的处理机制,将任务数据拆分后并行处理,大大提高了SMO中情感判断的处理效率。同时利用存储系统对各个步骤的结果的存储,以及在处理过程中对异常信息的及时记录,保证了在数据发生错误时可以及时溯源分析,查找定位问题,对于服务器的后期维护和修改作出了一定的贡献。基于前文本发明实施例提供的一种SMO中情感判断的方法,本发明实施例还提供了一种SMO中情感判断的装置,如图3所示,所述装置包括:第一处理单元10,用于在构建任务数据的过程中,每当构建完成一个子任务数据后,便将构建完成的子任务数据存储至存储系统中,并发送第一指示消息,其中所述任务数据包括至少一个子任务数据;第二处理单元20,用于在搜索并解析平台内容的过程中,每当监测到所述第一指示消息,便从所述存储系统中取出与所述第一指示消息相对应的子任务数据,并依据取出的子任务数据搜索相应的平台内容;解析搜索到的平台内容获得解析结果,并将所述解析结果存储至所述存储系统中,发送第二指示消息;第三处理单元30,用于在爬取正文内容的过程中,每当监测到所述第二指示消息,便从所述存储系统中取出与所述第二指示消息相对应的解析结果,依据所述解析结果爬取正文内容,并将爬取到的正文内容存储至所述存储系统中,发送第三指示消息;第四处理单元40,用于在情感判断的过程中,每当监测到所述第三指示消息,便从所述存储系统中取出与所述第三指示消息相对应的正文内容,识别取出的正文内容得到相应的情感判断结果,将所述情感判断结果存储至所述存储系统中。其中,所述第二处理单元20还用于,在搜索并解析平台内容的过程中,当监测到所述第一指示消息,却无法从所述存储系统中取出与所述第一指示消息相对应的子任务数据时,将所述第一指示消息添加到第一预设消息队列中,等待重新执行依据所述第一指示消息,从所述存储系统中取出与所述第一指示消息相对应的子任务数据的步骤;其中所述第一预设消息队列用于存储第一指示消息;当执行依据所述第一指示消息,从所述存储系统中取出与所述第一指示消息相对应的子任务数据的步骤的执行次数大于预设的第一阈值时,丢弃所述第一指示消息,并记录第一日志信息,所述第一日志信息用于表示依据所述第一指示消息,无法从所述存储系统中取出与所述第一指示消息相对应的子任务数据。所述第三处理单元30还用于,在爬取正文内容的过程中,当监测到所述第二指示消息,却无法从所述存储系统中取出与所述第二指示消息相对应的解析结果时,将所述第二指示消息添加到第二预设消息队列中,等待重新执行依据所述第二指示消息,从所述存储系统中取出与所述第二指示消息相对应的解析结果的步骤;其中所述第二预设消息队列用于存储第二指示消息;当执行依据所述第二指示消息,从所述存储系统中取出与所述第二指示消息相对应的解析结果的步骤的执行次数大于预设的第二阈值时,丢弃所述第二指示消息,并记录第二日志信息,所述第二日志信息用于表示依据所述第二指示消息,无法从所述存储系统中取出与所述第二指示消息相对应的解析结果。优选地,所述装置还可以包括:标记单元,用于在完成构建任务数据的过程后,将分配给用于完成构建任务数据的第一处理程序的状态标记为第一状态;在完成搜索并解析平台内容的过程后,将分配给用于完成搜索并解析平台内容的第二处理程序的状态标记为第一状态;在完成爬取正文内容的过程后,将分配给用于完成爬取正文内容的第三处理程序的状态标记为第一状态;在完成情感判断的过程后,将分配给用于完成情感判断的第四处理程序的状态标记为第一状态。发送单元,用于当监测到所述第一处理程序的状态、所述第二处理程序的状态、所述第三处理程序的状态标记、和所述第四处理程序的状态均为第一状态时,发送邮件信息至发起构建任务数据的发起方。所述SMO中情感判断的装置包括处理器和存储器,上述第一处理单元、第二处理单元、第三处理单元和第四处理单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来提高SMO中情感判断的处理效率。存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器RAM和或非易失性内存等形式,如只读存储器ROM或闪存flashRAM,存储器包括至少一个存储芯片。本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述SMO中情感判断的方法。本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述SMO中情感判断的方法。本发明实施例提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:在构建任务数据的过程中,每当构建完成一个子任务数据后,便将构建完成的子任务数据存储至存储系统中,发送第一指示消息,其中所述任务数据包括至少两个子任务数据;在搜索并解析平台内容的过程中,每当监测到所述第一指示消息,便从所述存储系统中取出与所述第一指示消息相对应的子任务数据,并依据取出的子任务数据搜索相应的平台内容;解析搜索到的平台内容获得解析结果,并将所述解析结果存储至所述存储系统中,发送第二指示消息;在爬取正文内容的过程中,每当监测到所述第二指示消息,便从所述存储系统中取出与所述第二指示消息相对应的解析结果,依据所述解析结果爬取正文内容,并将爬取到的正文内容存储至所述存储系统中,发送第三指示消息;在情感判断的过程中,每当监测到所述第三指示消息,便从所述存储系统中取出与所述第三指示消息相对应的正文内容,识别取出的正文内容得到相应的情感判断结果,将所述情感判断结果存储至所述存储系统中。可选地,还包括:在搜索并解析平台内容的过程中,当监测到所述第一指示消息,却无法从所述存储系统中取出与所述第一指示消息相对应的子任务数据时,将所述第一指示消息添加到第一预设消息队列中,等待重新执行依据所述第一指示消息,从所述存储系统中取出与所述第一指示消息相对应的子任务数据的步骤;其中所述第一预设消息队列用于存储第一指示消息;当执行依据所述第一指示消息,从所述存储系统中取出与所述第一指示消息相对应的子任务数据的步骤的执行次数大于预设的第一阈值时,丢弃所述第一指示消息,并记录第一日志信息,所述第一日志信息用于表示依据所述第一指示消息,无法从所述存储系统中取出与所述第一指示消息相对应的子任务数据。可选地,还包括:在爬取正文内容的过程中,当监测到所述第二指示消息,却无法从所述存储系统中取出与所述第二指示消息相对应的解析结果时,将所述第二指示消息添加到第二预设消息队列中,等待重新执行依据所述第二指示消息,从所述存储系统中取出与所述第二指示消息相对应的解析结果的步骤;其中所述第二预设消息队列用于存储第二指示消息;当执行依据所述第二指示消息,从所述存储系统中取出与所述第二指示消息相对应的解析结果的步骤的执行次数大于预设的第二阈值时,丢弃所述第二指示消息,并记录第二日志信息,所述第二日志信息用于表示依据所述第二指示消息,无法从所述存储系统中取出与所述第二指示消息相对应的解析结果。可选地,还包括:在完成构建任务数据的过程后,将分配给用于完成构建任务数据的第一处理程序的状态标记为第一状态;在完成搜索并解析平台内容的过程后,将分配给用于完成搜索并解析平台内容的第二处理程序的状态标记为第一状态;在完成爬取正文内容的过程后,将分配给用于完成爬取正文内容的第三处理程序的状态标记为第一状态;在完成情感判断的过程后,将分配给用于完成情感判断的第四处理程序的状态标记为第一状态。可选地,还包括:当监测到所述第一处理程序的状态、所述第二处理程序的状态、所述第三处理程序的状态标记、和所述第四处理程序的状态均为第一状态时,发送邮件信息至发起构建任务数据的发起方。本文中的设备可以是服务器、PC、PAD、手机等。本发明还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:在构建任务数据的过程中,每当构建完成一个子任务数据后,便将构建完成的子任务数据存储至存储系统中,发送第一指示消息,其中所述任务数据包括至少两个子任务数据;在搜索并解析平台内容的过程中,每当监测到所述第一指示消息,便从所述存储系统中取出与所述第一指示消息相对应的子任务数据,并依据取出的子任务数据搜索相应的平台内容;解析搜索到的平台内容获得解析结果,并将所述解析结果存储至所述存储系统中,发送第二指示消息;在爬取正文内容的过程中,每当监测到所述第二指示消息,便从所述存储系统中取出与所述第二指示消息相对应的解析结果,依据所述解析结果爬取正文内容,并将爬取到的正文内容存储至所述存储系统中,发送第三指示消息;在情感判断的过程中,每当监测到所述第三指示消息,便从所述存储系统中取出与所述第三指示消息相对应的正文内容,识别取出的正文内容得到相应的情感判断结果,将所述情感判断结果存储至所述存储系统中。可选地,还包括:在搜索并解析平台内容的过程中,当监测到所述第一指示消息,却无法从所述存储系统中取出与所述第一指示消息相对应的子任务数据时,将所述第一指示消息添加到第一预设消息队列中,等待重新执行依据所述第一指示消息,从所述存储系统中取出与所述第一指示消息相对应的子任务数据的步骤;其中所述第一预设消息队列用于存储第一指示消息;当执行依据所述第一指示消息,从所述存储系统中取出与所述第一指示消息相对应的子任务数据的步骤的执行次数大于预设的第一阈值时,丢弃所述第一指示消息,并记录第一日志信息,所述第一日志信息用于表示依据所述第一指示消息,无法从所述存储系统中取出与所述第一指示消息相对应的子任务数据。可选地,还包括:在爬取正文内容的过程中,当监测到所述第二指示消息,却无法从所述存储系统中取出与所述第二指示消息相对应的解析结果时,将所述第二指示消息添加到第二预设消息队列中,等待重新执行依据所述第二指示消息,从所述存储系统中取出与所述第二指示消息相对应的解析结果的步骤;其中所述第二预设消息队列用于存储第二指示消息;当执行依据所述第二指示消息,从所述存储系统中取出与所述第二指示消息相对应的解析结果的步骤的执行次数大于预设的第二阈值时,丢弃所述第二指示消息,并记录第二日志信息,所述第二日志信息用于表示依据所述第二指示消息,无法从所述存储系统中取出与所述第二指示消息相对应的解析结果。可选地,还包括:在完成构建任务数据的过程后,将分配给用于完成构建任务数据的第一处理程序的状态标记为第一状态;在完成搜索并解析平台内容的过程后,将分配给用于完成搜索并解析平台内容的第二处理程序的状态标记为第一状态;在完成爬取正文内容的过程后,将分配给用于完成爬取正文内容的第三处理程序的状态标记为第一状态;在完成情感判断的过程后,将分配给用于完成情感判断的第四处理程序的状态标记为第一状态。可选地,还包括:当监测到所述第一处理程序的状态、所述第二处理程序的状态、所述第三处理程序的状态标记、和所述第四处理程序的状态均为第一状态时,发送邮件信息至发起构建任务数据的发起方。本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质包括但不限于磁盘存储器、CD-ROM、光学存储器等上实施的计算机程序产品的形式。本发明是参照根据本发明实施例的方法、设备系统、和计算机程序产品的流程图和或方框图来描述的。应理解可由计算机程序指令实现流程图和或方框图中的每一流程和或方框、以及流程图和或方框图中的流程和或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和或方框图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和或方框图一个方框或多个方框中指定的功能的步骤。在一个典型的配置中,计算设备包括一个或多个处理器CPU、输入输出接口、网络接口和内存。存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器RAM和或非易失性内存等形式,如只读存储器ROM或闪存flashRAM。存储器是计算机可读介质的示例。计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存PRAM、静态随机存取存储器SRAM、动态随机存取存储器DRAM、其他类型的随机存取存储器RAM、只读存储器ROM、电可擦除可编程只读存储器EEPROM、快闪记忆体或其他内存技术、只读光盘只读存储器CD-ROM、数字多功能光盘DVD或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体transitorymedia,如调制的数据信号和载波。还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。本领域技术人员应明白,本发明的实施例可提供为方法、系统或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质包括但不限于磁盘存储器、CD-ROM、光学存储器等上实施的计算机程序产品的形式。以上仅为本发明的实施例而已,并不用于限制本发明。对于本领域技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。
权利要求:1.一种SMO中情感判断的方法,其特征在于,所述方法包括:在构建任务数据的过程中,每当构建完成一个子任务数据后,便将构建完成的子任务数据存储至存储系统中,发送第一指示消息,其中所述任务数据包括至少两个子任务数据;在搜索并解析平台内容的过程中,每当监测到所述第一指示消息,便从所述存储系统中取出与所述第一指示消息相对应的子任务数据,并依据取出的子任务数据搜索相应的平台内容;解析搜索到的平台内容获得解析结果,并将所述解析结果存储至所述存储系统中,发送第二指示消息;在爬取正文内容的过程中,每当监测到所述第二指示消息,便从所述存储系统中取出与所述第二指示消息相对应的解析结果,依据所述解析结果爬取正文内容,并将爬取到的正文内容存储至所述存储系统中,发送第三指示消息;在情感判断的过程中,每当监测到所述第三指示消息,便从所述存储系统中取出与所述第三指示消息相对应的正文内容,识别取出的正文内容得到相应的情感判断结果,将所述情感判断结果存储至所述存储系统中。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:在搜索并解析平台内容的过程中,当监测到所述第一指示消息,却无法从所述存储系统中取出与所述第一指示消息相对应的子任务数据时,将所述第一指示消息添加到第一预设消息队列中,等待重新执行依据所述第一指示消息,从所述存储系统中取出与所述第一指示消息相对应的子任务数据的步骤;其中所述第一预设消息队列用于存储第一指示消息;当执行依据所述第一指示消息,从所述存储系统中取出与所述第一指示消息相对应的子任务数据的步骤的执行次数大于预设的第一阈值时,丢弃所述第一指示消息,并记录第一日志信息,所述第一日志信息用于表示依据所述第一指示消息,无法从所述存储系统中取出与所述第一指示消息相对应的子任务数据。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:在爬取正文内容的过程中,当监测到所述第二指示消息,却无法从所述存储系统中取出与所述第二指示消息相对应的解析结果时,将所述第二指示消息添加到第二预设消息队列中,等待重新执行依据所述第二指示消息,从所述存储系统中取出与所述第二指示消息相对应的解析结果的步骤;其中所述第二预设消息队列用于存储第二指示消息;当执行依据所述第二指示消息,从所述存储系统中取出与所述第二指示消息相对应的解析结果的步骤的执行次数大于预设的第二阈值时,丢弃所述第二指示消息,并记录第二日志信息,所述第二日志信息用于表示依据所述第二指示消息,无法从所述存储系统中取出与所述第二指示消息相对应的解析结果。4.根据权利要求1-3任一项所述的方法,其特征在于,所述方法还包括:在完成构建任务数据的过程后,将分配给用于完成构建任务数据的第一处理程序的状态标记为第一状态;在完成搜索并解析平台内容的过程后,将分配给用于完成搜索并解析平台内容的第二处理程序的状态标记为第一状态;在完成爬取正文内容的过程后,将分配给用于完成爬取正文内容的第三处理程序的状态标记为第一状态;在完成情感判断的过程后,将分配给用于完成情感判断的第四处理程序的状态标记为第一状态。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:当监测到所述第一处理程序的状态、所述第二处理程序的状态、所述第三处理程序的状态标记、和所述第四处理程序的状态均为第一状态时,发送邮件信息至发起构建任务数据的发起方。6.一种SMO中情感判断的装置,其特征在于,所述装置包括:第一处理单元,用于在构建任务数据的过程中,每当构建完成一个子任务数据后,便将构建完成的子任务数据存储至存储系统中,并发送第一指示消息,其中所述任务数据包括至少一个子任务数据;第二处理单元,用于在搜索并解析平台内容的过程中,每当监测到所述第一指示消息,便从所述存储系统中取出与所述第一指示消息相对应的子任务数据,并依据取出的子任务数据搜索相应的平台内容;解析搜索到的平台内容获得解析结果,并将所述解析结果存储至所述存储系统中,发送第二指示消息;第三处理单元,用于在爬取正文内容的过程中,每当监测到所述第二指示消息,便从所述存储系统中取出与所述第二指示消息相对应的解析结果,依据所述解析结果爬取正文内容,并将爬取到的正文内容存储至所述存储系统中,发送第三指示消息;第四处理单元,用于在情感判断的过程中,每当监测到所述第三指示消息,便从所述存储系统中取出与所述第三指示消息相对应的正文内容,识别取出的正文内容得到相应的情感判断结果,将所述情感判断结果存储至所述存储系统中。7.根据权利要求6所述的装置,其特征在于,所述第二处理单元还用于,在搜索并解析平台内容的过程中,当监测到所述第一指示消息,却无法从所述存储系统中取出与所述第一指示消息相对应的子任务数据时,将所述第一指示消息添加到第一预设消息队列中,等待重新执行依据所述第一指示消息,从所述存储系统中取出与所述第一指示消息相对应的子任务数据的步骤;其中所述第一预设消息队列用于存储第一指示消息;当执行依据所述第一指示消息,从所述存储系统中取出与所述第一指示消息相对应的子任务数据的步骤的执行次数大于预设的第一阈值时,丢弃所述第一指示消息,并记录第一日志信息,所述第一日志信息用于表示依据所述第一指示消息,无法从所述存储系统中取出与所述第一指示消息相对应的子任务数据。8.根据权利要求6所述的装置,其特征在于,所述第三处理单元还用于,在爬取正文内容的过程中,当监测到所述第二指示消息,却无法从所述存储系统中取出与所述第二指示消息相对应的解析结果时,将所述第二指示消息添加到第二预设消息队列中,等待重新执行依据所述第二指示消息,从所述存储系统中取出与所述第二指示消息相对应的解析结果的步骤;其中所述第二预设消息队列用于存储第二指示消息;当执行依据所述第二指示消息,从所述存储系统中取出与所述第二指示消息相对应的解析结果的步骤的执行次数大于预设的第二阈值时,丢弃所述第二指示消息,并记录第二日志信息,所述第二日志信息用于表示依据所述第二指示消息,无法从所述存储系统中取出与所述第二指示消息相对应的解析结果。9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行如权利要求1-5中任一项所述的SMO中情感判断的方法。10.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行如权利要求1-5中任一项所述的SMO中情感判断的方法。
百度查询: 北京国双科技有限公司 SMO中情感判断的方法、装置、存储介质和处理器
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。