首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于人工智能的校园学生安全监视系统及方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:湖南协成电子技术有限公司

摘要:本发明属于安全监视技术领域,本发明公开了基于人工智能的校园学生安全监视系统及方法;包括:采集学生的行为数据和学生所处的环境参数;将行为数据和环境参数输入到基于变分自编码器的多模态融合深度学习模型中,输出统一行为嵌入向量序列;利用改进双重决策Q学习算法,生成基线行为模式;基于马尔可夫决策算法计算出异常分数,并获取异常分数对应的置信度;预设异常阈值,当异常分数大于或等于异常阈值,且异常分数对应的置信度大于或等于预设的置信水平时,则判定为异常行为,并将行为数据和环境参数发送给安全监视终端,为学校采取针对性措施提供了重要依据,避免了误报或漏报的风险。

主权项:1.基于人工智能的校园学生安全监视系统,其特征在于,包括:数据采集模块,用于采集学生的行为数据和学生所处的环境参数;数据融合模块,用于将行为数据和环境参数输入到基于变分自编码器的多模态融合深度学习模型中,输出统一行为嵌入向量序列;行为模式拟合模块,用于利用改进双重决策Q学习算法,对学生的正常行为进行建模,生成基线行为模式;异常检测模块,用于将统一行为嵌入向量序列与基线行为模式,基于马尔可夫决策算法计算出异常分数,并获取异常分数对应的置信度;异常判定模块,用于预设异常阈值,当异常分数大于或等于异常阈值,且异常分数对应的置信度大于或等于预设的置信水平时,则判定为异常行为,并将行为数据和环境参数发送给安全监视终端,各个模块之间通过有线和或无线的方式进行连接;所述基线行为模式的生成方式包括:定义状态空间,将行为特征向量和环境特征向量映射为状态空间内的状态;定义学生执行的一系列行为作为行为空间,并将行为空间设计为层次化的结构,包括高级行为和低级行为;确定个优化目标,针对每个优化目标,定义一个对应的单一目标奖励函数; ,其中,为核函数;状态-动作对的示例;为核系数,为示例的数量,为求和的索引;将个单一目标奖励函数聚合成一个多目标奖励函数; ;其中,为优化目标的权重;将状态空间和行为空间交互过程中获得的状态转移元组存储在预设的经验回放池中,其中,为时刻的状态,为时刻的动作,为时刻根据多目标奖励函数计算得到的奖励值,为时刻的状态;分别定义两个独立的Q网络和,使用一个Q网络的值来选择最优的行为,另一个Q网络的值来计算目标值;并且引入两个目标Q网络'和,定期从和复制参数过来,用于同步计算目标值;并将优化的目标定义为最小化两个Q网络的均方误差损失,将经验回放池分布在M5个计算节点上,并行地进行数据采样和更新;运用学生历史的行为数据和所处的环境参数训练Q网络,根据当前的状态选择动作,执行该动作,观察到下一状态和奖励值,并更新Q网络,迭代得到训练完成的训练完成的Q网络;采集学生的正常行为数据以及对应所处的环境参数,将其作为初始状态,对于初始状态,使用训练完成的Q网络,执行贪婪策略得到一系列最优行为序列,最优行为序列就构成了学生的基线行为模式;所述异常分数的计算方式包括:将学生的行为建模为一个马尔可夫决策过程,其中,将马尔可夫决策过程的交互状态定义为统一行为嵌入向量序列;基线行为模式表示为一个最优行为序列,其中,为第个时间步的基线行为向量;将马尔可夫决策过程的交互行为定义为是基线行为向量;定义状态转移概率和奖励函数,使用前向算法计算统一行为嵌入向量序列的概率,将该概率的值的负对数作为异常分数;奖励函数,其中,为Sigmoid函数,和是可学习参数,为的转置; ;其中,为第个时间步的基线行为向量的权重;将异常分数作为输入学习一个高斯过程回归模型,输出异常分数的置信度。

全文数据:

权利要求:

百度查询: 湖南协成电子技术有限公司 基于人工智能的校园学生安全监视系统及方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。