Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于支持向量机SVM的P帧中Intra预测模式快速判定方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京航空航天大学

摘要:本发明公布了一种基于支持向量机SVM的P帧中Intra预测模式快速判定方法,该方法利用支持向量机分类器决策P帧中是否选择Intra预测模式,在所述决策过程中,利用了帧间预测过程中产生的辅助特征,降低了P帧中Intra预测模式判定的误判率。本发明所提出的基于支持向量机的P帧中Intra预测模式快速判定方法能够在保证编码质量的前提下,显著提高编码速度。

主权项:1.一种基于支持向量机SVM的P帧中Intra预测模式快速判定方法,其特征在于包括:A对HEVC视频标准测试序列进行编码,收集P帧中Intra预测模式判定数据,并生成正负样本的数据集,而后,对正负样本数据集使用K‑folder交叉验证法进行验证;B按照编码单元CU的率失真性能的重要程度,给正负样本的数据集中的样本点赋予不同的权重,用加权支持向量机来对支持向量分类器进行训练,加入权重系数以后,训练样本记为:其中,xi是第i个输入数据,ci是第i个输入数据的所属类别,Wi为第i个输入数据的权重系数,分类器目标函数Φω则调整为:其中ω为法向量,C为惩罚因子,即噪声点的权重,ξi为松弛变量;C计算支持向量机SVM的输入特征,包括:当前预测单元与相邻预测单元运动矢量MV模长的平均差、当前编码单元的编码深度、帧间预测INTER_2Nx2N模式的率失真代价与MergeSKIP模式MSM率失真代价的归一化差值、帧间预测率失真归一化代价;其中,所述率失真代价的归一化差值的计算方式如下:其中RD2N×2N为帧间预测INTER_2Nx2N模式的率失真代价,RDMSM为MergeSKIP模式MSM率失真代价;帧间预测率失真归一化代价的计算方式如下:APRD_Cost=RD_CostPU_Width×PU_Height,其中,RD_Cost为当前预测单元PU的率失真代价,PU_Width为当前预测单元PU的宽度,PU_Height为当前预测单元PU的高度;D在支持向量机SVM分类器对P帧Intra预测模式进行判定过程中,首先将加权SVM离线训练出来的SVM模型加载到HM 16.0编码器中,而后将帧间预测过程中计算得到的特征输入到所述分类器中进行Intra预测模式判定。

全文数据:一种基于支持向量机SVM的P巾贞中Intra预测模式快速判定方法技术领域[0001]本发明属于多媒体编码领域,涉及一种针对HEVC视频编码标准的P帧预测中Intra预测模式快速判定方法。背景技术[0002]视觉是人们感知和认知外部世界的主要途径。实验心理学家赤瑞特拉通过大量实验证实人类获得信息的80%以上都来自视觉。正因为如此,在这个信息化的时代,多媒体相关应用已深入到人们生活的方方面面。HDTV、IPTV、网络媒体流、网络电视、视频会议等多媒体应用不断改变着人们的生活方式。与此同时,这些多媒体应用也给现有的存储资源与通信系统带来了巨大的挑战。根据cisco发布预测报告,2014年至2019年的全球移动互联网流量将会增长10倍,每月达到24.3EBIEB=10亿GB。其中约有72%的移动流量来自视频。因此,利用视频压缩技术来降低视频信号的存储容量和传输带宽,已经成为目前一项紧迫且现实的研究课题。[0003]随着高清视频分辨率4KX2K、8KX4K、3D视频、无线视频等应用逐步走进人们的视野,对于现有视频编码标准H.264AVC提出了新要求。为了更好的满足在移动无线视频、远程监控、数字广播、移动流媒体、便携摄像和医学成像等领域的应用。在2010年4月,VCEG与MPEG组建了视频编码联合组(JointCollaborativeTeamonVideoCoding,JCT_VC,负责组织新一代视频编码标准H.265HEVC的研发和制定。并于20I3年,由ITU-TInternationalTelecommunicationUnion-Telecommunicationstandardizationsector,国际电信联盟-电信标准化组)和IS0IECInternationalOrganizationforStandardizationInternationalElectrotechnicalCommission,国际标准化组织国际电工委员会)正式发布。作为新一代视频编码标准,HEVC的目标是在H.264AVChighprofile的基础上,通过采用多种先进的编码技术,使其压缩效率提高一倍,即在保证相同视频质量的前提下,压缩后的视频码流所占存储空间(带宽为原来的50%。[0004]然而,HEVC压缩效率的提升是以牺牲编码端的时间复杂度为代价的,这对于视频实时应用是一个巨大的挑战。HEVC标准测试代码HM16.0的编码器距离实时应用大约差5000倍速度。因此,在保证编码质量的前提下,进一步提升HEVC标准的编码速度,对于加快HEVC标准在产业界的广泛应用,提高视频编码技术在各个领域的应用水平,具有重要的应用价值和社会意义。发明内容[0005]通过深入的研究,本发明人认识到,在HEVCH.265标准的实际应用中,P帧预测起着至关重要的作用,由于I帧编码复杂度较高,所以在编码器的实时应用中,主要使用P帧与B帧编码,只是间隔插入I帧,在P帧编码过程中,首先执行帧间预测,而后使用HEVC标准的判定条件三个CBF是否同时为零),决策是否执行帧内预测,三个CBF同时为零,则跳过帧内预测过程,否则将执行帧内预测,在帧间与帧内预测中,选择率失真代价较小的模式作为当前预测单元的最优预测模式。通过对P帧中预测单元进行统计分析,只有5%左右预测单元的最优模式会由帧内预测选出,这说明在P帧编码中,绝大部分编码单元最终选择帧间预测作为最优的预测模式,前HEVC参考软件中的P帧intra快速算法会导致P帧中一部分帧内预测是冗余的,而帧内预测的自身时间复杂度较高,从而降低了编码效率。从上诉分析中可以得出,仅靠量化残差系数判定是否执行帧内预测是不够准确的,所以本发明人在充分研究帧间编码特征的基础上,加入能够在一定程度上区分帧间预测与帧内预测的特征,并结合机器学习的思想,对编码单元进行预测,提高P帧的编码效率。[0006]为了克服现有技术的缺陷,本发明人提出一种基于支持向量机的P帧中Intra预测模式快速判定方法,该方法利用支持向量机分类器决策P帧预测过程中是否选择Intra预测模式,在决策过程中,引入帧间预测过程中产生的一些辅助特征,进一步降低了P帧Intra预测模式的误判率。根据本发明的基于支持向量机的P桢中Intra预测模式快速判定方法能够在保证编码性能的前提下,有效地减少编码时间。[0007]根据本发明的一个实施例的基于支持向量机SVM的P帧中Intra预测模式快速判定方法包括:[0008]步骤(1、对HEVC视频标准测试序列进行编码,收集P帧中Intra预测模式判定数据,并生成正负样本的数据集,而后,对正负样本数据集使用K-folder交叉验证法进行验证;[0009]步骤2、按照编码单元CU的率失真性能的重要程度,给正负样本的数据集中的样本点赋予不同的权重,用加权支持向量机来对支持向量分类器进行训练,加入权重系数以后,训练样本记为其中,X1是第i个输入数据,^是第i个输入数据的所属类别,W1为第i个输入数据的权重系数,分类器目标函数Φω则调整为:,:其中ω为法向量,C为惩罚因子,即噪声点的权重,Ii为松弛变量;[00Ί0]步骤⑶、计算支持向量机SVM的输入特征,包括:当前预测单元与相邻预测单元运动矢量MV模长的平均差、当前编码单元的编码深度、帧间预测INTER_2Nx2N模式的率失真代价与MergeSKIP模式MSM率失真代价的归一化差值、帧间预测率失真归一化代价;[0011]其中,所述率失真代价的归一化差值的计算方式如下:[0012][0013]其中1^2~\2抑为帧间预测11^^1?_2他2_莫式的率失真代价,1^]〇1为16找6SKIP模式MSM率失真代价;[0014]帧间预测率失真归一化代价的计算方式如下:[0015]APRD_Cost=RD_CostPU_ffidthXPU_Height,[0016]其中,RD_Cost为当前预测单元PU的率失真代价,PU_Width为当前预测单元PU的宽度,PUJfeight为当前预测单元PU的高度;[0017]步骤⑷、在支持向量机SVM分类器对P帧Intra预测模式进行判定过程中,首先将加权SVM离线训练出来的SVM模型加载到HM16.0编码器中,而后将帧间预测过程中计算得到的特征输入到所述分类器中进行Intra预测模式判定。[0018]根据本发明的一个进一步的实施例,在上述基于支持向量机SVM的P帧中Intra预测模式快速判定方法中,生成正负样本的数据集的处理包括:采用等比例采样的方式,生成正负样本的数据集,以保证样本均衡性。[0019]根据本发明的一个进一步的实施例,在上述基于支持向量机SVM的P帧中Intra预测模式快速判定方法中,使用K-folder交叉验证法进行验证的操作包括:将正负样本数据集分为K个子集,取其中的K-I个子集作为训练样本对支持向量分类器进行训练,剩余1个子集作为测试样本,交叉验证重复K次,每次选择一个子集作为测试集,并将K次的平均交叉验证正确率作为结果,以此消除分类器对训练样本的依赖性。[0020]根据本发明的一个进一步的实施例,在上述基于支持向量机SVM的P帧中Intra预测模式快速判定方法中,对HEVC视频标准测试序列进行编码的操作包括:使用HM16.0编码器,对HEVC视频标准测试序列进行编码。[0021]根据本发明的一个方面,提供了一种基于支持向量机SVM的P帧中Intra预测模式快速判定方法,其特征在于包括:[0022]A对HEVC视频标准测试序列进行编码,收集P帧中Intra预测模式判定数据,并生成正负样本的数据集,而后,对正负样本数据集使用K_folder交叉验证法进行验证;[0023]B按照编码单元CU的率失真性能的重要程度,给正负样本的数据集中的样本点赋予不同的权重,用加权支持向量机来对支持向量分类器进行训练,加入权重系数以后,训练样本记为I其中,X1是第i个输入数据,C1是第i个输入数据的所属类别,W1为第i个输入数据的权重系数,分类器目标函数Φω则调整为:其中ω为法向量,C为惩罚因子,即噪声点的权重,ξi为松弛变量;[0024]C计算支持向量机SVM的输入特征,包括:当前预测单元与相邻预测单元运动矢量MV模长的平均差、当前编码单元的编码深度、帧间预测INTER_2Nx2N模式的率失真代价与MergeSKIP模式MSM率失真代价的归一化差值、帧间预测率失真归一化代价;[0025]其中,所述率失真代价的归一化差值的计算方式如下:[0026][0027]其中RD2NX2N为帧间预测INTER_2Nx2N模式的率失真代价,RDMSM为MergeSKIP模式MSM率失真代价;[0028]帧间预测率失真归一化代价的计算方式如下:[0029]APRD_Cost=RD_CostPU_ffidthXPU_Height,[0030]其中,RD_Cost为当前预测单元PU的率失真代价,PU_Width为当前预测单元PU的宽度,PUJfeight为当前预测单元PU的高度;[0031]D在支持向量机SVM分类器对P帧Intra预测模式进行判定过程中,首先将加权SVM离线训练出来的SVM模型加载到HM16.0编码器中,而后将帧间预测过程中计算得到的特征输入到所述分类器中进行Intra预测模式判定。[0032]本发明的优点和有益效果包括:[0033]1、本发明将P帧中Intra预测模式进行判定问题转化为一个二分类问题,并利用SVM分类器对其判定分类;[0034]2、在利用SVM分类器对P帧中Intra预测模式判定过程中,引入了运动矢量、编码深度、帧间率失真代价等特征,提高了预测精度。附图说明[0035]图1线性不可分示意图。[0036]图2为基于运动区域划分的HEVC运动估计提前终止方法流程图。具体实施方式[0037]下面结合附图和具体实施方式对本发明作进一步的说明。[0038]为了提高HEVC视频编码器的编码速度,满足高清视频的实时压缩编码需求,本发明提出了一种基于支持向量机SVM的P帧中Intra预测模式快速判定方法。该方法利用支持向量机分类器决策P帧预测过程中是否选择Intra预测模式,在决策过程中,利用帧间预测过程中产生的一些辅助特征,进一步降低了P帧Intra预测模式的误判率。下面展开具体说明。[0039]在新一代视频编码标准HEVC中,P桢编码是指以前向桢作为参考桢,进行桢间编码。对于HEVC,P帧编码首先要对当前编码单元做一次帧间预测,然后以帧间预测的量化残差系数CBF是否全为零作为判定条件,决策是否进行帧内预测。[0040]支持向量机SVM是一种监督式学习的方法,它由V.Vapnik和CorinnaCortes于1995年提出。这种分类器的特点是他们能够同时最小化经验误差与最大化几何边缘区,因此支持向量机也被称为最大边缘区分类器,可广泛地应用于统计分类以及回归分析。对于SVM来说,在样本为线性不可分的情况下,能够很好的处理噪声点带来的影响,如图1所示,有一些游离的噪声点,如果游离点在另一个类别,超平面就会移动,分类间隔因此改变。此夕卜,在小样本训练集上能够得到比其它算法好很多的结果,其优秀的泛化能力,是因为SVM是以统计学习理论的VCVapnik-Chervonenkis维理论和结构风险最小化理论为基石,SVM中使用的是结构风险最小化准则,即SRMStructuralRiskMinimization准则,它把函数集构造为一个函数子集序列,使各个子集按VC维的大小排列,并在每个子集中寻找最小经验风险,在子集间达到经验风险和置信范围的折衷,取得实际风险最小。而SVM根据有限的样本信息在模型复杂度和学习能力之间寻求最佳折衷,以达到最好的推广能力。因此通过对数据分布的结构化描述,减低了对数据规模及分布的要求。而对于编码器来说,这种弱监督,对样本数量要求不高的分类器更为合适。[0041]本发明对P帧中预测单元进行统计分析,如表1所示,最终只有5%左右的编码单元会被判定为帧内预测,这说明在P帧编码中,绝大部分编码单元最终选择帧间预测作为最优的预测模式,而对于当前HEVC参考软件中的P桢intra快速算法,本发明对其算法的性能进行了评估,快速算法准确率为平均70%,其判定结果会导致P帧中一部分帧内预测是冗余的,而帧内预测的自身时间复杂度较高,这样便降低了编码效率。从上诉分析中可以得出,仅靠量化残差系数判定是否执行帧内预测是不够准确的,所以本发明在充分研究帧间编码特征的基础上,加入能够在一定程度上区分帧间预测与帧内预测的特征,并结合机器学习的思想,对编码单元进行预测,提高P帧的编码效率。[0042]表IP帧编码中Intra预测模式所占比例QP=32[0043][0044]本发明详细流程如图2所示。首先进行帧间预测,而后计算SVM分类器的离线训练特征,通过利用SVM分类器决策是否执行帧内预测,判断P帧预测过程是否提前终止。[0045]在介绍具体实施方式前,首先对本发明用到的参数进行说明。[0046]RDcostis与RDcostiη:分别是第i个釆用“执行Intra预测模式”与“跳过Intra预测模式”两种编码方式的率失真代价,用两者中较小者进行归一,以消除不同序列特性或者不同编码配置下率失真代价绝对值的差异;[0047]ND2NX2N,MSM:帧间预测INTER_2Nx2N模式的率失真代价与MergeSKIP模式MSM率失真代价的归一化差值;[0048]RD2NX2N:帧间预测INTER_2Nx2N模式的率失真代价;[0049]RDMSM:MergeSKIP模式MSM的率失真代价;[0050]APRD_Cost:当前预测单元桢间预测的率失真归一化代价,利用当前预测单元PU的率失真代价除以当前预测单元的大小。[0051]权利要求步骤⑴在以下方法(1、(2中详细描述,权利要求步骤2在以下方法3、(4中详细描述,权利要求步骤3中参数更新在方法5中详细描述,权利要求步骤⑷中参数更新在方法⑹中详细描述。[0052]方法描述如下:[0053]1使用HEVC标准测试序列作为HEVC参考软件的输入序列,并修改P帧编码过程,强制每次编码做一次帧间与帧内预测,保证样本均衡性前提下,建立正负样本的数据集。[0054]2对所收集的正负样本数据集使用K-folder交叉验证法,将正负样本数据集分为K个子集,取其中的K-I个子集作为训练样本对支持向量分类器进行训练,剩余1个子集作为测试样本,交叉验证重复K次,每次选择一个子集作为测试集,并将K次的平均交叉验证正确率作为结果,以此消除分类器对训练样本的依赖性。[0055]3计算P帧预测两种预测方式的率失真代价,而后将归一化的率失真代价的变化作为权重系数Wi。[0056]⑷利用所收集数据,训练加权支持向量机WSVM,并作为P帧中Intra预测模式判定过程中的分类器。[0057]5计算支持向量机的输入特征,包括当前预测单元与相邻预测单元运动矢量MV模长的平均差、当前预测单元的深度、ND2NX2N,MSM以及APRD_Cos。[0058]⑹利用SVM分类器的判定结果,决策是否执行P帧编码过程中的帧内预测。如果结果为“1”,表示跳过Intra预测模式,桢间预测的最优模式将作为当前P帧预测的最优模式,如果结果为“0”,则表示执行Intra预测模式,P帧预测的最优模式则通过比较帧间帧内预测各自选出的最优模式率失真代价得出。[0059]其中,步骤⑶中W1的计算方法见公式1[0060][0061]其中,RDcostis与RDcosti⑹分别是第i个釆用“执行Intra预测模式”与“跳过Intra预测模式”两种编码方式的率失真代价,用两者中较小者进行归一化,以消除不同序列特性或者不同编码配置下率失真代价绝对值的差异。贝叶斯风险在真实的率失真结果与决策结果相同时,贝叶斯风险为零,否则贝叶斯风险为错误分类导致的率失真上升;在加权中,无论决策结果与真实的率失真优化结果是否相同,都将权重系数设定为率失真的变化量,这样,既削弱了噪声点的影响,也使得训练过程更加重视率失真性能变化较大的样本。需要特别指出的是,权重系数只用于训练过程,不用于预测。[0062]通过公式(1可以得到一个自适应变化的权重系数1,而后将权重系数带入目标函数中,计算目标函数,如公式⑵所示:[0063][0064]其中C为惩罚因子,即噪声点的权重,Ii为松弛变量。[0065]步骤⑸中ND2NX2N,MSM的计算方法见公式⑶[0066][0067]如果在一个编码单元中,模式选择时使用运动补偿而不是MSM,说明当前编码块很可能运动较为剧烈或纹理较为复杂,在大多数情况下,帧内预测会比帧间预测得到更好的编码增益。且RD2NX2N与RDMSM不会消耗额外的计算量,是帧间预测过程中产生的特征。而步骤⑸中帧间预测率失真归一化代价APRD_Cost的计算方法见公式4。[0068]APRD_Cost=RD_CostPU_ffidthXPU_Height4[0069]以上公开的仅为本发明的具体实施例。根据本发明提供的技术思想,本领域的技术人员所能思及的变化,都应落入本发明的保护范围内。

权利要求:1.一种基于支持向量机SVM的P桢中Intra预测模式快速判定方法,其特征在于包括:A对HEVC视频标准测试序列进行编码,收集P帧中Intra预测模式判定数据,并生成正负样本的数据集,而后,对正负样本数据集使用K-folder交叉验证法进行验证;B按照编码单元CU的率失真性能的重要程度,给正负样本的数据集中的样本点赋予不同的权重,用加权支持向量机来对支持向量分类器进行训练,加入权重系数以后,训练样本记为其中,X1是第i个输入数据,C1是第i个输入数据的所属类别,W1为第i个输入数据的权重系数,分类器目标函数Φω则调整为:其中ω为法向量,C为惩罚因子,即噪声点的权重,Ii为松弛变量;C计算支持向量机SVM的输入特征,包括:当前预测单元与相邻预测单元运动矢量MV模长的平均差、当前编码单元的编码深度、帧间预测INTER_2Nx2N模式的率失真代价与MergeSKIP模式MSM率失真代价的归一化差值、帧间预测率失真归一化代价;其中,所述率失真代价的归一化差值的计算方式如下:其中RD2NX2N为帧间预测INTER_2Nx2N模式的率失真代价,RDMSM为MergeSKIP模式MSM率失真代价;帧间预测率失真归一化代价的计算方式如下:其中,RD_Cost为当前预测单元PU的率失真代价,PU_Width为当前预测单元PU的宽度,PUJfeight为当前预测单元PU的高度;D在支持向量机SVM分类器对P帧Intra预测模式进行判定过程中,首先将加权SVM离线训练出来的SVM模型加载到HM16.0编码器中,而后将帧间预测过程中计算得到的特征输入到所述分类器中进行Intra预测模式判定。2.如权利要求1所述的基于支持向量机SVM的P桢中Intra预测模式快速判定方法,其特征在于所述步骤A中生成正负样本的数据集的操作包括:采用等比例采样的方式,生成正负样本的数据集,以保证样本均衡性。3.如权利要求1所述的基于支持向量机SVM的P桢中Intra预测模式快速判定方法,其特征在于所述步骤A中使用K-folder交叉验证法进行验证的操作包括:将正负样本数据集分为K个子集,取其中的K-I个子集作为训练样本对支持向量分类器进行训练,剩余1个子集作为测试样本,交叉验证重复K次,每次选择一个子集作为测试集,并将K次的平均交叉验证正确率作为结果,以此消除分类器对训练样本的依赖性。4.如权利要求1所述的基于支持向量机SVM的P桢中Intra预测模式快速判定方法,其特征在于所述步骤A中对HEVC视频标准测试序列进行编码的操作包括:使用HM16.0编码器,对HEVC视频标准测试序列进行编码。

百度查询: 北京航空航天大学 一种基于支持向量机SVM的P帧中Intra预测模式快速判定方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。