买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:云启智慧科技有限公司
摘要:本发明提供一种基于波动风险的高考志愿推荐方法及系统,涉及数据推荐技术领域,包括:获取学生实际分数并确定院校集合,将院校集合分组得到院校组,基于回归模型预测分数线,将预测分数线引入院校组形成院校分数表;按照院校组,计算波动标准差;遍历院校分数表,根据学生实际分数、预测分数线和波动标准差计算录取风险概率,并计算最终录取概率;根据最终录取概率得到第一院校列表;构建院校专业画像和学生意向画像;根据关联映射规则对学生意向画像和院校专业画像进行分析,得到推荐指数,按照推荐指数得到第二院校列表,根据第二院校列表向学生推荐。本发明基于波动概率密度和关联映射的混合志愿推荐算法,为考生选择更合适的志愿填报选择。
主权项:1.一种基于波动风险的高考志愿推荐方法,其特征在于,包括以下步骤:S1:获取学生实际分数并确定院校集合,将院校集合进行分组,得到院校组,根据院校组分别统计各个院校近6年的历史分数线,利用历史分数线训练回归模型,基于训练后的回归模型预测得到各个院校的预测分数线,将预测分数线引入院校组中,形成院校分数表;步骤S1包括:S11:获取学生实际分数和院校集合;S12:将院校按照省份、批次、文理科分别进行分组,得到院校组,包括省份组别、批次组别和文理科组别;S13:分别统计省份组别、批次组别和文理科组别的近6年的历史分数线,其中,历史分数线为各个院校针对不同省份、不同批次或不同文理科的分数线;S14:以当前年份为起始年份,将历史分数线按照其年份与起始年份的相隔年数从小到大进行划分,记为S1、S2、S3、S4、S5和S6,其中,S1为去年的历史分数线;S15:将S2、S3、S4、S5和S6作为输入特征值,将S1作为预测结果,以此训练回归模型,直至回归模型收敛;S16:基于训练后的回归模型预测各个院校针对不同省份、不同批次或不同文理科的预测分数线;S17:将各个院校针对不同省份、不同批次或不同文理科的预测分数线分别引入省份组别、批次组别和文理科组别中,得到省份分数表、批次分数表和文理科分数表;S2:按照院校组,统计每个院校的近5年的历史录取分数和历史录取率,根据历史录取分数计算波动标准差;波动标准差的计算公式为: ;式中,σ为波动标准差;i表示历史年份;start表示当前年份;start+1表示从当前年份开始往前+1年份;start+5表示从当前年份开始往前+5年份;wi表示第i年的历史录取分数的波动值;表示近5年的历史录取分数的波动值的平均值;n表示历史录取分数的数量;S3:遍历院校分数表,计算学生实际分数与预测分数线的差值,根据学生实际分数与预测分数线的差值和波动标准差计算录取风险概率,结合录取风险概率和历史录取率计算得到最终录取概率;步骤S3包括:S31:遍历院校分数表中的批次分数表,计算学生实际分数与预测分数线的差值,记为gap,将gap作为概率密度累计函数的输入,结合波动标准差σ计算录取风险概率prisk: ;式中,prisk为录取风险概率,gap为学生实际分数与预测分数线的差值,x表示学生实际分数,σ为波动标准差,μ为波动系数;S32:引入历史录取率对异常波动进行矫正,根据历史录取率和录取风险概率计算得到最终录取概率p: ;式中,p为最终录取概率,prisk为录取风险概率,phis为历史录取率,λ为调节参数;波动系数μ根据院校的历史录取分数的波动情况进行设置,调节参数λ根据各个院校的历史分数线和历史录取率进行训练得到;S4:根据每个院校的最终录取概率对院校集合进行筛选,得到第一院校列表;S5:构建第一院校列表中各院校的院校专业画像和学生意向画像;步骤S5包括:S51:一对一咨询并收集学生的背景数据和个人意向数据,背景数据包括家庭信息数据、教育计划成本投入数据,个人意向数据包括学业规划数据、地域选择数据、专业偏好数据、偏好理由数据和职业规划数据;S52:对收集的背景数据和个人意向数据进行清洗和标准化处理;S53:对背景数据和个人意向数据进行特征提取和分析,得到背景特征和个人意向特征,其中,背景特征为m维特征,个人意向特征为n维特征;S54:将背景特征和个人意向特征组成学生意向特征;S55:根据学生的个人偏向为学生意向特征分配初始权重,得到初始权重集;S56:结合学生意向特征和初始权重集构建学生意向画像;S57:针对每个院校,获取院校的院校信息,将院校信息进行特征提取,得到k维的院校特征,并为院校特征均等分配权重,得到院校权重集,结合院校特征和院校权重集构建每个院校的院校专业画像;S6:根据关联映射规则对学生意向画像和第一院校列表中各院校的院校专业画像进行关联分析,计算得到第一院校列表中各院校的推荐指数,按照推荐指数对第一院校列表进行重排,得到第二院校列表,根据第二院校列表向学生进行推荐;步骤S6包括:S61:对学生意向画像和院校专业画像中的非数值型特征进行特征编码量化,转换为数值型特征,更新后的学生意向特征为m+n维,更新后的院校特征为k维;S62:调取历史推荐数据,包括历史学生画像和历史意向权重向量,并提取历史学生画像特征;S63:按照多重权重机制,调整学生意向特征的初始权重集,并计算学生意向特征和历史学生画像特征的相似度值;步骤S63中,相似度值的计算公式为: ;式中,sim指的是学生意向特征和历史学生画像特征的相似度值,λs指的是专家的专业性参数权重集,λo指的是学生主观偏好权重集,f指的是λs和λo的权重调整值,ci指的是第i个学生意向特征,指的是第i个历史学生画像特征;S64:设置相似度阈值t,判断相似度值与相似度阈值t的大小:若相似度值小于t,则根据相似度值为学生意向特征匹配到目标历史学生画像特征,并根据对应的历史意向权重向量得到该学生的意向权重向量S;若相似度值大于t,则采用人工录入的方式,选择院校并训练模型参数来得到该学生的意向权重向量S,其中,训练模型参数时采用多级过滤关联的方式,根据学生的学业规划来分级训练模型参数;S65:对于第一院校列表中的每个院校,将意向权重向量S与院校特征进行向量内积计算,得到各院校的推荐指数r;S66:按照推荐指数r从高到低对第一院校列表中的院校进行重新排序,得到第二院校列表;S67:将第二院校列表推荐给学生。
全文数据:
权利要求:
百度查询: 云启智慧科技有限公司 一种基于波动风险的高考志愿推荐方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。