用于图像质量和美学评价的统一视觉语言模型预训练和调整方法

导航：龙图腾网> 最新专利技术> 用于图像质量和美学评价的统一视觉语言模型预训练和调整方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：清华大学深圳国际研究生院

摘要：一种用于图像质量和美学评价的统一视觉语言模型预训练和调整方法，包括以下步骤：a.使用多模态大语言模型MLLM为用于图像质量和美学评估任务的训练图像生成与图像质量和美学相关的文本描述，得到图像‑文本描述数据集；b.采用数据净化策略，通过美学相关性和信息丰富度排名AIR筛选和优化图像‑文本描述数据集；c.在得到的图像‑文本数据集上进行统一视觉语言模型UniQA的预训练，通过对比学习策略最大化成对图像和文本特征的相似度，同时最小化不匹配图像和文本的相似度；d.通过轻量级适配器调整预训练好的UniQA模型的视觉特征，以适应特定的图像评估任务。本发明对图像评估提供了一种高效、准确且适应性强的解决方案，具有广泛的应用前景和实际价值。

主权项：1.一种用于图像质量和美学评价的统一视觉语言模型预训练和调整方法，其特征在于，包括以下步骤：a.使用多模态大语言模型MLLM为用于图像质量和美学评估任务的训练图像生成与图像质量和美学相关的文本描述，得到图像-文本描述数据集；b.采用数据净化策略，通过美学相关性和信息丰富度排名AIR筛选和优化所述图像-文本描述数据集；c.在步骤b筛选和优化得到的图像-文本数据集上进行统一视觉语言模型UniQA的预训练，通过对比学习策略最大化成对图像和文本特征的相似度，同时最小化不匹配图像和文本的相似度；d.通过轻量级适配器调整预训练好的UniQA模型的视觉特征，以适应特定的图像评估任务。

全文数据：

权利要求：

百度查询：清华大学深圳国际研究生院用于图像质量和美学评价的统一视觉语言模型预训练和调整方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种宽组分区间的高性能压电陶瓷及其制备方法

下一篇：一种马铃薯繁育脱毒装置及脱毒方法

相关技术

一种宽组分区间的高性能压电陶瓷及其制备方法

一种马铃薯繁育脱毒装置及脱毒方法

一种缺陷管道非开挖修复的清淤装置及其施工方法

一种装饰条连接件与立柱压板的连接工艺

一种节能建筑屋顶结构及施工方法

数据驱动的需求侧负荷预测与不确定性估计方法及系统

一种高安全性的并机并网的储能设备

一种飞机液压牵引系统横向稳定性实验平台

一种多功能电源管理芯片

一种音视频混合数字多码加密方法

一种红松生长影响因素获取系统

一种铜光催化未活化卤代烃胺化制备氮烷基化化合物的方法

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

用于图像质量和美学评价的统一视觉语言模型预训练和调整方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务