1.7 秒实现高清大片快速复原,我国团队发布 HYPIR 图像复原大模型

内容摘要IT之家 7 月 28 日消息,中国科学院深圳先进技术研究院数字所董超研究员团队今日发布了一项名为 HYPIR 的图像复原大模型,不仅比现有的图像复原技术快数十倍,更在高清分辨率、文字保真、理解能力、用户控制灵活性等方面展现出了优异性能。传

联系电话:400-962-3929

IT之家 7 月 28 日消息,中国科学院深圳先进技术研究院数字所董超研究员团队今日发布了一项名为 HYPIR 的图像复原大模型,不仅比现有的图像复原技术快数十倍,更在高清分辨率、文字保真、理解能力、用户控制灵活性等方面展现出了优异性能。

传统方法中,基于预训练扩散模型的复原技术显著提升了图像复原效果,但存在计算复杂度高、推理速度慢、训练资源消耗大以及生成结果可控性不足等问题,成为了限制图像复原技术发展的瓶颈问题。

▲ 1927 年第五届索尔维会议合影修复

去年,董超团队提出了智能画质增强大模型 SUPIR,将低质量的图像恢复到接近原始状态的高清图像,修复多种退化类型的图像。而此次图像大模型 HYPIR 作为升级版,舍弃了迭代式的扩散模型训练,改用单步的对抗生成模型训练方式,将原有的算法速度提升了数倍,同时采用更新的文生图基模型进一步提升算法效果,实现了 8K 级别的细节生成,在生成图像的稳定性和可控性方面远超 SUPIR 大模型。

▲ HYPIR 大模型修复图像效果展示

“以往图像复原方法中往往包括扩散模型蒸馏、ControlNet 适配器或者多步推理过程。而 HYPIR 则不需要依赖这些步骤,使用方法更加简单。在训练和推理速度上较传统方法提升了一个数量级以上,且性能更优。”董超介绍,HYPIR 主要有两个创新点,一是使用预训练扩散模型初始化复原网络;二是从理论角度出发解释这一简单方法背后蕴含的深刻原理。

实验数据显示,在单张显卡(图像处理器)上,HYPIR 仅需 1.7 秒即可完成一张 1024x1024 分辨率图像的复原。相比现有的图像复原方法,研究人员提出的 HYPIR 在复原图像的质量上性能更优,且能够适用于各种尺寸的预训练扩散模型,为不同应用场景提供了灵活性。

▲ HYPIR 大模型处理图片纹理细节的效果展示

在应用层面,研究人员介绍,HYPIR 在图像高清分辨率、文字保真、理解能力、用户控制灵活性等方面均展现出了优异的性能。

例如,在老照片修复方面,研究人员运用 HYPIR 修复了国内外经典电影、电视剧老照片,让模糊的影像重现清晰的细节,为文化记忆传承提供了技术支持。在高分辨率图像修复领域,HYPIR 同样表现出色,因其兼具速度与效果,HYPIR 成功攻克了传统方法在生成 8K 分辨率图像时往往面临速度慢或效果不佳的难题。

▲ HYPIR 大模型在高分辨率图像超分复原方面的效果展示

在文字保真方面,传统基于扩散模型的方法常导致复原出的文字模糊或扭曲,缺乏精确性,而 HYPIR 则能够使复原出的文字保持高保真度和清晰度,无论是简单的标识还是复杂的文档,HYPIR 都能精准地还原其原始形态,使图像中的文字清晰可读。

值得一提的是,HYPIR 还具备了突出的自然语言理解能力,能够精准捕捉和理解用户的输入指令,在图像复原过程中准确地反映用户的意图。此外,用户可以根据需求灵活调节生成与复原的平衡,或精细控制图像细节程度,从而获得符合自身偏好的结果。

HYPIR 不仅展示了图像修复技术上的创新性,也体现了对实际应用需求的理解。通过打破传统思维定式,该技术在文化传承与保护、影视修复、高分辨率图像生成等领域提供了解决方案。

IT之家附 HYPIR 项目官网链接:

 
举报 收藏 打赏 评论 0
今日推荐
浙ICP备19001410号-1

免责声明

本网站(以下简称“本站”)提供的内容来源于互联网收集或转载,仅供用户参考,不代表本站立场。本站不对内容的准确性、真实性或合法性承担责任。我们致力于保护知识产权,尊重所有合法权益,但由于互联网内容的开放性,本站无法核实所有资料,请用户自行判断其可靠性。

如您认为本站内容侵犯您的合法权益,请通过电子邮件与我们联系:675867094@qq.com。请提供相关证明材料,以便核实处理。收到投诉后,我们将尽快审查并在必要时采取适当措施(包括但不限于删除侵权内容)。本站内容均为互联网整理汇编,观点仅供参考,本站不承担任何责任。请谨慎决策,如发现涉嫌侵权或违法内容,请及时联系我们,核实后本站将立即处理。感谢您的理解与配合。

合作联系方式

如有合作或其他相关事宜,欢迎通过以下方式与我们联系: