麻烦看一下这样是否正确

Question

麻烦看一下这样是否正确

Opened this issue a month ago · 5 comments

import torch
from basicsr.archs.hit_srf_arch import HiT_SRF
import torchvision.transforms as transforms
from PIL import Image
import os

加载图像

image_path = "C:\Users\17525\Desktop\tupian\rectImage1.bmp"
image = Image.open(image_path).convert('RGB')

定义预处理转换

transform = transforms.Compose([
transforms.Resize((224, 224)),
transforms.ToTensor(),
transforms.Normalize(mean=[0.4488, 0.4371, 0.4040], std=[1.0, 1.0, 1.0])
])

应用预处理

input_tensor = transform(image).unsqueeze(0)

初始化模型

model = HiT_SRF(upscale=2)

加载本地模型权重

local_model_path = "D:\chaofenbian\HiT-SR-main\HiT-SR\HiT-SRF-2x.pth"

检查文件是否存在

if not os.path.exists(local_model_path):
print(f"File not found: {local_model_path}")
else:
try:
state_dict = torch.load(local_model_path, map_location='cpu', weights_only=True)
model.load_state_dict(state_dict, strict=False)
except Exception as e:
print(f"An error occurred: {e}")

设置模型为评估模式

model.eval()

确保使用与模型训练时相同的设备

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
model.to(device)
input_tensor = input_tensor.to(device)

进行推理

with torch.no_grad():
output_tensor = model(input_tensor)

反标准化

output_tensor = output_tensor.squeeze(0).cpu()
output_tensor = output_tensor.clamp(0, 1)

转换为图像

output_image = transforms.ToPILImage()(output_tensor)

保存或显示输出图像

output_image.save('output_image.png')
output_image.show()

Answer 1 · 2024-11-29T10:10:46.000Z

你好，感谢对我们工作的关注！
请问方便分享一下输入图像吗，对比输入输出比较好看是否正确。不过这个结果看起来感觉好像某步的normalization不对。如果只想测试单张图的话我推荐使用我们huggingface的demo。也可以参考这里的网络源文件来调整代码。
希望对你有帮助！

Answer 2 · 2024-11-29T10:27:06.000Z

你好感谢你的回复，我是直接在github把工程下载下来的，我尝试过huggingface但是一直链接不到那边的服务器，我这代码是根据你的huggingface逻辑写的。我会检查一下归一化的问题，看一下输入是不是在0到1之间，我有两个问题需要问一下
1：我想知道这个模型直接进行去噪效果怎麽样
2：如果运行一个200200，或者是400400的图片大概需要多少ms（没有任何超分）

下面是我的原图

Answer 3 · 2024-11-29T11:16:46.000Z

如果运行正确结HiT-SRF-2x的结果应该是这样，供您参考

目前我们只在超分任务上进行过实验，还没有测试过去噪性能。如果您感兴趣的话可以参考SwinIR训练一个去噪模型看看效果如何。
对于运行时间，我们目前训练的模型都带超分，所以只能提供超分的运行时间作为参考。在论文图1b中我们测试了从360✖640超分到720x1280的速度，在A100 GPU上大约为331ms (HiT-SRF)。这个速度会随着不同设备而变化，因此在你们目标设备上测试结果才更准确。

Answer 4 · 2024-11-29T12:54:10.000Z

非常感谢您提供的信息，非常有用，目前我正在做关于超分去噪的，我现在是200*200的图片超分到400*400的，用的是华为海思的芯片，主要是嵌入式那边对模型的大小(10M以内)，运行的时间(20ms以内)，图像增强的效果也要很好，最近都在找模型，之前用生成对抗网络，效果是很好，但是模型太大了，蒸馏这部分主要不太确定效果怎么样，目前在找轻量化模型，感觉你这个可以，所以就准备试一下。非常感谢您提供的信息。

…

---原始邮件--- 发件人: "Xiang ***@***.***> 发送时间: 2024年11月29日(周五) 晚上7:17 收件人: ***@***.***>; 抄送: ***@***.******@***.***>; 主题: Re: [XiangZ-0/HiT-SR] 麻烦看一下这样是否正确 (Issue #7) 如果运行正确结HiT-SRF-2x的结果应该是这样，供您参考 391052430-e277f2f9-f7c3-4f43-a7ba-007c815fd648_x2.png (view on web) 目前我们只在超分任务上进行过实验，还没有测试过去噪性能。如果您感兴趣的话可以参考SwinIR训练一个去噪模型看看效果如何。对于运行时间，我们目前训练的模型都带超分，所以只能提供超分的运行时间作为参考。在论文图1b中我们测试了从360✖640超分到720x1280的速度，在A100 GPU上大约为331ms (HiT-SRF)。这个速度会随着不同设备而变化，因此在你们目标设备上测试结果才更准确。 — Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: ***@***.***>

Answer 5 · 2024-11-29T14:08:25.000Z

谢谢，您可以用超分去噪的数据集训练一个新的网络，可能效果会比我们预训练的网络更好（我们训练时没有考虑噪声）。
祝项目一切顺利！