test_TCVC_onesampling_noGT.py

"""
Test Vid4 (SR) and REDS4 (SR-clean, SR-blur, deblur-clean, deblur-compression) datasets
"""

import alphaui as gr
import os
import os.path as osp
import glob
import logging
import numpy as np
import cv2
import torch
import torch.nn.functional as F
import math

import utils.util as util
import data.util as data_util

import models.archs.TCVC_IDC_arch as TCVC_IDC_arch

from compute_hist import *


import requests
import boto3
import subprocess

import os
os.environ["AWS_ACCESS_KEY_ID"] = "Add AWS key"
os.environ["AWS_SECRET_ACCESS_KEY"] = "Add AWS key"
s3 = boto3.client('s3')


def upload_to_s3(file, bucket_name, object_name):
    """Upload a file to an S3 bucket."""
    s3.upload_file(file, bucket_name, object_name)

def download_video(url):
    """Download a video from a URL."""
    response = requests.get(url)
    content_type = response.headers.get('content-type')
    if 'video' not in content_type:
        return None
    filename = url.split('/')[-1]
    with open(filename, 'wb') as f:
        f.write(response.content)
    return filename

def upload_org_video(filename,bucket_name):
    upload_to_s3(filename, bucket_name, "upload_videos/"+filename)
    return "org Uploded Video"

def upload_process_video(filename, bucket_name):
    s3_key = "processed_videos/" + filename
    upload_to_s3(filename, bucket_name, s3_key)
    s3_url = f"https://{bucket_name}.s3.amazonaws.com/{s3_key}"
    print("------------S3 URL",s3_url)
    return s3_url


def calculate_psnr(img1, img2):
    # img1 and img2 have range [0, 255]
    img1 = img1.astype(np.float64)
    img2 = img2.astype(np.float64)
    mse = np.mean((img1 - img2)**2)
    if mse == 0:
        return float('inf')
    return 20 * math.log10(255.0 / math.sqrt(mse))

def calculate_psnr_folders(input_path, GT_path, interval_length, logger):
    input_folder_list = os.listdir(input_path)
    input_folder_list.sort()
    
    avg_psnr_l = []
    key_avg_psnr_l = []
    inter_avg_psnr_l = []
    key_n_l = []
    inter_n_l = []
    
    for folder in input_folder_list:
        if not os.path.isdir(os.path.join(input_path, folder)):
            continue
      
        GT_img_path_l = sorted(glob.glob(osp.join(GT_path, folder, "*")))
        Input_img_path_l = sorted(glob.glob(osp.join(input_path, folder, "*")))
        
        max_idx = len(GT_img_path_l)
        keyframe_idx = list(range(0, max_idx, interval_length + 1))
        #print(keyframe_idx)
        
        avg_psnr, N_im = 0, 0
        key_avg_psnr, inter_avg_psnr = 0, 0
        key_N_im, inter_N_im = 0, 0
        count = 0

        for img1_path, img2_path in zip(GT_img_path_l, Input_img_path_l):
            img1 = cv2.imread(img1_path)
            img2 = cv2.imread(img2_path)
            img_name = img1_path.split('/')[-1]
              
            psnr = calculate_psnr(img1, img2)        
            avg_psnr += psnr
            

            if count in keyframe_idx or count == len(GT_img_path_l)-1:
                key_avg_psnr += psnr
                key_N_im += 1
                key_flag = True
                #print(img1_path)
            else:
                inter_avg_psnr += psnr
                inter_N_im += 1
                key_flag = False
   
            count += 1
            N_im += 1
            
            logger.info(
                "{:3d} - {:25} \tPSNR: {:.6f} dB   key frame: {}".format(
                    count, img_name, psnr, key_flag
                )
            )
            
        avg_psnr /= N_im
        avg_psnr_l.append(avg_psnr)
        
        key_avg_psnr /= key_N_im
        key_avg_psnr_l.append(key_avg_psnr)
        
        inter_avg_psnr /= inter_N_im
        inter_avg_psnr_l.append(inter_avg_psnr)
        
        key_n_l.append(key_N_im)
        inter_n_l.append(inter_N_im)
        
        message = "Folder {} - Average PSNR: {:.6f} dB for {} frames; AVG key PSNR: {:.6f} dB for {} key frames; AVG inter PSNR: {:.6f} dB for {} inter frames.".format(
                    folder, avg_psnr, N_im, key_avg_psnr, key_N_im, inter_avg_psnr, inter_N_im)
        logger.info(message)

         
    logger.info("################ Final Results ################")
    logger.info('Inter: {}'.format(str(interval_length)))
    
    
    message = "Total Average PSNR: {:.6f} dB for {} clips; AVG key PSNR: {:.6f} dB for {} key frames; AVG inter PSNR: {:.6f} dB for {} inter frames.".format(
        sum(avg_psnr_l) / len(avg_psnr_l), len(input_folder_list), 
        sum(key_avg_psnr_l) / len(key_avg_psnr_l), sum(key_n_l), 
        sum(inter_avg_psnr_l) / len(inter_avg_psnr_l), sum(inter_n_l), 
        )
    logger.info(message)

    
    return avg_psnr_l


def save_imglist(k, end_k, output_dir, img_list, logger, img_paths):
    """The color type of input img list is rgb"""
    count = 0
    for i in range(k, end_k):
        imname = img_paths[count].split('/')[-1]
        #print(imname)
        out_path = os.path.join(output_dir, imname)
        #logger.info("save img: {}".format(out_path))
        cv2.imwrite(out_path, img_list[count][:,:,::-1])
        count += 1

def main(video):
    #################
    # configurations
    #################
    device = torch.device("cuda")
    os.environ["CUDA_VISIBLE_DEVICES"] = "0"
    
    data_mode = "Real" 
    key_net = "IDC"
    color_type = "LAB"
    GT_size = 256
    
    model_path = "./experiments/TCVC_IDC/models/80000_G.pth"  

    interval_length = 17
    
    # specify the input folder and the output folder
    Input_dataset_folder = "/home/src/video/"
    
    save_folder = "../results/TCVC_{}_interlen{}_output".format(key_net, interval_length)
    

    # specify key net
    
    if key_net == "IDC":           
        model = TCVC_IDC_arch.TCVC_IDC(nf=64, N_RBs=3, key_net="sig17", dataset="DAVIS4")
    else:
        raise NotImplementedError('Backbone [{}] is not yet ready!'.format(key_net))
       

    #### evaluation
    crop_border = 0

    # temporal padding mode
    padding = "new_info"
    save_imgs = True

    util.mkdirs(save_folder)
    util.setup_logger(
        "base", save_folder, "test", level=logging.INFO, screen=True, tofile=True
    )
    logger = logging.getLogger("base")

    #### log info
    logger.info("Data: {} - {}".format(data_mode, Input_dataset_folder))
    logger.info("Padding mode: {}".format(padding))
    logger.info("Model path: {}".format(model_path))
    logger.info("Save images: {}".format(save_imgs))

    #### set up the models
    model.load_state_dict(torch.load(model_path), strict=True)
    model.eval()
    model = model.to(device)

    avg_psnr_l = []
    # video = "apple.mp4"
    print(video)
    ## mkdir output dir
    save_subfolder = osp.join(save_folder, video)
    if save_imgs:
        util.mkdirs(save_subfolder)
    
    video_dir_path = os.path.join(Input_dataset_folder, video)
    print(video_dir_path)
    img_list = sorted(glob.glob(os.path.join("../images/test_s3/", "*.png")))
    # print("Imagw list---------------------->",img_list)
    imgs = [data_util.read_img(None, img_list[i])/255. for i in range(len(img_list))]
    # print(imgs)
    if imgs[0].shape[-1] == 3:
        rgb_flag = True
    elif imgs[0].shape[-1] == 1:
        rgb_flag = False
    else:
        print('weird img channel: {}! please double check!'.format(imgs[0].shape[-1]))
        exit()
    
    keyframe_idx = list(range(0, len(imgs), interval_length+1))
    if keyframe_idx[-1] == (len(imgs)-1):
        keyframe_idx = keyframe_idx[:-1]
    print("Processing '{}'".format(video))
    print("Total images: {}  keyframe index: {}".format(len(imgs), keyframe_idx))
    print(">>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>")
    
    count = 0
    avg_psnr, N_im = 0, 0
    for k in keyframe_idx:
        img_paths = img_list[k:k+interval_length+2]
        #print(img_paths)
        img_in = imgs[k:k+interval_length+2] # get input list
        img_in = np.stack(img_in, 0) # [9, H, W, 3] rgb
        img_tensor = torch.from_numpy(img_in.transpose(0,3,1,2)).float()
        if rgb_flag:
            img_lab_tensor = data_util.rgb2lab(img_tensor) # [9, 3, H, W] lab (-1, 1)
            img_l_tensor = img_lab_tensor[:,:1,:,:] # get l channel, original size (-0.5, 0.5)
        else:
            img_l_tensor = img_tensor - 0.5
        
        img_l_rs_tensor = F.interpolate(img_l_tensor, size=[GT_size, GT_size], mode="bilinear") # resize l channel to 256*256\
        img_l_rs_tensor_list = [img_l_rs_tensor[i:i+1,...].cuda() for i in range(img_l_rs_tensor.shape[0])] # generate input list
        
        with torch.no_grad():
            out_ab, _, _, _, _ = model(img_l_rs_tensor_list) # [1, 9, 3, H, W] rgb (0, 1)
#                 out_rgb = torch.cat((out_rgb[:,:1,:,:,:], w_rgb), 1)
        out_ab = out_ab.detach().cpu()[0,...]

        N, C, H, W = img_tensor.size() 
        out_a_rs = F.interpolate(out_ab[:,:1,:,:], size=[H, W], mode="bilinear") # resize ab channel to original size
        out_b_rs = F.interpolate(out_ab[:,1:2,:,:], size=[H, W], mode="bilinear")
#             out_ab_rs = F.interpolate(out_ab, size=[H, W], mode="bilinear")
        out_lab_origsize = torch.cat((img_l_tensor, out_a_rs, out_b_rs), 1) # concat
        out_rgb_origsize = data_util.lab2rgb(out_lab_origsize) # lab to rgb [9, 3, H, W] (0, 1)
        
        out_rgb_img = [util.tensor2img(np.clip(out_rgb_origsize[i,...]*255., 0, 255), np.uint8) for i in range(out_rgb_origsize.size(0))] # (0, 255)
        #import matplotlib.pyplot as plt
        #plt.imshow(out_rgb_img[0])
        #plt.show()
        
        
        save_imglist(k, k+len(out_rgb_img), save_subfolder, out_rgb_img, logger, img_paths)
                  
        
    dilation = [1,2,4]
    weight = [1/3, 1/3, 1/3]    
    JS_b_mean_list, JS_g_mean_list, JS_r_mean_list, JS_b_dict, JS_g_dict, JS_r_dict, CDC = calculate_folders_multiple(save_folder, data_mode, dilation=dilation, weight=weight)


    logger.info("################ Final Results ################")
    logger.info("Data: {} - {}".format(data_mode, Input_dataset_folder))
    logger.info("Padding mode: {}".format(padding))
    logger.info("Model path: {}".format(model_path))
    logger.info("Save images: {}".format(save_imgs))

    logger.info("JS_b_mean: {:.6f} JS_g_mean: {:.6f} JS_r_mean: {:.6f}  CDC: {:.6f}".format(np.mean(JS_b_mean_list), np.mean(JS_g_mean_list), np.mean(JS_r_mean_list), CDC))
    return save_subfolder
    
    
def process_video(url):
    """Process a video by downloading it and uploading it to an S3 bucket."""
    bucket_name="videos-tcvc"

    filename = download_video(url)
    if filename is not None:
        input_video = filename
        output_images = "../images/test_s3/out_%d.png"

        cmd = ["ffmpeg", "-i", input_video, "-vf", "fps=20", output_images]
        subprocess.call(cmd)
        upload_org_video(filename,bucket_name)
        image_pattern=main(filename)
        # exit()

        # Convert images to video
        image_pattern = image_pattern+"/out_%d.png"
        output_video = "output.mp4"

        cmd = ["ffmpeg", "-framerate", "20", "-i", image_pattern, output_video]
        subprocess.call(cmd)
        link=upload_process_video(output_video,bucket_name)


        return link,output_video
    else:
        return "The URL does not contain a video."

# process_video("")
# inputs = [
#     gr.inputs.Textbox(label="Video URL"),

# ]

# output = [gr.outputs.Textbox(label="Link"),gr.Video(label="Colorized Video")]

# gr.Interface(fn=process_video, inputs=inputs, outputs=output, title="Upload Video to S3").launch()

if __name__ == '__main__':
    process_video("https://davidpengg-movie-video-colorization.hf.space/file=/tmp/1_falcon4e4516c63ac8127b171bda65e54e01b22e5633e2.mp4")