Como construir um pipeline de remoção e inpainting de objetos de vídeo Netflix VOID com CogVideoX, custom prompting e inferência de amostra de ponta a ponta

Neste tutorial, construímos e executamos um pipeline avançado para o modelo VOID da Netflix. Configuramos o ambiente, instalamos todas as dependências necessárias, clonamos o repositório, baixamos o modelo base oficial e o checkpoint VOID, e preparamos as entradas de amostra necessárias para a remoção de objetos de vídeo. Também tornamos o fluxo de trabalho mais prático, permitindo entrada de segredos estilo terminal seguro para tokens e, opcionalmente, usando um modelo OpenAI para gerar um prompt de fundo mais limpo. À medida que avançamos no tutorial, carregamos os componentes do modelo, configuramos o pipeline, executamos a inferência em uma amostra interna e visualizamos o resultado gerado e uma comparação lado a lado, o que nos dá uma compreensão prática completa de como o VOID funciona. Confira os códigos completos Copiar Código Copiado Utilize outro navegador import os, sys, json, shutil, subprocess, textwrap, gc from pathlib import Path from getpass import getpass def run(cmd, check=True): print(f"
[RUN] {cmd}") result = subprocess.run(cmd, shell=True, text=True) if check and result.returncode != 0: raise RuntimeError(f"A execução do comando falhou com código de saída {result.returncode}: {cmd}") print("=" * 100) print("VOID — TUTORIAL AVANÇADO DO GOOGLE COLAB") print("=" * 100) try: import torch gpu_name = torch.cuda.get_device_name(0) if torch.cuda.is_available() else "CPU" print(f"PyTorch já disponível. CUDA: {torch.cuda.is_available()} | Dispositivo: {gpu_name}") except Exception: run(f"{sys.executable} -m pip install -q torch torchvision torchaudio") import torch gpu_name = torch.cuda.get_device_name(0) if torch.cuda.is_available() else "CPU" print(f"CUDA: {torch.cuda.is_available()} | Dispositivo: {gpu_name}") if not torch.cuda.is_available(): raise RuntimeError("Este tutorial requer um ambiente de execução com GPU. No Colab, vá para Tempo de execução > Alterar tipo de tempo de execução > GPU.") print("
Este repositório é pesado. O notebook oficial observa que 40GB+ de VRAM são recomendados.") print("A100 funciona melhor. T4/L4 pode falhar ou ser extremamente lento mesmo com offload da CPU.
") HF_TOKEN = getpass("Digite seu token do Hugging Face (entrada oculta, pressione Enter se já estiver logado): ").strip() OPENAI_API_KEY = getpass("Digite sua chave de API OpenAI para assistência OPCIONAL ao prompt (pressione Enter para pular): ").strip() run(f"{sys.executable} -m pip install -q --upgrade pip") run(f"{sys.executable} -m pip install -q huggingface_hub hf_transfer") run("apt-get -qq update && apt-get -qq install -y ffmpeg git") run("rm -rf /content/void-model") run("git clone https://github.com/Netflix/v"