En esta guía te explico el proceso completo sobre cómo poder usar el modelo LTX 2 de manera local: instalación del entorno, configuración del modelo, parámetros clave y ejemplos reales de uso.
Si prefieres seguir una guía audiovisual puedes ver el siguiente vídeo:
Qué es LTX 2 y por qué instalarlo en local
LTX 2 es un modelo de generación de vídeo que combina:
- Creación visual basada en prompts de texto
- Generación automática de voz sincronizada
- Posibilidad de partir desde imágenes estáticas
- Control sobre duración, calidad y estilo
Instalarlo en local tiene varias ventajas claras frente a soluciones online:
- No dependes de servidores externos
- No hay límites de uso ni costes recurrentes
- Mayor privacidad sobre los contenidos generados
- Posibilidad de experimentar sin restricciones
Qué es Pinokio y por qué se usa para LTX 2
Pinokio es una aplicación que funciona como un gestor de herramientas de IA en local. Permite instalar modelos complejos mediante sistemas de “one click install”, evitando configuraciones manuales, dependencias y errores habituales.
En este caso, Pinokio se utiliza para instalar Wan2GP, que es la interfaz desde la cual se ejecuta el modelo LTX 2.
Requisitos antes de empezar
Sistema operativo
Pinokio está disponible para varios sistemas operativos. El proceso explicado funciona correctamente en Windows, aunque es similar en otros entornos compatibles.
Hardware recomendado
Aunque LTX 2 puede ejecutarse en equipos modestos, el rendimiento depende mucho del hardware:
- Tarjeta gráfica con VRAM alta (recomendable por lo menos 12GB)
- Memoria RAM suficiente (recomendable tener un mínimo de 16GB)
- Espacio en disco para descargas iniciales (recomendable tener un espacio mínimo de 150Gb)
Cuanta más potencia tenga el equipo, menor será el tiempo de renderizado.
Instalar Pinokio paso a paso
Descargar Pinokio
- Accede a la web oficial de Pinokio: https://pinokio.co/download.html
- Selecciona la versión correspondiente a tu sistema operativo
- Descarga e instala como cualquier otro programa
Si necesitas ampliar información sobre cómo usar Pinokio puedes leer el siguiente artículo: Guía Completa de Pinokio AI
Instalar Wan2GP desde Pinokio
Buscar la aplicación
- Dentro de Pinokio, ve a la sección Discover
- Busca Wan2GP manualmente o usando el buscador
- Accede a su ficha
Instalación
- Pulsa en One click install with Pinokio
- Asigna un nombre (puede dejarse el predeterminado)
- Inicia la descarga e instalación
⚠️ Importante:
La primera vez puede tardar bastante tiempo, ya que se descargan múltiples paquetes necesarios. Es normal que el proceso dure varios minutos o incluso más, dependiendo del equipo.
Acceder a Wan2GP y seleccionar LTX 2
Una vez finalizada la instalación, Wan2GP se abre automáticamente con una interfaz que incluye varias secciones.
Selección del modelo
- Accede a la configuración del modelo
- Por defecto suele aparecer Wan 2.1
- Abre el desplegable y selecciona LTX 2
Desde este momento, el entorno ya está preparado para generar vídeos con LTX 2.
Interfaz de generación de vídeo
La sección principal que se utiliza es Video Generator. Desde aquí se gestionan todas las creaciones.
Opciones principales
- Generación desde texto
- Generación desde imagen
- Continuación de vídeo
- Configuración de audio y calidad
- Parámetros avanzados de renderizado

Generar un vídeo usando solo texto
Configuración básica
- Selecciona Text Prompt
- Elige la calidad del vídeo (480p recomendado para pruebas)
- Define la duración (por ejemplo, 10 segundos)
- Ajusta los pasos de renderizado según tu hardware
A mayor calidad y más pasos, mayor tiempo de generación y consumo de memoria.
Uso correcto del prompt
El prompt debe describir claramente:
- Escenario
- Tipo de cámara
- Personaje o acción
- Ambiente y estilo
Voces dentro del vídeo
Si quieres que una parte del texto se escuche con voz, debe ir entre comillas.
Ejemplo conceptual:
… the character whispers, “This is where everything begins.”
Solo el texto entre comillas se generará como voz.
Generar y descargar
- Pulsa Generate
- Observa el progreso en la parte derecha
- Al finalizar, podrás reproducir y descargar el vídeo
📌 La primera ejecución suele tardar más porque el modelo termina de descargar dependencias adicionales. Esto se puede ver desde la pestaña de Terminal.
Generar un vídeo a partir de una imagen
Otra de las funciones más potentes de LTX 2 es crear vídeo partiendo de una imagen estática.
Start with image
- Selecciona Start with image
- Carga una imagen como base
- Escribe el prompt describiendo la escena y el discurso
Image Source Video Strength
Este parámetro controla cuánto influye la imagen original en el resultado final. Ten en cuenta lo siguiente.
| Valor aproximado | Resultado |
|---|---|
| 1.0 | Imagen casi idéntica |
| 0.9 – 0.95 | Buen equilibrio |
| 0.7 o menos | Mayor variación facial y visual |
Para mantener parecido con la imagen original, no se recomienda bajar de 0.90.
Resultado final
El modelo:
- Anima la imagen
- Genera movimiento facial
- Sincroniza la voz con el texto entre comillas
- Produce una escena coherente sin audio de referencia
El resultado puede llegar a ser sorprendentemente realista incluso sin entrenar voces personalizadas.
Tiempos de renderizado y rendimiento
El tiempo depende de varios factores:
- Primera carga del modelo (más lenta)
- Calidad seleccionada
- Duración del vídeo
- Potencia de la GPU
- Cantidad de RAM disponible
Es normal que la primera generación tarde mucho más que las siguientes.
Buenas prácticas recomendadas
- Empieza con resoluciones bajas para pruebas
- Ajusta duración y pasos progresivamente
- No fuerces parámetros si tu hardware es limitado
- Observa siempre la pestaña de terminal en la primera ejecución
Tabla resumen de configuración básica ideal
En esta tabla te resumo la configuración básica que debes poner para generar escenas lo más rápido posible, sin complicarse y sin consumir muchos recursos de tu equipo.
| Parámetro | Recomendación inicial |
|---|---|
| Resolución | 480p |
| Duración | 10 segundos |
| Image Strength | 0.95 – 0.98 |
| Modelo | LTX 2 |
| Audio | Automático desde prompt |
Preguntas Frecuentes
¿LTX 2 es gratuito en local?
Sí, al ejecutarlo en local no hay costes de uso, más allá del hardware necesario.
¿Necesito conexión a internet?
Solo para la descarga inicial de Pinokio, Wan2GP y los paquetes del modelo.
¿Por qué la primera generación tarda tanto?
Porque el sistema descarga dependencias adicionales antes de generar el primer vídeo.
¿Se puede usar audio propio?
Sí, es posible añadir una pista de audio externa en lugar del sonido generado por el prompt.
¿Se pueden usar LoRAs?
Sí, pueden descargarse desde repositorios compatibles y cargarse en Wan2GP.
¿Qué pasa si bajo mucho el image strength?
La imagen se parecerá menos a la original y pueden aparecer variaciones faciales notables.
Documentación recomendada
Para comprender mejor los fundamentos de modelos generativos y ejecución local de IA, puedes consultar documentación general sobre modelos multimodales en repositorios abiertos como: https://huggingface.co/docs
En resumen, aprender cómo instalar y usar LTX 2 de manera local permite acceder a una herramienta avanzada de generación de vídeo con IA sin depender de servicios externos. Con Pinokio y Wan2GP, el proceso se simplifica enormemente, haciendo posible crear escenas con voz, movimiento y narrativa directamente desde tu ordenador, ajustando cada parámetro según tus necesidades y capacidades de hardware.





