Guía de prompts para la generación de videos de la IA GPT-5.6
GPT-5.6 IA Guía de prompts para la generación de videos
Las indicaciones de vídeo para IA no son las mismas que las indicaciones de imagen.
Las indicaciones de imagen se usan para describir un solo fotograma. Las indicaciones de vídeo se utilizan para describir la dimensión temporal. Esto significa que se necesita controlar el sujeto, el movimiento, la toma, la iluminación, la coherencia, el estilo y todo tipo de limitaciones en unos segundos. Si el prompt no es lo suficientemente preciso, los resultados generados podrían seguir teniendo un aspecto visual impresionante, pero es posible que no se puedan utilizar de manera práctica. Los personajes pueden aparecer desviados. Los productos pueden distorsionarse y deformarse. El movimiento de la cámara es excesivamente amplio. El estilo artístico puede cambiar. Es posible que no haya suficiente espacio en la escena para agregar subtítulos. La transición de escena también puede no poder enlazarse con la toma anterior.
GPT-5.6 puede ayudar a los creadores a escribir indicaciones de mayor calidad, ya que es capaz de razonar sobre la arquitectura del flujo de producción. La versión preliminar de GPT-5.6 de OpenAI presentó una familia de modelos compuesta por Sol, Terra y Luna, en la que Sol se posiciona como el modelo insignia, Terra es la opción preferida de bajo costo y alto rendimiento, y Luna es la opción más rápida y con la mejor relación coste-beneficio. Durante la fase de previsualización, OpenAI indicó que actualmente solo concede acceso a organizaciones confiables seleccionadas a través de la API y Codex, y planea ampliar el alcance de la disponibilidad en el futuro.
Para los creadores, esto significa que GPT-5.6 debe considerarse una capa de planificación. Ayuda a organizar las ideas y redactar instrucciones más completas. Herramientas como esta Inteligencia Artificial Elser Luego, se convierten estas instrucciones en videos generativos: clips de animación, anuncios de productos, escenas de personajes, planos de video convertidos de imágenes, imágenes de videoclips musicales, contenido de promoción de aplicaciones y contenido de videos cortos.
Esta guía te ofrece un marco de indicaciones práctico para utilizar el razonamiento al estilo de GPT-5.6 Generación de videos con IA.
Fórmula de indicaciones de video de IA central
Una indicación de video de IA de calidad generalmente contiene ocho partes:
Formato
Tema
Protección de identidad o de productos
Operación
cámara
iluminación
estilo
Restricciones
La fórmula es la siguiente:
“Graba una toma de vídeo en formato [format]. El sujeto de la grabación es [subject]. Por favor, conserva [identity/product/style details]. En esta toma, [specific action]. Configuración de la toma: [movement and framing]. Iluminación: [source and mood]. Estilo: [visual style]. Por favor, evita [failure modes].”
Esta estructura es efectiva porque separa los elementos estables de los elementos flexibles.
Los elementos fijos se refieren al contenido que no se puede modificar: imagen de los personajes, empaque de productos, logo, estilos de vestuario, estilo artístico, disposición del recinto.
Elementos flexibles se refiere a diversos tipos de elementos que se pueden ajustar: acciones, planos cinematográficos, emociones, dinámicas del fondo, ambiente de luz y sombra, posición de los subtítulos.
Los problemas relacionados con los videos de inteligencia artificial suelen aparecer cuando el prompt no le especifica al modelo a qué categoría pertenece cada elemento.
Sugerencia de consistencia de personajes
Para los videos de personajes, la identidad del personaje debe colocarse en primer lugar. No empieces con acciones. Hay que empezar con la apertura de los personajes.
prompt débil
Chica de anime corriendo por la ciudad.
Prompt potente:
“Usa el mismo personaje de anime de la imagen de referencia. Conserva su forma exacta de rostro, ojos ámbar, pelo corto negro, chaqueta impermeable amarilla, insignia roja, pantalones cortos negros, zapatillas deportivas blancas, proporciones de figura equilibrada y compacta, y el estilo de animación de cel shading limpio. En este plano, ella corre por un callejón neonsolado bajo la lluvia, mientras sostiene un paquete luminoso. Plano: Plano de seguimiento lateral, composición de plano medio. Iluminación: Reflejos de neón azul y farolas de tono cálido. Sin deformaciones faciales, sin cambios de ropa, sin modificaciones de peinado, sin cambios de edad, sin desviaciones de estilo.”
Esta indicación protegerá la información de identidad antes de que se solicite la ejecución de una acción.
Al usar Elser AI, primero sube o crea una referencia de personaje. Luego usa GPT-5.6 para generar indicaciones de escena que permitan reutilizar el mismo módulo de identidad. Esto es mucho más seguro que generar todas las escenas solo a través de texto.
Convocatoria de videos de productos
Para los videos de productos, la precisión es más importante que la imaginación visual. Los productos no deben cambiar sus formas, etiquetas, logotipos, empaques, materiales, colores o proporciones.
Plantilla de prompts:
“Elabora un video de producto de [format] basado en la imagen de referencia. Por favor, conserva de forma completa y exacta la forma, el logotipo, las etiquetas, los colores, el empaque, el material, la tapadera, la pantalla, los botones y la proporción del producto. El producto [acción o tratamiento visual]. Toma de cámara: [movimiento]. Iluminación: [estilo]. Fondo: [entorno]. Si necesitas agregar [texto/CTA], por favor reserva espacio. Queda prohibido deformar el producto, torcer las etiquetas, modificar el logotipo ni inventar características del producto.”
Ejemplo:
“Crea un anuncio de producto de estilo TikTok en formato vertical con proporción 9:16 basado en la imagen de referencia. Conserva la forma exacta del producto, la identidad de marca, las etiquetas, el empaque, la tapa del producto, el color, el material y la proporción. Comienza con un gancho visual rápido y llamativo, luego muestra el producto de forma clara en una superficie limpia de estudio fotográfico. Planos: primero un zoom rápido, luego una pausa prolongada para crear una textura de alta gama. Iluminación: utiliza una iluminación de estudio brillante y suave, combinada con efectos de sombra realistas y naturales. Deja un área limpia y vacía en la parte superior para agregar texto de subtítulos. No deformes el producto, no distorsiones las etiquetas del producto y no agregues ningún detalle adicional de empaque.”
GPT-5.6 puede ayudar a reescribir una sola ficha de producto en múltiples variantes de indicaciones (prompts): publicidad visual principal para comercio electrónico, publicidad de lujo, materiales para escenarios de vida cotidiana, anzuelos de atracción de tráfico para TikTok, publicidades de soluciones a problemas y las tomas de llamada a la acción (CTA) finales. Posteriormente, Elser AI puede generar la versión de video correspondiente a partir de las imágenes del producto.
Sugerencia de conversión de imagen a vídeo
Las instrucciones para generar videos a partir de imágenes deben conservar la imagen de origen. Las instrucciones no deben pedir a la IA que rediseñe todo el contenido.
Plantilla de prompts:
“Anima la imagen de origen usando [movimiento específico]. Conserva el sujeto original, la composición, el estilo artístico, los colores, la iluminación, el fondo y los detalles importantes. Agrega [movimiento ambiental o movimiento de cámara]. No modifiques [elementos protegidos].”
Ejemplo:
“Agrega efectos dinámicos sutiles y controlables a las imágenes de anime de origen. Los personajes giran lentamente la cabeza hacia la cámara y parpadean. Mantén la forma facial, el peinado, la ropa, la proporción corporal, la composición del fondo, la combinación de colores y el estilo celuloide de anime completamente idénticos. Agrega un ligero movimiento de las hebras del pelo y unos suaves efectos de destellos de luz. Cámara: Acercamiento lento. No se permite la deformación facial, el cambio de ropa, la distorsión corporal ni la desviación del estilo.”
La conversión de imagen a video obtiene los mejores resultados cuando la amplitud del movimiento es moderada. Si solicitas una amplitud de movimiento excesiva, el modelo podría tener que completar estructuras corporales faltantes, ángulos de grabación o detalles del fondo de la nada.
Indicación de movimiento de la cámara
El movimiento de cámara debe ser específico y tener una motivación razonable. Evita usar solo el término "sensación cinematográfica".
Términos prácticos de cámara incluyen:
Empujar lentamente
Primer plano estático
plano medio de seguimiento lateral
Revelación en ángulo bajo
Desplazarse suavemente de izquierda a derecha
plano desde el hombro
Plano angular amplio de establecimiento
Primer plano de producto en macro
Movimiento de mano sutil
Movimiento orbital lento alrededor del producto
plano medio a altura ocular
La cámara debe cumplir con el propósito del vídeo.
Para realzar el ambiente emocional: plano de acercamiento lento.
Para crear tensión: composición estática o plano de primer plano extremo.
Exhibición de productos de alta gama: primeros planos macro y rotación lenta.
Filmación de acción de anime: Toma de seguimiento lateral o toma de empuje dinámica.
Para la educación: marco estable y gráficos claros y legibles.
Apto para escenarios inmobiliarios: recorridos de visita de inmuebles lentos o tomas de desplazamiento suaves.
GPT-5.6 puede ayudar a elegir el lenguaje cinematográfico adecuado según el objetivo de creación. Posteriormente, Elser AI puede aplicar esta dirección durante el proceso de generación.
Sugerencias de iluminación
La iluminación debe tener una fuente de luz. "La iluminación estéticamente agradable" es demasiado genérica. "La luz natural cálida junto a la ventana de la izquierda" es realmente práctica.
Ejemplo:
Suave luz de ventana que brilla desde la izquierda
Puesta de sol a contraluz con tono cálido
El resplandor azul emitido por la pantalla del teléfono móvil
Reflejos de neón en la carretera mojada y resbaladiza
Una lámpara de mesa crea una sombra acogedora
Iluminación profesional de estudio de alta gama, con reflejo suave
Luz solar en un día nublado, colores suaves
Viaje ligero en hora punta
La luz afecta la coherencia de la imagen. Si el estilo de iluminación de cada toma es diferente, el video parecerá desincronizado. Para videos con múltiples tomas, mantén la coherencia en la descripción de la iluminación en cada indicación.
Aviso de transición
Las transiciones de cámara fluidas necesitan una buena planificación de la coherencia. Si un personaje realiza un movimiento de giro al final de una toma, la siguiente toma debe continuar con ese movimiento o mostrar lo que están mirando.
Línea de indicación:
Este plano continúa la escena anterior.
Mantén la misma posición del personaje y la dirección de la iluminación.
La cámara continúa realizando el movimiento de acercamiento lento de la toma anterior.
El personaje mira el objeto, y la siguiente toma muestra este objeto.
“Usa el mismo lugar de filmación y el mismo esquema de combinación de colores que en la toma anterior.”
GPT-5.6 puede ayudar a convertir guiones gráficos en indicaciones con conciencia de transición. En comparación con los fragmentos aislados de tomas, puede generar secuencias de tomas coherentes.
Sugerencias para videos cortos
Por favor, especifique el formato vertical y el espacio para subtítulos para TikTok, YouTube Shorts e Instagram Reels.
Plantilla de prompts:
“Realiza un vídeo vertical corto con proporción 9:16. El primer segundo de la apertura debe tener un punto visual claro y llamativo. 【Sujeto o acción de grabación】. Toma: 【Modo de movimiento de la cámara】. Por favor, reserva una zona limpia en【arriba, abajo, izquierda o derecha】para agregar subtítulos. La imagen debe verse claramente en la pantalla del teléfono móvil. No dejes la imagen demasiado congestionada.”
Las indicaciones de formato corto deben priorizar la legibilidad. Los planos con efectos visuales complejos pueden verse bien en el escritorio, pero tendrán problemas en los dispositivos móviles.
Usar conjuntamente GPT-5.6 y Elser AI para realizar indicaciones
Un flujo de trabajo potente se ve así:
Deja que GPT-5.6 transforme tus ideas vagas en un briefing creativo bien estructurado.
Haz que redacte tres prompts de IA para videos según este informe breve.
Selecciona la palabra de indicación más fuerte.
Importar las indicaciones y la referencia visual a Elser AI
Generar vídeo.
Elementos de verificación fallidos: rostro, efectos dinámicos, precisión del producto, luz, ritmo o estilo.
Según este fracaso, haz que GPT-5.6 modifique este prompt.
Regenerar en Elser AI.
Este flujo de trabajo genera resultados iterativos. La primera salida no tiene que ser perfecta. Solo sirve para que te des cuenta de los aspectos que necesitan mejora.
Ejemplo de prompt completo
Crea un vídeo corto de IA en formato vertical con relación de aspecto 9:16 para YouTube Shorts. Usa a la misma inventora anime de la imagen de referencia. Mantén intactos su pelo corto de color gris plateado, ojos verdes, gafas redondas, sudadera con capucha anaranjada holgada, pantalones cortos negros, kit de herramientas, cuerpo compacto y bien proporcionado, así como el estilo de renderizado de anime cel limpio. En esta toma, se muestra orgullosamente un pequeño robot que emite humo en el banco de trabajo, luego descubre que el robot empieza a temblar. Configuración de la toma: Toma en plano medio con un acercamiento lento. Configuración de la iluminación: Lámpara de mesa de tonos cálidos a la izquierda, para crear sombras suaves, con un fondo de estudio acogedor. Atmósfera general: Humorística, entretenida y con un toque de desorden. Deja un área limpia en la parte superior para agregar subtítulos. No modifiques su rostro, ropa, peinado, figura, edad ni estilo general. Está prohibido deformar las manos, que aparezcan dedos adicionales ni que haya deformaciones en el fondo.
Esta indicación es válida, ya que especifica explícitamente el formato, el tema, la configuración de la identidad, la acción, el ángulo de toma, la iluminación, la atmósfera, la disposición de los títulos y las condiciones de restricción.
Conclusión
GPT-5.6 puede optimizar los efectos de las indicaciones de video de IA, ya que puede ayudar a los creadores a construir instrucciones creativas. Puede transformar ideas vagas en indicaciones listas para la producción formal, conservar los detalles clave, generar múltiples variantes y también diagnosticar las causas por las que los resultados de salida fallan.
Pero la etapa de las indicaciones solo representa la mitad de todo el flujo de trabajo. Todavía necesitas una plataforma de generación de videos.
Usar GPT-5.6 como capa de planificación y redacción de indicaciones. Utilizar Elser AI Como capa de generación e iteración. Regístrate en Elser AI, sube tus imágenes de referencia o fotos de producto, y luego prueba los prompts construidos con esta estructura. Cuanto mayor sea la calidad del prompt, mayor será el control que tengas sobre el vídeo.




