guideTutoriales y guías9 min de lectura

Guía completa de prompts y cinematografía con Veo 3.1

Cómo usar prompts en Veo 3.1 para obtener resultados de nivel broadcast: 4K nativo, audio espacial y alta adherencia al fotograma inicial — con una fórmula de cinco partes reutilizable y comparativas antes/después en OmniArt.

Equipo OmniArt
Guía completa de prompts y cinematografía con Veo 3.1

Veo 3.1 es el modelo de vídeo de nivel broadcast de OmniArt — el que eliges cuando la salida tiene que aguantar una pantalla grande. Incluye 4K nativo, audio espacial que se genera junto con los fotogramas de vídeo, y una adherencia inusualmente fuerte al fotograma inicial cuando proporcionas una imagen de referencia. Pero nada de eso importa si el prompt es vago. Esta guía te ofrece una fórmula de cinco partes reutilizable para dirigir a Veo 3.1 de la manera que le gusta ser dirigido, junto con comparativas antes/después, una tabla de vocabulario cinematográfico y orientación para elegir el nivel correcto (estándar, rápido o lite) según el trabajo.

La fórmula de cinco partes para prompts en Veo 3.1

Veo 3.1 responde bien a prompts estructurados que responden cinco preguntas en orden. Deja una fuera y el modelo rellena el hueco — normalmente de la manera más genérica posible.

  1. Sujeto y acción — quién o qué, haciendo qué, dónde. "Una cineasta revisando grabaciones sola en una oscura sala de montaje."
  2. Cámara (movimiento, óptica, encuadre) — tamaño del plano, distancia focal, el movimiento y su velocidad. "Lento push-in, 50mm, plano medio-corto, cámara fija que luego deriva hacia adelante."
  3. Iluminación y ambiente — fuente, dirección, calidad, paleta. "Brillo de un único monitor como luz clave, sombras profundas, azul frío, alto contraste."
  4. Audio y ambiencia — cómo suena el espacio, sonidos específicos, dirección musical o no music. "Zumbido eléctrico suave, clic ocasional de teclado, no music."
  5. Salida técnica — resolución (4K o no), intención de duración, cualquier referencia de estilo. "4K, 8 segundos, fotorrealista."

Un ejemplo completamente desarrollado

Prompt:

"Una cineasta revisando grabaciones sola en una oscura sala de montaje. Lento push-in, 50mm, plano medio-corto, cámara fija que luego deriva hacia adelante. Brillo de un único monitor como luz clave, sombras profundas, azul frío, alto contraste. Zumbido eléctrico suave, clic ocasional de teclado, no music. 4K, 8 segundos, fotorrealista."

Este prompt tarda menos de treinta segundos en escribirse. Especifica el plano de la manera que un director de fotografía lo describiría a un gaffer, y Veo 3.1 tiene poco margen para adivinar incorrectamente.

Consejo

Incluye dirección de audio en todos los prompts, no solo en los que el sonido importa. Veo 3.1 genera audio espacial junto con los fotogramas de vídeo — dejar el audio sin especificar no silencia la salida, simplemente cede el control al modelo. Escribe no music si quieres un tono de ambiente limpio para mezclar por separado.

Tabla de vocabulario cinematográfico

Estos términos se traducen directamente en generaciones de Veo 3.1. Copia las frases que necesites en tus prompts.

Movimientos de cámara

MovimientoFrase para el prompt
Aproximación lenta"slow dolly-in", "gentle push-in"
Retroceso"slow pull-back", "dolly-out to reveal"
Seguimiento lateral"smooth tracking shot from the left", "lateral dolly"
Subida y revelación"slow crane up to reveal the skyline"
Tensión con cámara en mano"subtle handheld shake, reactive framing"
Bloqueada, estable"tripod-locked", "static wide"
Arco alrededor del sujeto"slow arc around the subject"

Tamaños de plano y ángulos

IntenciónFrase para el prompt
Escala y contexto"wide 18mm, deep focus, full environment"
Sujeto en el espacio"medium shot, eye level"
Intimidad"medium close-up, 50mm"
Intensidad"tight close-up, 85mm, shallow focus"
Poder y amenaza"low angle looking up"
Vulnerabilidad"high angle looking down"

Iluminación

AspectoFrase para el prompt
Calidez natural"golden-hour side light, warm highlights, cool shadows"
Contraste dramático"chiaroscuro, single hard source from camera right"
Atmósfera urbana"neon spill, magenta and cyan, reflections in wet pavement"
Entrevista limpia"soft diffused key, slightly warm, low contrast"
Presencia nocturna"practical light only — a single lamp, deep background falloff"

Comparativas antes y después

A: dirección de cámara — la palanca individual más importante

El cambio más impactante que puedes hacer en un prompt de Veo 3.1 es añadir un movimiento de cámara y una distancia focal. Compara:

Sin: "A street musician playing violin in the rain."

Con: "Medium close-up of a street musician playing violin in the rain. Slow dolly-in, 85mm, shallow depth of field — background traffic dissolving into blur. Practical street-lamp from above, rim-lighting the bow. Light rain sound, distant traffic, no music."

La segunda versión no usa la palabra "cinematic" ni una sola vez. Especifica lo que hace el plano cinematográfico — y el modelo renderiza la intención en lugar de elegir una de diez interpretaciones genéricas.

B: adherencia al fotograma inicial en el flujo imagen a vídeo

Veo 3.1 tiene una adherencia de imagen notablemente fuerte cuando proporcionas una imagen de referencia como fotograma inicial. El modelo mantiene la composición, la gradación de color y los detalles clave del personaje del primer fotograma y los usa como restricción durante toda la generación.

Uso práctico: toma un fotograma fijo de una sesión comercial, un render de producto o un concepto de personaje, proporciónalo como fotograma inicial en el flujo imagen a vídeo de OmniArt y escribe un prompt que describa el movimiento desde ese punto de partida.

Prompt tras proporcionar un fotograma inicial de foto de producto:

"El frasco de perfume reposa sobre una superficie de mármol blanco. Arco lento de izquierda a derecha, con el frasco manteniéndose centrado. La luz de última hora de la tarde de una ventana alta barre el cristal, captando las facetas. 4K, 6 segundos, no music."

El modelo hereda la iluminación exacta, el posicionamiento del producto y la textura de la superficie de tu referencia y aplica el movimiento descrito — en lugar de regenerar la escena desde cero.

Nota

La adherencia de imagen es más fuerte cuando tu imagen de fotograma inicial está cerca de la proporción de aspecto y resolución en que estás generando. Una imagen cuadrada proporcionada a una generación 16:9 será recortada o tendrá bandas laterales, lo que puede desplazar la composición que el modelo hereda.

C: audio espacial desde una sola línea de prompt

El audio espacial de Veo 3.1 no requiere un pase separado — una línea de audio descriptiva en el prompt es suficiente para producir un paisaje sonoro en capas con consciencia posicional.

Fragmento de prompt:

"...Audio: lluvia captada de cerca sobre chapa de hierro corrugado en lo alto, una multidumbre de mercado al fondo, una moto ocasional pasando de derecha a izquierda, no music."

Lo que el modelo produce: la lluvia es presente y direccional — puedes escucharla espacialmente sobre la escena. La multidumbre del mercado ocupa el plano medio. La moto recorre el campo estéreo según lo descrito. La direccionalidad proviene de la arquitectura de audio nativa de Veo 3.1, no de postprocesamiento. Nombrar capas y sus relaciones espaciales — close, distant, passing left to right — le da al modelo lo que necesita para renderizar con posicionamiento.

Elegir entre estándar, rápido y lite

Veo 3.1 ofrece tres niveles en OmniArt. La elección correcta depende del trabajo, no de un hábito por defecto.

NivelCuándo usarloCoste en créditos
veo-3.1-standardSalida final, entrega broadcast, revisión con cliente, cualquier caso de uso en 4KEl más alto por segundo
veo-3.1-fastIteración y refinamiento de prompt con calidad razonableIntermedio
veo-3.1-liteTests rápidos de concepto, verificación de miniaturas, pases de movimiento para storyboardEl más bajo por segundo

Cuándo el 4K vale los créditos extra: entregables para pantallas grandes, fotografías hero de producto, cualquier cosa que se exportará a resolución completa, o trabajo donde el detalle de renderizado del modelo en fondos y texturas importa para el encargo. El 4K solo está disponible en veo-3.1-standard.

Cuándo el 4K es un desperdicio: recortes para redes sociales a 1080p o menos, borradores de movimiento que vas a regenerar de todas formas, cualquier cosa que estés explorando en lugar de entregando. Usa veo-3.1-lite para ese trabajo — itera de forma económica y luego cambia al estándar para el pase final.

Advertencia

Ejecutar 4K en un prompt exploratorio que vas a regenerar varias veces multiplica rápidamente el gasto de créditos. Afina el prompt en fast o lite primero, luego confirma la versión final en standard con 4K.

Errores comunes de prompt

Sobrecargar la línea del sujeto. "Una mujer de mediana edad con el pelo rizado rojo vistiendo un abrigo vintage de pie junto a un canal en Ámsterdam sosteniendo un ramo de tulipanes con expresión melancólica" pone tantos detalles que el modelo tiene que elegir cuáles renderizar realmente. Quédate solo con lo esencial para este plano y deja ir el resto.

Direcciones de cámara contradictorias. "Slow push-in with a wide pull-back" es físicamente imposible — el modelo elegirá uno e ignorará el otro. Escribe un único movimiento motivado por prompt. Si necesitas un plano que empieza abierto y cierra, eso es un push-in, sin más.

Olvidar completamente el audio. Veo 3.1 generará audio tanto si lo diriges como si no. Una generación de audio sin dirección no es silencio — es la mejor suposición del modelo, que puede no coincidir con tu intención. Siempre cierra el prompt con una línea de audio, aunque sea solo no music, ambient room tone only.

Escribir "cinematic" como palabra de estilo. La palabra "cinematic" le pide al modelo que tome una decisión que deberías estar tomando tú. Sustitúyela por las propiedades visuales específicas que realmente quieres: óptica, luz, movimiento, paleta.

Cómo empezar en OmniArt

Veo 3.1 — estándar, rápido y lite — está disponible en el espacio de trabajo de vídeo de OmniArt junto a todos los demás modelos de la biblioteca. La forma más rápida de ganar fluidez es tomar una idea existente, escribirla con la fórmula de cinco partes anterior y generar en veo-3.1-fast primero para refinar el prompt antes de pasarlo al estándar.

Para el vocabulario cinematográfico más amplio y cómo los mismos patrones de prompt se aplican en toda la línea de modelos de vídeo de OmniArt, consulta la guía de prompts cinematográficos para vídeo con IA. Cuando estés listo para profundizar en la generación de audio de Veo 3.1 específicamente, la guía de mejores prácticas de audio espacial de Veo 3.1 cubre paisajes sonoros en capas, señales de audio posicional y dirección musical en detalle. Para una comparativa directa de Veo 3.1 frente a otros modelos de primer nivel, consulta Veo 3.1 vs Sora 2.

¿Listo para crear?

Empieza a generar contenido increíble con IA

Empezar gratis