Veo 3.1 프롬프트 및 시네마틱 영상 제작 완전 가이드
방송급 결과물을 위한 Veo 3.1 프롬프트 작성법: 네이티브 4K, 공간 오디오, 강력한 시작 프레임 참조 준수 — 재사용 가능한 5단계 공식과 전후 비교 예시를 OmniArt에서 바로 활용하세요.

Veo 3.1은 OmniArt의 방송급 영상 모델입니다. 출력물이 대형 화면에서도 완벽하게 구현되어야 할 때 가장 먼저 선택하게 되는 모델이죠. 네이티브 4K를 지원하고, 영상 프레임과 함께 공간 오디오가 동시에 생성되며, 참조 이미지를 시작 프레임으로 제공했을 때 구도를 매우 충실하게 유지합니다. 하지만 프롬프트가 모호하면 이 모든 장점이 무용지물이 됩니다. 이 가이드는 Veo 3.1이 원하는 방식으로 지시를 내릴 수 있는 재사용 가능한 5단계 공식을 제공하며, 전후 비교 예시, 시네마틱 용어 표, 그리고 작업에 맞는 버전(표준, 빠름, 경량) 선택 방법도 함께 다룹니다.
Veo 3.1을 위한 5단계 프롬프트 공식
Veo 3.1은 다섯 가지 질문에 순서대로 답하는 구조화된 프롬프트에 잘 반응합니다. 하나라도 빠뜨리면 모델이 그 공백을 채우는데, 대개 가장 평범한 방식으로 처리합니다.
- 피사체와 동작 — 누가 또는 무엇이, 무엇을 하고 있는지, 어디에서. "어두운 편집실에서 혼자 영상을 검토하는 영화감독."
- 카메라 (움직임, 렌즈, 프레이밍) — 숏 크기, 초점 거리, 움직임과 속도. "느린 푸시인, 50mm, 미디엄 클로즈업, 고정 후 천천히 앞으로 이동."
- 조명과 분위기 — 광원, 방향, 질감, 색감. "주 조명으로 모니터 빛 하나, 깊은 그림자, 차가운 파란 톤, 높은 대비."
- 오디오와 환경음 — 공간의 소리, 특정 효과음, 음악 방향 또는
no music. "조용한 전기 윙윙소리, 간헐적인 키보드 소리, no music." - 기술 출력값 — 해상도 (4K 여부), 길이 의도, 스타일 참조. "4K, 8초, 사실적."
완성된 예시
프롬프트:
"어두운 편집실에서 혼자 영상을 검토하는 영화감독. 느린 푸시인, 50mm, 미디엄 클로즈업, 고정 후 천천히 앞으로 이동. 주 조명으로 모니터 빛 하나, 깊은 그림자, 차가운 파란 톤, 높은 대비. 조용한 전기 윙윙소리, 간헐적인 키보드 소리, no music. 4K, 8초, 사실적."
이 프롬프트는 30초 안에 작성할 수 있습니다. 촬영 감독이 조명 담당자에게 숏을 설명하듯 구체적으로 기술하면 Veo 3.1이 잘못 추측할 여지가 거의 없어집니다.
팁
no music을 명시하세요.시네마틱 용어 빠른 참조 표
다음 용어들은 Veo 3.1 생성에 직접 적용됩니다. 필요한 문구를 복사해서 프롬프트에 붙여 넣으세요.
카메라 움직임
| 움직임 | 프롬프트 문구 |
|---|---|
| 천천히 접근 | "slow dolly-in", "gentle push-in" |
| 후퇴 | "slow pull-back", "dolly-out to reveal" |
| 옆으로 따라가기 | "smooth tracking shot from the left", "lateral dolly" |
| 상승하며 전경 공개 | "slow crane up to reveal the skyline" |
| 핸드헬드 긴장감 | "subtle handheld shake, reactive framing" |
| 고정, 안정적 | "tripod-locked", "static wide" |
| 피사체 주위를 아크로 돌기 | "slow arc around the subject" |
숏 크기와 앵글
| 의도 | 프롬프트 문구 |
|---|---|
| 규모와 배경 | "wide 18mm, deep focus, full environment" |
| 공간 속 피사체 | "medium shot, eye level" |
| 친밀함 | "medium close-up, 50mm" |
| 강렬함 | "tight close-up, 85mm, shallow focus" |
| 힘과 위압감 | "low angle looking up" |
| 취약함 | "high angle looking down" |
조명
| 느낌 | 프롬프트 문구 |
|---|---|
| 자연스러운 따뜻함 | "golden-hour side light, warm highlights, cool shadows" |
| 무거운 대비 | "chiaroscuro, single hard source from camera right" |
| 도시적 분위기 | "neon spill, magenta and cyan, reflections in wet pavement" |
| 깔끔한 인터뷰 조명 | "soft diffused key, slightly warm, low contrast" |
| 야간 존재감 | "practical light only — a single lamp, deep background falloff" |
전후 비교 예시
A: 카메라 방향 — 가장 강력한 단일 조정 요소
Veo 3.1 프롬프트에서 가장 큰 효과를 내는 변화는 카메라 움직임과 초점 거리를 추가하는 것입니다. 비교해 보세요.
추가 전: "A street musician playing violin in the rain."
추가 후: "Medium close-up of a street musician playing violin in the rain. Slow dolly-in, 85mm, shallow depth of field — background traffic dissolving into blur. Practical street-lamp from above, rim-lighting the bow. Light rain sound, distant traffic, no music."
두 번째 버전에는 "cinematic"이라는 단어가 한 번도 등장하지 않습니다. 대신 숏을 시네마틱하게 만드는 구체적인 요소들을 명시하고, 모델은 그 의도를 그대로 렌더링합니다. 열 가지 일반적인 해석 중 하나를 임의로 선택하는 것이 아니라요.
B: 이미지-영상 변환의 시작 프레임 준수 능력
참조 이미지를 시작 프레임으로 제공할 때 Veo 3.1의 이미지 준수 능력은 특히 뛰어납니다. 모델은 첫 프레임의 구도, 색 보정, 주요 캐릭터 세부 사항을 가져와 생성 과정 전반에 걸쳐 제약 조건으로 활용합니다.
실제 활용법: 광고 촬영의 스틸 컷, 제품 렌더링, 또는 캐릭터 컨셉 이미지를 가져와 OmniArt의 이미지-영상 변환 워크플로에서 시작 프레임으로 설정한 다음, 그 출발점에서의 움직임을 묘사하는 프롬프트를 작성하세요.
제품 촬영 시작 프레임 제공 후 프롬프트:
"향수병이 흰 대리석 표면 위에 놓여 있습니다. 왼쪽에서 오른쪽으로 천천히 아크 이동하며 병은 중앙을 유지합니다. 높은 창문에서 들어오는 오후 늦은 햇살이 유리 위를 가로질러 각진 면을 반짝이게 합니다. 4K, 6초, no music."
모델은 참조 이미지의 정확한 조명, 제품 위치, 표면 질감을 그대로 이어받아 기술된 움직임을 적용합니다. 장면을 처음부터 다시 생성하는 것이 아닙니다.
참고
C: 한 줄 프롬프트로 만드는 공간 오디오
Veo 3.1의 공간 오디오는 별도의 패스가 필요 없습니다. 프롬프트에 설명적인 오디오 한 줄을 추가하는 것만으로도 레이어가 풍부하고 방향성을 가진 사운드스케이프를 생성할 수 있습니다.
프롬프트 일부:
"...오디오: 머리 위 파형 철판 지붕에 가까이서 수음한 빗소리, 멀리 들리는 시장 군중 소리, 가끔 오른쪽에서 왼쪽으로 지나가는 오토바이 소리, no music."
모델이 생성하는 결과: 빗소리는 방향성을 띠며 공간적으로 장면 위에서 들립니다. 시장 군중 소리는 중거리에 위치합니다. 오토바이는 기술된 대로 스테레오 필드를 가로질러 이동합니다. 방향성은 후처리가 아닌 Veo 3.1의 네이티브 오디오 아키텍처에서 비롯됩니다. 각 레이어와 공간 관계(close, distant, passing left to right)를 명시하면 모델이 위치 기반 렌더링에 필요한 정보를 얻게 됩니다.
표준, 빠름, 경량 버전 중 선택하기
Veo 3.1은 OmniArt에서 세 가지 버전으로 제공됩니다. 올바른 선택은 기본 습관이 아닌 작업의 성격에 따라 달라집니다.
| 버전 | 사용 시기 | 크레딧 비용 |
|---|---|---|
veo-3.1-standard | 최종 출력, 방송급 납품, 클라이언트 검토, 모든 4K 사용 사례 | 초당 최고 |
veo-3.1-fast | 합리적인 품질에서의 반복 작업과 프롬프트 개선 | 중간 |
veo-3.1-lite | 빠른 개념 테스트, 썸네일 확인, 스토리보드 모션 패스 | 초당 최저 |
4K가 추가 크레딧 값어치를 하는 경우: 대형 화면 납품물, 제품 주요 영상, 전체 해상도로 내보낼 모든 작업, 또는 배경과 텍스처의 세부 렌더링 품질이 프로젝트에 중요한 경우. 4K는 veo-3.1-standard에서만 사용할 수 있습니다.
4K가 낭비인 경우: 1080p 이하 소셜 미디어용 크롭, 어차피 재생성할 모션 초안, 납품이 아닌 탐색 단계의 모든 작업. 그런 작업에는 veo-3.1-lite를 사용하세요. 저렴하게 반복하고, 최종 버전이 확정되면 표준 버전으로 전환하세요.
경고
흔한 프롬프트 실수
피사체 설명 과적재. "암스테르담 운하 옆에 서서 튤립 꽃다발을 들고 아련한 표정을 짓고 있는, 곱슬 빨간 머리의 빈티지 코트를 입은 중년 여성" 같은 묘사는 피사체 줄에 너무 많은 세부 사항을 넣어 모델이 실제로 어떤 것을 렌더링할지 직접 선택해야 합니다. 이 숏에 꼭 필요한 특징만 남기고 나머지는 놓아주세요.
상충하는 카메라 방향. "Slow push-in with a wide pull-back"은 물리적으로 불가능합니다. 모델은 하나를 선택하고 다른 하나를 무시합니다. 프롬프트당 하나의 명확한 카메라 움직임만 작성하세요. 넓은 화면에서 가까이 좁혀드는 숏이 필요하다면 그것은 푸시인입니다.
오디오를 완전히 잊어버리기. Veo 3.1은 지시 여부와 관계없이 오디오를 생성합니다. 지시하지 않은 오디오 생성은 무음이 아닙니다. 모델의 최선의 추측으로, 의도와 다를 수 있습니다. 프롬프트 마지막에는 항상 오디오 한 줄을 추가하세요. no music, ambient room tone only 정도면 충분합니다.
"cinematic"을 스타일 단어로 쓰기. "cinematic"이라고 쓰는 것은 당신이 내려야 할 결정을 모델에게 맡기는 것입니다. 실제로 원하는 구체적인 시각적 속성으로 대체하세요: 렌즈, 조명, 움직임, 색감.
OmniArt에서 시작하기
Veo 3.1(표준, 빠름, 경량)은 라이브러리의 다른 모든 모델과 함께 OmniArt 영상 워크스페이스에서 이용할 수 있습니다. 익숙해지는 가장 빠른 방법은 기존의 아이디어 하나를 위의 5단계 공식으로 작성하고, 프롬프트를 다듬기 위해 먼저 veo-3.1-fast로 생성한 다음 표준 버전으로 최종 출력하는 것입니다.
더 폭넓은 시네마틱 용어와 동일한 프롬프트 패턴이 OmniArt의 전체 영상 모델 라인업에 어떻게 적용되는지 알아보려면 시네마틱 AI 영상 프롬프트 가이드를 참고하세요. Veo 3.1의 오디오 생성 기능을 더 깊이 파고들 준비가 됐다면 Veo 3.1 공간 오디오 모범 사례 가이드에서 레이어 사운드스케이프, 위치 오디오 신호, 음악 방향에 대한 자세한 내용을 확인할 수 있습니다. Veo 3.1과 다른 최상위 모델을 비교하려면 Veo 3.1 vs Sora 2를 참고하세요.
제작할 준비가 되셨나요?
AI로 멋진 콘텐츠를 생성하세요