guide튜토리얼 및 사용 가이드15분 읽기

Gemini Omni Flash로 10초 동영상 프롬프트 작성하는 법

Gemini Omni Flash의 프롬프트 환경은 독특합니다. 네거티브 파라미터가 없고, 화면비는 두 가지뿐이며, 영어만 지원하고, 서로 다른 두 가지 프롬프트 모드가 있습니다. 두 모드를 모두 잘 작성하는 방법을 정리했습니다.

OmniArt 팀
Gemini Omni Flash로 10초 동영상 프롬프트 작성하는 법

대부분의 AI 동영상 프롬프트 가이드는 한 가지만 가르칩니다. 모델에 한 번 건네는, 풍부하고 세밀한 문단 하나를 쓰는 법입니다. Gemini Omni Flash는 그 전제를 깹니다. 개발자 API(6월 30일부터 이용 가능)는 서로 다른 두 가지 프롬프트 행위를 중심으로 설계되어 있습니다. 첫 번째 생성, 그리고 같은 클립을 매번 다시 다듬는 수정 대화의 연속입니다. 한쪽만 신경 쓰고 다른 쪽을 무시하면 모델의 대부분을 활용하지 못한 채 놓치게 됩니다.

Omni Flash의 프롬프트 환경은 무엇을 덜어냈는지에서도 독특합니다. 네거티브 프롬프트 필드가 없고, temperature 조절도 없으며, 시스템 명령도 없고, 화면비는 두 가지뿐입니다. 이는 무작정 우회해야 할 결함이 아닙니다. 각각의 제약이 프롬프트를 어떻게 표현해야 하는지를 바꿉니다. 이 가이드에서는 두 모드와 그것을 규정하는 제약을 모두 다룹니다.

참고

2026년 7월 1일 기준으로 Gemini Omni Flash는 Google AI Studio, Gemini API, Gemini 앱, Google Flow를 통해 이용할 수 있지만, 아직 OmniArt 워크스페이스에는 들어와 있지 않습니다. 아래 내용은 Google 자체 도구에서 직접 프롬프트를 작성하는 방법을 설명하며, 마지막 섹션에서는 어떤 습관이 오늘날 OmniArt에서 사용 가능한 동영상 모델로 이어지는지 정리합니다.

하나가 아닌 두 가지 프롬프트 모드

모든 Omni Flash 세션에는 두 종류의 프롬프트가 있으며, 각각 서로 다른 작성 방식을 요구합니다.

첫 번째 생성 프롬프트는 하나의 10초 장면을 위한 완결된 브리프입니다. 피사체, 움직임, 카메라, 조명, 사운드, 스타일을 담습니다. 이는 강력한 텍스트-영상 변환이나 이미지-영상 변환 프롬프트와 똑같이 작동합니다. 세부 정보를 앞쪽에 배치하고, 구체적으로 쓰며, 샷 전체를 한 번에 묘사하세요.

대화형 수정 명령은 그 반대입니다. 짧고, 정확히 하나의 변경만 지정하며, 모델이 이전 클립을 이미 문맥에 담고 있다고 가정합니다. "조명을 골든아워로 바꿔줘." "세단을 픽업트럭으로 교체해줘." 모델은 언급하지 않은 요소를 모두 유지하면서 변경을 반영합니다. 이는 Interactions API를 통해 최대 세 번의 순차적 수정에 걸쳐 세션 상태를 이어 주는 previous_interaction_id 덕분입니다. 하나의 수정 명령에 세 가지 변경을 몰아넣으면, 이 모드를 쓸 가치가 있게 만드는 정밀함을 잃게 됩니다.

이렇게 이해하면 됩니다. 첫 프롬프트에서 구성하고, 후속 명령에서 연출하라. 탄탄한 베이스 클립을 먼저 얻은 다음, 촬영 도중 감독에게 지시하듯 한 번에 하나씩 다듬어 나가세요.

표현을 좌우하는 API 제약

Omni Flash의 파라미터 목록은 의도적으로 짧습니다. 생략된 항목마다 프롬프트에 미치는 결과가 있습니다.

제약프롬프트에 미치는 의미
네거티브 프롬프트 필드 없음제외 요소를 프롬프트 안에 표현하세요 — 별도의 네거티브 목록 대신 "텅 빈 거리, 보행자 없음, 차량 없음"처럼 씁니다
temperature / top_p / 시스템 명령 없음변동성을 조절하거나 지속적인 스타일 규칙을 설정할 수 없으므로, 매번 톤과 스타일을 프롬프트 문장에 담으세요
화면비: 9:16 또는 16:9만 지원방향을 미리 정하세요. 정사각형이나 시네마 와이드 옵션이 없으므로 첫 단어부터 세로 또는 가로에 맞춰 구도를 잡습니다
오디오는 묘사만, 업로드 불가맞출 트랙을 건넬 수 없으므로 원하는 소리를 말로 묘사합니다(아래 참조)
영어 완전 지원, 다른 언어는 미검증예측 가능한 결과를 위해 프롬프트는 영어로 작성하세요
10초 하드 제한생성당 하나의 명확한 동작 — 샷 리스트가 아닙니다

경고

Omni Flash에는 오디오 레퍼런스 업로드가 없습니다. 동기화할 배경 음악이나 음성 샘플을 넣어줄 수 없습니다. 기본적으로 오디오 트랙을 생성하며, 여러분이 통제할 수 있는 것은 프롬프트 속 단어뿐입니다. 따라서 사운드 디자인은 첨부하는 것이 아니라 글로 써야 합니다.

첫 번째 생성을 위한 템플릿

10초에는 하나의 장면만 담기므로, 가장 강력한 첫 프롬프트는 모든 레이어를 명시한 하나의 연속된 순간을 묘사합니다. 여섯 개의 슬롯이면 거의 모든 샷을 커버할 수 있습니다.

  1. 피사체 — 화면에 등장하는 사람이나 사물을 구체적으로 묘사
  2. 움직임 — 클립 전체에 걸쳐 전개되는 하나의 동작
  3. 카메라 — 시퀀스가 아닌 단일 이동("천천히 밀고 들어가기", "고정된 와이드 샷")
  4. 조명 — 방향, 질감, 시간대
  5. 사운드 디자인 — 생성하고 싶은 오디오를 말로 표현
  6. 스타일 — 색감, 시대감, 영화 레퍼런스, 질감

실제 예시입니다.

"옅은 오크 카운터 위의 세라믹 푸어오버 커피 드리퍼, 진한 커피가 아래 유리 카라페로 흘러내리며 김이 피어오른다. 드립 위로 천천히 밀고 들어가는 카메라. 카메라 왼쪽 창에서 들어오는 부드러운 아침 햇살, 따뜻하고 확산된 빛. 사운드: 잔잔한 물 흐르는 소리, 멀리서 들리는 주방 환경음, 음악 없음. 절제된 에디토리얼 색감, 얕은 피사계 심도, 빠른 단초점 렌즈로 촬영."

제외 요소는 문장 안에 담기고("음악 없음"), 카메라는 하나의 이동이며, 사운드는 명확히 서술되어 있습니다. 이것이 전부입니다.

대화형 편집: 제대로 먹히는 표현

베이스 클립을 확보하고 나면, 수정이야말로 Omni Flash가 생성 후 폐기하는 방식보다 앞서 나가는 지점입니다. 각 명령은 하나의 의도로 유지하고, 모델이 깔끔하게 읽어내는 일관된 동사 어휘에 의존하세요.

  • 재조명 — "골든아워로 바꿔줘", "뒤에서 들어오는 차가운 림 라이트를 추가해줘"
  • 교체 — "커피 드리퍼를 프렌치 프레스로 바꿔줘"
  • 리스타일 — "1970년대 필름 질감처럼 만들어줘"
  • 색상 변경 — "머그컵을 무광 검정으로 바꿔줘"
  • 타이밍 조정 — "붓는 속도를 늦춰줘", "김이 더 오래 머물게 해줘"

두 가지 규칙이 대화의 흐름을 일관되게 유지해 줍니다. 한 번에 하나의 변경 — 모델은 언급하지 않은 것을 유지하므로, 한 가지만 지정하는 수정이 더 예측 가능하고 다시 프롬프트를 넣어 되돌리기도 쉽습니다. 그리고 이전 턴의 표현 위에 쌓아 올리기 — 여러분이 정한 명사를 재사용하면("그 머그컵", "그 붓는 동작") 모델이 장면을 다시 추론하지 않고 같은 요소에 고정됩니다.

세 번의 수정 체인은 제안이 아니라 예산입니다. 후속 명령이 가장 적게 필요하도록 베이스 프롬프트를 설계하세요. 강력한 첫 생성은 수정 턴을 진짜 창의적인 변경에 쓸 수 있게 남겨 둡니다. 첫 프롬프트에서 명시할 수 있었던 것을 고치는 데 쓰는 것이 아니라요.

현재의 한계를 우회하는 법

몇몇 한계는 프롬프트로 해결되지 않으므로, 맞서 싸우기보다 그 한계를 염두에 두고 프롬프트를 작성하는 편이 낫습니다.

  • 10초 제한. API에는 장면 확장이 없으므로, 더 긴 흐름을 암시하는 프롬프트를 쓰지 마세요. 홀로 완결되는 하나의 장면을 설계하세요.
  • 장면 전환 간 인물 일관성은 인정된 약점입니다. 유사성이 중요하다면, 모델에게 인물을 새로운 배경으로 옮기라고 요구하기보다 같은 장면 안에서 수정을 진행하세요.
  • 3초를 넘는 동영상 레퍼런스는 완전히 처리되지 않습니다. 레퍼런스 클립은 짧고 핵심만 담으세요.
  • 다중 동영상 참조와 음성 편집은 지원되지 않습니다. 둘 다 미지원이므로, 이 단계는 프롬프트가 아니라 별도의 도구에서 처리하도록 계획하세요.

이 중 어느 것도 빠른 숏폼 반복 도구로서의 자격을 박탈하지는 않습니다. 다만 Omni Flash가 잘하는 것 — 하나의 탄탄한 장면을 대화로 다듬는 것 — 에 맞춰 프롬프트를 좁혀야 한다는 뜻입니다.

오늘날 OmniArt로 이어지는 것

Omni Flash는 아직 OmniArt 워크스페이스에 없지만, 위의 거의 모든 습관은 이미 사용 가능한 동영상 모델로 그대로 이어집니다. 밑바탕의 원칙 — 하나의 명확한 장면, 키워드 나열보다 구체성, 프롬프트에 써 넣은 사운드 — 이 모델과 무관하게 통하기 때문입니다.

  • 레퍼런스 기반 생성은 OmniArt에서 사용 가능한 Seedance 2.0로 곧바로 이어집니다. 이 모델은 @image1 / @video1 구문으로 역할에 바인딩된 이미지 최대 9장, 동영상 3개, 오디오 파일 3개를 받아들입니다. "에셋으로 구성하기"라는 개념을, Omni Flash가 제공하는 것보다 더 많은 입력으로 구현한 셈입니다.
  • 영화적 카메라 언어는 Veo 3.1로 이어집니다. 이 모델은 "drift", "glide", "dolly in" 같은 동작 동사를 절제감 있게 해석합니다.
  • 여섯 개 슬롯 템플릿(피사체, 움직임, 카메라, 조명, 사운드, 스타일)은 워크스페이스의 모든 동영상 모델에서 깔끔한 결과를 만들어 내는 동일한 뼈대입니다.

OmniArt에서 동영상 워크스페이스를 열고, 샷에 맞는 모델을 고른 뒤, 첫 프롬프트를 하나의 완결된 장면으로 작성하세요. Omni Flash가 도착하면, 위의 두 모드 워크플로우가 여러분이 추가할 부분입니다. 프롬프트 기술은 이미 동일합니다.

제작할 준비가 되셨나요?

AI로 멋진 콘텐츠를 생성하세요

무료로 시작하기