industry모델 및 인사이트17분 읽기

Gemini Omni Flash: 출시된 것과 Google이 보류한 것

Google이 I/O 2026에서 Gemini Omni Flash를 공개했습니다. 첫 번째 Omni 모델이 무엇을 할 수 있는지, 어떤 기능이 의도적으로 보류되었는지, OmniArt 크리에이터를 위한 실질적인 대응 방법을 정리했습니다.

OmniArt 팀2026년 6월 12일

참고

업데이트(2026년 7월 13일): Gemini Omni Flash는 이제 OmniArt에서 표준 텍스트 및 참조 이미지 기반 동영상 생성에 사용할 수 있습니다. Google의 상태 유지형 대화 편집 제어는 아직 OmniArt UI에 노출되지 않았으며, 아래의 이전 가용성 설명은 게시 당시의 상태입니다.

Google I/O 2026이 5월 19일에 열렸고, 기조연설이 끝나는 날 Gemini Omni Flash가 바로 출시되었습니다. "곧 출시 예정"도 아니고, "제한 미리 보기"도 아닌, 당일 바로 사용할 수 있었습니다. 2주 전, 저희는 I/O 이전 유출 정보에 대한 분석을 게시하며 확인된 신호와 추측을 구분했습니다. 이제 실제 모델이 나왔습니다. 출시된 것, Google이 의도적으로 출시하지 않은 것, 그리고 이번 주 마감이 있는 크리에이터에게 이것이 의미하는 바를 정리합니다.

Omni Flash는 Google의 새로운 "Omni" 체계에서 첫 번째로 공개된 모델입니다. Veo 4가 아니고, Veo 3.1의 이름을 바꾼 것도 아닌, 별도의 제품 라인입니다. Google DeepMind는 후속으로 상위 모델인 Omni Pro가 출시될 것을 이미 확인했지만, 날짜는 공개되지 않았습니다. Flash는 1단계입니다.

확인된 것 vs. 보류된 것

유출 분석 글에서 이 모델을 "전체 모달 야망을 가진 Gemini 네이티브 동영상"이라고 표현했는데, 이는 잘 들어맞았습니다. 기조연설의 열기가 식은 지금, 전체 그림을 정리해 드립니다.

기능	상태	크리에이터에게 의미하는 것
단일 프롬프트로 동기화된 오디오를 포함한 10초 영상 클립 생성	출시됨	이 클립 길이는 숏폼 소셜, 예고편, 오프닝 타이틀에 가장 적합합니다
어떤 입력이든 가능: 텍스트, 이미지, 오디오, 동영상을 하나의 프롬프트에	출시됨	참고 이미지, 음성 메모, 브리프를 함께 넣을 수 있습니다. 세 가지 모두 하나의 프롬프트 문법으로 처리됩니다
대화형/채팅 기반 편집 ("조명을 바꿔줘", "개를 고양이로 바꿔줘")	출시됨	유출 글에서 진짜 헤드라인으로 지목한 워크플로 변화입니다. 아래에서 자세히 다룹니다
모든 출력에 SynthID 워터마크	출시됨, 비활성화 불가, API 토글 없음	기본적으로 워터마크가 있는 출력을 계획하세요. 상업적 사용 전 이용 약관을 확인하세요
생성된 동영상 내 음성 또는 오디오 편집	안전을 이유로 보류됨	딥페이크 관련 위험이 있습니다. Google은 기술적 한계가 아닌 의도적 보류임을 확인했습니다
아바타 모드	보류됨	오디오 편집과 같은 범주의 안전 우려입니다. 일정이 공개되지 않았습니다
개발자 API	"몇 주 내"	API가 출시되고 안정화되기 전까지는 프로덕션 파이프라인 구축을 미루세요

경고

두 가지 중요한 기능인 동영상 내 오디오 편집과 아바타 모드는 기술적 이유가 아닌 안전을 이유로 의도적으로 보류되었습니다. Google이 이를 공식 확인했습니다. 파이프라인이 이 중 어느 것에라도 의존한다면, 현재로서는 대안이 없고 출시 날짜도 없습니다.

Google은 또한 세 가지 현재 한계를 공개적으로 인정했습니다. 편집 중 시각적 일관성, 복잡한 동작 시퀀스, 동영상 내 텍스트 렌더링 문제입니다. 이는 AI 동영상 분야 전체가 공유하는 약점이며, Omni Flash도 이를 해결하지 못했습니다.

유출 예측 vs. 현실 점검

I/O 이전에 저희는 Omni가 무엇일 수 있는지에 대한 세 가지 시나리오를 제시했습니다. Veo의 소비자 재브랜딩, Gemini 네이티브 동영상 모델, 또는 진정한 멀티모달 통합 시스템이었습니다. "시나리오 2와 3의 혼합"이 가장 유력하다고 판단했습니다.

이 판단은 정확했습니다. Omni Flash는 틀림없이 Gemini 네이티브입니다. Veo의 독립 서비스가 아니라 Gemini 앱과 Google Flow 내에서 실행됩니다. 그리고 입력 면에서 진정한 어떤 입력이든 가능한 방식을 구현했습니다. Google이 부여한 "멀티모달" 포지셔닝은 마케팅 과장이 아닙니다. 텍스트, 이미지, 오디오, 동영상을 하나의 프롬프트로 결합하는 것은 Veo 3.1의 입력 모델과 비교할 때 실질적인 능력 변화입니다.

추측이 빗나간 부분이 있다면, 유출 당시의 "리믹스" 프레임이 대화형 편집 기능의 깊이를 과소평가했다는 점입니다. 단순히 처음부터 다시 리믹스하는 게 아닙니다. 다중 편집에 걸쳐 일관성을 유지하는 것으로, 이는 본질적으로 다른 기능입니다.

대화형 편집이 진짜 핵심

오늘날 주요 AI 동영상 모델은 모두 워크플로 수준에서 동일한 방식으로 작동합니다. 프롬프트를 작성하고, 기다리고, 클립을 다운로드한 다음, 결과가 마음에 들지 않으면 다시 프롬프트를 씁니다. Omni Flash는 이 패턴을 깹니다. 대화형 편집 기능을 사용하면 "조명을 황금빛 시간대로 바꿔줘" 또는 "개를 고양이로 바꿔줘"라고 입력하면 처음부터 다시 생성하지 않고 이전 출력과 일관성을 유지하면서 수정된 클립을 받을 수 있습니다.

이것이 중요한 이유는 동영상 반복 작업의 비용이 항상 재생성 사이클에 있었기 때문입니다. 시간과 크레딧 모두에서 그렇습니다. 일관성을 유지하는 다중 편집은 초안과 완성 클립 사이의 간격을 줄여줍니다. 또한 생성 후 폐기하는 워크플로와 달리 모델이 프로젝트에 대한 컨텍스트를 보유한다는 의미이기도 합니다.

현재 인정된 한계는 실재합니다. 복잡한 동작 시퀀스는 편집 전반에 걸쳐 일관성을 잃으며, 세밀한 시각적 세부 사항에서 모델이 흔들릴 수 있습니다. 하지만 워크플로 원칙은 타당하며, 기반 모델이 개선됨에 따라 가장 오래 살아남을 기능입니다.

라인업에서 Omni Flash의 위치

Omni Flash의 강점은 소비자 접근성, 대화형 반복, 멀티모달 입력 유연성입니다. 한계인 10초 클립, 음성 편집 불가, 동작 및 텍스트 렌더링 문제는 그 용도를 명확히 규정합니다.

원하는 작업	추천 모델
대화형 반복, 채팅 기반 정교화	Omni Flash (Google 플랫폼)
네이티브 4K, 공간 오디오, 방송 수준 완성도	Veo 3.1
긴 단일 테이크	Sora 2
멀티샷 스토리보드 연속성	Kling, V6 + BACH
빠르고 스타일리시한 고에너지 클립	PixVerse 모델들
볼륨 작업의 가성비	Kling (비용 효율적인 완성 초당)

Omni Flash와 Veo 3.1의 샷별 비교를 더 깊이 알고 싶다면 Gemini Omni Flash vs. Veo 3.1: 어떤 것이 내 워크플로에 맞는가를 참고하세요.

실제로 어디서 사용할 수 있는가

Omni Flash는 YouTube Shorts, YouTube Create, Gemini 앱, Google Flow에서 사용할 수 있습니다. 가격은 Google의 AI 구독 티어를 통해 책정됩니다. AI Plus는 월 약 $7.99, Ultra는 $250에서 $100으로 인하되었습니다. 개발자 API는 "몇 주 내"에 출시 예정이지만 정확한 날짜는 없습니다.

Veo 제품 라인 전반에 대한 맥락은 Veo 4 출시 현황 및 OmniArt에서 Veo의 위치에서 Veo 3.1이 현재 할 수 있는 것과 멀티모델 워크스페이스 내 위치를 확인할 수 있습니다.

Omni Pro는 확인됨, 일정은 미정

Google DeepMind는 상위 모델인 Omni Pro가 출시될 것을 확인했으며, "Flash보다 한 단계 위"라고 설명했습니다. 출시 날짜, 기능 목록, 미리 보기 액세스 모두 없습니다. 약속이 아닌 출시된 것을 기준으로 계획하세요.

Q3 납품 일정이 있다면, 오늘 Omni Flash의 확인된 스펙을 기반으로 파이프라인을 구축하세요. Omni Pro가 출시되면 이미 결과물을 내고 있는 워크플로에 선택지를 추가하는 것이지, 기다리거나 플랫폼을 재구성하는 게 아닙니다.

참고

이것이 실제로 멀티모델 워크스페이스의 가치입니다. 새로운 출시는 추가지, 파괴가 아닙니다. 기다려온 것이 아니라 이미 납품하고 있는 것과 비교하는 겁니다.

이번 주에 할 일

Omni Flash는 Google 자체 플랫폼인 Gemini 앱, YouTube Shorts, Google Flow에서 실행됩니다. 대화형 편집을 테스트하려면 그곳에서 해보세요. Google은 "몇 주 내" 개발자 일정 외에 서드파티 API 통합을 발표하지 않았습니다.

OmniArt에서는 지금 바로 Veo 3.1(네이티브 4K 및 공간 오디오)과 라인업의 나머지 모델들인 PixVerse 모델, Sora 2, Kling, HappyHorse, Seedance 2 등을 하나의 워크스페이스에서 이미지, 동영상, 오디오, 음악 작업에 사용할 수 있습니다. 하나의 잔액, 하나의 프롬프트 문법, 나란히 비교할 수 있는 하나의 공간.

Omni Flash를 평가하는 동안 Veo 3.1을 최대한 활용하는 실용적인 단계는 Veo 3.1 프롬프트 및 시네마틱 제작 가이드에서 브리프부터 완성 클립까지 전체 워크플로를 확인하세요.

실질적인 대응: 지금 출시되어 안정적인 모델로 현재 브리프를 처리하세요. Omni Pro가 출시되거나 Omni Flash API가 열릴 때, 이미 결과를 내고 있는 파이프라인에 추가하는 것이지, 시작을 기다리는 게 아닙니다.

자주 묻는 질문

Gemini Omni Flash는 지금 사용 가능한가요?

네. 2026년 5월 19일 Google I/O 2026에서 출시되어 당일 YouTube Shorts, YouTube Create, Gemini 앱, Google Flow를 통해 사용 가능해졌습니다. 개발자 API는 "몇 주 내"로 예고되어 있습니다.

Omni Flash와 Veo 3.1의 차이점은 무엇인가요?

Omni Flash는 Gemini 네이티브이며, 어떤 입력이든 가능한 방식(텍스트, 이미지, 오디오, 동영상을 하나의 프롬프트에)을 지원하고, 대화형 다중 편집 기능을 갖추고 있습니다. Veo 3.1은 네이티브 4K 출력과 공간 오디오가 확인된 전용 동영상 모델입니다. 두 모델은 서로 다른 강점을 가지며 현재 다른 플랫폼에서 운영됩니다.

Google이 Omni Flash에서 보류한 기능은 무엇인가요?

두 가지 기능이 의도적으로 보류되었습니다. 동영상 내 음성 및 오디오 편집, 그리고 아바타 모드입니다. Google은 이것이 기술적 한계가 아닌 안전을 이유로 보류되었음을 확인했습니다. 어느 쪽도 출시 날짜가 없습니다.

Gemini Omni Pro가 Flash를 대체할 건가요?

Google DeepMind는 Omni Pro를 "Flash보다 한 단계 위"라고 설명한 미래의 상위 모델로 확인했지만, 기능, 가격, 출시 날짜는 공개되지 않았습니다. Flash의 확인된 기능을 기반으로 계획하고, Omni Pro는 미래의 추가 선택지로 다루세요.

Omni Flash에는 SynthID 워터마크가 있나요?

네. 모든 Omni Flash 출력에는 SynthID 워터마크가 포함됩니다. 비활성화할 수 없으며 API 토글도 없습니다. 상업적 맥락에서 출력물을 사용하기 전에 플랫폼의 서비스 약관을 확인하세요.

제작할 준비가 되셨나요?

AI로 멋진 콘텐츠를 생성하세요

무료로 시작하기