industry모델 및 인사이트14분 읽기

Gemini Omni 유출: Google 영상 모델이 의미하는 것

Google I/O 2026 앞, Gemini Omni 영상 모델 유출 정리. 확인된 사실, 루머, 이번 주 OmniArt 크리에이터가 할 일.

OmniArt 팀2026년 5월 13일

Google I/O 2026는 5월 19~20일이고, AI 영상 쪽은 이미 키노트를 미리 보고 있습니다. Gemini 영상 탭 UI 문자열 하나가 이유입니다: 「Start with an idea or try a template. Powered by Omni.」 그 한 줄에서 세 파도의 유출이 미공개 Google 영상 모델 — 잠정명 Gemini Omni — 의 그림을 그렸습니다. Veo 3.1을 대체할지, 나란히 둘지, 전체 생성 스택을 조용히 올릴지는 아직 열려 있습니다.

이 글은 화요일 전에 OmniArt 크리에이터가 무엇을 할지 정하려는 분을 위한 읽을거리입니다. 확인된 신호와 추측을 나누고, Omni의 세 가지 정체성, 이번 주 실무적 움직임까지 정리합니다.

실제로 아는 것(모르는 것)

신호	상태	의미
Gemini 영상 탭 「Powered by Omni」 UI	스크린샷으로 확인	Omni라는 제품이 플래그 뒤에 배치됨
모델 ID `bard_eac_video_generation_omni`	앱 검사로 보고	Gemini 영상 파이프라인에 내부 ID 연결
10초 클립 상한	초기 테스터 보고	초기 단계 또는 소비자 티어 제약 가능
「Remix your videos, edit directly in chat, try a template」	기능 카피 보고	생성만이 아니라 편집·리믹스 워크플로
텍스트 일관성(수식 등)	데모 보도	인비디오 타이포의 기술적 진전 신호
네이티브 오디오	미확인	Veo 3.1은 네이티브 오디오, Omni는 불명
API 접근	미확인	미확인 스펙으로 계획하지 말 것
Veo 3.1 대체·보완·리브랜딩	미결	프로덕션 팀에게 가장 중요한 질문

요약하면, Omni라는 Google 영상 제품은 UI 카피만으로도 실재감이 있지만, 아키텍처 주장은 앱 문자열과 테스터 보고에서 나온 추론입니다.

세 가지 그럴듯한 정체성

불확실성은 대부분 Omni가 실제로 무엇인지 세 시나리오로 수렴합니다.

시나리오 1 — Veo의 소비자 리브랜딩

가장 단순한 해석: Omni는 Gemini 안에서 「Veo」 브랜드를 대체하는 소비자 표면입니다. 이미지 생성이 「Nano Banana」로 통합된 것과 유사합니다. 엔진은 Veo, 표면은 Omni.

그렇다면: Veo 3.1 대비 능력 변화는 제한적, 소비자 티어 8~10초 상한 유지, API·엔터프라이즈는 Veo 트랙 지속을 기대할 수 있습니다.

시나리오 2 — Gemini 네이티브 영상 모델

둘째 해석: Omni는 영상에 맞게 미세조정된 Gemini 아키텍처 버전으로, Veo와 병렬입니다. Veo는 API·엔터프라이즈 전용, Omni는 Gemini의 텍스트·추론 능력을 받는 소비자 모델.

그렇다면: 프롬프트 준수 강화, 인비디오 타이포(수식 보고와 부합), Gemini 채팅 편집과의 밀착을 기대할 수 있습니다.

시나리오 3 — 진정한 옴니모달 모델

가장 야심 찬 해석: 텍스트·이미지·영상·오디오를 하나의 모델에서 네이티브 생성. 이름 「Omni」가 이 방향을 시사하며, 런치가 완전한 패리티에 못 미칠 수 있습니다.

그렇다면: 대화형 편집, 채팅 안 멀티모달 핸드오프, 모달리티별 모델 스택에 대한 장기적 압력을 기대할 수 있습니다.

I/O에서 가장 그럴듯한 결과는 2와 3의 혼합 — Gemini 네이티브 영상 모델이 옴니모달 야망을 갖추되 소비자 티어 제한으로 출시 — 입니다.

보고된 기능이 중요한 이유

모델 정체성 질문보다, 카테고리가 가는 방향을 가리키는 기능 세 가지가 있습니다.

대화형 편집이 기본값으로

「Remix your videos, edit directly in chat」은 워크플로 대화를 바꿉니다. 대부분의 AI 영상 도구는 여전히 생성·다운로드 — 프롬프트, 대기, 저장, 수정을 위해 재프롬프트. 채팅 편집은 모델을 연속 협업자로 둡니다: 「두 번째 샷을 더 따뜻하게」, 「배경 교체」, 「3초 연장」. Omni가 이를 잘 내면 다른 모델도 맞춰야 합니다.

템플릿이 온램프

템플릿은 프롬프트 장벽을 낮춥니다. 모두가 같은 시드에서 시작하면 출력 다양성은 평탄해집니다. 질문은 출시 여부가 아니라, 잘 쓴 브리프를 이기는지입니다.

영상 안 텍스트

수식이 깔끔하게 렌더된다는 보고는 기술적으로 주목할 만합니다. 인비디오 타이포는 주요 모델의 약점이었습니다. Omni가 복잡한 타이포를 안정적으로 처리하면 익스플레이너·교육·모션 그래픽 워크플로가 열립니다.

라인업에서 Omni의 자리

이미 여러 AI 영상 모델을 쓰는 크리에이터에게 질문은 Omni가 이기는지가 아니라 어디에 끼는지입니다.

능력	Gemini Omni(보고)	Veo 3.1(확인)	V6 / R1	Sora 2
길이	10초(보고)	최대 8초	1~15초	최대 20초
해상도	불명	최대 1080p	최대 1080p	1080p, 4K
네이티브 오디오	미확인	확인	포함	포함
편집/리믹스	리믹스·채팅·템플릿(보고)	제한적	Modify, Extend, 멀티클립	제한적
API	미확인	가능	가능	가능
강점	대화형 편집(보고)	네이티브 4K, 공간 오디오	시네마틱 제어, 실시간	긴 원테이크

유출 기능이 맞다면 Omni의 레인은 「대화형 소비자 영상」 — 빠른 소셜과 채팅 반복. 시네마틱·방송·멀티샷 레인은 증거가 나올 때까지 현 리더가 유지됩니다.

이번 주 크리에이터에게 의미

발표 전 유출의 유혹은 기다리는 것입니다. 앞으로 열흘 안에 납품이 있으면 기다리지 않는 편이 낫습니다.

경고

언론의 Omni 기능은 발표 전 신호로 취급하세요. 보고된 스펙으로 짠 계획은 키노트에서 절반만 살아남는 경우가 많습니다.

실무적 움직임은 무엇을 내는지에 달립니다.

이번 주 영상이 마감이면

지금 라이브하고 검증된 것을 쓰세요. 시네마틱은 V6, 네이티브 4K 방송은 Veo 3.1, 다국어 소셜은 Kling 3.0, 빠른 반복은 HappyHorse 1.0. OmniArt 안에서는 한 클릭 거리라 키노트 전에 한 도구에 묶일 필요가 없습니다.

Q3 프로덕션을 계획 중이면

브랜드가 아니라 능력으로 브리프를 짜세요. 길이, 해상도, 오디오, 편집 모델, 캐릭터 락을 문서화하고, I/O 이후 라인업이 재입찰하게 두세요. Omni가 나와도 파이프라인 전체를 다시 쓰지 않아도 됩니다.

조사·학습 중이면

키노트를 보세요. 의견보다 테스트를 저장하세요. 런치 후 가장 값진 것은 같은 브리프·참조·루브릭으로 Veo 3.1과 기존 라인업과 나란히 돌린 비교입니다.

Omni가 가리키는 더 큰 변화

Omni가 무엇이든, 유출은 Google보다 카테고리 이야기를 더 분명히 합니다.

경쟁 표면이 이동 중입니다. 1차 시각 품질은 수렴합니다. 차별화는 제어 가능성, 멀티샷 일관성, 시청각 동기, 대화형 편집, 실제 워크플로 적합도로 옮겨갑니다.

비용은 여전히 큽니다. Omni UI의 사용 한도·소비 탭 보고는 고품질 영상 생성이 여전히 비싸다는 뜻입니다. 템플릿과 짧은 클립 상한은 UX이자 경제입니다.

권리와 리믹스가 어려워집니다. 생성 영상 위 리믹스는 텍스트-투-비디오보다 IP·동의·상업 이용 질문을 더 드러냅니다. 유료 매체에 넣기 전에 권리 체크리스트를 준비하세요.

OmniArt의 대응

OmniArt 워크스페이스는 두 기준을 만족할 때 모델을 추가합니다: 안정적 공개 가용성, 기존 라인업이 못 하는 실제 창작 잡. Gemini Omni도 같은 기준으로 평가합니다.

I/O에 Omni가 나와 기준을 통과하면 Veo 3.1, Sora 2, V6, Kling 3.0, HappyHorse 1.0, Seedance 2.0, Runway Gen-4.5, Hailuo, Grok Imagine과 함께 — 하나의 프롬프트 문법, 하나의 잔액, 한곳에서 비교 — 들어올 것으로 예상합니다.

현재 영상 라인업 배경은 OmniArt 영상 모델 투어, 브리프 작성은 프롬프트 가이드를 보세요.

FAQ

Gemini Omni가 공식 발표됐나요?

아니요. 2026년 5월 13일 기준 Google은 Gemini Omni를 발표하지 않았습니다. 제품명·모델 ID·기능 카피는 앱 UI와 초기 테스터 보고에서 나왔습니다. Google I/O 2026(5월 19~20일)이 유력한 창입니다.

Gemini Omni가 Veo 3.1을 대체하나요?

불명확합니다. 소비자 표면 리브랜딩, Gemini 네이티브 소비자 모델 병행, 진정한 옴니모달 통합 세 시나리오가 있고, 런치는 2와 3의 혼합이 가장 그럴듯합니다.

보고된 Gemini Omni 기능은?

Gemini 채팅 안 대화형 편집, 리믹스 워크플로, 프롬프트 템플릿, 영상 내 텍스트 일관성(수식), 10초 클립 상한이 보고됐습니다. 공식 확인은 없습니다.

이번 주 영상을 Omni를 기다려야 하나요?

아니요. 오늘 안정적인 모델을 쓰세요. 라인업은 시네마틱, 네이티브 4K 방송, 다국어 소셜, 빠른 반복, 멀티샷 연속성, 프레임 VFX를 이미 덮습니다. Omni가 기준을 넘으면 나머지 파이프라인을 다시 쓰지 않고 끼워 넣으면 됩니다.

Omni와 Veo 3.1 비교는?

보고 스펙만 보면 Omni는 대화형 편집·인비디오 타이포, Veo 3.1은 네이티브 오디오·4K가 확인된 강점입니다. Omni가 공개되기 전에는 직접 비교가 불가능합니다.

제작할 준비가 되셨나요?

AI로 멋진 콘텐츠를 생성하세요

무료로 시작하기