Gerçekten işe yarayan 8 Grok Imagine promptu
FLUX.1'in doğal dil stiliyle Konu + Eylem + Kamera + Stil + Ses yapısı üzerine inşa edilmiş, Grok Imagine 1.5 için görüntü ve video üretiminde kopyalamaya hazır sekiz prompt. Her promptun ne ürettiği ve neden işe yaradığı, OmniArt içinde.

Grok Imagine 1.5, görüntü tabanını Black Forest Labs'ın FLUX.1 modeline yükseltti ve bu değişikliğin prompt yazma biçiminiz üzerinde somut bir etkisi var: model, doğal dil açıklamalarına bir fotoğrafçının iş özetini okuduğu gibi yanıt veriyor; eski modellerin anahtar kelime listelerini ayrıştırma biçiminde değil. Aşağıdaki sekiz prompt kopyalamaya hazır — OmniArt'ın Grok Imagine çalışma alanına yapıştırın, ayrıntıları ayarlayın ve üretin. Her kart, tam prompt metnini, ne ürettiğini ve yapının neden işe yaradığına dair bir teknik notu içermektedir.
OmniArt modellerinin tamamı için genel prompt teorisi konusunda daha iyi promptlar nasıl yazılır sayfasına bakabilirsiniz. Grok Imagine'in altı üretim modu ve maliyet hesaplamaları için Grok Imagine yaratıcı rehberini inceleyin. Bu makale özellikle Grok Imagine 1.5 — FLUX.1 sürümü — ve onun ödüllendirdiği prompt tekniği hakkındadır.
Grok Imagine 1.5, prompt yazımını nasıl değiştirdi
FLUX.1 temel modeli, önceki metin-görüntü mimarilerinden farklı şekilde eğitildi. Bağlı nesri iyi analiz ediyor ve saf anahtar kelime yığınlarına düşük tepki veriyor. Kaliteyi en güvenilir biçimde artıran beş alışkanlık şunlardır:
- Anahtar kelime yığınları yerine doğal dil. Tam cümleler, virgülle ayrılmış sıfatlardan daha iyi sonuç verir. "Bir kolaylık marketi tabelasının huzmesiyle aydınlatılan mavi saatteki bir sokak" ifadesi, "sokak, gece, neon, sinematik, 4K" ifadesini geçer.
- Belirsiz sıfatlar yerine özgün referanslar. "Fujifilm XT4, 23mm f/2 ile çekildi" ifadesi modele "yüksek kaliteli fotoğraf"tan çok daha fazla bilgi verir. Özel ekipman adları ve film türleri gizli alanda gerçek ağırlık taşır.
- "Renkli" yerine tam renk kelimeleri. "Elektrik mavisi ve sıcak pembe" bilinçli bir palet üretir. "Renkli" ise ortalanmış gürültü üretir.
- "Altın saat" yerine tam saat. "Ekim ayı sonu, 17:45, güneş ufkun 6° üzerinde" modele ışığın tam açısını ve sıcaklığını bildirir. "Altın saat" mevsimler ve enlemler arasında belirsizdir.
- Video yapısı: Konu + Eylem + Kamera + Stil + Ses. Ana konuyu ve eylemi ilk 20–30 kelimeye yerleştirin. Tek bir stil odağı, karışık stile kıyasla daha iyi sonuç verir. Aşamalı olarak yineleyin — sonuç oturana kadar her nesilde bir değişkeni değiştirin, ardından daha da geliştirin.
Videoya aktarılabilecek sinematografik kelime dağarcığının tam bir analizi için sinematik yapay zeka video promptu rehberi, lens seçimini, motivasyona dayalı kamera hareketlerini ve ışıklandırma dilini derinlemesine ele almaktadır.
8 prompt
1. Sinematik ürün çekimi (görüntü)
35mm product photography, shot on Fujifilm XT4. A matte black mechanical wristwatch resting on a slab of raw concrete,
late October afternoon light coming in low from camera left at roughly 20°, casting a long shadow across the concrete
face. Shallow depth of field, background falling completely soft. Color palette: warm amber highlights, cool blue-grey
shadow fill. No props, no reflections except the concrete surface itself.
Ne üretir: yapay zeka çıktısı değil de profesyonel ürün fotoğrafçılığı gibi okunan temiz, sanatsal yönlendirmeli bir natürmort.
Neden işe yarar: Fujifilm XT4 referansı, renk bilimini ve sensör işlemesini gerçek dünyadan belirli bir görünüme bağlar. Işık açısı sayısal olarak belirtilmiş olup modelin varsayılan olarak difüz tepeden aydınlatmaya başvurmasını önler. Paleti iki renkle sınırlandırmak — sıcak kehribar yüksek noktaları, soğuk mavi-gri gölge dolgusu — modelin üçüncü bir rakip ton eklemesini engeller.
2. Sesli karakter yakın çekimi (video)
Medium close-up of a young woman with short silver hair and a worn leather jacket, inside a neon-lit record shop at
3 am. She looks directly into camera and says: "Every city has one song. I'm still looking for mine." Natural lip
sync. Camera holds completely still. Light source: one pink neon tube overhead, one cyan neon sign spilling from
camera right. Atmosphere: quiet, a little melancholic, not cinematic drama. Ambient audio: low vinyl static underneath
the dialogue. 8 seconds.
Ne üretir: yerel Grok Imagine 1.5 sesiyle bir karakter anı — model tek bir çıkarım geçişinde diyaloğu, dudak senkronizasyonunu ve ortam sesini üretir.
Neden işe yarar: diyalog satırı 8 saniye içinde temiz bir dudak senkronizasyonu için yeterince kısa. İki ayrı ve adlandırılmış neon ışık kaynağı (üstten pembe, sağdan camgöbeği) modele açık bir ışık haritası sağlayarak genel "neon şehir" ortalamasını önler. "Sinematik drama değil" ifadesi, olumlu bir sıfattan çok daha kesin biçimde ruh halini yönlendiren olumsuz bir kısıtlamadır.
İpucu
10 saniyenin altındaki kliplerde söylenen diyaloğu bir veya iki kısa cümleyle sınırlayın. Daha uzun satırlar mevcut süreyi doldurur ve model söylemi hızlandırabilir ya da sesi erken kesebilir.
3. Atmosferik ortam — ambiyans klibi (video)
Wide establishing shot of a fog-filled pine forest in southern Norway, early November, 7 am. No people, no animals.
Soft diffused dawn light filtering through the canopy, pale grey-white, casting almost no shadow. Slow imperceptible
push forward, as if the camera is drifting on breath. Audio: deep forest ambience — distant water, occasional bird,
near-silence underneath. No music. 12 seconds.
Ne üretir: arkaplan görüntüsü, geçiş materyali veya açılış sahnesi olarak ideal, ambiyans yaratan bir klip.
Neden işe yarar: "Kasım başı, sabah 7" ifadesi "sisli sabah"tan daha isabetlidir. İlerleme "neredeyse hissedilmez" ve "nefes üzerinde süzülüyormuş gibi" olarak tanımlanmakta olup bu, "yavaş ilerleme"den çok daha kesin biçimde tempoyu aktarır. Müzik olmamasını istemek, modelin arka plan müziğini varsayılan olarak kullanmasını önler ve model bunun yerine gerçek bir alan kaydı tarzında ambiyans üretir.
4. Hızlı tempolu dikey sosyal video — ürün tanıtımı (video)
9:16 vertical. A pair of electric blue running shoes drops into frame from the top, landing on a wet reflective black
studio floor. High-speed impact, tiny water spray, shoes bounce once and settle. Immediate cut to product floating
at centre frame, slow rotation 360°. Fast rhythm: first motion 0–2s, rotation 2–8s. Hard direct light from above,
electric blue accent light from below floor (subtle). No dialogue. Audio: sharp impact sound on drop, then a clean
single synthesizer tone during rotation. 8 seconds.
Ne üretir: TikTok, Reels veya Shorts için yapılmış etkili bir 9:16 sosyal klip — yerel sesli hızlı kurgu ürün tanıtımı.
Neden işe yarar: baştan 9:16 belirtmek, prompttaki her şeyden önce en boy oranını belirler. Zaman çizelgesi açıkça yazılmıştır ("0–2s / 2–8s"); bu, modelin iki vuruşu tek bir harekete karıştırmak yerine doğru biçimde ayarlamasına yardımcı olur. Belirli ses olaylarını adlandırmak (çarpma sesi, synthesizer tonu), "ses efekti ekle" ifadesinden çok daha kasıtlı bir ses tasarımı üretir.
Uyarı
Grok Imagine 1.5 klipleri 15 saniyeye kadar çalışır. Sosyal içerik için klipleri en fazla 8–10 saniyede tutun — modelin hareketi bu aralıkta en temizdir ve sosyal platform dikkat pencereleri kısadır. 720p'de 8 saniyelik bir klip OmniArt'ta 120 kredi tutar.
5. Stilize illüstrasyon (görüntü)
Risograph print illustration of a small coastal Japanese fishing village at dusk, mid-December. Two ink colors only:
deep indigo and warm persimmon orange. Flat graphic shapes, no gradients. Fishing boats pulled up on shore, a single
wooden dock, lantern light in two window rectangles. Composition: low horizon line, large sky area, boats and dock in
lower third. The print has slight ink misregistration — indigo shifted 2px left from the orange layer. Texture:
visible paper grain throughout.
Ne üretir: genel dijital sanat yerine gerçek bir baskı süreci gibi okunan grafik, sınırlı renkli bir illüstrasyon.
Neden işe yarar: baskı tekniğini (Risograph) ve özgün kısıtlamalarını (iki mürekkep rengi, düz grafik şekiller, gradyan yok, mürekkep kayıt kayması) adlandırmak modele eksiksiz bir teknik özet sağlar. "Mürekkep kayıt kayması," çıktıyı gerçek dünya estetiğine bağlayan fiziksel süreç ayrıntısıdır — FLUX.1'de film türü adlandırmanın eşdeğeridir. Bu olmadan model, gradyan ekleme ya da renkleri karıştırma eğilimindedir.
6. Dinamik kamera hareketi — drone geri çekimi (video)
Aerial drone footage. Extreme close-up on the face of a compass resting on a weathered wooden ship's deck, late
afternoon November light, warm golden horizontal rays from camera left. Slow pull-back revealing the full deck,
then the ship's hull, then open grey Atlantic ocean horizon. Pull-back runs the full 15 seconds — begin on compass,
end with ocean filling 80% of the frame. Camera elevation stays constant, no tilt. Real drone color science: flat
LOG-style color, slight lens vignette. Audio: wind increasing in volume as ocean fills frame.
Ne üretir: tek bir motive kamera hareketi etrafında kurulu, modelin maksimum klip uzunluğu olan 15 saniyelik sürekli bir ortaya koyma çekimi.
Neden işe yarar: bu prompt, 15 saniyelik sürenin tamamını tek bir sürekli hareket için kullanmakta olup bu uzunlukta temiz bir sonuç almanın en güvenilir yoludur. Geri çekim, sabit yükseklikle sınırlandırılmıştır (eğim yok); bu, modelin ikinci bir kamera eksenini doğaçlama eklemesini ve sarsıntılı hareket yaratmasını önler. "LOG tarzı renk, hafif lens vinyeti" ifadesi, belirli ekipman adları gerektirmeden gerçek bir kamera görünümünü kodlar.
7. Stilize moda — film portresi (görüntü)
Expired Kodak Portra 400 film scan. Portrait of a woman in her mid-thirties, strong afternoon window light from
camera right, half of her face in deep shadow. She is wearing a deep forest green linen blazer, no visible jewellery.
Expression is neutral, looking slightly off-camera left. Grain heavy and warm, slight halation around the window
highlight, greens shifted slightly toward yellow-olive. Tight crop: from collarbone to just above top of head.
Aspect ratio 4:5.
Ne üretir: gerçek tahıl, hale ve süresi dolmuş film renk kaymaları gibi doğru vintage renk işlemesiyle analog fotoğraf portresi.
Neden işe yarar: "süresi dolmuş Kodak Portra 400" görüntü gizli alanında en güçlü tek cümlelik stil referanslarından biridir — eksiksiz bir ton beklentisi seti taşır. Renk kaymasını belirtmek ("yeşiller sarı-zeytin yönünde hafifçe kaymış") genel vintage tahılı önler ve süresi dolmuş filmle ilişkili tam palet bozulmasını yönlendirir. Sıkı kırpma ve belirli en boy oranı (4:5), gerçek bir fotoğraf baskısı gibi okunan bir portre üretir.
8. Sürükleyici ortam — yağmur (video)
Ground-level POV inside a glass bus shelter, heavy urban rain, Tokyo residential street, late June 22:00. Camera
holds completely still. Rain streaks down the glass panels in foreground, streetlights smear into vertical bokeh
streaks behind the wet glass. A cyclist passes in the distance — silhouette only, visible for about 2 seconds in
mid-clip. No camera movement. Audio: heavy rain on glass, distant car tyre hiss, one distant motorbike engine
fading right-to-left. No music. 10 seconds.
Ne üretir: açılış çekimi veya bağımsız bir ruh hali eseri olarak güçlü, tek bakış açılı sürükleyici çevresel klip.
Neden işe yarar: "Haziran sonu, 22:00" tam mevsimi, sıcaklık hissini (nemli yaz yağmuru) ve karanlık düzeyini belirtir. Geçen bisikletçi, belirli bir anda belirli bir olay olarak yerleştirilmiştir ("klibin ortasında yaklaşık 2 saniye"); bu, karmaşık karakter eylemi gerektirmeden modele anlatı çıpası sağlar. Ses, üç ayrı katmanda verilmektedir (camda yağmur, uzaktaki lastik sesi, motosiklet); bu, tek bir "ortam kentsel yağmur sesi" talimatından çok daha düşünceli bir ses tasarımı üretme eğilimindedir.
Bunları OmniArt'ta çalıştırma
Sekiz promptun tamamı, OmniArt'ın yaratım çalışma alanında Grok Imagine 1.5 üzerinde çalışır — ayrı bir xAI aboneliğine gerek yoktur. Görüntü promptları (1, 5, 7) görüntü çalışma alanına; video promptları (2, 3, 4, 6, 8) Grok Imagine altındaki video çalışma alanına gider.
OmniArt çalıştırmaları için birkaç pratik not:
- Yineleme için 480p'den başlayın. 480p'de video saniyede 10 kredi tutar. Yapı doğru olduğunda son çekim için 720p'ye (saniyede 15 kredi) geçin.
- Uzatmak için Genişletme Modunu kullanın. Ambiyans klibi (prompt 3) ve drone geri çekimi (prompt 6), Grok Imagine'in Genişletme Modu kullanılarak 15 saniyeye kadar uzatılabilir — aynı model, yalnızca eklenen bölüm faturalandırılır.
- Hedefli düzeltmeler için Değiştirme Modunu kullanın. Bir sonuçtaki aydınlatma neredeyse doğruysa ancak bir öğe yerli yerinde değilse, Değiştirme Modu tam klibi yeniden oluşturmadan değişikliği metin olarak açıklamanıza olanak tanır. Kaynak klipleri Değiştirme'ye geçirmeden önce 480p'de tutun — mod girişi 854×480 ile sınırlar.
- Çekimler arasında karakter tutarlılığı: Aynı karakterin birden fazla çekimini oluşturuyorsanız (prompt 2 tarzı), bir vesikalık fotoğrafı
@Image1olarak kullanan Referans Modunu kullanın ve her yeni promptta karakter açıklamasını yeniden belirtin. Grok Imagine 1.5'in Referans Modu, ince ayarlı bir modele dayanmadan tutarlılığa ulaşmanın en doğrudan yoludur.
Grok Imagine'in altı üretim modunun tamamı, maliyet senaryoları ve farklı bir modele ne zaman geçileceği hakkında tam bir analiz için eksiksiz Grok Imagine rehberine bakın. Herhangi bir video promptuna aktarılabilecek daha geniş sinematografi kelime dağarcığı için sinematik yapay zeka video promptu rehberi, bu makaleyle birlikte yer imine eklemeye değer.
Oluşturmaya hazır mısınız?
AI ile harika içerikler üretmeye başlayın