guideModèles et analyses9 min de lecture

Seedance 2.0 : patterns de prompt et six cas d'usage vidéo IA

Guide créateur de Seedance 2.0 — entrées multi-référence, sortie 2K native, timelines multi-plans et six prompts testés avec résultats dans OmniArt.

Équipe OmniArt2 mai 2026

Seedance 2.0 est le modèle que les créateurs choisissent quand le brief se lit comme un brief réalisateur. ByteDance l'a shipé en février 2026 comme Transformer diffusion multimodal unifié qui accepte texte, jusqu'à neuf images, trois vidéos de référence et trois fichiers audio dans un seul prompt — tous adressables avec la syntaxe @image1 et @video1. Le résultat est le chemin le plus propre vers la cohérence personnage sur timelines multi-plans disponible aujourd'hui. Ce guide couvre la grammaire prompt qui respecte le modèle et six cas d'usage testés avec prompts et résultats.

Ce qu'est Seedance 2.0

Seedance 2.0 génère des clips 4–15 secondes jusqu'en 2K avec audio stéréo natif. Le headline n'est pas la résolution — c'est l'architecture multi-référence et le prompting multi-plans style timeline.

Spec	Valeur
Architecture	Transformer diffusion multimodal unifié
Résolution max	2K
Durée	4–15 secondes
Entrées image	jusqu'à 9 (`@image1`–`@image9`)
Entrées vidéo	jusqu'à 3 (`@video1`–`@video3`)
Entrées audio	jusqu'à 3 (`@audio1`–`@audio3`)
Sortie audio native	Oui — dialogue, SFX, ambiance, musique
Langues lip-sync	7+
Modes	Standard, Fast

Pourquoi le système multi-référence compte

La plupart des modèles vidéo acceptent une référence, ou aucune. Seedance 2.0 accepte une stack et vous laisse lier chaque référence à un rôle dans le prompt. Utilisez @image1 pour le visage du personnage, @image2 pour le costume, @image3 pour le lieu, @video1 pour le mouvement caméra voulu, @audio1 pour le bed musical. La sortie respecte chacun comme instruction discrète au lieu de les moyenner en bruit.

C'est la raison pratique pour laquelle la ressemblance personnage tient entre plans : la même référence @image entre dans chaque plan de la timeline, et le modèle l'utilise comme ancre identité plutôt que de re-inférer le personnage depuis le prompt à chaque fois.

Structure de prompt qui marche

Seedance 2.0 récompense une structure en six parties.

Sujet — qui ou quoi est à l'écran
Action / mouvement — ce qu'ils font
Décor / environnement — où cela se passe
Style visuel — références film, palette, époque
Direction caméra — termes cinématographiques spécifiques
Éclairage — direction, qualité, moment de la journée

Un bon prompt template :

"Subject (with @image1 reference if applicable). Action. Setting. Visual style. Camera direction (specific cinematography term). Lighting detail."

Notation timeline multi-plans

Pour le travail multi-plans, écrivez la timeline directement dans le prompt.

0–4s: wide establishing shot, character (in @image1) walks into the scene
4–8s: medium tracking shot follows them across the room
8–12s: 360-degree orbit around the table they reach

Épinglez le même @image1 sur chaque segment. La ressemblance reste cohérente à travers la coupe.

Discipline de tagging référence

Un petit rulebook qui paie :

Utilisez @image1, @image2 pour photos visage et shots produit.
Utilisez @video1 pour le mouvement caméra à copier.
Utilisez @audio1 quand le bed audio compte plus que le défaut du modèle.
Référencez chaque tag explicitement dans le texte. Ne comptez pas sur le modèle pour inférer quelle référence joue quel rôle.

Six cas d'usage testés avec prompts

Chaque prompt ci-dessous est un que nous avons exécuté sur Seedance 2.0. La colonne résultats est ce que nous avons obtenu, avec temps de génération mesuré en Standard 720p.

1. Scène film cinématographique

"A retired detective in a long dark coat walks through a rain-soaked alley at night. Neon signs reflect red and blue on the wet cobblestones. He pauses, lights a cigarette, and glances over his shoulder. Slow push-in from wide shot to medium close-up. Film noir style, anamorphic lens flare, teal-orange color grading, film grain."

Résultat. Push-in caméra fluide. Reflets pluie convaincants, mouvement manteau naturel. Allumage cigarette sans distortion main. Audio pluie et ville ambiant généré en sync. ~70 secondes.

2. Commercial produit

"A luxury perfume bottle rotates slowly on a black marble surface. Golden liquid catches the light as it turns. Soft particles of gold dust float in the air around it. Macro close-up, slow 360-degree orbit camera. Studio lighting with warm rim light, high-end commercial photography style."

Résultat. Réfraction verre et comportement liquide précis. Dérive particules naturelle. Rotation complète fluide, angles lumière corrects, texture marbre visible. ~65 secondes.

3. Clip musical

"A female singer in a flowing red silk dress performs on a rooftop at sunset. City skyline stretches behind her. Wind blows her hair and dress dramatically. She sings with emotional intensity, arms spread wide. Dynamic tracking shot circling around her. Golden hour backlighting, lens flare, vibrant warm tones."

Résultat. Physique robe réaliste. Orbite tracking fluide. Visage reste cohérent à travers la rotation. Mouvement cheveux match direction vent. Piste musicale ambiante générée. ~75 secondes.

4. Portrait personnage en mouvement

"An elderly Japanese craftsman in a traditional wooden workshop, morning light streaming through paper screens. He slowly lifts a hand-forged ceramic tea bowl, examining it with quiet pride. His weathered hands rotate the bowl gently. Close-up of his hands, then slow tilt up to reveal his face. Wabi-sabi aesthetic, warm natural light, documentary portrait quality."

Résultat. Nombre doigts correct. Mouvement articulations naturel. Tilt fluide mains vers visage. Lumière réaliste à travers écrans. Sons atelier ambiant faibles. Texture peau réaliste. ~80 secondes.

5. Nature et paysage

"Aerial drone shot gliding over a misty mountain valley at sunrise. Layers of fog roll between emerald green peaks. A winding river reflects the golden morning light below. Eagles soar through the frame at eye level. Smooth forward tracking with slight descent. Epic landscape, volumetric fog, golden hour lighting."

Résultat. Couches brume indépendantes créent profondeur convaincante. Reflets rivière se mettent à jour avec position caméra. Bon équilibre palette. Brume volumétrique rendue proprement. Audio vent et cris oiseaux. ~55 secondes — le plus rapide des six.

6. Anime et fantasy

"An anime warrior princess stands atop a cliff overlooking a burning medieval city at night. Her long silver hair and crimson cape billow in the wind. She draws a glowing blue katana, electricity crackling along the blade. Cherry blossom petals swirl around her. Dynamic low-angle shot with slow push-in. Cel-shading style, vibrant neon accents, dramatic speed lines."

Résultat. Cel-shading cohérent partout. Dégainage katana fluide. Effet électricité s'intègre naturellement. Pétales cerisier bougent indépendamment. Interaction lumière feu avec cape. Audio swoosh épée dramatique. ~70 secondes.

Erreurs courantes et correctifs

Problème	Cause	Correctif
Prompt rejeté	Mots-clés visage ou phrasing ambigu	Retirez descriptions visage explicites ; utilisez références `@image`
Frames noires	Prompt trop complexe	Coupez à une action par 4–5 secondes ; baissez résolution pour le test
Visage personnage change entre plans	Pas de référence cohérente	Épinglez le même `@image1` dans chaque plan de la timeline
Audio désynchronisé	Mismatch diffusion jointe	Régénérez avec audio désactivé, ajoutez le bed séparément
Distortion main ou doigts	Interaction main complexe sans référence	Ajoutez image référence de la pose main voulue
Texture « AI-generated »	Sur-utilisation mots-clés style	Ajoutez détails physiques — matériaux, éclairage, type objectif

Seedance 2.0 vs Seedance 1.0

Si vous avez utilisé 1.0, l'écart vers 2.0 est plus large que le numéro de version ne le suggère.

Fonctionnalité	1.0	2.0
Architecture	Pipelines séparés	Transformer diffusion unifié
Entrée image	1 optionnelle	jusqu'à 9, adressable via `@tag`
Entrée vidéo	Aucune	jusqu'à 3
Entrée audio	Aucune	jusqu'à 3
Sortie audio native	Non	Oui
Résolution max	1080p	2K
Durée	5–10s	4–15s
Multi-plans	Basique	Storyboard timeline avec cohérence cross-shot
Qualité mains	Artefacts fréquents	Nettement améliorée
Édition in-video	Non	Oui — swap personnage / objet
Utilisable du premier coup	~60 %	90 %+

Quand choisir autre chose

Seedance 2.0 n'est pas le bon outil pour chaque brief.

Besoin	Meilleur choix
4K à 60fps pour broadcast	Veo 3
Direction mouvement frame-level	Runway Gen-4.5
Social 720p le moins cher avec audio	Grok Imagine
Boucle d'itération la plus rapide	HappyHorse 1.0
Contrôle objectif paramétré lourd	V6
Long plan unique	Sora 2

Tarification sur OmniArt

Seedance 2.0 est tarifé en crédits dans l'espace vidéo OmniArt. Standard 720p tourne à 30 crédits par seconde ; Fast 720p à 20 crédits par seconde. Les membres Ultra ont 40 % de réduction crédits sur les deux modes. Comme check rapide sur le calcul itération : un clip Standard 720p 5 secondes coûte 150 crédits, un clip Fast 720p 5 secondes coûte 100.

Avertissement

ByteDance n'a pas publié de droits d'usage commercial explicites pour les sorties Seedance 2.0 au moment de l'écriture. Pour le travail commercial high-stakes, revérifiez les termes de licence plateforme avant livraison.

Commencer sur OmniArt

Seedance 2.0 se trouve dans l'espace vidéo OmniArt à côté de V6, BACH, Sora 2, Veo 3, Kling 3.0, HappyHorse 1.0 et Grok Imagine. Même solde crédits, même upload référence, même grammaire prompt.

Commencez avec le prompt scène film cinématographique ci-dessus pour sentir le workflow multi-référence, puis passez au brief clip musical une fois que vous voulez tester la cohérence visage à travers le mouvement.

Si vous choisissez entre Seedance 2.0 et HappyHorse 1.0, la comparaison HappyHorse 1 vs Seedance 2 parcourt les trade-offs plan par plan. Pour les séquences narratives plus longues, le guide cinématographique BACH est le meilleur point de départ.

Prêt à créer ?

Commencez à générer du contenu incroyable avec l’IA

Commencer gratuitement