Seedance 2.0 : patterns de prompt et six cas d'usage vidéo IA
Guide créateur de Seedance 2.0 — entrées multi-référence, sortie 2K native, timelines multi-plans et six prompts testés avec résultats dans OmniArt.

Seedance 2.0 est le modèle que les créateurs choisissent quand le brief se lit comme un brief réalisateur. ByteDance l'a shipé en février 2026 comme Transformer diffusion multimodal unifié qui accepte texte, jusqu'à neuf images, trois vidéos de référence et trois fichiers audio dans un seul prompt — tous adressables avec la syntaxe @image1 et @video1. Le résultat est le chemin le plus propre vers la cohérence personnage sur timelines multi-plans disponible aujourd'hui. Ce guide couvre la grammaire prompt qui respecte le modèle et six cas d'usage testés avec prompts et résultats.
Ce qu'est Seedance 2.0
Seedance 2.0 génère des clips 4–15 secondes jusqu'en 2K avec audio stéréo natif. Le headline n'est pas la résolution — c'est l'architecture multi-référence et le prompting multi-plans style timeline.
| Spec | Valeur |
|---|---|
| Architecture | Transformer diffusion multimodal unifié |
| Résolution max | 2K |
| Durée | 4–15 secondes |
| Entrées image | jusqu'à 9 (@image1–@image9) |
| Entrées vidéo | jusqu'à 3 (@video1–@video3) |
| Entrées audio | jusqu'à 3 (@audio1–@audio3) |
| Sortie audio native | Oui — dialogue, SFX, ambiance, musique |
| Langues lip-sync | 7+ |
| Modes | Standard, Fast |
Pourquoi le système multi-référence compte
La plupart des modèles vidéo acceptent une référence, ou aucune. Seedance 2.0 accepte une stack et vous laisse lier chaque référence à un rôle dans le prompt. Utilisez @image1 pour le visage du personnage, @image2 pour le costume, @image3 pour le lieu, @video1 pour le mouvement caméra voulu, @audio1 pour le bed musical. La sortie respecte chacun comme instruction discrète au lieu de les moyenner en bruit.
C'est la raison pratique pour laquelle la ressemblance personnage tient entre plans : la même référence @image entre dans chaque plan de la timeline, et le modèle l'utilise comme ancre identité plutôt que de re-inférer le personnage depuis le prompt à chaque fois.
Structure de prompt qui marche
Seedance 2.0 récompense une structure en six parties.
- Sujet — qui ou quoi est à l'écran
- Action / mouvement — ce qu'ils font
- Décor / environnement — où cela se passe
- Style visuel — références film, palette, époque
- Direction caméra — termes cinématographiques spécifiques
- Éclairage — direction, qualité, moment de la journée
Un bon prompt template :
"Subject (with
@image1reference if applicable). Action. Setting. Visual style. Camera direction (specific cinematography term). Lighting detail."
Notation timeline multi-plans
Pour le travail multi-plans, écrivez la timeline directement dans le prompt.
0–4s: wide establishing shot, character (in @image1) walks into the scene
4–8s: medium tracking shot follows them across the room
8–12s: 360-degree orbit around the table they reach
Épinglez le même @image1 sur chaque segment. La ressemblance reste cohérente à travers la coupe.
Discipline de tagging référence
Un petit rulebook qui paie :
- Utilisez
@image1,@image2pour photos visage et shots produit. - Utilisez
@video1pour le mouvement caméra à copier. - Utilisez
@audio1quand le bed audio compte plus que le défaut du modèle. - Référencez chaque tag explicitement dans le texte. Ne comptez pas sur le modèle pour inférer quelle référence joue quel rôle.
Six cas d'usage testés avec prompts
Chaque prompt ci-dessous est un que nous avons exécuté sur Seedance 2.0. La colonne résultats est ce que nous avons obtenu, avec temps de génération mesuré en Standard 720p.
1. Scène film cinématographique
"A retired detective in a long dark coat walks through a rain-soaked alley at night. Neon signs reflect red and blue on the wet cobblestones. He pauses, lights a cigarette, and glances over his shoulder. Slow push-in from wide shot to medium close-up. Film noir style, anamorphic lens flare, teal-orange color grading, film grain."
Résultat. Push-in caméra fluide. Reflets pluie convaincants, mouvement manteau naturel. Allumage cigarette sans distortion main. Audio pluie et ville ambiant généré en sync. ~70 secondes.
2. Commercial produit
"A luxury perfume bottle rotates slowly on a black marble surface. Golden liquid catches the light as it turns. Soft particles of gold dust float in the air around it. Macro close-up, slow 360-degree orbit camera. Studio lighting with warm rim light, high-end commercial photography style."
Résultat. Réfraction verre et comportement liquide précis. Dérive particules naturelle. Rotation complète fluide, angles lumière corrects, texture marbre visible. ~65 secondes.
3. Clip musical
"A female singer in a flowing red silk dress performs on a rooftop at sunset. City skyline stretches behind her. Wind blows her hair and dress dramatically. She sings with emotional intensity, arms spread wide. Dynamic tracking shot circling around her. Golden hour backlighting, lens flare, vibrant warm tones."
Résultat. Physique robe réaliste. Orbite tracking fluide. Visage reste cohérent à travers la rotation. Mouvement cheveux match direction vent. Piste musicale ambiante générée. ~75 secondes.
4. Portrait personnage en mouvement
"An elderly Japanese craftsman in a traditional wooden workshop, morning light streaming through paper screens. He slowly lifts a hand-forged ceramic tea bowl, examining it with quiet pride. His weathered hands rotate the bowl gently. Close-up of his hands, then slow tilt up to reveal his face. Wabi-sabi aesthetic, warm natural light, documentary portrait quality."
Résultat. Nombre doigts correct. Mouvement articulations naturel. Tilt fluide mains vers visage. Lumière réaliste à travers écrans. Sons atelier ambiant faibles. Texture peau réaliste. ~80 secondes.
5. Nature et paysage
"Aerial drone shot gliding over a misty mountain valley at sunrise. Layers of fog roll between emerald green peaks. A winding river reflects the golden morning light below. Eagles soar through the frame at eye level. Smooth forward tracking with slight descent. Epic landscape, volumetric fog, golden hour lighting."
Résultat. Couches brume indépendantes créent profondeur convaincante. Reflets rivière se mettent à jour avec position caméra. Bon équilibre palette. Brume volumétrique rendue proprement. Audio vent et cris oiseaux. ~55 secondes — le plus rapide des six.
6. Anime et fantasy
"An anime warrior princess stands atop a cliff overlooking a burning medieval city at night. Her long silver hair and crimson cape billow in the wind. She draws a glowing blue katana, electricity crackling along the blade. Cherry blossom petals swirl around her. Dynamic low-angle shot with slow push-in. Cel-shading style, vibrant neon accents, dramatic speed lines."
Résultat. Cel-shading cohérent partout. Dégainage katana fluide. Effet électricité s'intègre naturellement. Pétales cerisier bougent indépendamment. Interaction lumière feu avec cape. Audio swoosh épée dramatique. ~70 secondes.
Erreurs courantes et correctifs
| Problème | Cause | Correctif |
|---|---|---|
| Prompt rejeté | Mots-clés visage ou phrasing ambigu | Retirez descriptions visage explicites ; utilisez références @image |
| Frames noires | Prompt trop complexe | Coupez à une action par 4–5 secondes ; baissez résolution pour le test |
| Visage personnage change entre plans | Pas de référence cohérente | Épinglez le même @image1 dans chaque plan de la timeline |
| Audio désynchronisé | Mismatch diffusion jointe | Régénérez avec audio désactivé, ajoutez le bed séparément |
| Distortion main ou doigts | Interaction main complexe sans référence | Ajoutez image référence de la pose main voulue |
| Texture « AI-generated » | Sur-utilisation mots-clés style | Ajoutez détails physiques — matériaux, éclairage, type objectif |
Seedance 2.0 vs Seedance 1.0
Si vous avez utilisé 1.0, l'écart vers 2.0 est plus large que le numéro de version ne le suggère.
| Fonctionnalité | 1.0 | 2.0 |
|---|---|---|
| Architecture | Pipelines séparés | Transformer diffusion unifié |
| Entrée image | 1 optionnelle | jusqu'à 9, adressable via @tag |
| Entrée vidéo | Aucune | jusqu'à 3 |
| Entrée audio | Aucune | jusqu'à 3 |
| Sortie audio native | Non | Oui |
| Résolution max | 1080p | 2K |
| Durée | 5–10s | 4–15s |
| Multi-plans | Basique | Storyboard timeline avec cohérence cross-shot |
| Qualité mains | Artefacts fréquents | Nettement améliorée |
| Édition in-video | Non | Oui — swap personnage / objet |
| Utilisable du premier coup | ~60 % | 90 %+ |
Quand choisir autre chose
Seedance 2.0 n'est pas le bon outil pour chaque brief.
| Besoin | Meilleur choix |
|---|---|
| 4K à 60fps pour broadcast | Veo 3 |
| Direction mouvement frame-level | Runway Gen-4.5 |
| Social 720p le moins cher avec audio | Grok Imagine |
| Boucle d'itération la plus rapide | HappyHorse 1.0 |
| Contrôle objectif paramétré lourd | V6 |
| Long plan unique | Sora 2 |
Tarification sur OmniArt
Seedance 2.0 est tarifé en crédits dans l'espace vidéo OmniArt. Standard 720p tourne à 30 crédits par seconde ; Fast 720p à 20 crédits par seconde. Les membres Ultra ont 40 % de réduction crédits sur les deux modes. Comme check rapide sur le calcul itération : un clip Standard 720p 5 secondes coûte 150 crédits, un clip Fast 720p 5 secondes coûte 100.
Warning
ByteDance n'a pas publié de droits d'usage commercial explicites pour les sorties Seedance 2.0 au moment de l'écriture. Pour le travail commercial high-stakes, revérifiez les termes de licence plateforme avant livraison.
Commencer sur OmniArt
Seedance 2.0 se trouve dans l'espace vidéo OmniArt à côté de V6, BACH, Sora 2, Veo 3, Kling 3.0, HappyHorse 1.0 et Grok Imagine. Même solde crédits, même upload référence, même grammaire prompt.
Commencez avec le prompt scène film cinématographique ci-dessus pour sentir le workflow multi-référence, puis passez au brief clip musical une fois que vous voulez tester la cohérence visage à travers le mouvement.
Si vous choisissez entre Seedance 2.0 et HappyHorse 1.0, la comparaison HappyHorse 1 vs Seedance 2 parcourt les trade-offs plan par plan. Pour les séquences narratives plus longues, le guide cinématographique BACH est le meilleur point de départ.