Le modèle vidéo IA de nouvelle génération de ByteDance avec le système de référence @ révolutionnaire. Combinez texte, images, clips vidéo et audio dans une seule instruction. Synchronisation audio-vidéo native, montage V2V et résolution jusqu'en 2K à 30fps — le tout dans une génération unifiée.
Seedance 2.0 est le modèle de génération vidéo IA le plus avancé de ByteDance, dévoilé en février 2026. Il adopte une architecture unifiée de génération conjointe audio-vidéo multimodale prenant en charge 4 modalités d'entrée simultanément — texte, jusqu'à 9 images, jusqu'à 3 clips vidéo et jusqu'à 3 pistes audio. Le système de référence @ révolutionnaire vous permet de taguer des éléments spécifiques dans votre instruction et de les lier à des références téléchargées pour un contrôle granulaire des mouvements de caméra, de l'apparence des personnages, du rythme audio et du style visuel. Les sorties atteignent la résolution 2K avec un audio natif synchronisé, incluant le synchronisé labial multilingue, les effets sonores et la musique de fond.
Taguage de référence révolutionnaire utilisant les labels @Image, @Video et @Audio dans votre instruction. Liez des éléments spécifiques à des fichiers téléchargés pour un contrôle précis des mouvements de caméra, des actions des personnages, du rythme audio et du style visuel.
Combinez du texte, jusqu'à 9 images, jusqu'à 3 clips vidéo et jusqu'à 3 pistes audio dans une seule requête de génération. Seedance 2.0 est le premier modèle à traiter les quatre types d'entrée simultanément.
La synthèse conjointe audio-vidéo produit des dialogues synchronisés labialement, des effets sonores et une musique de fond synchronisés avec la sortie visuelle. Prend en charge le synchronisé labial multilingue avec une précision au niveau phonémique.
Modifiez des vidéos existantes via le mode référence-vers-vidéo. Transférez les motifs de mouvement, les trajectoires de caméra et le rythme des clips téléchargés. Changez les tenues, modifiez les actions ou remplacez des éléments tout en préservant la structure originale.
Sortie native 2K (2048x1080) à 30fps avec plusieurs niveaux de qualité : 480p, 720p et 1080p. La durée de la vidéo varie de 4 à 15 secondes par génération.
Téléchargez plusieurs images de référence du même personnage sous différents angles. Seedance 2.0 maintient des visages, vêtements, proportions corporelles et accessoires cohérents sur plusieurs clips générés.
Découvrez les capacités de Seedance 2.0 en matière de contrôle de référence multimodal, de génération audio native et de montage vidéo

“@Image1 traverse @Image2 avec le mouvement de caméra de @Video1 et la musique de fond de @Audio1”
Instruction multi-référence combinant toutes les modalités

“Le personnage @Image1 danse au rythme de @Audio1 dans l'environnement @Image3”
Mouvement du personnage guidé par le rythme audio de référence

“Une personne faisant une présentation avec un discours en anglais synchronisé et des transitions de diapositives”
Dialogue synchronisé labialement avec contenu visuel

“Tutoriel de cuisine avec narration étape par étape et sons ambiants de cuisine”
Narration synchronisée avec les actions culinaires
Seedance 2.0 FAQ
Le système de référence @ vous permet de taguer des éléments de votre instruction avec les labels @Image1, @Video1, @Audio1 et de les lier à des fichiers de référence téléchargés. Seedance 2.0 extrait les mouvements de caméra des références vidéo, les rythmes des références audio et les styles de composition des images. Cela vous donne un contrôle granulaire sur chaque aspect de la vidéo générée.
Seedance 2.0 prend en charge 4 modalités d'entrée simultanément : des instructions textuelles (longueur illimitée), jusqu'à 9 images de référence (≤30MB chacune), jusqu'à 3 clips vidéo (2-15s de durée totale, ≤50MB chacun) et jusqu'à 3 pistes audio (≤15s au total, ≤15MB chacune). Limite totale de fichiers : 12 fichiers par requête.
Seedance 2.0 produit une sortie native 2K (2048x1080) à 30fps avec plusieurs niveaux de qualité : 480p, 720p et 1080p. La durée de la vidéo varie de 4 à 15 secondes par génération. Les rapports d'aspect pris en charge incluent le paysage, le portrait et l'ultra-large 21:9.
Seedance 2.0 utilise une architecture à deux branches qui traite les latences vidéo et audio en parallèle. L'audio est généré simultanément avec les visuels, garantissant une synchronisation à la milliseconde près. Il prend en charge les dialogues avec synchronisé labial multilingue, les effets sonores adaptés aux actions et la musique de fond adaptée à l'ambiance. Vous pouvez également télécharger des références audio comme entrée.
Le montage V2V vous permet de télécharger des clips vidéo existants comme référence et de générer de nouvelles vidéos qui héritent de leurs motifs de mouvement, trajectoires de caméra et rythme. Vous pouvez modifier des éléments spécifiques comme les tenues, les actions ou les détails de scène tout en préservant la structure de mouvement d'origine.
Seedance 2.0 ajoute des entrées de référence vidéo et audio, passe de 1 à 9 références image, introduit le système de référence @ pour le contrôle multimodal, ajoute le montage vidéo V2V, étend la résolution maximale de 1080p à 2K, augmente la durée de 12s à 15s et est environ 30% plus rapide que 1.5 Pro.
Seedance 2.0 utilise une tarification dynamique à la seconde basée sur la résolution : 480p (14-28 crédits/seconde), 720p (28.5-57 crédits/seconde) et 1080p (640-3 810 crédits/seconde). Deux variantes de vitesse sont disponibles : Standard et Rapide, cette dernière étant environ 30% plus rapide.
Seedance 2.0 est idéal pour les réalisateurs vidéo ayant besoin d'un contrôle précis du mouvement, les créateurs de contenu souhaitant une synchronisation audio native sans post-production, les annonceurs produisant du contenu vidéo de marque, les éducateurs créant des tutoriels narrés et toute personne ayant besoin d'une vidéo IA de qualité professionnelle avec un son synchronisé.
Oui, le modèle accepte les prompts en français avec une bonne compréhension sémantique. Vous pouvez décrire l'image souhaitée directement en français. Les prompts mixtes français-anglais fonctionnent également.
Oui. Toutes les images générées sur Nano Banana 2 Pro incluent des droits d'utilisation commerciale complets. Vous pouvez les utiliser pour les réseaux sociaux, le marketing, l'e-commerce et tout projet professionnel sans restrictions.
La plateforme respecte les normes de protection des données. Les images générées ne sont pas stockées de manière permanente sur nos serveurs après téléchargement. Consultez notre politique de confidentialité pour les détails complets sur le traitement des données.
"Le système de référence @ est véritablement révolutionnaire. Je peux extraire les mouvements de caméra d'un clip de référence et les appliquer instantanément — c'est un flux de travail créatif complètement nouveau."
Réalisateur vidéo
"L'entrée à 4 modalités change la donne. Je peux intégrer un design de personnage, une référence de mouvement de caméra et une musique de fond dans une seule instruction et obtenir exactement ce que j'avais imaginé."
Motion designer
"Le système de référence @ est véritablement révolutionnaire. Je peux extraire les mouvements de caméra d'un clip de référence et les appliquer instantanément — c'est un flux de travail créatif complètement nouveau."
Réalisateur vidéo
"L'entrée à 4 modalités change la donne. Je peux intégrer un design de personnage, une référence de mouvement de caméra et une musique de fond dans une seule instruction et obtenir exactement ce que j'avais imaginé."
Motion designer
Découvrez Seedance 2.0 — le générateur vidéo le plus avancé de ByteDance, gratuitement en ligne