ByteDanceの次世代AI動画モデル、革新的な@-referenceシステムを搭載。テキスト、画像、動画クリップ、音声を単一のプロンプトで組み合わせられます。ネイティブな映像音声同期、V2V編集、最大2K解像度・30fpsの出力を、すべて統一された生成プロセスで実現します。
Seedance 2.0はByteDanceの最先端AI動画生成モデルで、2026年2月に発表されました。統合型マルチモーダル音声動画共同生成アーキテクチャを採用し、テキスト、最大9枚の画像、最大3本の動画クリップ、最大3本の音声トラックという4つの入力モダリティを同時に処理できます。画期的な@-referenceシステムを使用すると、プロンプト内の特定の要素にタグを付け、アップロードした参照ファイルにバインドすることで、カメラの動き、キャラクターの外見、音声のリズム、視覚スタイルを細かく制御できます。出力は最大2K解像度に達し、多言語リップシンク、効果音、背景音楽を含むネイティブ同期音声に対応しています。
プロンプト内で@Image、@Video、@Audioラベルを使用する革新的な参照タグ付け機能。特定の要素をアップロードしたファイルにバインドし、カメラの動き、キャラクターの動作、音声リズム、視覚スタイルを精密に制御できます。
テキスト、最大9枚の画像、最大3本の動画クリップ、最大3本の音声トラックを単一の生成リクエストで組み合わせられます。Seedance 2.0は4つの入力タイプすべてを同時に処理する最初のモデルです。
音声と映像の統合合成により、リップシンク対応の台詞、効果音、背景音楽を視覚出力と同期して生成します。音素レベルの精度で多言語リップシンクに対応しています。
参照-to-動画モードで既存の動画を編集。アップロードしたクリップから動作パターン、カメラパス、テンポを転写します。元の構造を保持したまま、服装の変更、アクションの修正、要素の置き換えが可能です。
ネイティブ2K(2048×1080)出力、30fps、複数の品質レベルに対応:480p、720p、1080p。生成あたりの動画長は4〜15秒です。
同じキャラクターを様々な角度から撮影した複数の参照画像をアップロード。Seedance 2.0は、生成された複数のクリップ間で顔、服装、身体プロポーション、アクセサリーの一貫性を維持します。
Seedance 2.0のマルチモーダル参照制御、ネイティブ音声生成、動画編集機能をご覧ください

“@Image1が@Image2の中を歩く、@Video1のカメラワーク、@Audio1の背景音楽”
全モダリティを組み合わせたマルチ参照プロンプト

“@Image1のキャラクターが@Audio1のリズムに合わせて@Image3の環境で踊る”
音声ビート参照でガイドされるキャラクターの動き

“英語の同期音声とスライド遷移を伴うプレゼンテーションを行う人物”
視覚コンテンツと同期したリップシンク台詞

“ステップバイステップのナレーションと台所の環境音を伴う料理チュートリアル”
料理動作と同期したナレーション
Seedance 2.0 FAQ
@-referenceシステムは、プロンプト内の要素を@Image1、@Video1、@Audio1ラベルでタグ付けし、アップロードした参照ファイルにバインドできる機能です。Seedance 2.0は動画参照からカメラの動き、音声からビートリズム、画像から構図スタイルを抽出します。これにより、生成される動画のあらゆる側面を細かく制御できます。
Seedance 2.0は4つの入力モダリティを同時にサポートします:テキストプロンプト(長さ無制限)、最大9枚の参照画像(各30MB以下)、最大3本の動画クリップ(合計2〜15秒、各50MB以下)、最大3本の音声トラック(合計15秒以下、各15MB以下)。ファイル総数制限:リクエストあたり最大12ファイルです。
Seedance 2.0はネイティブ2K(2048×1080)解像度、30fpsで出力し、複数の品質レベル(480p、720p、1080p)に対応しています。生成あたりの動画長は4〜15秒です。対応アスペクト比は横長、縦長、21:9ウルトラワイドです。
Seedance 2.0はデュアルブランチアーキテクチャを採用し、動画と音声の潜在表現を並列処理します。音声は映像と同時に生成されるため、ミリ秒単位の同期が保証されます。多言語リップシンク台詞、動作に合った効果音、雰囲気に適した背景音楽をサポートしています。また、音声参照を入力としてアップロードすることも可能です。
V2V編集は、既存の動画クリップを参照としてアップロードし、その動作パターン、カメラパス、テンポを継承した新しい動画を生成できる機能です。元の動作構造を保持したまま、服装、アクション、シーンの詳細などの特定の要素を変更できます。
Seedance 2.0は動画と音声の参照入力を新たに追加し、画像参照を1枚から9枚に増加、@-referenceシステムによるマルチモーダル制御を導入、V2V動画編集を追加、最大解像度を1080pから2Kに拡張、長さを12秒から15秒に延長し、1.5 Proと比較して約30%高速化されています。
Seedance 2.0は解像度に基づく秒単位の動的料金設定を採用しています:480p(14〜28クレジット/秒)、720p(28.5〜57クレジット/秒)、1080p(640〜3,810クレジット/秒)。標準と高速の2つの速度バリエーションがあり、高速版は約30%高速です。
Seedance 2.0は、精密なモーション制御が必要な映像ディレクター、ポストプロダクション不要でネイティブ音声同期を求めるコンテンツクリエイター、ブランド動画コンテンツを制作する広告主、ナレーション付きチュートリアルを作成する教育者、そしてプロ品質のAI動画と同期サウンドを必要とするすべての方に最適です。
"@-referenceシステムは本当に革新的です。参照クリップからカメラの動きを抽出して即座に適用できる — まったく新しいクリエイティブワークフローです。"
映像ディレクター
"4モダリティ入力は状況を一変させます。キャラクターデザイン、カメラワークの参考、背景音楽をすべて1つのプロンプトに入れれば、思い描いた通りのものが得られるのです。"
モーションデザイナー
"@-referenceシステムは本当に革新的です。参照クリップからカメラの動きを抽出して即座に適用できる — まったく新しいクリエイティブワークフローです。"
映像ディレクター
"4モダリティ入力は状況を一変させます。キャラクターデザイン、カメラワークの参考、背景音楽をすべて1つのプロンプトに入れれば、思い描いた通りのものが得られるのです。"
モーションデザイナー
Seedance 2.0 — ByteDanceが誇る最先端の動画生成AIをオンラインで無料体験