5つのリファレンス、1つのNSFWシーン





ドラッグで比較。左:5つのリファレンス。右:R2Vの出力。
エディターで試すReference-to-Videoの仕組み
- 01
リファレンスをアップロード
最大5つの画像または短い動画をドロップ。それぞれがキャラ、動き、背景、スタイルなど異なる軸を担当します。
- 02
開始フレームを固定
動画の最初に表示するフレームを選択。任意 — スキップすればジェネレーターが選びます。
- 03
@reference付きプロンプトを書く
シーンを記述。@ref1のようにタグを付けて、本人を正しい被写体に紐づけます。
Two women on a couch, @ref1 in red, @ref2 in black - 04
生成
解像度(720pまたは1080p)と尺(5、10、15秒)を選び、生成。
Reference-to-Video NSFWの使い方6選
カップル
2つのキャラリファレンスを1つの親密シーンにレンダリング。
衣装スワップ
同じキャラに、衣装リファレンスから別の服装を当てる。
スタイル転送
あなたのキャラを、リファレンスから引いたアニメ調でレンダリング。
背景スワップ
同じ被写体に、背景リファレンスから別のシチュエーションを当てる。
動画から動きを取得
動きを言葉で書くのではなく、短い動画リファレンスから振付を駆動。
マルチ被写体シーン
3人以上のキャラを1フレームに、各人別々のリファレンスから。
Reference-to-Video vs Image-to-Video NSFW
キャラの一貫性
Image-to-videoは1つのソースフレームから本人性を推定するため、3秒を超えると顔が崩れ始めます。R2Vは顔の特徴に専用枠を割り当て、毎フレームで再アンカー。5、10、15秒のクリップで、カメラや衣装が変わっても同じルックを保持します。
マルチキャラシーン
1枚画像ジェネレーターは学習元が1つしかないため、被写体も1人しか動かせません。R2Vは最大5つの個別リファレンスを受け取り、プロンプトで@ref1、@ref2のようにタグ付け可能。同じショット内でカップルやグループシーンを、各人の顔を明確に保ったまま構成。
モーションコントロール
プロンプトだけで動きを指定すると情報が落ちてしまいます — タイミングや正確なポーズはテキストでは捉えにくいからです。R2Vは短い動画リファレンスを読み取り、振付をあなたのキャラにフレーム単位で再適用します。「ゆっくり腰を振り、0:02で頭を右に傾ける」と書いてモデルが従ってくれるのを祈るより、ずっと早くて確実です。
背景とスタイル
1枚画像ツールは背景・ライティング・画風を1枚に焼き付けてしまうため、1つだけ変えようとしても全部まとめて失われます。R2Vはそれぞれを独立したリファレンス枠に分けるので、ソース画像を作り直さずに組み替えられます。寝室をビーチに変える、アニメ調リファレンスを写実的な顔と組み合わせるなど、1要素ずつ差し替え可能です。
まだ1枚画像動画ですか? まず基本フローを試す.
生成できる範囲
- リファレンス5枚
- 開始フレーム固定
- 720p / 1080p
- 5 / 10 / 15秒
- 5アスペクト比
- @reference構文
- ネガティブプロンプト
- 被写体別ボイス
稼働上の上限はこれですべて。
18+専用 · 実在人物のリファレンス不可 · 架空コンテンツのみ。
Reference-to-Video FAQ
Reference-to-Videoを始める準備は?
エディターを開いてリファレンスを入れれば、最初のマルチキャラ動画まで数分。
18+専用 · 実在人物のリファレンス不可 · 架空コンテンツのみ
