Reference-to-Video NSFW para escenas multi-personaje
El vídeo NSFW de una sola imagen choca con un muro de consistencia de personaje. Referencia hasta 5 imágenes o vídeos y fija identidad, movimiento y estilo en cada frame.
- 5 referencias
- 720p / 1080p
- 5 / 10 / 15s
5 referencias, una escena NSFW





Arrastra para comparar. Izquierda: tus 5 referencias. Derecha: la salida R2V.
Probarlo en el editorCómo funciona Reference-to-Video
- 01
Subir referencias
Suelta hasta 5 imágenes o vídeos cortos. Cada uno ancla una dimensión distinta — personaje, movimiento, fondo o estilo.
- 02
Bloquear frame inicial
Elige el primer frame con el que abre el vídeo. Opcional — sáltalo y el generador lo elige por ti.
- 03
Escribir prompt con @reference
Describe la escena. Etiqueta referencias específicas como @ref1 para fijar la identidad al sujeto correcto.
Two women on a couch, @ref1 in red, @ref2 in black - 04
Generar
Elige resolución (720p o 1080p) y duración (5, 10 o 15 segundos), luego genera.
6 casos de uso de Reference-to-Video NSFW
Pareja junta
Dos referencias de personaje renderizadas en una escena íntima.
Cambio de vestuario
Mismo personaje, ropa distinta tomada de una referencia de vestuario.
Transferencia de estilo
Tu personaje, renderizado en estilo anime tomado de una referencia.
Cambio de fondo
Mismo sujeto, escenario distinto tomado de una referencia de fondo.
Movimiento desde vídeo
Dirige la coreografía desde una referencia de vídeo corto en vez de describirla.
Escena multi-sujeto
Tres o más personajes en un frame, cada uno desde una referencia distinta.
Reference-to-Video vs Image-to-Video NSFW
Consistencia de personaje
Image-to-video infiere la identidad de un frame fuente, así que las caras empiezan a desviarse o fundirse pasada la marca de los 3 segundos. R2V dedica una ranura aparte a los rasgos faciales y los re-ancla en cada frame. Tu personaje mantiene el mismo aspecto en clips de 5, 10 o 15 segundos — incluso cuando cambia la cámara o el vestuario.
Escenas multi-personaje
Los generadores de una sola imagen solo animan un sujeto porque solo tienen una fuente para aprender. R2V toma hasta 5 referencias separadas y deja etiquetarlas en el prompt con @ref1, @ref2, y así. Compón parejas o escenas grupales enteras donde cada cara queda distinta en el mismo plano.
Control de movimiento
El movimiento descrito solo con prompt pierde precisión — el texto rara vez captura el timing o la pose exacta que tienes en mente. R2V lee una referencia de vídeo corto y reaplica la coreografía a tu personaje, frame a frame. Más fácil que teclear «balanceo lento de caderas, cabeza ladeada a la derecha en 0:02» y rezar para que el modelo lo pille.
Fondo y estilo
Las herramientas de una sola imagen funden fondo, iluminación y estilo artístico en una sola capa — cambias uno y los pierdes todos. R2V separa cada elemento en su propia ranura de referencia, así combinas sin reconstruir la imagen fuente. Cambia un dormitorio por una playa, o empareja una referencia de estilo anime con una cara fotorrealista — un cambio cada vez.
¿Aún con vídeo de una sola imagen? Prueba primero el flujo básico.
Qué puedes generar
- 5 referencias
- Bloqueo de frame inicial
- 720p / 1080p
- 5 / 10 / 15s
- 5 proporciones
- Sintaxis @reference
- Prompts negativos
- Voz por sujeto
Estos son los límites de operación, y no hay más.
Solo 18+ · Sin referencias de personas reales · Solo contenido ficticio.
Preguntas frecuentes de Reference-to-Video
¿Listo para Reference-to-Video?
Abre el editor, suelta tus referencias y estás a unos minutos de tu primer vídeo multi-personaje.
Solo 18+ · Sin referencias de personas reales · Solo contenido ficticio
