|
1 | | -Codificación de Texto: Utiliza el modelo CLIP para codificar la entrada de texto en clip_l, capturando características clave e información semántica del texto. |
2 | | -Comprensión Mejorada del Texto: Emplea el modelo de lenguaje grande T5XXL para procesar la entrada t5xxl, potencialmente expandiendo o refinando descripciones de texto para proporcionar información semántica más rica. |
3 | | -Fusión Multimodal: Combina los resultados del procesamiento de CLIP y T5XXL para crear una representación textual más completa. |
4 | | -Control de Generación: Ajusta la influencia de los mensajes de texto en la generación de imágenes a través del parámetro de guía, permitiendo a los usuarios encontrar un equilibrio entre la libertad creativa y la estricta adherencia a los mensajes. |
5 | | -Generación de Datos Condicionales: Produce datos condicionales procesados, que se utilizarán en procesos de generación de imágenes posteriores para asegurar que las imágenes generadas coincidan con las descripciones textuales. |
| 1 | +`CodificarTextoCLIPFlux` es un nodo avanzado de codificación de texto en ComfyUI, diseñado específicamente para la arquitectura Flux. Utiliza un mecanismo de doble codificador (CLIP-L y T5XXL) para procesar tanto palabras clave estructuradas como descripciones detalladas en lenguaje natural, proporcionando al modelo Flux una comprensión textual más precisa y completa para mejorar la calidad de la generación de imágenes a partir de texto. |
| 2 | + |
| 3 | +Este nodo se basa en la colaboración de dos codificadores: |
| 4 | +1. La entrada `clip_l` es procesada por el codificador CLIP-L, extrayendo características como estilo y tema, ideal para descripciones concisas. |
| 5 | +2. La entrada `t5xxl` es procesada por el codificador T5XXL, especializado en comprender descripciones complejas y detalladas en lenguaje natural. |
| 6 | +3. Los resultados de ambos codificadores se fusionan y, junto con el parámetro `orientación`, generan una incrustación condicional unificada (`ACONDICIONAMIENTO`) para los nodos de muestreo Flux, controlando el grado de coincidencia entre el contenido generado y la descripción textual. |
6 | 7 |
|
7 | 8 | ## Entradas |
8 | 9 |
|
9 | | -| Nombre del Parámetro | Tipo de Dato | Función | |
10 | | -|----------------------|---------------|---------| |
11 | | -| clip | CLIP | Entrada del objeto del modelo CLIP, utilizado para la codificación y procesamiento de texto, típicamente usado con DualCLIPLoader | |
12 | | -| clip_l | CADENA | Entrada de texto en múltiples líneas, ingresa texto similar a la información de etiquetas para la codificación del modelo CLIP | |
13 | | -| t5xxl | CADENA | Entrada de texto en múltiples líneas, ingresa descripciones de mensajes en lenguaje natural para la codificación del modelo T5XXL | |
14 | | -| guidance | FLOAT | Valor de punto flotante, utilizado para guiar el proceso de generación; valores más altos aumentan la coincidencia entre imagen y mensaje, pero pueden reducir la creatividad | |
| 10 | +| Nombre del parámetro | Tipo de dato | Método de entrada | Valor por defecto | Rango | Función | |
| 11 | +|---------------------|--------------|-------------------|-------------------|-------|---------| |
| 12 | +| `clip` | CLIP | Entrada de nodo | Ninguno | - | Debe ser un modelo CLIP compatible con Flux, que incluya los codificadores CLIP-L y T5XXL | |
| 13 | +| `clip_l` | STRING | Caja de texto | Ninguno | Hasta 77 tokens | Adecuado para descripciones concisas de palabras clave, como estilo o tema | |
| 14 | +| `t5xxl` | STRING | Caja de texto | Ninguno | Prácticamente ilimitado | Adecuado para descripciones detalladas en lenguaje natural, expresando escenas y detalles complejos | |
| 15 | +| `orientación` | FLOAT | Deslizador | 3.5 | 0.0 - 100.0 | Controla la influencia de las condiciones textuales en el proceso de generación; valores más altos significan mayor adherencia al texto | |
15 | 16 |
|
16 | 17 | ## Salidas |
17 | 18 |
|
18 | | -| Nombre del Parámetro | Tipo de Dato | Función | |
19 | | -|----------------------|---------------|---------| |
20 | | -| CONDITIONING | Condición | Contiene datos condicionales (cond) para tareas de generación condicional posteriores | |
| 19 | +| Nombre de salida | Tipo de dato | Función | |
| 20 | +|--------------------|-----------------|---------| |
| 21 | +| `ACONDICIONAMIENTO`| CONDITIONING | Contiene la incrustación fusionada de ambos codificadores y el parámetro de orientación, utilizada para la generación condicional de imágenes | |
| 22 | + |
| 23 | +## Ejemplos de uso |
| 24 | + |
| 25 | +### Ejemplos de mensajes |
| 26 | + |
| 27 | +- **Entrada clip_l** (palabras clave): |
| 28 | + - Utiliza combinaciones estructuradas y concisas de palabras clave |
| 29 | + - Ejemplo: `masterpiece, best quality, portrait, oil painting, dramatic lighting` |
| 30 | + - Enfócate en el estilo, la calidad y el tema principal |
| 31 | + |
| 32 | +- **Entrada t5xxl** (descripción en lenguaje natural): |
| 33 | + - Utiliza descripciones completas y fluidas de la escena |
| 34 | + - Ejemplo: `A highly detailed portrait in oil painting style, featuring dramatic chiaroscuro lighting that creates deep shadows and bright highlights, emphasizing the subject's features with renaissance-inspired composition.` |
| 35 | + - Enfócate en los detalles de la escena, relaciones espaciales y efectos de luz |
| 36 | + |
| 37 | +### Notas |
| 38 | + |
| 39 | +1. Asegúrate de usar un modelo CLIP compatible con la arquitectura Flux |
| 40 | +2. Se recomienda rellenar tanto `clip_l` como `t5xxl` para aprovechar la ventaja del doble codificador |
| 41 | +3. Ten en cuenta el límite de 77 tokens para `clip_l` |
| 42 | +4. Ajusta el parámetro `orientación` según los resultados generados |
0 commit comments