Skip to content

Commit 22e6972

Browse files
authored
Merge pull request #34 from Comfy-Org/ClipTextEncodeSdxlRefiner
Update ClipTextEncodeSdxlRefiner docs
2 parents 4c82de2 + b8350b7 commit 22e6972

File tree

8 files changed

+224
-67
lines changed

8 files changed

+224
-67
lines changed

comfyui_embedded_docs/docs/ClipTextEncodeSdxl/es.md

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -18,4 +18,4 @@ Ce nœud est conçu pour encoder le texte d'entrée en utilisant un modèle CLIP
1818

1919
| Paramètre | Data Type | Description |
2020
|-----------|-----------|-------------|
21-
| `CONDITIONING` | CONDITIONING | Contient le texte encodé et les informations conditionnelles nécessaires à la génération d'images. |
21+
| `ACONDICIONAMIENTO` | CONDITIONING | Contient le texte encodé et les informations conditionnelles nécessaires à la génération d'images. |
Lines changed: 31 additions & 11 deletions
Original file line numberDiff line numberDiff line change
@@ -1,17 +1,37 @@
1-
This node specializes in refining the encoding of text inputs using CLIP models, enhancing the conditioning for generative tasks by incorporating aesthetic scores and dimensions.
1+
This node is specifically designed for the SDXL Refiner model to convert text prompts into conditioning information by incorporating aesthetic scores and dimensional information to enhance the conditions for generation tasks, thereby improving the final refinement effect. It acts like a professional art director, not only conveying your creative intent but also injecting precise aesthetic standards and specification requirements into the work.
2+
3+
## About SDXL Refiner
4+
5+
SDXL Refiner is a specialized refinement model that focuses on enhancing image details and quality based on the SDXL base model. This process is like having an art retoucher:
6+
7+
1. First, it receives preliminary images or text descriptions generated by the base model
8+
2. Then, it guides the refinement process through precise aesthetic scoring and dimensional parameters
9+
3. Finally, it focuses on processing high-frequency image details to improve overall quality
10+
11+
Refiner can be used in two ways:
12+
- As a standalone refinement step for post-processing images generated by the base model
13+
- As part of an expert integration system, taking over processing during the low-noise phase of generation
214

315
## Inputs
416

5-
| Parameter | Data Type | Description |
6-
| --- | --- | --- |
7-
| `clip` | `CLIP` | A CLIP model instance used for text tokenization and encoding, central to generating the conditioning. |
8-
| `ascore` | `FLOAT` | The aesthetic score parameter influences the conditioning output by providing a measure of aesthetic quality. |
9-
| `width` | `INT` | Specifies the width of the output conditioning, affecting the dimensions of the generated content. |
10-
| `height` | `INT` | Determines the height of the output conditioning, influencing the dimensions of the generated content. |
11-
| `text` | `STRING` | The text input to be encoded, serving as the primary content descriptor for conditioning. |
17+
| Parameter Name | Data Type | Input Type | Default Value | Value Range | Description |
18+
|----------------|-----------|------------|---------------|-------------|-------------|
19+
| `clip` | CLIP | Required | - | - | CLIP model instance used for text tokenization and encoding, the core component for converting text into model-understandable format |
20+
| `ascore` | FLOAT | Optional | 6.0 | 0.0-1000.0 | Controls the visual quality and aesthetics of generated images, similar to setting quality standards for artwork:<br/>- High scores(7.5-8.5): Pursues more refined, detail-rich effects<br/>- Medium scores(6.0-7.0): Balanced quality control<br/>- Low scores(2.0-3.0): Suitable for negative prompts |
21+
| `width` | INT | Required | 1024 | 64-16384 | Specifies output image width (pixels), must be multiple of 8. SDXL performs best when total pixel count is close to 1024×1024 (about 1M pixels) |
22+
| `height` | INT | Required | 1024 | 64-16384 | Specifies output image height (pixels), must be multiple of 8. SDXL performs best when total pixel count is close to 1024×1024 (about 1M pixels) |
23+
| `text` | STRING | Required | - | - | Text prompt description, supports multi-line input and dynamic prompt syntax. In Refiner, text prompts should focus more on describing desired visual quality and detail characteristics |
1224

1325
## Outputs
1426

15-
| Parameter | Data Type | Description |
16-
| --- | --- | --- |
17-
| `CONDITIONING` | CONDITIONING | The refined conditioning output, enriched with aesthetic scores and dimensions for enhanced content generation. |
27+
| Output Name | Data Type | Description |
28+
|-------------|-----------|-------------|
29+
| `CONDITIONING` | CONDITIONING | Refined conditional output containing integrated encoding of text semantics, aesthetic standards, and dimensional information, specifically for guiding SDXL Refiner model in precise image refinement |
30+
31+
## Notes
32+
33+
1. This node is specifically optimized for the SDXL Refiner model and differs from regular CLIPTextEncode nodes
34+
2. An aesthetic score of 7.5 is recommended as the baseline, which is the standard setting used in SDXL training
35+
3. All dimensional parameters must be multiples of 8, and total pixel count close to 1024×1024 (about 1M pixels) is recommended
36+
4. The Refiner model focuses on enhancing image details and quality, so text prompts should emphasize desired visual effects rather than scene content
37+
5. In practical use, Refiner is typically used in the later stages of generation (approximately the last 20% of steps), focusing on detail optimization
Lines changed: 31 additions & 11 deletions
Original file line numberDiff line numberDiff line change
@@ -1,17 +1,37 @@
1-
Este nodo se especializa en refinar la codificación de las entradas de texto utilizando modelos CLIP, mejorando el condicionamiento para tareas generativas al incorporar puntuaciones estéticas y dimensiones.
1+
Este nodo está específicamente diseñado para el modelo SDXL Refiner para convertir indicaciones textuales en información de acondicionamiento mediante la incorporación de puntuaciones estéticas e información dimensional para mejorar las condiciones de las tareas de generación, mejorando así el efecto de refinamiento final. Actúa como un director de arte profesional, no solo transmitiendo tu intención creativa sino también inyectando estándares estéticos precisos y requisitos de especificación en el trabajo.
2+
3+
## Acerca de SDXL Refiner
4+
5+
SDXL Refiner es un modelo de refinamiento especializado que se centra en mejorar los detalles y la calidad de la imagen basándose en el modelo base SDXL. Este proceso es como tener un retocador de arte:
6+
7+
1. Primero, recibe imágenes preliminares o descripciones textuales generadas por el modelo base
8+
2. Luego, guía el proceso de refinamiento a través de puntuación estética precisa y parámetros dimensionales
9+
3. Finalmente, se centra en procesar detalles de imagen de alta frecuencia para mejorar la calidad general
10+
11+
El Refiner se puede usar de dos maneras:
12+
- Como un paso de refinamiento independiente para el post-procesamiento de imágenes generadas por el modelo base
13+
- Como parte de un sistema de integración experto, tomando el control del procesamiento durante la fase de bajo ruido de la generación
214

315
## Entradas
416

5-
| Parámetro | Tipo de Dato | Descripción |
6-
| --- | --- | --- |
7-
| `clip` | `CLIP` | Una instancia del modelo CLIP utilizada para la tokenización y codificación de texto, central para generar el condicionamiento. |
8-
| `ascore` | `FLOAT` | El parámetro de puntuación estética influye en la salida del condicionamiento al proporcionar una medida de calidad estética. |
9-
| `width` | `INT` | Especifica el ancho del condicionamiento de salida, afectando las dimensiones del contenido generado. |
10-
| `height` | `INT` | Determina la altura del condicionamiento de salida, influyendo en las dimensiones del contenido generado. |
11-
| `text` | `STRING` | La entrada de texto a codificar, que sirve como el descriptor principal del contenido para el condicionamiento. |
17+
| Nombre del Parámetro | Data Type | Tipo de Entrada | Valor Predeterminado | Rango de Valores | Descripción |
18+
|----------------------|-----------|-----------------|---------------------|------------------|-------------|
19+
| `clip` | CLIP | Requerido | - | - | Instancia del modelo CLIP utilizada para la tokenización y codificación de texto, el componente central para convertir texto en formato comprensible para el modelo |
20+
| `ascore` | FLOAT | Opcional | 6.0 | 0.0-1000.0 | Controla la calidad visual y la estética de las imágenes generadas, similar a establecer estándares de calidad para obras de arte:<br/>- Puntuaciones altas(7.5-8.5): Busca efectos más refinados y ricos en detalles<br/>- Puntuaciones medias(6.0-7.0): Control de calidad equilibrado<br/>- Puntuaciones bajas(2.0-3.0): Adecuado para indicaciones negativas |
21+
| `width` | INT | Requerido | 1024 | 64-16384 | Especifica el ancho de la imagen de salida (píxeles), debe ser múltiplo de 8. SDXL funciona mejor cuando el recuento total de píxeles está cerca de 1024×1024 (aproximadamente 1M píxeles) |
22+
| `height` | INT | Requerido | 1024 | 64-16384 | Especifica la altura de la imagen de salida (píxeles), debe ser múltiplo de 8. SDXL funciona mejor cuando el recuento total de píxeles está cerca de 1024×1024 (aproximadamente 1M píxeles) |
23+
| `text` | STRING | Requerido | - | - | Descripción de la indicación de texto, admite entrada multilínea y sintaxis de indicación dinámica. En Refiner, las indicaciones de texto deben centrarse más en describir la calidad visual deseada y las características de detalle |
1224

1325
## Salidas
1426

15-
| Parámetro | Tipo de Dato | Descripción |
16-
| --- | --- | --- |
17-
| `CONDITIONING` | CONDITIONING | La salida de condicionamiento refinada, enriquecida con puntuaciones estéticas y dimensiones para una generación de contenido mejorada.
27+
| Nombre de Salida | Data Type | Descripción |
28+
|------------------|-----------|-------------|
29+
| `ACONDICIONAMIENTO` | CONDITIONING | Salida condicional refinada que contiene codificación integrada de semántica textual, estándares estéticos e información dimensional, específicamente para guiar al modelo SDXL Refiner en el refinamiento preciso de imágenes |
30+
31+
## Notas
32+
33+
1. Este nodo está específicamente optimizado para el modelo SDXL Refiner y difiere de los nodos CLIPTextEncode regulares
34+
2. Se recomienda una puntuación estética de 7.5 como línea base, que es la configuración estándar utilizada en el entrenamiento de SDXL
35+
3. Todos los parámetros dimensionales deben ser múltiplos de 8, y se recomienda un recuento total de píxeles cercano a 1024×1024 (aproximadamente 1M píxeles)
36+
4. El modelo Refiner se centra en mejorar los detalles y la calidad de la imagen, por lo que las indicaciones de texto deben enfatizar los efectos visuales deseados en lugar del contenido de la escena
37+
5. En el uso práctico, Refiner se utiliza típicamente en las últimas etapas de generación (aproximadamente el último 20% de los pasos), centrándose en la optimización de detalles
Lines changed: 31 additions & 11 deletions
Original file line numberDiff line numberDiff line change
@@ -1,17 +1,37 @@
1-
Ce nœud se spécialise dans l'affinage de l'encodage des entrées textuelles en utilisant les modèles CLIP, améliorant le conditionnement pour les tâches génératives en incorporant des scores esthétiques et des dimensions.
1+
Ce nœud est spécialement conçu pour le modèle SDXL Refiner pour convertir les prompts textuels en informations de conditionnement en incorporant des scores esthétiques et des informations dimensionnelles pour améliorer les conditions des tâches de génération, améliorant ainsi l'effet de raffinement final. Il agit comme un directeur artistique professionnel, non seulement en transmettant votre intention créative mais aussi en injectant des standards esthétiques précis et des exigences de spécification dans le travail.
2+
3+
## À propos de SDXL Refiner
4+
5+
SDXL Refiner est un modèle de raffinement spécialisé qui se concentre sur l'amélioration des détails et de la qualité de l'image basé sur le modèle de base SDXL. Ce processus est comme avoir un retoucheur d'art :
6+
7+
1. D'abord, il reçoit les images préliminaires ou les descriptions textuelles générées par le modèle de base
8+
2. Ensuite, il guide le processus de raffinement à travers un scoring esthétique précis et des paramètres dimensionnels
9+
3. Enfin, il se concentre sur le traitement des détails d'image haute fréquence pour améliorer la qualité globale
10+
11+
Le Refiner peut être utilisé de deux manières :
12+
- Comme une étape de raffinement autonome pour le post-traitement des images générées par le modèle de base
13+
- Comme partie d'un système d'intégration expert, prenant le relais du traitement pendant la phase de faible bruit de la génération
214

315
## Entrées
416

5-
| Paramètre | Type de Donnée | Description |
6-
| --- | --- | --- |
7-
| `clip` | `CLIP` | Une instance du modèle CLIP utilisée pour la tokenisation et l'encodage du texte, centrale pour générer le conditionnement. |
8-
| `ascore` | `FLOAT` | Le paramètre de score esthétique influence la sortie de conditionnement en fournissant une mesure de la qualité esthétique. |
9-
| `width` | `INT` | Spécifie la largeur du conditionnement de sortie, affectant les dimensions du contenu généré. |
10-
| `height` | `INT` | Détermine la hauteur du conditionnement de sortie, influençant les dimensions du contenu généré. |
11-
| `text` | `STRING` | L'entrée textuelle à encoder, servant de descripteur de contenu principal pour le conditionnement. |
17+
| Nom du paramètre | Type de données | Type d'entrée | Valeur par défaut | Plage de valeurs | Description |
18+
|-----------------|-----------------|----------------|-------------------|------------------|-------------|
19+
| `clip` | CLIP | Required | - | - | Instance du modèle CLIP utilisée pour la tokenisation et l'encodage du texte, le composant central pour convertir le texte en format compréhensible par le modèle |
20+
| `ascore` | FLOAT | Optional | 6.0 | 0.0-1000.0 | Contrôle la qualité visuelle et l'esthétique des images générées, similaire à la définition de standards de qualité pour l'œuvre :<br/>- Scores élevés (7.5-8.5) : Recherche des effets plus raffinés et riches en détails<br/>- Scores moyens (6.0-7.0) : Contrôle de qualité équilibré<br/>- Scores bas (2.0-3.0) : Adapté aux prompts négatifs |
21+
| `largeur` | INT | Required | 1024 | 64-16384 | Spécifie la largeur de l'image de sortie (pixels), doit être un multiple de 8. SDXL fonctionne mieux quand le nombre total de pixels est proche de 1024×1024 (environ 1M pixels) |
22+
| `hauteur` | INT | Required | 1024 | 64-16384 | Spécifie la hauteur de l'image de sortie (pixels), doit être un multiple de 8. SDXL fonctionne mieux quand le nombre total de pixels est proche de 1024×1024 (environ 1M pixels) |
23+
| `text` | STRING | Required | - | - | Description du prompt textuel, supporte l'entrée multi-lignes et la syntaxe de prompt dynamique. Dans Refiner, les prompts textuels doivent se concentrer davantage sur la description de la qualité visuelle désirée et les caractéristiques des détails |
1224

1325
## Sorties
1426

15-
| Paramètre | Type de Donnée | Description |
16-
| --- | --- | --- |
17-
| `CONDITIONING` | CONDITIONING | La sortie de conditionnement affinée, enrichie de scores esthétiques et de dimensions pour une génération de contenu améliorée. |
27+
| Nom de sortie | Type de données | Description |
28+
|---------------|-----------------|-------------|
29+
| `CONDITIONNEMENT` | CONDITIONING | Sortie conditionnelle raffinée contenant l'encodage intégré de la sémantique du texte, des standards esthétiques et des informations dimensionnelles, spécifiquement pour guider le modèle SDXL Refiner dans le raffinement précis de l'image |
30+
31+
## Notes
32+
33+
1. Ce nœud est spécifiquement optimisé pour le modèle SDXL Refiner et diffère des nœuds CLIPTextEncode réguliers
34+
2. Un score esthétique de 7.5 est recommandé comme référence, qui est le paramètre standard utilisé dans l'entraînement SDXL
35+
3. Tous les paramètres dimensionnels doivent être des multiples de 8, et un nombre total de pixels proche de 1024×1024 (environ 1M pixels) est recommandé
36+
4. Le modèle Refiner se concentre sur l'amélioration des détails et de la qualité de l'image, donc les prompts textuels doivent mettre l'accent sur les effets visuels désirés plutôt que sur le contenu de la scène
37+
5. Dans l'utilisation pratique, Refiner est typiquement utilisé dans les dernières étapes de la génération (environ les 20% derniers pas), se concentrant sur l'optimisation des détails

0 commit comments

Comments
 (0)