Skip to content

Commit 5c3c45c

Browse files
committed
Update ClipTextEncodeSdxl node docs
1 parent a6463a0 commit 5c3c45c

File tree

7 files changed

+109
-88
lines changed

7 files changed

+109
-88
lines changed
Lines changed: 13 additions & 13 deletions
Original file line numberDiff line numberDiff line change
@@ -1,21 +1,21 @@
1-
This node is designed to encode text inputs using the CLIP model specifically tailored for the SDXL architecture. It focuses on converting textual descriptions into a format that can be effectively utilized for generating or manipulating images, leveraging the capabilities of the CLIP model to understand and process text in the context of visual content.
1+
This node is designed to encode text input using a CLIP model specifically customized for the SDXL architecture. It uses a dual encoder system (CLIP-L and CLIP-G) to process text descriptions, resulting in more accurate image generation.
22

33
## Inputs
44

55
| Parameter | Data Type | Description |
6-
| --- | --- | --- |
7-
| `clip` | `CLIP` | The CLIP model instance used for encoding the text. It plays a vital role in processing the text input and converting it into a format suitable for image generation or manipulation tasks. |
8-
| `width` | `INT` | Specifies the width of the image in pixels. It determines the dimensions of the output image generated or manipulated. |
9-
| `height` | `INT` | Specifies the height of the image in pixels. It determines the dimensions of the output image generated or manipulated. |
10-
| `crop_w` | `INT` | Defines the width of the crop area in pixels. This parameter is used to crop the image to a specific width before processing. |
11-
| `crop_h` | `INT` | Defines the height of the crop area in pixels. This parameter is used to crop the image to a specific height before processing. |
12-
| `target_width` | `INT` | The target width for the output image after processing. It allows for resizing the image to a desired width. |
13-
| `target_height` | `INT` | The target height for the output image after processing. It allows for resizing the image to a desired height. |
14-
| `text_g` | `STRING` | The global textual description to be encoded. This input is crucial for generating the corresponding visual representations and understanding the content described. |
15-
| `text_l` | `STRING` | The local textual description to be encoded. This input provides additional detail or context to the global description, enhancing the specificity of the generated or manipulated image. |
6+
|-----------|-----------|-------------|
7+
| `clip` | CLIP | CLIP model instance used for text encoding. |
8+
| `width` | INT | Specifies the image width in pixels, default 1024. |
9+
| `height` | INT | Specifies the image height in pixels, default 1024. |
10+
| `crop_w` | INT | Width of the crop area in pixels, default 0. |
11+
| `crop_h` | INT | Height of the crop area in pixels, default 0. |
12+
| `target_width` | INT | Target width for the output image, default 1024. |
13+
| `target_height` | INT | Target height for the output image, default 1024. |
14+
| `text_g` | STRING | Global text description for overall scene description. |
15+
| `text_l` | STRING | Local text description for detail description. |
1616

1717
## Outputs
1818

1919
| Parameter | Data Type | Description |
20-
| --- | --- | --- |
21-
| `CONDITIONING` | CONDITIONING | The output of the node, which includes the encoded text along with additional information necessary for image generation or manipulation tasks. |
20+
|-----------|-----------|-------------|
21+
| `CONDITIONING` | CONDITIONING | Contains encoded text and conditional information needed for image generation. |
Lines changed: 17 additions & 17 deletions
Original file line numberDiff line numberDiff line change
@@ -1,21 +1,21 @@
1-
Este nodo está diseñado para codificar las entradas de texto utilizando el modelo CLIP específicamente adaptado para la arquitectura SDXL. Se centra en convertir descripciones textuales en un formato que puede ser utilizado de manera efectiva para generar o manipular imágenes, aprovechando las capacidades del modelo CLIP para entender y procesar texto en el contexto del contenido visual.
1+
Ce nœud est conçu pour encoder le texte d'entrée en utilisant un modèle CLIP spécialement adapté pour l'architecture SDXL. Il utilise un système de double encodeur (CLIP-L et CLIP-G) pour traiter les descriptions textuelles, permettant une génération d'images plus précise.
22

3-
## Entradas
3+
## Entrées
44

5-
| Parámetro | Tipo de Dato | Descripción |
6-
| --- | --- | --- |
7-
| `clip` | `CLIP` | La instancia del modelo CLIP utilizada para codificar el texto. Juega un papel vital en el procesamiento de la entrada de texto y su conversión en un formato adecuado para tareas de generación o manipulación de imágenes. |
8-
| `width` | `INT` | Especifica el ancho de la imagen en píxeles. Determina las dimensiones de la imagen de salida generada o manipulada. |
9-
| `height` | `INT` | Especifica la altura de la imagen en píxeles. Determina las dimensiones de la imagen de salida generada o manipulada. |
10-
| `crop_w` | `INT` | Define el ancho del área de recorte en píxeles. Este parámetro se utiliza para recortar la imagen a un ancho específico antes del procesamiento. |
11-
| `crop_h` | `INT` | Define la altura del área de recorte en píxeles. Este parámetro se utiliza para recortar la imagen a una altura específica antes del procesamiento. |
12-
| `target_width` | `INT` | El ancho objetivo para la imagen de salida después del procesamiento. Permite redimensionar la imagen a un ancho deseado. |
13-
| `target_height` | `INT` | La altura objetivo para la imagen de salida después del procesamiento. Permite redimensionar la imagen a una altura deseada. |
14-
| `text_g` | `STRING` | La descripción textual global que se va a codificar. Esta entrada es crucial para generar las representaciones visuales correspondientes y entender el contenido descrito. |
15-
| `text_l` | `STRING` | La descripción textual local que se va a codificar. Esta entrada proporciona detalles o contexto adicionales a la descripción global, mejorando la especificidad de la imagen generada o manipulada. |
5+
| Paramètre | Data Type | Description |
6+
|-----------|-----------|-------------|
7+
| `clip` | CLIP | Instance du modèle CLIP utilisée pour l'encodage du texte. |
8+
| `width` | INT | Spécifie la largeur de l'image en pixels, par défaut 1024. |
9+
| `height` | INT | Spécifie la hauteur de l'image en pixels, par défaut 1024. |
10+
| `crop_w` | INT | Largeur de la zone de recadrage en pixels, par défaut 0. |
11+
| `crop_h` | INT | Hauteur de la zone de recadrage en pixels, par défaut 0. |
12+
| `target_width` | INT | Largeur cible pour l'image de sortie, par défaut 1024. |
13+
| `target_height` | INT | Hauteur cible pour l'image de sortie, par défaut 1024. |
14+
| `text_g` | STRING | Description textuelle globale pour la description générale de la scène. |
15+
| `text_l` | STRING | Description textuelle locale pour les détails. |
1616

17-
## Salidas
17+
## Sorties
1818

19-
| Parámetro | Tipo de Dato | Descripción |
20-
| --- | --- | --- |
21-
| `CONDITIONING` | CONDITIONING | La salida del nodo, que incluye el texto codificado junto con información adicional necesaria para tareas de generación o manipulación de imágenes. |
19+
| Paramètre | Data Type | Description |
20+
|-----------|-----------|-------------|
21+
| `CONDITIONING` | CONDITIONING | Contient le texte encodé et les informations conditionnelles nécessaires à la génération d'images. |
Lines changed: 15 additions & 15 deletions
Original file line numberDiff line numberDiff line change
@@ -1,21 +1,21 @@
1-
Ce nœud est conçu pour encoder les entrées textuelles en utilisant le modèle CLIP spécifiquement adapté à l'architecture SDXL. Il se concentre sur la conversion des descriptions textuelles en un format qui peut être efficacement utilisé pour générer ou manipuler des images, en tirant parti des capacités du modèle CLIP pour comprendre et traiter le texte dans le contexte du contenu visuel.
1+
Ce nœud est conçu pour encoder le texte d'entrée en utilisant un modèle CLIP spécialement adapté pour l'architecture SDXL. Il utilise un système de double encodeur (CLIP-L et CLIP-G) pour traiter les descriptions textuelles, permettant une génération d'images plus précise.
22

33
## Entrées
44

5-
| Paramètre | Type de Donnée | Description |
6-
| --- | --- | --- |
7-
| `clip` | `CLIP` | L'instance du modèle CLIP utilisée pour encoder le texte. Elle joue un rôle vital dans le traitement de l'entrée textuelle et sa conversion en un format adapté aux tâches de génération ou de manipulation d'images. |
8-
| `width` | `INT` | Spécifie la largeur de l'image en pixels. Elle détermine les dimensions de l'image générée ou manipulée. |
9-
| `height` | `INT` | Spécifie la hauteur de l'image en pixels. Elle détermine les dimensions de l'image générée ou manipulée. |
10-
| `crop_w` | `INT` | Définit la largeur de la zone de recadrage en pixels. Ce paramètre est utilisé pour recadrer l'image à une largeur spécifique avant le traitement. |
11-
| `crop_h` | `INT` | Définit la hauteur de la zone de recadrage en pixels. Ce paramètre est utilisé pour recadrer l'image à une hauteur spécifique avant le traitement. |
12-
| `target_width` | `INT` | La largeur cible pour l'image de sortie après traitement. Elle permet de redimensionner l'image à une largeur souhaitée. |
13-
| `target_height` | `INT` | La hauteur cible pour l'image de sortie après traitement. Elle permet de redimensionner l'image à une hauteur souhaitée. |
14-
| `text_g` | `STRING` | La description textuelle globale à encoder. Cette entrée est cruciale pour générer les représentations visuelles correspondantes et comprendre le contenu décrit. |
15-
| `text_l` | `STRING` | La description textuelle locale à encoder. Cette entrée fournit des détails ou un contexte supplémentaires à la description globale, améliorant la spécificité de l'image générée ou manipulée. |
5+
| Paramètre | Data Type | Description |
6+
|-----------|-----------|-------------|
7+
| `clip` | CLIP | Instance du modèle CLIP utilisée pour l'encodage du texte. |
8+
| `largeur` | INT | Spécifie la largeur de l'image en pixels, par défaut 1024. |
9+
| `hauteur` | INT | Spécifie la hauteur de l'image en pixels, par défaut 1024. |
10+
| `crop_w` | INT | Largeur de la zone de recadrage en pixels, par défaut 0. |
11+
| `crop_h` | INT | Hauteur de la zone de recadrage en pixels, par défaut 0. |
12+
| `largeur_cible` | INT | Largeur cible pour l'image de sortie, par défaut 1024. |
13+
| `hauteur_cible` | INT | Hauteur cible pour l'image de sortie, par défaut 1024. |
14+
| `text_g` | STRING | Description textuelle globale pour la description générale de la scène. |
15+
| `text_l` | STRING | Description textuelle locale pour les détails. |
1616

1717
## Sorties
1818

19-
| Paramètre | Type de Donnée | Description |
20-
| --- | --- | --- |
21-
| `CONDITIONING` | CONDITIONING | La sortie du nœud, qui inclut le texte encodé ainsi que des informations supplémentaires nécessaires pour les tâches de génération ou de manipulation d'images. |
19+
| Paramètre | Data Type | Description |
20+
|-----------|-----------|-------------|
21+
| `CONDITIONNEMENT` | CONDITIONING | Contient le texte encodé et les informations conditionnelles nécessaires à la génération d'images. |
Lines changed: 15 additions & 15 deletions
Original file line numberDiff line numberDiff line change
@@ -1,21 +1,21 @@
1-
このノードは、SDXLアーキテクチャに特化したCLIPモデルを使用してテキスト入力をエンコードするように設計されています。テキスト記述を画像生成や操作に効果的に利用できる形式に変換することに重点を置いており、視覚コンテンツの文脈でテキストを理解し処理するためのCLIPモデルの能力を活用します
1+
このノードは、SDXL アーキテクチャ用に特別にカスタマイズされた CLIP モデルを使用してテキスト入力をエンコードするように設計されています。デュアルエンコーダーシステム(CLIP-L と CLIP-G)を使用してテキストの説明を処理し、より正確な画像生成を実現します
22

33
## 入力
44

5-
| パラメータ | データ型 | 説明 |
6-
| --- | --- | --- |
7-
| `clip` | `CLIP` | テキストをエンコードするために使用されるCLIPモデルインスタンスです。テキスト入力を処理し、画像生成や操作タスクに適した形式に変換する上で重要な役割を果たします|
8-
| `width` | `INT` | 画像の幅をピクセル単位で指定します。生成または操作された出力画像の寸法を決定します|
9-
| `height` | `INT` | 画像の高さをピクセル単位で指定します。生成または操作された出力画像の寸法を決定します|
10-
| `crop_w` | `INT` | ピクセル単位でのクロップ領域の幅を定義します。このパラメータは、処理前に画像を特定の幅にクロップするために使用されます|
11-
| `crop_h` | `INT` | ピクセル単位でのクロップ領域の高さを定義します。このパラメータは、処理前に画像を特定の高さにクロップするために使用されます|
12-
| `target_width` | `INT` | 処理後の出力画像の目標幅です。画像を希望の幅にリサイズすることができます|
13-
| `target_height` | `INT` | 処理後の出力画像の目標高さです。画像を希望の高さにリサイズすることができます|
14-
| `text_g` | `STRING` | エンコードされるグローバルなテキスト記述です。この入力は、対応する視覚表現を生成し、記述された内容を理解するために重要です|
15-
| `text_l` | `STRING` | エンコードされるローカルなテキスト記述です。この入力は、グローバルな記述に追加の詳細や文脈を提供し、生成または操作された画像の特異性を高めます|
5+
| パラメータ名 | Data Type | 説明 |
6+
|------------|-----------|------|
7+
| `クリップ` | CLIP | テキストエンコーディングに使用される CLIP モデルのインスタンス|
8+
| `` | INT | 画像の幅をピクセル単位で指定、デフォルト1024|
9+
| `高さ` | INT | 画像の高さをピクセル単位で指定、デフォルト1024|
10+
| `crop_w` | INT | トリミング領域の幅をピクセル単位で指定、デフォルト0|
11+
| `crop_h` | INT | トリミング領域の高さをピクセル単位で指定、デフォルト0|
12+
| `目標の幅` | INT | 出力画像の目標幅、デフォルト1024|
13+
| `目標の高さ` | INT | 出力画像の目標高さ、デフォルト1024|
14+
| `text_g` | STRING | シーン全体の説明のためのグローバルテキスト記述|
15+
| `text_l` | STRING | 詳細説明のためのローカルテキスト記述|
1616

1717
## 出力
1818

19-
| パラメータ | データ型 | 説明 |
20-
| --- | --- | --- |
21-
| `CONDITIONING` | CONDITIONING | ノードの出力であり、エンコードされたテキストと画像生成や操作タスクに必要な追加情報を含みます|
19+
| パラメータ名 | Data Type | 説明 |
20+
|------------|-----------|------|
21+
| `条件付け` | CONDITIONING | エンコードされたテキストと画像生成に必要な条件情報を含みます|
Lines changed: 15 additions & 15 deletions
Original file line numberDiff line numberDiff line change
@@ -1,21 +1,21 @@
1-
이 노드는 SDXL 아키텍처에 맞춰 특별히 설계된 CLIP 모델을 사용하여 텍스트 입력을 인코딩하도록 설계되었습니다. 이 노드는 텍스트 설명을 이미지 생성 또는 조작에 효과적으로 활용할 수 있는 형식으로 변환하는 데 중점을 두며, 시각적 콘텐츠의 맥락에서 텍스트를 이해하고 처리하는 CLIP 모델의 기능을 활용합니다.
1+
이 노드는 SDXL 아키텍처를 위해 특별히 커스터마이즈된 CLIP 모델을 사용하여 텍스트 입력을 인코딩하도록 설계되었습니다. 이중 인코더 시스템(CLIP-L과 CLIP-G)을 사용하여 텍스트 설명을 처리하여 더 정확한 이미지 생성을 가능하게 합니다.
22

33
## 입력
44

5-
| 매개변수 | 데이터 유형 | 설명 |
6-
| --------------- | ----------- | -------------------------------------------------------------------------------------------------------------------------------------------------------------------- |
7-
| `clip` | `CLIP` | 텍스트를 인코딩하는 데 사용되는 CLIP 모델 인스턴스입니다. 텍스트 입력을 처리하고 이를 이미지 생성 또는 조작 작업에 적합한 형식으로 변환하는 데 중요한 역할을 합니다. |
8-
| `width` | `INT` | 이미지의 너비를 픽셀 단위로 지정합니다. 생성되거나 조작된 출력 이미지의 크기를 결정합니다. |
9-
| `height` | `INT` | 이미지의 높이를 픽셀 단위로 지정합니다. 생성되거나 조작된 출력 이미지의 크기를 결정합니다. |
10-
| `crop_w` | `INT` | 자르기 영역의 너비를 픽셀 단위로 정의합니다. 이 매개변수는 처리 전에 이미지를 특정 너비로 자르는 데 사용됩니다. |
11-
| `crop_h` | `INT` | 자르기 영역의 높이를 픽셀 단위로 정의합니다. 이 매개변수는 처리 전에 이미지를 특정 높이로 자르는 데 사용됩니다. |
12-
| `target_width` | `INT` | 처리 후 출력 이미지의 목표 너비입니다. 원하는 너비로 이미지를 크기 조정할 수 있습니다. |
13-
| `target_height` | `INT` | 처리 후 출력 이미지의 목표 높이입니다. 원하는 높이로 이미지를 크기 조정할 수 있습니다. |
14-
| `text_g` | `STRING` | 인코딩할 전역 텍스트 설명입니다. 이 입력은 해당 시각적 표현을 생성하고 설명된 내용을 이해하는 데 중요합니다. |
15-
| `text_l` | `STRING` | 인코딩할 로컬 텍스트 설명입니다. 이 입력은 전역 설명에 추가적인 세부 정보나 맥락을 제공하여 생성되거나 조작된 이미지의 구체성을 향상시킵니다. |
5+
| 매개변수 | 데이터 유형 | 설명 |
6+
|----------|------------|------|
7+
| `clip` | CLIP | 텍스트 인코딩에 사용되는 CLIP 모델 인스턴스입니다. |
8+
| `너비` | INT | 이미지의 너비를 픽셀 단위로 지정합니다. 기본값 1024. |
9+
| `높이` | INT | 이미지의 높이를 픽셀 단위로 지정합니다. 기본값 1024. |
10+
| `크롭 너비` | INT | 자르기 영역의 너비를 픽셀 단위로 지정합니다. 기본값 0. |
11+
| `크롭 높이` | INT | 자르기 영역의 높이를 픽셀 단위로 지정합니다. 기본값 0. |
12+
| `목표 너비` | INT | 출력 이미지의 목표 너비입니다. 기본값 1024. |
13+
| `목표 높이` | INT | 출력 이미지의 목표 높이입니다. 기본값 1024. |
14+
| `text_g` | STRING | 전체 장면 설명을 위한 전역 텍스트 설명입니다. |
15+
| `text_l` | STRING | 세부 사항 설명을 위한 지역 텍스트 설명입니다. |
1616

1717
## 출력
1818

19-
| 매개변수 | 데이터 유형 | 설명 |
20-
| -------------- | ------------ | ---------------------------------------------------------------------------------------------- |
21-
| `CONDITIONING` | CONDITIONING | 노드의 출력으로, 인코딩된 텍스트와 이미지 생성 또는 조작 작업에 필요한 추가 정보를 포함합니다. |
19+
| 매개변수 | 데이터 유형 | 설명 |
20+
|----------|------------|------|
21+
| `조건` | CONDITIONING | 인코딩된 텍스트와 이미지 생성에 필요한 조건부 정보를 포함합니다. |

0 commit comments

Comments
 (0)