|
1 | | - |
2 | | -Les principales fonctions du nœud `CLIPTextEncodeHunyuanDiT` sont : |
3 | | - |
4 | | -- **Tokenization** : Conversion du texte d'entrée en séquences de tokens pouvant être traitées par le modèle. |
5 | | -- **Encodage** : Utilisation du modèle CLIP pour encoder les séquences de tokens en encodages conditionnels. |
6 | | - |
7 | | -Ce nœud peut être considéré comme un "traducteur de langage" qui convertit le texte d'entrée de l'utilisateur (en anglais ou dans d'autres langues) en "langage machine" que les modèles d'IA peuvent comprendre, permettant au modèle de générer du contenu correspondant basé sur ces conditions. |
| 1 | +Le nœud `CLIPTextEncodeHunyuanDiT` a pour fonction principale de convertir le texte d'entrée dans une forme compréhensible par le modèle. C'est un nœud de conditionnement avancé spécialement conçu pour l'architecture à double encodeur de texte du modèle HunyuanDiT. |
| 2 | +Son rôle principal est celui d'un traducteur, convertissant nos descriptions textuelles en "langage machine" que le modèle d'IA peut comprendre. Les entrées `bert` et `mt5xl` préfèrent différents types de prompts. |
8 | 3 |
|
9 | 4 | ## Entrées |
10 | 5 |
|
11 | | -| Paramètre | Type de Données Comfy | Description | |
12 | | -| --------- | -------------------- | ----------- | |
13 | | -| `clip` | `CLIP` | Une instance du modèle CLIP pour la tokenization et l'encodage de texte, essentielle pour générer des conditions. | |
14 | | -| `bert` | `STRING` | Entrée de texte pour l'encodage, prend en charge les prompts multiligne et dynamiques. | |
15 | | -| `mt5xl` | `STRING` | Autre entrée de texte pour l'encodage, prend en charge les prompts multiligne et dynamiques (multilingue). | |
16 | | - |
17 | | -- **Paramètre `bert`** : Adapté à l'entrée de texte en anglais. Il est recommandé d'entrer un texte concis avec contexte pour aider le nœud à générer des représentations de tokens plus précises et significatives. |
18 | | -- **Paramètre `mt5xl`** : Adapté à l'entrée de texte multilingue. Vous pouvez entrer du texte dans n'importe quelle langue pour aider le modèle à comprendre les tâches multilingues. |
| 6 | +| Paramètre | Data Type | Description | |
| 7 | +|-----------|-----------|-------------| |
| 8 | +| `clip` | CLIP | Une instance du modèle CLIP utilisée pour la tokenisation et l'encodage du texte, essentielle pour générer les conditions. | |
| 9 | +| `bert` | STRING | Entrée de texte pour l'encodage, préfère les phrases et mots-clés, prend en charge les prompts multilignes et dynamiques. | |
| 10 | +| `mt5xl` | STRING | Autre entrée de texte pour l'encodage, prend en charge les prompts multilignes et dynamiques (multilingue), peut utiliser des phrases complètes et des descriptions complexes. | |
19 | 11 |
|
20 | 12 | ## Sorties |
21 | 13 |
|
22 | | -| Paramètre | Type de Données Comfy | Description | |
23 | | -| --------- | -------------------- | ----------- | |
24 | | -| `CONDITIONING` | CONDITIONING | Sortie conditionnelle encodée pour un traitement ultérieur dans les tâches de génération. | |
25 | | - |
26 | | -## Méthodes |
27 | | - |
28 | | -- **Méthode d'Encodage** : `encode` |
29 | | - |
30 | | - Cette méthode accepte `clip`, `bert` et `mt5xl` comme paramètres. D'abord, elle tokenize `bert`, puis tokenize `mt5xl`, et stocke les résultats dans un dictionnaire `tokens`. Enfin, elle utilise la méthode `clip.encode_from_tokens_scheduled` pour encoder les tokens en conditions. |
31 | | - |
32 | | -## Contenu Étendu pour le Nœud CLIP Text Encode Hunyuan DiT |
33 | | - |
34 | | -### BERT (Bidirectional Encoder Representations from Transformers) |
35 | | - |
36 | | -BERT est un modèle de représentation du langage bidirectionnel basé sur l'architecture Transformer. |
37 | | - |
38 | | -Il apprend des informations contextuelles riches grâce au pré-entraînement sur de grandes quantités de données textuelles, puis s'affine sur des tâches en aval pour atteindre des performances élevées. |
39 | | - |
40 | | -**Caractéristiques Principales :** |
41 | | - |
42 | | -- **Bidirectionnalité** : BERT considère simultanément les informations contextuelles gauche et droite, permettant une meilleure compréhension du sens des mots. |
43 | | - |
44 | | -- **Pré-entraînement et Affinage** : Grâce aux tâches de pré-entraînement (comme le Masked Language Model et la Next Sentence Prediction), BERT peut être rapidement affiné pour diverses tâches en aval. |
45 | | - |
46 | | -**Scénarios d'Application :** |
47 | | - |
48 | | -- Classification de Texte |
49 | | - |
50 | | -- Reconnaissance d'Entités Nommées |
51 | | - |
52 | | -- Systèmes de Questions-Réponses |
53 | | - |
54 | | -### mT5-XL (Multilingual Text-to-Text Transfer Transformer) |
55 | | - |
56 | | -mT5-XL est la version multilingue du modèle T5, utilisant une architecture encodeur-décodeur qui prend en charge le traitement de plusieurs langues. |
57 | | - |
58 | | -Il unifie toutes les tâches NLP en transformations texte-à-texte, capable de gérer diverses tâches incluant la traduction, le résumé et les questions-réponses. |
59 | | - |
60 | | -**Caractéristiques Principales :** |
61 | | - |
62 | | -- **Support Multilingue** : mT5-XL prend en charge le traitement de jusqu'à 101 langues. |
63 | | - |
64 | | -- **Représentation Unifiée des Tâches** : Conversion de toutes les tâches au format texte-à-texte, simplifiant le pipeline de traitement des tâches. |
65 | | - |
66 | | -**Scénarios d'Application :** |
67 | | - |
68 | | -- Traduction Automatique |
69 | | - |
70 | | -- Résumé de Texte |
71 | | - |
72 | | -- Systèmes de Questions-Réponses |
73 | | - |
74 | | -### Articles de Recherche sur BERT et mT5-XL |
75 | | - |
76 | | -1. [BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding](https://arxiv.org/pdf/1810.04805) |
77 | | - - **Description** : Cet article fondamental présente BERT, un modèle basé sur les transformers qui obtient des résultats état de l'art sur un large éventail de tâches NLP. |
78 | | - |
79 | | -2. [mT5: A Massively Multilingual Pre-trained Text-to-Text Transformer](https://aclanthology.org/2021.naacl-main.41.pdf) |
80 | | - - **Description** : Cet article présente mT5, une variante multilingue de T5, entraînée sur un nouveau jeu de données basé sur Common Crawl couvrant 101 langues. |
81 | | - |
82 | | -3. [mLongT5: A Multilingual and Efficient Text-To-Text Transformer for Longer Sequences](https://arxiv.org/pdf/2112.08760) |
83 | | - - **Description** : Ce travail développe mLongT5, un modèle multilingue conçu pour gérer efficacement les séquences d'entrée plus longues. |
84 | | - |
85 | | -4. [Bridging Linguistic Barriers: Inside Google's mT5 Multilingual Technology](https://medium.com/@rukaiya.rk24/bridging-linguistic-barriers-inside-googles-mt5-multilingual-technology-4a85e6ca056f) |
86 | | - - **Description** : Un article discutant des capacités et applications du modèle mT5 de Google dans les tâches NLP multilingues. |
87 | | - |
88 | | -5. [BERT-related Papers](https://github.com/tomohideshibata/BERT-related-papers) |
89 | | - - **Description** : Une liste organisée d'articles de recherche liés à BERT, incluant des études, des tâches en aval et des modifications. |
| 14 | +| Paramètre | Data Type | Description | |
| 15 | +|-----------|-----------|-------------| |
| 16 | +| `CONDITIONNEMENT` | CONDITIONING | La sortie conditionnelle encodée utilisée pour le traitement ultérieur dans les tâches de génération. | |
0 commit comments