You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Die angezeigten Preise spiegeln die Tarife vom 10. September 2025 wider. Überprüfen Sie die Anbieterdokumentation für aktuelle Preise.
105
+
Die angezeigten Preise entsprechen den Tarifen vom 10. September 2025. Überprüfen Sie die Dokumentation der Anbieter für aktuelle Preise.
85
106
</Callout>
86
107
87
-
## Kostenoptimierungsstrategien
108
+
## Strategien zur Kostenoptimierung
88
109
89
110
-**Modellauswahl**: Wählen Sie Modelle basierend auf der Komplexität der Aufgabe. Einfache Aufgaben können GPT-4.1-nano verwenden, während komplexes Denken möglicherweise o1 oder Claude Opus erfordert.
90
111
-**Prompt-Engineering**: Gut strukturierte, präzise Prompts reduzieren den Token-Verbrauch ohne Qualitätseinbußen.
91
112
-**Lokale Modelle**: Verwenden Sie Ollama oder VLLM für unkritische Aufgaben, um API-Kosten vollständig zu eliminieren.
92
-
-**Caching und Wiederverwendung**: Speichern Sie häufig verwendete Ergebnisse in Variablen oder Dateien, um wiederholte AI-Modellaufrufe zu vermeiden.
93
-
-**Batch-Verarbeitung**: Verarbeiten Sie mehrere Elemente in einer einzigen AI-Anfrage anstatt einzelne Aufrufe zu tätigen.
113
+
-**Caching und Wiederverwendung**: Speichern Sie häufig verwendete Ergebnisse in Variablen oder Dateien, um wiederholte KI-Modellaufrufe zu vermeiden.
114
+
-**Batch-Verarbeitung**: Verarbeiten Sie mehrere Elemente in einer einzigen KI-Anfrage anstatt einzelne Aufrufe zu tätigen.
94
115
95
116
## Nutzungsüberwachung
96
117
97
118
Überwachen Sie Ihre Nutzung und Abrechnung unter Einstellungen → Abonnement:
98
119
99
-
-**Aktuelle Nutzung**: Echtzeit-Nutzung und Kosten für den aktuellen Zeitraum
120
+
-**Aktuelle Nutzung**: Echtzeit-Nutzung und -Kosten für den aktuellen Zeitraum
100
121
-**Nutzungslimits**: Plangrenzen mit visuellen Fortschrittsanzeigen
101
122
-**Abrechnungsdetails**: Prognostizierte Gebühren und Mindestverpflichtungen
102
123
-**Planverwaltung**: Upgrade-Optionen und Abrechnungsverlauf
@@ -86,9 +107,9 @@ El desglose del modelo muestra:
86
107
87
108
## Estrategias de optimización de costos
88
109
89
-
-**Selección de modelo**: Elige modelos según la complejidad de la tarea. Las tareas simples pueden usar GPT-4.1-nano mientras que el razonamiento complejo podría necesitar o1 o Claude Opus.
90
-
-**Ingeniería de prompts**: Los prompts bien estructurados y concisos reducen el uso de tokens sin sacrificar calidad.
91
-
-**Modelos locales**: Usa Ollama o VLLM para tareas no críticas para eliminar completamente los costos de API.
110
+
-**Selección de modelos**: Elige modelos según la complejidad de la tarea. Las tareas simples pueden usar GPT-4.1-nano mientras que el razonamiento complejo podría necesitar o1 o Claude Opus.
111
+
-**Ingeniería de prompts**: Los prompts bien estructurados y concisos reducen el uso de tokens sin sacrificar la calidad.
112
+
-**Modelos locales**: Usa Ollama o VLLM para tareas no críticas para eliminar por completo los costos de API.
92
113
-**Almacenamiento en caché y reutilización**: Guarda resultados frecuentemente utilizados en variables o archivos para evitar llamadas repetidas al modelo de IA.
93
114
-**Procesamiento por lotes**: Procesa múltiples elementos en una sola solicitud de IA en lugar de hacer llamadas individuales.
94
115
@@ -101,7 +122,7 @@ Monitorea tu uso y facturación en Configuración → Suscripción:
101
122
-**Detalles de facturación**: Cargos proyectados y compromisos mínimos
102
123
-**Gestión del plan**: Opciones de actualización e historial de facturación
103
124
104
-
### Seguimiento programático del uso
125
+
### Seguimiento programático de uso
105
126
106
127
Puedes consultar tu uso actual y límites de forma programática utilizando la API:
0 commit comments