Kostenloser LLM Token Rechner

Tokens zählen und API-Kosten berechnen für GPT-4o, Claude, Gemini, DeepSeek & LLaMA — sofort, privat, in Ihrem Browser.

OpenAI
Anthropic
Google
DeepSeek
Meta
Mistral
0 Zeichen
0
Tokens
0
Wörter
0
Zeichen
$0.00
Eingabekosten
Kontext: 0 / 272.0K tokens(0.0%)
I/O Ratio
IN 70%/OUT 30%
0% out0 output tokens100% out
INPUT$0.0000
OUTPUT+$0.0000
GESAMT$0.00000
🎨Token Visualizer
Text eingeben, um Tokenisierung zu sehen…

💰 MONTHLY COST PROJECTOR

Requests/day1.0K
Input tokens1.0K
Output tokens500
ModelMonthly costAnnual cost
Llama 4 Scout$8.40$100.80
GPT-4.1 Nano$9.00$108.00
Gemini 2.5 Flash-Lite$9.00$108.00
GPT-4o Mini$13.50$162.00
DeepSeek V3$14.70$176.40
Llama 4 Maverick$15.00$180.00
GPT-4.1 Mini$36.00$432.00
Gemini 2.5 Flash$46.50$558.00
DeepSeek R1$49.35$592.20
o4-mini$99.00$1188.00
Claude Haiku 4.5$105.00$1260.00
Gemini 1.5 Pro$112.50$1350.00
GPT-4.1$180.00$2160.00
o3$180.00$2160.00
Gemini 2.5 Pro$187.50$2250.00
GPT-4o$225.00$2700.00
Claude Sonnet 4.6$315.00$3780.00
Claude Opus 4.7$525.00$6300.00
Claude Opus 4.6$525.00$6300.00
o3-pro$1800.00$21600.00

* Multiply monthly cost ×12 for annual estimate

Best value for this usage: Llama 4 Scout ($8.40/mo)

💰 API-Preise pro 1M Tokens

ModellAnbieterKontextInput / 1MOutput / 1M
Ministral 3BMistral128K$0.040$0.04
GPT-5 NanoOpenAI200K$0.050$0.40
Gemini 1.5 FlashGoogle1M$0.075$0.30
Llama 4.1 ScoutMeta10M$0.090$0.28
GPT-4.1 NanoOpenAI1.0M$0.10$0.40
Gemini 2.5 Flash-LiteGoogle1M$0.10$0.40
Gemini 2.0 FlashGoogle1M$0.10$0.40
Ministral 8BMistral128K$0.10$0.10
Mistral Small 3Mistral32K$0.10$0.30
Llama 4 ScoutMeta10M$0.11$0.34
Gemini 3.5 Flash-LiteGoogle1M$0.15$0.90
GPT-4o MiniOpenAI128K$0.15$0.60
Mistral NemoMistral128K$0.15$0.15
Pixtral 12BMistral128K$0.15$0.15
Grok 4.1 FastxAI2M$0.20$0.50
Llama 4 MaverickMeta1M$0.20$0.60
GPT-5.4 NanoOpenAI272K$0.20$1.25
CodestralMistral256K$0.20$0.60
Sonar SmallPerplexity127K$0.20$0.20
Qwen 2.5 72BQwen131K$0.23$0.40
Gemini 3.1 Flash-LiteGoogle1M$0.25$1.50
GPT-5 MiniOpenAI200K$0.25$2.00
Claude Haiku 3Anthropic200K$0.25$1.25
DeepSeek V3DeepSeek128K$0.28$0.42
Gemini 2.5 FlashGoogle1M$0.30$2.50
GPT-5.5 NanoOpenAI500K$0.30$1.75
DeepSeek V3.5DeepSeek128K$0.38$0.60
GPT-4.1 MiniOpenAI1.0M$0.40$1.60
Grok 5 MinixAI1M$0.40$1.00
Gemini 3 FlashGoogle2M$0.50$3.00
Gemini 3.1 FlashGoogle1M$0.50$3.00
Qwen 3.5 PlusQwen1M$0.50$2.00
GPT-3.5 TurboOpenAI16K$0.50$1.50
DeepSeek R1DeepSeek128K$0.55$2.19
LLaMA 3.3 70BMeta131K$0.59$0.79
Qwen 4 PlusQwen1M$0.70$2.80
Gemini 3.5 FlashGoogle2M$0.75$4.50
GPT-5.4 MiniOpenAI272K$0.75$4.50
Claude Haiku 3.5Anthropic200K$0.80$4.00
DeepSeek R2DeepSeek128K$0.80$3.20
GPT-5.5 MiniOpenAI500K$1.00$6.00
Claude Haiku 4.5Anthropic200K$1.00$5.00
Sonar LargePerplexity127K$1.00$1.00
o4-miniOpenAI200K$1.10$4.40
o3-miniOpenAI200K$1.10$4.40
o1-miniOpenAI200K$1.10$4.40
Claude Haiku 4.6Anthropic200K$1.20$6.00
Gemini 2.5 ProGoogle2M$1.25$10.00
Gemini 1.5 ProGoogle2M$1.25$5.00
Grok 4.20xAI2M$1.25$2.50
Grok 4.3xAI1M$1.25$2.50
GPT-5.1OpenAI200K$1.25$10.00
GPT-5OpenAI200K$1.25$10.00
GPT-5.2OpenAI200K$1.75$14.00
Gemini 3.1 ProGoogle2M$2.00$12.00
Grok 5xAI2M$2.00$4.00
GPT-4.1OpenAI1.0M$2.00$8.00
o3OpenAI200K$2.00$8.00
Mistral Large 3Mistral128K$2.00$6.00
Pixtral LargeMistral128K$2.00$6.00
Qwen 3.7 MaxQwen1M$2.50$7.50
GPT-5.4OpenAI272K$2.50$15.00
Mistral Large 4Mistral256K$2.50$7.50
GPT-4oOpenAI128K$2.50$10.00
Gemini 3.5 ProGoogle2M$3.00$18.00
Claude Sonnet 4.6Anthropic1M$3.00$15.00
Claude Sonnet 4.5Anthropic200K$3.00$15.00
Claude Sonnet 4Anthropic200K$3.00$15.00
Claude Sonnet 3.7Anthropic200K$3.00$15.00
Sonar ProPerplexity200K$3.00$15.00
Claude Sonnet 4.7Anthropic1M$3.50$17.50
Qwen 4 MaxQwen1M$3.50$10.50
GPT-5.5OpenAI500K$3.50$21.00
Claude Opus 4.7Anthropic1M$5.00$25.00
Claude Opus 4.6Anthropic1M$5.00$25.00
Claude Opus 4.5Anthropic200K$5.00$25.00
Sonar HugePerplexity127K$5.00$5.00
Claude Opus 4.8Anthropic1M$6.00$30.00
GPT-5 ProOpenAI200K$15.00$120.00
o1OpenAI200K$15.00$60.00
Claude Opus 4.1Anthropic200K$15.00$75.00
Claude Opus 4Anthropic200K$15.00$75.00
Claude Opus 3Anthropic200K$15.00$75.00
o3-proOpenAI200K$20.00$80.00
GPT-5.2 ProOpenAI200K$21.00$168.00
GPT-5.4 ProOpenAI272K$30.00$180.00
GPT-5.5 ProOpenAI500K$40.00$240.00
o1-proOpenAI200K$150.00$600.00
Ministral 3BMistral
Input$0.040/1M tokens
Output$0.04/1M tokens
Kontext128Ktokens
GPT-5 NanoOpenAI
Input$0.050/1M tokens
Output$0.40/1M tokens
Kontext200Ktokens
Gemini 1.5 FlashGoogle
Input$0.075/1M tokens
Output$0.30/1M tokens
Kontext1Mtokens
Llama 4.1 ScoutMeta
Input$0.090/1M tokens
Output$0.28/1M tokens
Kontext10Mtokens
GPT-4.1 NanoOpenAI
Input$0.10/1M tokens
Output$0.40/1M tokens
Kontext1.0Mtokens
Gemini 2.5 Flash-LiteGoogle
Input$0.10/1M tokens
Output$0.40/1M tokens
Kontext1Mtokens
Gemini 2.0 FlashGoogle
Input$0.10/1M tokens
Output$0.40/1M tokens
Kontext1Mtokens
Ministral 8BMistral
Input$0.10/1M tokens
Output$0.10/1M tokens
Kontext128Ktokens
Mistral Small 3Mistral
Input$0.10/1M tokens
Output$0.30/1M tokens
Kontext32Ktokens
Llama 4 ScoutMeta
Input$0.11/1M tokens
Output$0.34/1M tokens
Kontext10Mtokens
Gemini 3.5 Flash-LiteGoogle
Input$0.15/1M tokens
Output$0.90/1M tokens
Kontext1Mtokens
GPT-4o MiniOpenAI
Input$0.15/1M tokens
Output$0.60/1M tokens
Kontext128Ktokens
Mistral NemoMistral
Input$0.15/1M tokens
Output$0.15/1M tokens
Kontext128Ktokens
Pixtral 12BMistral
Input$0.15/1M tokens
Output$0.15/1M tokens
Kontext128Ktokens
Grok 4.1 FastxAI
Input$0.20/1M tokens
Output$0.50/1M tokens
Kontext2Mtokens
Llama 4 MaverickMeta
Input$0.20/1M tokens
Output$0.60/1M tokens
Kontext1Mtokens
GPT-5.4 NanoOpenAI
Input$0.20/1M tokens
Output$1.25/1M tokens
Kontext272Ktokens
CodestralMistral
Input$0.20/1M tokens
Output$0.60/1M tokens
Kontext256Ktokens
Sonar SmallPerplexity
Input$0.20/1M tokens
Output$0.20/1M tokens
Kontext127Ktokens
Qwen 2.5 72BQwen
Input$0.23/1M tokens
Output$0.40/1M tokens
Kontext131Ktokens
Gemini 3.1 Flash-LiteGoogle
Input$0.25/1M tokens
Output$1.50/1M tokens
Kontext1Mtokens
GPT-5 MiniOpenAI
Input$0.25/1M tokens
Output$2.00/1M tokens
Kontext200Ktokens
Claude Haiku 3Anthropic
Input$0.25/1M tokens
Output$1.25/1M tokens
Kontext200Ktokens
DeepSeek V3DeepSeek
Input$0.28/1M tokens
Output$0.42/1M tokens
Kontext128Ktokens
Gemini 2.5 FlashGoogle
Input$0.30/1M tokens
Output$2.50/1M tokens
Kontext1Mtokens
GPT-5.5 NanoOpenAI
Input$0.30/1M tokens
Output$1.75/1M tokens
Kontext500Ktokens
DeepSeek V3.5DeepSeek
Input$0.38/1M tokens
Output$0.60/1M tokens
Kontext128Ktokens
GPT-4.1 MiniOpenAI
Input$0.40/1M tokens
Output$1.60/1M tokens
Kontext1.0Mtokens
Grok 5 MinixAI
Input$0.40/1M tokens
Output$1.00/1M tokens
Kontext1Mtokens
Gemini 3 FlashGoogle
Input$0.50/1M tokens
Output$3.00/1M tokens
Kontext2Mtokens
Gemini 3.1 FlashGoogle
Input$0.50/1M tokens
Output$3.00/1M tokens
Kontext1Mtokens
Qwen 3.5 PlusQwen
Input$0.50/1M tokens
Output$2.00/1M tokens
Kontext1Mtokens
GPT-3.5 TurboOpenAI
Input$0.50/1M tokens
Output$1.50/1M tokens
Kontext16Ktokens
DeepSeek R1DeepSeek
Input$0.55/1M tokens
Output$2.19/1M tokens
Kontext128Ktokens
LLaMA 3.3 70BMeta
Input$0.59/1M tokens
Output$0.79/1M tokens
Kontext131Ktokens
Qwen 4 PlusQwen
Input$0.70/1M tokens
Output$2.80/1M tokens
Kontext1Mtokens
Gemini 3.5 FlashGoogle
Input$0.75/1M tokens
Output$4.50/1M tokens
Kontext2Mtokens
GPT-5.4 MiniOpenAI
Input$0.75/1M tokens
Output$4.50/1M tokens
Kontext272Ktokens
Claude Haiku 3.5Anthropic
Input$0.80/1M tokens
Output$4.00/1M tokens
Kontext200Ktokens
DeepSeek R2DeepSeek
Input$0.80/1M tokens
Output$3.20/1M tokens
Kontext128Ktokens
GPT-5.5 MiniOpenAI
Input$1.00/1M tokens
Output$6.00/1M tokens
Kontext500Ktokens
Claude Haiku 4.5Anthropic
Input$1.00/1M tokens
Output$5.00/1M tokens
Kontext200Ktokens
Sonar LargePerplexity
Input$1.00/1M tokens
Output$1.00/1M tokens
Kontext127Ktokens
o4-miniOpenAI
Input$1.10/1M tokens
Output$4.40/1M tokens
Kontext200Ktokens
o3-miniOpenAI
Input$1.10/1M tokens
Output$4.40/1M tokens
Kontext200Ktokens
o1-miniOpenAI
Input$1.10/1M tokens
Output$4.40/1M tokens
Kontext200Ktokens
Claude Haiku 4.6Anthropic
Input$1.20/1M tokens
Output$6.00/1M tokens
Kontext200Ktokens
Gemini 2.5 ProGoogle
Input$1.25/1M tokens
Output$10.00/1M tokens
Kontext2Mtokens
Gemini 1.5 ProGoogle
Input$1.25/1M tokens
Output$5.00/1M tokens
Kontext2Mtokens
Grok 4.20xAI
Input$1.25/1M tokens
Output$2.50/1M tokens
Kontext2Mtokens
Grok 4.3xAI
Input$1.25/1M tokens
Output$2.50/1M tokens
Kontext1Mtokens
GPT-5.1OpenAI
Input$1.25/1M tokens
Output$10.00/1M tokens
Kontext200Ktokens
GPT-5OpenAI
Input$1.25/1M tokens
Output$10.00/1M tokens
Kontext200Ktokens
GPT-5.2OpenAI
Input$1.75/1M tokens
Output$14.00/1M tokens
Kontext200Ktokens
Gemini 3.1 ProGoogle
Input$2.00/1M tokens
Output$12.00/1M tokens
Kontext2Mtokens
Grok 5xAI
Input$2.00/1M tokens
Output$4.00/1M tokens
Kontext2Mtokens
GPT-4.1OpenAI
Input$2.00/1M tokens
Output$8.00/1M tokens
Kontext1.0Mtokens
o3OpenAI
Input$2.00/1M tokens
Output$8.00/1M tokens
Kontext200Ktokens
Mistral Large 3Mistral
Input$2.00/1M tokens
Output$6.00/1M tokens
Kontext128Ktokens
Pixtral LargeMistral
Input$2.00/1M tokens
Output$6.00/1M tokens
Kontext128Ktokens
Qwen 3.7 MaxQwen
Input$2.50/1M tokens
Output$7.50/1M tokens
Kontext1Mtokens
GPT-5.4OpenAI
Input$2.50/1M tokens
Output$15.00/1M tokens
Kontext272Ktokens
Mistral Large 4Mistral
Input$2.50/1M tokens
Output$7.50/1M tokens
Kontext256Ktokens
GPT-4oOpenAI
Input$2.50/1M tokens
Output$10.00/1M tokens
Kontext128Ktokens
Gemini 3.5 ProGoogle
Input$3.00/1M tokens
Output$18.00/1M tokens
Kontext2Mtokens
Claude Sonnet 4.6Anthropic
Input$3.00/1M tokens
Output$15.00/1M tokens
Kontext1Mtokens
Claude Sonnet 4.5Anthropic
Input$3.00/1M tokens
Output$15.00/1M tokens
Kontext200Ktokens
Claude Sonnet 4Anthropic
Input$3.00/1M tokens
Output$15.00/1M tokens
Kontext200Ktokens
Claude Sonnet 3.7Anthropic
Input$3.00/1M tokens
Output$15.00/1M tokens
Kontext200Ktokens
Sonar ProPerplexity
Input$3.00/1M tokens
Output$15.00/1M tokens
Kontext200Ktokens
Claude Sonnet 4.7Anthropic
Input$3.50/1M tokens
Output$17.50/1M tokens
Kontext1Mtokens
Qwen 4 MaxQwen
Input$3.50/1M tokens
Output$10.50/1M tokens
Kontext1Mtokens
GPT-5.5OpenAI
Input$3.50/1M tokens
Output$21.00/1M tokens
Kontext500Ktokens
Claude Opus 4.7Anthropic
Input$5.00/1M tokens
Output$25.00/1M tokens
Kontext1Mtokens
Claude Opus 4.6Anthropic
Input$5.00/1M tokens
Output$25.00/1M tokens
Kontext1Mtokens
Claude Opus 4.5Anthropic
Input$5.00/1M tokens
Output$25.00/1M tokens
Kontext200Ktokens
Sonar HugePerplexity
Input$5.00/1M tokens
Output$5.00/1M tokens
Kontext127Ktokens
Claude Opus 4.8Anthropic
Input$6.00/1M tokens
Output$30.00/1M tokens
Kontext1Mtokens
GPT-5 ProOpenAI
Input$15.00/1M tokens
Output$120.00/1M tokens
Kontext200Ktokens
o1OpenAI
Input$15.00/1M tokens
Output$60.00/1M tokens
Kontext200Ktokens
Claude Opus 4.1Anthropic
Input$15.00/1M tokens
Output$75.00/1M tokens
Kontext200Ktokens
Claude Opus 4Anthropic
Input$15.00/1M tokens
Output$75.00/1M tokens
Kontext200Ktokens
Claude Opus 3Anthropic
Input$15.00/1M tokens
Output$75.00/1M tokens
Kontext200Ktokens
o3-proOpenAI
Input$20.00/1M tokens
Output$80.00/1M tokens
Kontext200Ktokens
GPT-5.2 ProOpenAI
Input$21.00/1M tokens
Output$168.00/1M tokens
Kontext200Ktokens
GPT-5.4 ProOpenAI
Input$30.00/1M tokens
Output$180.00/1M tokens
Kontext272Ktokens
GPT-5.5 ProOpenAI
Input$40.00/1M tokens
Output$240.00/1M tokens
Kontext500Ktokens
o1-proOpenAI
Input$150.00/1M tokens
Output$600.00/1M tokens
Kontext200Ktokens
Anbieter:
OpenAI
Anthropic
Google
DeepSeek
Meta
Mistral
Preisgruppen (Input):
$0.00 ≤ $0.50 (Günstig)
$1.00 Mittelklasse
$5.00 ≥ $5.00 (Premium)

Tokenisierung verstehen

Dieses Tool fungiert als universeller Tokenizer für OpenAI, Anthropic und Google Modelle. Wir verwenden offizielle Tiktoken-Bibliotheken und modellspezifische Tokenizer für 99% Genauigkeit bei der Token-Zählung.

Was ist BPE (Byte-Pair Encoding)?

BPE ist der Tokenisierungs-Algorithmus, der von GPT-Modellen verwendet wird. Er zerlegt Text in Unterworteinheiten, indem er iterativ die häufigsten Zeichenpaare zusammenführt. Dies ermöglicht es Modellen, seltene Wörter effizient zu handhaben, während die Vokabulargröße überschaubar bleibt.

Was ist ein Kontextfenster?

Das Kontextfenster ist die maximale Anzahl an Tokens, die ein LLM in einer einzigen Anfrage verarbeiten kann (Eingabe + Ausgabe kombiniert). GPT-4o bietet 128K Tokens, Claude 3.5 bietet 200K Tokens und Gemini 1.5 Pro unterstützt bis zu 2M Tokens. Das Überschreiten dieses Limits führt zu Kürzungen oder Fehlern.

Was ist Cached Input Pricing?

Gecachte Eingabepreise bieten erhebliche Rabatte (bis zu 90%), wenn Sie dasselbe Prompt-Präfix über mehrere API-Aufrufe hinweg wiederverwenden. Dies ist ideal für System-Prompts, Few-Shot-Beispiele oder Dokumentenanalysen.

Eingabe- vs. Ausgabetoken-Kosten

Ausgabetokens sind typischerweise 2-4x teurer als Eingabetokens, da sie eine sequenzielle Generierung durch das Modell erfordern. Um Kosten zu optimieren, entwerfen Sie Prompts, die präzise Antworten liefern, und nutzen Sie Längenbegrenzungen.

Wort-zu-Token Umrechnungstabelle

Die Token-Anzahl variiert stark je nach Inhaltstyp und Sprache. Nutzen Sie diese Referenz zur Abschätzung.

InhaltstypBeispielVerhältnis1000 Wörter ≈Hinweise
Englischer TextHello world~1,3 Tokens/Wort~1.300-1.500Standardprosa ca. 1,3 Tokens pro Wort
Deutscher TextHallo Welt~1,5-2 Tokens/Wort~1.500-2.000Zusammengesetzte Wörter erhöhen die Tokens
Code (Python/JS)def func():~2-3 Tokens/Wort~2.000-3.000Symbole und Syntax erhöhen die Token-Anzahl
Chinesisch/Japanisch你好世界~2+ Tokens/Zeichen~2.000+CJK-Zeichen werden in mehrere Tokens aufgeteilt
JSON/XML-Daten{"key":"value"}~3-4 Tokens/Wort~3.000-4.000Strukturzeichen verursachen Overhead

So funktioniert es

01
📝

Text einfügen

Tippen oder fügen Sie Text ein — System-Prompt, Nachricht oder Konversation. Der Rechner tokenisiert in Echtzeit.

02
🤖

Modell auswählen

Wählen Sie GPT-4o, Claude, Gemini, DeepSeek und 20+ Modelle. Derselbe Text kann bei verschiedenen Modellen 2× mehr kosten.

03
💰

Tokens + Kosten

Sofort Token-Anzahl, API-Kosten und Kontextfenster-Auslastung sehen. Keine Anmeldung erforderlich.

Wie funktioniert das Zählen von KI-Tokens?

Ein Token ist die kleinste Einheit, die KI-Modelle wie GPT-4o, Claude und Gemini verarbeiten. Anstatt Text wie Menschen zu lesen, zerlegen KI-Modelle Text in Tokens — das können ganze Wörter, Wortteile oder einzelne Zeichen sein.

Das ist wichtig, weil API-Preise auf der Token-Anzahl basieren, nicht auf der Wortanzahl. Unser Token Rechner verwendet die gleiche tiktoken-Bibliothek, die OpenAI intern nutzt — vollständig in Ihrem Browser über WebAssembly.

Datenschutz

Die gesamte Tokenisierung findet in Ihrem Browser statt. Es wird niemals Text an einen Server gesendet. Keine Cookies, keine Analysen.

❓ Häufige Fragen

🔍
Was ist ein Token in KI und großen Sprachmodellen?
Ein Token ist die grundlegende Texteinheit, die KI-Modelle wie GPT-4o, Claude und Gemini verarbeiten. Tokens können ganze Wörter, Teile von Wörtern oder gar einzelne Zeichen sein. Im Englischen entspricht 1 Token etwa 4 Zeichen oder 0,75 Wörtern. Derselbe Text kann je nach Tokenizer des Modells unterschiedliche Mengen an Tokens erzeugen — GPT-4o verwendet z. B. cl100k_base und o200k_base.
Hat das Ihre Frage beantwortet?
Wie funktioniert dieser Token-Rechner?
Dieser Rechner nutzt dieselben Tokenisierungs-Bibliotheken wie OpenAI und andere KI-Anbieter (tiktoken) und läuft via WebAssembly vollständig in Ihrem Browser. Wenn Sie Text eingeben oder einfügen, wird er in Echtzeit ohne API-Aufrufe tokenisiert — der Text verlässt Ihr Gerät nie. Tokenanzahl, Wörter, Zeichen und geschätzte Kosten werden sofort berechnet.
Hat das Ihre Frage beantwortet?
Warum berechnen verschiedene KI-Modelle unterschiedliche Token-Anzahlen?
Jedes KI-Modell verwendet einen anderen Tokenizer mit individuellem Vokabular. GPT-4o nutzt o200k_base (200.000 Tokens im Lexikon), GPT-3.5 cl100k_base (100.000 Tokens). Ein größeres Vokabular bedeutet meist weniger Tokens für denselben Text. Claude und Gemini haben eigene Systeme, weshalb derselbe Text bei verschiedenen Anbietern oft leicht abweichende Kosten verursacht.
Hat das Ihre Frage beantwortet?
Wie viel kostet die Nutzung von GPT-4o, Claude oder Gemini?
Die Preise variieren stark. Stand März 2026: GPT-4o kostet 2,50 $ für 1M Input-Tokens und 10 $ für 1M Output-Tokens. Claude Sonnet 4.6 liegt bei 3 $ Input / 15 $ Output pro Million. Gemini 1.5 Pro kostet 1,25 $ / 5 $. Preiswertere Varianten sind GPT-4o Mini (0,15 $ / 0,60 $) und DeepSeek V3 (0,27 $ / 1,10 $).
Hat das Ihre Frage beantwortet?
Wie kann ich meine LLM-API-Kosten senken?
Die wirksamsten Strategien sind: 1) Kürzere Systemprompts verwenden — sie werden bei jeder Anfrage gesendet. 2) Das passende Modell wählen — GPT-4o Mini für einfache Aufgaben statt GPT-4o. 3) Prompt-Caching nutzen. 4) API-Anfragen im Batch (Stapelverarbeitung) senden, um Mengenrabatte zu erhalten. 5) Unnötigen Kontext kürzen.
Hat das Ihre Frage beantwortet?
Was ist ein Kontextfenster und warum ist es wichtig?
Das Kontextfenster (Context Window) bestimmt die maximale Anzahl an Tokens, die ein Modell in einer Anfrage verarbeiten kann (Eingabe + Ausgabe kombiniert). GPT-4o bietet 128K, Claude 200K und Gemini 1.5 Pro bis zu 2 Millionen Tokens. Bei Erreichen dieses Limits meldet die API einen Fehler. Sie müssen in dem Fall Text kürzen oder ein RAG-System verwenden.
Hat das Ihre Frage beantwortet?
Sind meine Textdaten sicher, wenn ich diesen Rechner benutze?
Ja, absolut. Dieser Token-Rechner wird komplett in Ihrem Browser ausgeführt (via WebAssembly). Ihr Text wird weder auf Server geladen noch in APIs eingespeist — alle Tokenisierungsarbeiten verbleiben lokal auf dem Gerät. Wir sammeln weder Daten noch verwenden wir Tracking-Cookies für Ihre Textinhalte.
Hat das Ihre Frage beantwortet?
Wie genau ist dieser Token-Rechner im Vergleich zur offiziellen OpenAI-API?
Für OpenAI-Modelle (GPT-4o, GPT-4, GPT-3.5) verwendet dieses Tool 1:1 die tiktoken-Bibliothek von OpenAI; das Ergebnis ist also 100 % passgenau. Die Angaben für LLaMA, Claude, DeepSeek und Gemini basieren hingegen auf etablierten Näherungswerten gleichartiger Codierstandards (die Fehlertoleranz dort liegt bei maximal 5–15 %).
Hat das Ihre Frage beantwortet?