KI-Glossar — 30 Begriffe, die du nach diesem Artikel im Schlaf erklären kannst.
Token, Halluzination, Kontextfenster, RAG. Wer KI versteht, redet anders über KI — präziser, sicherer, ohne Bauchgefühl. Hier sind die 30 Begriffe, die in jeder Konversation auftauchen, sortiert nach Wichtigkeit. Nach dem Lesen fühlt sich kein KI-Artikel mehr wie eine Fremdsprache an.
Du liest einen KI-Artikel und alle drei Sätze taucht ein Wort auf, das du nicht kennst. Token. Embedding. Kontextfenster. Du nickst, googelst aber nicht — weil du schon dreimal gegoogelt hast und die Erklärungen alle aus drei weiteren Fremdwörtern bestanden.
Dieser Artikel ist die Abkürzung. 30 Begriffe, die in jeder ernsthaften KI-Konversation auftauchen, jeweils in zwei Sätzen erklärt — und mit einem Alltagsbild dahinter, damit sie hängen bleiben. Sortiert von "musst du kennen" nach "nice to have". Lies einfach von oben nach unten. Später brauchst du den Artikel als Nachschlagewerk — alle Begriffe haben Anker-Links.
Block 1 — Die absoluten Basics (Begriffe 1–8)
Ohne diese acht Begriffe läuft nichts. Sie sind die Brille, durch die du jede KI-Diskussion verstehst.
1. KI · Künstliche Intelligenz
Der Sammelbegriff für jede Software, die Aufgaben löst, die wir intuitiv für intelligent halten — Sprache verstehen, Bilder erkennen, Schach spielen, Code schreiben. Wichtig: "KI" ist heute fast immer ein Marketing-Wort. Wenn du genauer wissen willst, was eine Anwendung tut, frag konkret nach: Sprachmodell? Bilderkennung? Vorhersagealgorithmus?
2. LLM · Large Language Model
Ein Sprachmodell, das mit dutzenden Milliarden Wörtern trainiert wurde und deshalb erstaunlich flüssig schreibt. ChatGPT, Claude, Gemini, Llama — alles LLMs. Alltagsbild: Stell dir einen Praktikanten vor, der alle Bücher der Stadtbibliothek gelesen hat, aber nichts davon wirklich verstanden, nur Muster gelernt. Beeindruckend produktiv. Manchmal komplett daneben.
3. Prompt
Deine Eingabe an die KI. "Schreib mir eine E-Mail an meinen Vermieter wegen einer kaputten Heizung" — das ist ein Prompt. Je präziser dein Prompt, desto besser die Antwort. Klingt selbstverständlich, ist es aber nicht: 80 % aller schlechten KI-Antworten kommen von zu vagen Prompts.
4. Token
Die kleinste Verarbeitungseinheit eines Sprachmodells. Grobe Faustregel: 1 Token ≈ 0,75 Wörter (im Deutschen etwas weniger, weil unsere Wörter länger sind). Warum wichtig? Weil KI-Anbieter danach abrechnen — und weil jedes Modell ein Limit hat, wie viele Token es auf einmal verarbeiten kann.
5. Kontextfenster
Wie viele Token das Modell gleichzeitig überblickt — deine Frage plus alles, was vorher im Chat stand. Aktuelle Werte: GPT-4o = 128.000 Token (ein Roman), Claude Opus = 200.000, Gemini 2.0 = bis 2 Mio. Praktisch: Wenn du ein 300-Seiten-PDF zusammenfassen lassen willst, brauchst du ein Modell mit großem Kontextfenster — sonst übersieht es den hinteren Teil.
6. Halluzination
Wenn die KI eine Antwort erfindet, die plausibel klingt aber falsch ist. Beispiel: Du fragst nach einem Buchtitel, die KI nennt dir Autor, Verlag, ISBN — alles ausgedacht. Halluzinationen sind das größte Problem aller LLMs. Faustregel: Bei Zahlen, Namen, Daten, Zitaten immer nachprüfen.
7. Training
Der monatelange Lernprozess, in dem ein Modell aus riesigen Textmengen Muster lernt. Frisst Stromkosten in Millionenhöhe, dauert Wochen, läuft auf tausenden GPUs. Ist das Modell trainiert, ist sein Wissen "eingefroren" — bis zum sogenannten Knowledge Cutoff.
8. Knowledge Cutoff
Der Zeitpunkt, ab dem das Modell nichts mehr weiß. ChatGPT-4o etwa kannte Anfang 2026 keine Ereignisse nach Oktober 2024 — bis OpenAI ein Update einspielte. Wichtig: Frag nach dem Cutoff, bevor du das Modell zu aktuellen Themen befragst. Sonst bekommst du veraltete oder halluzinierte Antworten.
Block 2 — Wie du KI bedienst (Begriffe 9–15)
Diese sieben Begriffe beschreiben, wie du das Modell steuerst. Wer sie kennt, schreibt deutlich bessere Prompts.
9. System-Prompt
Eine versteckte Anweisung, die VOR deiner Eingabe an das Modell geht und sein Verhalten formt. "Du bist ein knapper, deutschsprachiger Code-Reviewer. Antworte nie länger als 5 Sätze." — das wäre ein System-Prompt. In ChatGPT heisst er "Custom Instructions", in Claude "Project Instructions".
10. Few-Shot-Prompting
Du gibst dem Modell Beispiele, wie deine Antwort aussehen soll. "Beispiel 1: Eingabe X → Ausgabe Y. Beispiel 2: Eingabe A → Ausgabe B. Jetzt: Eingabe Z → ?". Das ist der mit Abstand effektivste Trick, um konsistente Ergebnisse zu bekommen.
11. Zero-Shot-Prompting
Gegenteil: Du gibst keine Beispiele, sondern beschreibst nur die Aufgabe. Funktioniert überraschend gut bei modernen Modellen — aber wenn das Ergebnis schief geht, ist Few-Shot der nächste Schritt.
12. Chain-of-Thought
Du bittest das Modell, seine Überlegung Schritt für Schritt aufzuschreiben, bevor es antwortet. "Denk laut durch." oder "Schreib zuerst deine Annahmen, dann die Lösung.". Verbessert die Antwortqualität bei komplexen Aufgaben dramatisch.
13. Temperatur
Ein Regler zwischen 0 und 1 (manchmal 2), der bestimmt, wie kreativ vs. konsistent das Modell antwortet. Temperatur 0: dieselbe Frage = immer dieselbe Antwort (gut für Code, Datenextraktion). Temperatur 1: jedes Mal anders (gut für Brainstorming).
14. Streaming
Die Antwort kommt Wort für Wort, nicht als ganzer Block am Ende. Fühlt sich schneller an, weil du sofort etwas siehst. Hinter den Kulissen ist es exakt so schnell — nur die Darstellung ändert sich.
15. API
Eine Schnittstelle, über die andere Software direkt mit der KI sprechen kann — ohne Browser, ohne Chat-UI. Du brauchst keine API für normale Nutzung. Erst wenn du selbst etwas baust (eigener Bot, Automatisierung), wird das Thema relevant.
Block 3 — Wie KI an Wissen kommt (Begriffe 16–22)
Wenn ein Modell mehr wissen soll als beim Training gelernt — etwa über DEIN Unternehmen, DEINE Notizen — gibt es dafür Techniken. Diese sieben Begriffe musst du kennen, wenn jemand über "KI an eigene Daten anbinden" redet.
16. RAG · Retrieval-Augmented Generation
Die KI bekommt vor jeder Antwort relevante Auszüge aus DEINEN Dokumenten mit. So kann sie zu deinem Unternehmen antworten, ohne dass das Modell selbst neu trainiert werden musste. Alltagsbild: Ein Assistent mit Zugriff auf deine Aktenschränke.
17. Embedding
Ein Text wird in eine Liste von Zahlen umgewandelt — ein Vektor mit z.B. 1.536 Dimensionen. Was bedeutet, dass die Bedeutung des Textes mathematisch fassbar wird. Ist die Grundlage für RAG: Texte mit ähnlicher Bedeutung haben ähnliche Embeddings.
18. Vektor-Datenbank
Eine Datenbank, die nicht nach exakten Stichwörtern, sondern nach Bedeutung sucht. Du fragst "Wie kündige ich meinen Vertrag?", die DB findet auch Texte, in denen "Vertrag beenden" steht. Beispiele: Pinecone, Weaviate, Qdrant, Chroma.
19. Fine-Tuning
Du nimmst ein vortrainiertes Modell und schulst es mit DEINEN Daten nach — damit es deinen Stil oder dein Spezialwissen beherrscht. Aufwendig, teuer, lohnt sich nur für sehr spezifische Anwendungsfälle. Für 95 % aller Fälle ist RAG die schlauere Lösung.
20. Knowledge Base
Die Sammlung deiner Dokumente, die per RAG eingebunden werden. PDFs, Webseiten, Notizen, Datenbankeinträge. Je sauberer deine Knowledge Base, desto besser die Antworten der KI.
21. Hallucination Rate
Wie oft ein Modell halluziniert — in Prozent. Aktuelle Top-Modelle liegen bei 1–3 % bei einfachen Faktenfragen, schnellen bei komplexen Themen aber auf 15–30 %. Merksatz: Je spezifischer dein Thema, desto kritischer prüfen.
22. Grounding
Die KI antwortet ausschließlich auf Basis bereitgestellter Quellen und nicht aus dem Training. Drastisch weniger Halluzinationen, dafür begrenztes Wissen. Standard-Modus für seriöse Unternehmens-KI.
Block 4 — Modelle & Architekturen (Begriffe 23–27)
Diese Begriffe tauchen auf, sobald jemand über "welches Modell für welche Aufgabe" redet. Du musst sie nicht aktiv nutzen — aber wenn sie fallen, sollst du nicken können.
23. Transformer
Die Architektur hinter fast allen modernen LLMs. 2017 von Google erfunden, hat alles verändert. Du musst nicht verstehen, wie sie funktioniert — nur, dass das "T" in GPT dafür steht.
24. Parameter
Die "Stellschrauben" im Modell, die beim Training justiert werden. GPT-4o hat schätzungsweise 200 Milliarden, Llama 3 in der 70B-Version 70 Milliarden, kleine Modelle 7–13 Milliarden. Faustregel: Mehr Parameter = höhere Qualität, aber auch höhere Kosten und langsamere Antworten.
25. Multimodal
Ein Modell, das nicht nur Text, sondern auch Bilder, Audio oder Video versteht. GPT-4o etwa kann ein Foto von deiner kaputten Waschmaschine analysieren und die Fehlermeldung erklären. Die Zukunft — und schon Gegenwart.
26. Open Source vs. Closed Source
Closed (ChatGPT, Claude, Gemini): nur über Anbieter nutzbar, Datenschutz fraglich. Open (Llama, Mistral, Qwen, Gemma): kannst du herunterladen und lokal auf deinem PC laufen lassen. Daten bleiben bei dir, aber etwas weniger Top-Qualität als die ganz großen Closed-Modelle.
27. Quantisierung
Eine Technik, um Modelle kleiner zu machen — aus 16 Bit pro Parameter werden 4 Bit. Das Modell wird viermal kleiner, läuft auch auf normalen Laptops, verliert dabei nur wenige Prozent Genauigkeit. Der Grund, warum 2026 jeder eine starke lokale KI haben kann.
Block 5 — Was 2026 wirklich neu ist (Begriffe 28–30)
Drei Begriffe, die in den letzten Monaten in jeder Konferenz, jedem Tech-Blog und jeder Snowbyte-Demo auftauchen.
28. Agent / Agentic AI
Eine KI, die nicht nur antwortet, sondern handelt — Webseiten aufruft, Dateien schreibt, E-Mails versendet, andere Tools steuert. Bisher tippst du eine Frage, bekommst Text. Mit einem Agenten sagst du "buch mir den günstigsten Flug nach Wien nächsten Donnerstag" und er macht es selbst.
29. Tool-Use / Function-Calling
Die Fähigkeit eines Modells, andere Programme aufzurufen — Rechner, Suchmaschine, Kalender, Datenbank. Ohne Tool-Use kann keine KI rechnen oder Wetterdaten abrufen. Mit Tool-Use wird sie zum echten Assistenten.
30. Mixture of Experts (MoE)
Eine moderne Architektur, in der ein großes Modell aus mehreren "Spezialisten" besteht und für jede Frage nur den passenden aktiviert. Beispiel: Mixtral, DeepSeek V3. Vorteil: Riesige Modelle, die trotzdem schnell antworten, weil immer nur ein Bruchteil aktiv ist.
Was du jetzt damit machen kannst
Du musst diese 30 Begriffe nicht alle gleich morgen draufhaben. Aber drei konkrete Schritte zahlen sich sofort aus:
- Speicher diesen Artikel als Lesezeichen. Wenn dir in einer Diskussion ein Begriff fehlt, springst du per Strg+F dort hin. Schneller als Google.
- Erklär heute einer Person aus deinem Umfeld drei Begriffe. Lehren ist die schnellste Form von Lernen. Such dir Token, Halluzination und RAG aus — das reicht für ein lebendiges Gespräch.
- Beim nächsten KI-Artikel achte bewusst auf die Begriffe. Du wirst überrascht sein, wie viel davon du schon kennst. Das Selbstvertrauen, das daraus entsteht, ist der eigentliche Gewinn.
Fazit: 30 Begriffe, eine halbe Stunde, ein lebenslanger Vorsprung. Wer KI nicht mehr nur "irgendwie nutzt", sondern auch darüber reden kann, schlägt automatisch 90 % der Menschen in jedem Tech-Gespräch. Du bist jetzt einer davon.
Lies weiter mit Snow Academy — ab 14 €/Monat.
Dieser Artikel ist Teil der gepflegten Snow Academy. Mit einem Privat- oder Business-Abo bekommst du vollen Zugriff auf alle Artikel, Quizze und das Zertifizierungs-Programm.