Kontakt aufnehmen
Zurück zur Academy
Grundlagen Privat 11 Min. Lesezeit 23. Mai 2026

KI-Glossar — 30 Begriffe, die du nach diesem Artikel im Schlaf erklären kannst.

Token, Halluzination, Kontextfenster, RAG. Wer KI versteht, redet anders über KI — präziser, sicherer, ohne Bauchgefühl. Hier sind die 30 Begriffe, die in jeder Konversation auftauchen, sortiert nach Wichtigkeit. Nach dem Lesen fühlt sich kein KI-Artikel mehr wie eine Fremdsprache an.

SR
Snow Academy Redaktion
Privat-Reihe · Grundlagen

Du liest einen KI-Artikel und alle drei Sätze taucht ein Wort auf, das du nicht kennst. Token. Embedding. Kontextfenster. Du nickst, googelst aber nicht — weil du schon dreimal gegoogelt hast und die Erklärungen alle aus drei weiteren Fremdwörtern bestanden.

Dieser Artikel ist die Abkürzung. 30 Begriffe, die in jeder ernsthaften KI-Konversation auftauchen, jeweils in zwei Sätzen erklärt — und mit einem Alltagsbild dahinter, damit sie hängen bleiben. Sortiert von "musst du kennen" nach "nice to have". Lies einfach von oben nach unten. Später brauchst du den Artikel als Nachschlagewerk — alle Begriffe haben Anker-Links.

So nutzt du dieses Glossar: Beim ersten Lesen lin­ear durch­gehen. Später, wenn du einen Begriff vergessen hast, über die Suchfunktion deines Browsers (Strg+F / Cmd+F) hierher zurückspringen. Geht schneller als jede Google-Suche.

Block 1 — Die absoluten Basics (Begriffe 1–8)

Ohne diese acht Begriffe läuft nichts. Sie sind die Brille, durch die du jede KI-Diskussion verstehst.

1. KI · Künstliche Intelligenz

Der Sammelbegriff für jede Software, die Aufgaben löst, die wir intuitiv für intelligent halten — Sprache verstehen, Bilder erkennen, Schach spielen, Code schreiben. Wichtig: "KI" ist heute fast immer ein Marketing-Wort. Wenn du genauer wissen willst, was eine Anwendung tut, frag konkret nach: Sprachmodell? Bilderkennung? Vorhersagealgorithmus?

2. LLM · Large Language Model

Ein Sprachmodell, das mit dutzenden Milliarden Wörtern trainiert wurde und deshalb erstaunlich flüssig schreibt. ChatGPT, Claude, Gemini, Llama — alles LLMs. Alltagsbild: Stell dir einen Praktikanten vor, der alle Bücher der Stadtbibliothek gelesen hat, aber nichts davon wirklich verstanden, nur Muster gelernt. Beeindruckend produktiv. Manchmal komplett daneben.

3. Prompt

Deine Eingabe an die KI. "Schreib mir eine E-Mail an meinen Vermieter wegen einer kaputten Heizung" — das ist ein Prompt. Je präziser dein Prompt, desto besser die Antwort. Klingt selbstverständlich, ist es aber nicht: 80 % aller schlechten KI-Antworten kommen von zu vagen Prompts.

4. Token

Die kleinste Verarbeitungseinheit eines Sprachmodells. Grobe Faustregel: 1 Token ≈ 0,75 Wörter (im Deutschen etwas weniger, weil unsere Wörter länger sind). Warum wichtig? Weil KI-Anbieter danach abrechnen — und weil jedes Modell ein Limit hat, wie viele Token es auf einmal verarbeiten kann.

5. Kontextfenster

Wie viele Token das Modell gleichzeitig überblickt — deine Frage plus alles, was vorher im Chat stand. Aktuelle Werte: GPT-4o = 128.000 Token (ein Roman), Claude Opus = 200.000, Gemini 2.0 = bis 2 Mio. Praktisch: Wenn du ein 300-Seiten-PDF zusammenfassen lassen willst, brauchst du ein Modell mit großem Kontextfenster — sonst übersieht es den hinteren Teil.

6. Halluzination

Wenn die KI eine Antwort erfindet, die plausibel klingt aber falsch ist. Beispiel: Du fragst nach einem Buchtitel, die KI nennt dir Autor, Verlag, ISBN — alles ausgedacht. Halluzinationen sind das größte Problem aller LLMs. Faustregel: Bei Zahlen, Namen, Daten, Zitaten immer nachprüfen.

7. Training

Der monatelange Lernprozess, in dem ein Modell aus riesigen Textmengen Muster lernt. Frisst Stromkosten in Millionenhöhe, dauert Wochen, läuft auf tausenden GPUs. Ist das Modell trainiert, ist sein Wissen "eingefroren" — bis zum sogenannten Knowledge Cutoff.

8. Knowledge Cutoff

Der Zeitpunkt, ab dem das Modell nichts mehr weiß. ChatGPT-4o etwa kannte Anfang 2026 keine Ereignisse nach Oktober 2024 — bis OpenAI ein Update einspielte. Wichtig: Frag nach dem Cutoff, bevor du das Modell zu aktuellen Themen befragst. Sonst bekommst du veraltete oder halluzinierte Antworten.

Block 2 — Wie du KI bedienst (Begriffe 9–15)

Diese sieben Begriffe beschreiben, wie du das Modell steuerst. Wer sie kennt, schreibt deutlich bessere Prompts.

9. System-Prompt

Eine versteckte Anweisung, die VOR deiner Eingabe an das Modell geht und sein Verhalten formt. "Du bist ein knapper, deutschsprachiger Code-Reviewer. Antworte nie länger als 5 Sätze." — das wäre ein System-Prompt. In ChatGPT heisst er "Custom Instructions", in Claude "Project Instructions".

10. Few-Shot-Prompting

Du gibst dem Modell Beispiele, wie deine Antwort aussehen soll. "Beispiel 1: Eingabe X → Ausgabe Y. Beispiel 2: Eingabe A → Ausgabe B. Jetzt: Eingabe Z → ?". Das ist der mit Abstand effektivste Trick, um konsistente Ergebnisse zu bekommen.

11. Zero-Shot-Prompting

Gegenteil: Du gibst keine Beispiele, sondern beschreibst nur die Aufgabe. Funktioniert überraschend gut bei modernen Modellen — aber wenn das Ergebnis schief geht, ist Few-Shot der nächste Schritt.

12. Chain-of-Thought

Du bittest das Modell, seine Überlegung Schritt für Schritt aufzuschreiben, bevor es antwortet. "Denk laut durch." oder "Schreib zuerst deine Annahmen, dann die Lösung.". Verbessert die Antwortqualität bei komplexen Aufgaben dramatisch.

13. Temperatur

Ein Regler zwischen 0 und 1 (manchmal 2), der bestimmt, wie kreativ vs. konsistent das Modell antwortet. Temperatur 0: dieselbe Frage = immer dieselbe Antwort (gut für Code, Datenextraktion). Temperatur 1: jedes Mal anders (gut für Brainstorming).

14. Streaming

Die Antwort kommt Wort für Wort, nicht als ganzer Block am Ende. Fühlt sich schneller an, weil du sofort etwas siehst. Hinter den Kulissen ist es exakt so schnell — nur die Darstellung ändert sich.

15. API

Eine Schnittstelle, über die andere Software direkt mit der KI sprechen kann — ohne Browser, ohne Chat-UI. Du brauchst keine API für normale Nutzung. Erst wenn du selbst etwas baust (eigener Bot, Automatisierung), wird das Thema relevant.

Block 3 — Wie KI an Wissen kommt (Begriffe 16–22)

Wenn ein Modell mehr wissen soll als beim Training gelernt — etwa über DEIN Unternehmen, DEINE Notizen — gibt es dafür Techniken. Diese sieben Begriffe musst du kennen, wenn jemand über "KI an eigene Daten anbinden" redet.

16. RAG · Retrieval-Augmented Generation

Die KI bekommt vor jeder Antwort relevante Auszüge aus DEINEN Dokumenten mit. So kann sie zu deinem Unternehmen antworten, ohne dass das Modell selbst neu trainiert werden musste. Alltagsbild: Ein Assistent mit Zugriff auf deine Aktenschränke.

17. Embedding

Ein Text wird in eine Liste von Zahlen umgewandelt — ein Vektor mit z.B. 1.536 Dimensionen. Was bedeutet, dass die Bedeutung des Textes mathematisch fassbar wird. Ist die Grundlage für RAG: Texte mit ähnlicher Bedeutung haben ähnliche Embeddings.

18. Vektor-Datenbank

Eine Datenbank, die nicht nach exakten Stichwörtern, sondern nach Bedeutung sucht. Du fragst "Wie kündige ich meinen Vertrag?", die DB findet auch Texte, in denen "Vertrag beenden" steht. Beispiele: Pinecone, Weaviate, Qdrant, Chroma.

19. Fine-Tuning

Du nimmst ein vortrainiertes Modell und schulst es mit DEINEN Daten nach — damit es deinen Stil oder dein Spezialwissen beherrscht. Aufwendig, teuer, lohnt sich nur für sehr spezifische Anwendungsfälle. Für 95 % aller Fälle ist RAG die schlauere Lösung.

20. Knowledge Base

Die Sammlung deiner Dokumente, die per RAG eingebunden werden. PDFs, Webseiten, Notizen, Datenbankeinträge. Je sauberer deine Knowledge Base, desto besser die Antworten der KI.

21. Hallucination Rate

Wie oft ein Modell halluziniert — in Prozent. Aktuelle Top-Modelle liegen bei 1–3 % bei einfachen Faktenfragen, schnellen bei komplexen Themen aber auf 15–30 %. Merksatz: Je spezifischer dein Thema, desto kritischer prüfen.

22. Grounding

Die KI antwortet ausschließlich auf Basis bereitgestellter Quellen und nicht aus dem Training. Drastisch weniger Halluzinationen, dafür begrenztes Wissen. Standard-Modus für seriöse Unternehmens-KI.

Block 4 — Modelle & Architekturen (Begriffe 23–27)

Diese Begriffe tauchen auf, sobald jemand über "welches Modell für welche Aufgabe" redet. Du musst sie nicht aktiv nutzen — aber wenn sie fallen, sollst du nicken können.

23. Transformer

Die Architektur hinter fast allen modernen LLMs. 2017 von Google erfunden, hat alles verändert. Du musst nicht verstehen, wie sie funktioniert — nur, dass das "T" in GPT dafür steht.

24. Parameter

Die "Stellschrauben" im Modell, die beim Training justiert werden. GPT-4o hat schätzungsweise 200 Milliarden, Llama 3 in der 70B-Version 70 Milliarden, kleine Modelle 7–13 Milliarden. Faustregel: Mehr Parameter = höhere Qualität, aber auch höhere Kosten und langsamere Antworten.

25. Multimodal

Ein Modell, das nicht nur Text, sondern auch Bilder, Audio oder Video versteht. GPT-4o etwa kann ein Foto von deiner kaputten Waschmaschine analysieren und die Fehlermeldung erklären. Die Zukunft — und schon Gegenwart.

26. Open Source vs. Closed Source

Closed (ChatGPT, Claude, Gemini): nur über Anbieter nutzbar, Datenschutz fraglich. Open (Llama, Mistral, Qwen, Gemma): kannst du herunterladen und lokal auf deinem PC laufen lassen. Daten bleiben bei dir, aber etwas weniger Top-Qualität als die ganz großen Closed-Modelle.

27. Quantisierung

Eine Technik, um Modelle kleiner zu machen — aus 16 Bit pro Parameter werden 4 Bit. Das Modell wird vier­mal kleiner, läuft auch auf normalen Laptops, verliert dabei nur wenige Prozent Genauigkeit. Der Grund, warum 2026 jeder eine starke lokale KI haben kann.

Block 5 — Was 2026 wirklich neu ist (Begriffe 28–30)

Drei Begriffe, die in den letzten Monaten in jeder Konferenz, jedem Tech-Blog und jeder Snowbyte-Demo auftauchen.

28. Agent / Agentic AI

Eine KI, die nicht nur antwortet, sondern handelt — Webseiten aufruft, Dateien schreibt, E-Mails versendet, andere Tools steuert. Bisher tippst du eine Frage, bekommst Text. Mit einem Agenten sagst du "buch mir den günstigsten Flug nach Wien nächsten Donnerstag" und er macht es selbst.

29. Tool-Use / Function-Calling

Die Fähigkeit eines Modells, andere Programme aufzurufen — Rechner, Suchmaschine, Kalender, Datenbank. Ohne Tool-Use kann keine KI rechnen oder Wetterdaten abrufen. Mit Tool-Use wird sie zum echten Assistenten.

30. Mixture of Experts (MoE)

Eine moderne Architektur, in der ein großes Modell aus mehreren "Spezialisten" besteht und für jede Frage nur den passenden aktiviert. Beispiel: Mixtral, DeepSeek V3. Vorteil: Riesige Modelle, die trotzdem schnell antworten, weil immer nur ein Bruchteil aktiv ist.

Was du jetzt damit machen kannst

Du musst diese 30 Begriffe nicht alle gleich morgen draufhaben. Aber drei konkrete Schritte zahlen sich sofort aus:

Nächster Schritt in der Privat-Reihe: Wenn du verstehen willst, wie ein Sprachmodell intern funktioniert — ohne Mathe, ohne Code — lies als nächstes "Wie funktioniert ein Sprachmodell? — KI-Magie ohne Mathe". Das ist die direkte Fortsetzung.

Fazit: 30 Begriffe, eine halbe Stunde, ein lebenslanger Vorsprung. Wer KI nicht mehr nur "irgendwie nutzt", sondern auch darüber reden kann, schlägt automatisch 90 % der Menschen in jedem Tech-Gespräch. Du bist jetzt einer davon.

Lust auf mehr? In der Snow Academy gibt's täglich neue Artikel, Tutorials und Branchen-Specials. Schon ab 14 €/Monat — voller Zugriff.

Lies weiter mit Snow Academy — ab 14 €/Monat.

Dieser Artikel ist Teil der gepflegten Snow Academy. Mit einem Privat- oder Business-Abo bekommst du vollen Zugriff auf alle Artikel, Quizze und das Zertifizierungs-Programm.

Privat
14 € / Monat
Voller Lesezugriff · alle Quizze · monatlich kündbar.
Privat freischalten
Business
44 € / Monat
Bis 5 Mitarbeitende · alle Zertifikate · EU-AI-Act-konform.
Business freischalten