Kontakt aufnehmen
Zurück zur Academy
Grundlagen Free 7 Min. Lesezeit 10. Mai 2026

Was ist ein LLM eigentlich?
Die 5 wichtigsten Begriffe in einfacher Sprache.

Du nutzt vielleicht schon SnowChat oder ChatGPT — aber unter der Haube reden Insider von Tokens, Parametern, Kontextfenstern, Fine-Tuning und RAG. Wer diese fünf Begriffe versteht, versteht KI. Und kann sie viel besser einsetzen. Hier ist die Schnellfassung.

SR
Snow Academy Redaktion
Grundlagen-Reihe · Teil 1 von 5

„LLM" steht für Large Language Model — ein großes Sprachmodell. Es ist die Technologie hinter ChatGPT, Claude, Gemini, Llama und allen anderen modernen KI-Chatbots. Aber wie funktioniert das Ding eigentlich? Und warum sollte dich das interessieren?

Ganz pragmatisch: Wer die Bausteine versteht, trifft bessere Entscheidungen. Du kennst dann den Unterschied zwischen einem 7-Milliarden-Parameter-Modell und einem 70-Milliarden-Modell. Du weißt, warum manche KIs „vergessen", was du am Anfang gesagt hast. Du verstehst, warum es manchmal sinnvoll ist, der KI Dokumente mitzugeben, statt sie neu zu trainieren. Und du kannst beurteilen, welche KI-Lösung für welchen Job die richtige ist.

Fünf Begriffe reichen für 80 % aller relevanten Entscheidungen.

01 Begriff

Token

Ein Token ist die kleinste Texteinheit, die ein LLM verarbeitet. Etwa 0,75 Wörter pro Token auf Deutsch.

Stell dir vor, du wirfst ein Buch in einen Mixer. Was rauskommt sind Tokens — meistens Wortteile, manchmal ganze Wörter, manchmal nur einzelne Buchstaben. Das Wort „Donaudampfschifffahrt" zerlegt das Modell vielleicht in Donau + dampf + schiff + fahrt. Vier Tokens.

Warum das wichtig ist: Tokens kosten Geld und Zeit. Je mehr Tokens, desto teurer die Cloud-Anfrage und desto langsamer die Antwort. Wenn du SnowChat lokal nutzt, kostet jeder Token Strom — minimal, aber real. Wenn du Cloud-Modelle nutzt, kostet eine längere Anfrage mehr.

Faustregel: 1 Seite Text ≈ 500–700 Tokens. Eine ganze Mail mit Anhang als Text? Schnell mal 2.000 Tokens. Ein Buchkapitel als „Kontext"? 5.000+. Das spielt gleich noch eine Rolle.

02 Begriff

Parameter

Parameter sind die „Stellschrauben" eines Modells. Mehr Parameter = mehr Wissen, mehr Nuancen, mehr Hardware-Hunger.

Wenn jemand sagt „das ist ein 7B-Modell", meint er 7 Milliarden Parameter. 70B = 70 Milliarden. 405B = das, was Meta in Llama 3.1 als größtes Open-Source-Modell veröffentlicht hat. Bei geschlossenen Modellen (GPT-4, Claude, Gemini) wird die genaue Parameterzahl von den Herstellern bewusst nicht veröffentlicht — alles, was du dazu liest, ist Spekulation.

Anschaulich: Stell dir ein riesiges Stellwerk vor. Jeder Parameter ist ein Hebel, der die KI ein klein wenig anders reagieren lässt. Beim Training werden alle Hebel justiert, bis das Modell „passende" Antworten gibt. Mehr Hebel = feinere Antworten, aber auch mehr Strom, Speicher und Zeit.

Was das für dich heißt:

  • 3B–7B-Modelle laufen auf normalen Laptops, sind schnell, gut für einfache Aufgaben (Zusammenfassen, Übersetzen, Smalltalk).
  • 13B–30B-Modelle brauchen schon eine ordentliche GPU. Können längere Argumente bauen, besser logisch denken.
  • 70B+ Modelle brauchen Workstation-Hardware oder die Cloud. Hier wird's wirklich smart — aber auch teurer.

SnowChat auf einem Snow GT läuft komfortabel mit 7B–13B-Modellen. Snow ICE schafft auch 70B lokal. Größere Modelle ziehst du hybrid aus der Cloud.

03 Begriff

Kontextfenster

Das Kontextfenster ist das „Kurzzeitgedächtnis" der KI — wie viele Tokens sie gleichzeitig im Kopf haben kann.

Stell dir vor, du erzählst jemandem die Vorgeschichte eines Projekts, und er fängt nach 5 Minuten an dir zu antworten — aber er hat nur die letzten 30 Sekunden gehört. Genau das passiert mit dem Kontextfenster.

Typische Größen:

  • 4k Tokens ≈ 3 Seiten Text. Reicht für eine Chat-Konversation, aber kein ganzes Dokument.
  • 32k Tokens ≈ 25 Seiten. Ein Vertrag passt rein, ein Buchkapitel auch.
  • 128k Tokens ≈ 100 Seiten. Ein ganzes Geschäftsmodell, ein Forschungspaper, fast eine kurze Doktorarbeit.
  • 1M Tokens ≈ ein 700-Seiten-Buch. Sehr neu, sehr teuer.

Warum das in der Praxis weh tut: Wenn dein Kontextfenster voll ist, vergisst die KI den Anfang. Bei langen Gesprächen, bei großen Dokumenten, bei komplexen Analysen ist das der Engpass.

Praxis-Tipp: Wenn du merkst, dass die KI plötzlich „vergesslich" wird oder Widersprüche macht, ist meistens das Kontextfenster voll. Dann hilft: Konversation komprimieren („Fass kurz zusammen, was wir bisher entschieden haben"), Dokumente kürzen, oder mehr Modell-Kontextfenster wählen.
04 Begriff

Fine-Tuning

Fine-Tuning ist das „Nachtraining" eines Modells mit deinen eigenen Daten — damit es z. B. deinen Schreibstil, deine Fachsprache oder deine Branche kennt.

Ein Standard-Modell weiß viel allgemeines Zeug. Es kennt aber nicht: deine Produkte, deine Kunden-FAQ, dein internes Wording, die spezifische Tonalität deiner Marke. Fine-Tuning ändert das.

Praktisch: Du sammelst einige hundert bis tausend Beispiele aus deinem Bereich (Beispiel-Mails, Beispiel-Antworten, gute Produkttexte) und gibst sie dem Modell zusätzlich zum Standard-Training. Danach „klingt" das Modell mehr wie ihr.

Aber: Fine-Tuning ist teuer und langsam. Du brauchst saubere Trainingsdaten, GPU-Zeit, Iterationen. Für 90 % aller Fälle reicht eine andere Methode — siehe nächster Punkt.

05 Begriff

RAG — Retrieval-Augmented Generation

RAG bedeutet: Die KI guckt nach, bevor sie antwortet. Du gibst ihr Zugriff auf deine Dokumente, und sie nutzt sie als Quelle.

Das ist die Geheimwaffe für 90 % aller Business-Use-Cases. Anstatt das Modell teuer mit deinen Daten zu trainieren, gibst du ihm eine Bibliothek — und sie sucht selbst nach.

Praktisches Beispiel: Eine Anwaltskanzlei lädt ihre 2.000 Mandanten-Akten in SnowMind hoch. Auf die Frage „Wann ist Müllers Vertrag abgelaufen?" findet die KI im Akten-Bestand das relevante Dokument, liest die passende Stelle, und antwortet mit Quelle. Kein Fine-Tuning nötig.

RAG hat drei riesige Vorteile gegenüber Fine-Tuning:

  • Aktualität: Neue Dokumente hochladen — sofort verfügbar. Kein Re-Training nötig.
  • Quellenangabe: Die KI sagt dir, wo sie's gefunden hat. Du kannst das nachprüfen.
  • Datenschutz: Die Daten bleiben bei dir, statt in einem Modell „verbaut" zu werden, das jemand anders nutzt.

SnowMind ist die Snowbyte-Lösung dafür. Hochladen, fragen, fertig.

Was bedeutet das alles in der Praxis?

Wenn du jetzt diese fünf Begriffe verstanden hast, kannst du viel selbstbewusster mit KI arbeiten:

Und wenn du tiefer einsteigen willst — in Agentic AI, Multi-Agent-Workflows, Prompt-Engineering — gibt's in der Snow Academy tägliche neue Inhalte. Voller Zugriff ab 14 €/Monat (Privat) oder 44 €/Monat (Business mit 5 Seats & EU-AI-Act-Zertifikaten).

Die wichtigste Erkenntnis: KI ist kein magisches Orakel. Es ist Mathematik — mit Stellschrauben, Speicher-Grenzen und Quellen-Anbindungen. Wer das versteht, kann KI sinnvoll einsetzen statt sich nur von ihr beeindrucken zu lassen.

Was du als Nächstes lesen solltest

Wenn du gerade angefangen hast, ist der nächste logische Schritt: Klassische KI vs. Agentic AI — der Unterschied, der alles verändert. Dort erklären wir, warum moderne KI nicht nur antwortet, sondern auch handeln kann. Den Artikel findest du auf der Academy-Übersicht.

Wenn du dich fragst, was du konkret mit der Academy lernen kannst, lies Snow Academy in 3 Minuten erklärt — was du für 14 €/Monat wirklich bekommst.

Wissens-Check — sichere dir den Fortschritt

5 Fragen, Multiple Choice. Ab 4 von 5 richtig wird der Artikel in deinem Zertifizierungs-Pfad als bestanden vermerkt. Du brauchst einen Snowbyte-Account, um den Fortschritt zu speichern.

Frage 01
Wie viele Wörter entsprechen auf Deutsch in etwa einem Token?
Frage 02
Was sind Parameter in einem LLM?
Frage 03
Was passiert, wenn das Kontextfenster voll ist?
Frage 04
Was ist RAG (Retrieval-Augmented Generation)?
Frage 05
Wann ist Fine-Tuning besser als RAG?
Lust auf mehr? In der Snow Academy gibt's täglich neue Artikel, Tutorials und Branchen-Specials. Schon ab 14 €/Monat — voller Zugriff.

Lies weiter mit Snow Academy — ab 14 €/Monat.

Dieser Artikel ist Teil der gepflegten Snow Academy. Mit einem Privat- oder Business-Abo bekommst du vollen Zugriff auf alle Artikel, Quizze und das Zertifizierungs-Programm.

Privat
14 € / Monat
Voller Lesezugriff · alle Quizze · monatlich kündbar.
Privat freischalten
Business
44 € / Monat
Bis 5 Mitarbeitende · alle Zertifikate · EU-AI-Act-konform.
Business freischalten