Was ist ein LLM? Large Language Model einfach erklärt

Q: Ist ein LLM dasselbe wie ChatGPT?

Nein. ChatGPT ist ein **Produkt** von OpenAI, das auf der GPT-**Modellfamilie** basiert. "LLM" ist der Oberbegriff für die zugrundeliegende Technologie — Claude, Gemini, Apertus sind andere LLMs. ChatGPT als Marke hat die Technologie in den Mainstream gebracht, ist aber nicht mit ihr gleichzusetzen. ## Quellen - ETH Zürich, Apertus — fully open, transparent, multilingual language model (2025): [ethz.ch](https://ethz.ch/en/news-and-events/eth-news/news/2025/09/press-release-apertus-a-fully-open-transparent-multilingual-language-model.html) - Google Research, Attention Is All You Need (Vaswani et al., 2017): [arxiv.org](https://arxiv.org/abs/1706.03762) - Anthropic, Claude Model Family: [anthropic.com](https://www.anthropic.com/claude) - EPFL, AI and Machine Learning Research: [epfl.ch](https://www.epfl.ch/research/domains/cluster-artificial-intelligence/) - Bundesamt für Justiz, Künstliche Intelligenz — Schweizer Regulierung: [bj.admin.ch](https://www.bj.admin.ch/bj/de/home/staat/gesetzgebung/kuenstliche-intelligenz.html)

25. April 20265 Min. Lesezeit

LLM steht für "Large Language Model" — auf Deutsch "grosses Sprachmodell". Es bezeichnet eine Klasse von KI-Modellen, die auf riesigen Textmengen trainiert wurden und menschliche Sprache statistisch vorhersagen, verstehen und generieren können. Bekannte Beispiele sind Claude (Anthropic), GPT (OpenAI), Gemini (Google) sowie das Schweizer Open-Source-Modell Apertus (EPFL/ETH/CSCS). Für Schweizer KMU sind LLMs heute die zentrale Technologie hinter praktisch jeder modernen KI-Anwendung — von Chatbots über Dokumentanalyse bis zum KI-Telefonassistenten.

Kurz und bündig: Ein Large Language Model ist eine auf Milliarden Textbeispielen trainierte KI, die Sprache generieren, zusammenfassen, übersetzen und beantworten kann. Die aktuell leistungsfähigsten Modelle (Claude 4.7, GPT-5, Gemini 2.x) beherrschen Dutzende Sprachen inklusive Schweizerdeutsch-Fähigkeiten und werden über API in Produkte integriert. In der Schweiz hat EPFL/ETH mit Apertus 2025 ein transparentes, mehrsprachiges Modell als Alternative zu US-Anbietern veröffentlicht.

Wie funktioniert ein LLM?

Statistische Vorhersage. Ein LLM lernt während des Trainings, das wahrscheinlichste nächste Wort (genauer: Token) in einem Text vorherzusagen. Wird das an Milliarden von Textbeispielen gemacht, entsteht eine sehr feine Wahrscheinlichkeitsverteilung über Sprache, Stil, Fakten und Schlussfolgerungsmuster.

Transformer-Architektur. Seit 2017 nutzen alle grossen Modelle die Transformer-Architektur (Google-Paper "Attention Is All You Need"). Kernidee: Jedes Wort im Kontext wird mit jedem anderen gewichtet verglichen — das Modell "versteht" Beziehungen über lange Textstrecken.

Training in zwei Phasen. Zuerst Pre-Training auf allgemeinen Textdaten, dann Fine-Tuning und Feedback-Training (z. B. Reinforcement Learning from Human Feedback, RLHF), damit das Modell hilfreich, wahrheitsgetreu und sicher antwortet.

Grösse. Moderne LLMs haben Milliarden bis Billionen Parameter. Die Parameterzahl allein sagt nicht alles — Trainingsdaten, Methodik und Feinschliff spielen mindestens so eine grosse Rolle.

Welche LLMs sind heute relevant?

Kommerzielle Anbieter.

Anthropic Claude (USA). Fokus auf Sicherheit, lange Kontexte, technische Genauigkeit. Claude-4-Serie ist State of the Art für strukturierte Geschäftsaufgaben.
OpenAI GPT (USA). Erster bekannter Anbieter im Mainstream. Breites Ökosystem, aggressive Iterationsgeschwindigkeit.
Google Gemini (USA). Eng mit Workspace-Produkten verzahnt, stark multimodal (Text, Bild, Audio, Video).
Mistral (Frankreich). Europäische Alternative mit Offenheit zu Open-Weight-Modellen.

Open-Source-Modelle.

Apertus (EPFL / ETH Zürich / CSCS, September 2025). Vollständig offenes, transparentes, mehrsprachiges LLM. Trainiert unter Berücksichtigung europäischer und Schweizer Sprachen (inkl. Schweizerdeutsch-Elementen). Pressemitteilung der ETH im September 2025 positioniert es als Schweizer Alternative zu den US-Modellen.
Llama (Meta), Qwen (Alibaba), DeepSeek. Weitere wichtige Open-Weight-Modelle.

Wofür werden LLMs in Unternehmen eingesetzt?

Kommunikation. E-Mail-Entwürfe, Chat-Antworten, Übersetzungen, Zusammenfassungen von Besprechungen, KI-Telefonassistenten.

Dokumentanalyse. Verträge, Offerten, Ausschreibungen prüfen, Risiken identifizieren, Zusammenfassungen erstellen.

Softwareentwicklung. Code-Generierung, Code-Review, Dokumentation, Tests.

Daten- und Wissensarbeit. Strukturierte Informationen aus unstrukturierten Quellen extrahieren, Reports erstellen, interne Suche.

Kundendialog. Chatbots, Voice-Assistenten, Self-Service-Systeme — zunehmend mit echtem Verstehen statt starrer Menüs.

Welche Grenzen und Risiken haben LLMs?

Halluzinationen. LLMs können überzeugend formulierte, aber faktisch falsche Antworten liefern. Besonders bei seltenen Fakten, aktuellen Ereignissen oder domänenspezifischem Wissen. Abhilfe: Retrieval-Augmented Generation (RAG) mit geprüfter Wissensbasis, menschliche Prüfung bei kritischen Anwendungen.

Datenschutz. Was in ein LLM eingegeben wird, kann — je nach Anbieter und Konfiguration — zum Training verwendet werden. Für DSG-konforme Nutzung in der Schweiz sollten Sie mit Business-Verträgen und Zero-Training-Zusicherungen arbeiten.

Aktualität. LLMs haben einen Wissens-Cutoff (z. B. Januar 2026 bei Claude Opus 4.7). Nach diesem Datum geschehene Ereignisse kennen sie nicht — es sei denn, sie werden über Tools (Suche, APIs) informiert.

Sprachbias. Englisch dominiert in den Trainingsdaten. Modelle wie Apertus versuchen hier bewusst, europäische Sprachen (inkl. Schweizer Sprachen) stärker zu gewichten. Hintergrund zur Schweizer Forschung im Glossar-Eintrag Was ist Schweizerdeutsch-KI?.

Rechenkosten. Training kostet Millionen. Auch der Betrieb (Inferenz) ist nicht gratis — ein intensiver Geschäftseinsatz erzeugt monatlich nennenswerte API-Kosten, die bei der Produktkalkulation mitbedacht werden müssen.

Wie passt ein LLM in einen KI-Telefonassistenten?

Ein KI-Telefonassistent nutzt ein LLM als Sprachverstehens- und Antwortgenerierungs-Komponente zwischen Spracherkennung (ASR) und Sprachsynthese (TTS). Der Ablauf:

1. Anrufer spricht → ASR wandelt in Text 2. Text + Firmenkontext gehen an das LLM → erkennt Absicht, formuliert Antwort, ruft bei Bedarf Tools (Kalender, CRM) auf 3. Antworttext → TTS wandelt in hörbare Stimme

Gute KI-Telefonassistenten kombinieren LLMs mit strukturierten Daten (Firmendaten, Öffnungszeiten, Mitarbeitende, Preise) und kontrollierten Ausgabepfaden — damit Halluzinationen weitgehend ausgeschlossen sind und der Assistent nur auf Basis hinterlegter Informationen antwortet. Mehr dazu im Glossar-Eintrag Was ist ein KI-Telefonassistent?.

fonea ausprobieren: KI-Telefonassistent mit modernen LLMs, Schweizer Datenhosting, DSG-konform. Jetzt starten

Key Takeaways

LLM = Large Language Model: auf Milliarden Texten trainierte KI zur Sprachverarbeitung und -generierung.
Architektur: Transformer-basiert seit 2017. Training in Pre-Training + Fine-Tuning.
Relevante Modelle 2026: Claude (Anthropic), GPT (OpenAI), Gemini (Google), Mistral, Apertus (EPFL/ETH, open-source Schweizer Alternative).
KMU-Einsatz: Kommunikation, Dokumentanalyse, Softwareentwicklung, Kundendialog, KI-Telefonassistenten.
Grenzen: Halluzinationen, Datenschutz, Wissens-Cutoff, Sprachbias, Rechenkosten.

Häufig gestellte Fragen

Welches LLM ist das beste?

Es gibt kein einzelnes "bestes" Modell. Die Wahl hängt von der Aufgabe, den Sprachen, den Kosten und den Datenschutz-Anforderungen ab. Für sicherheitskritische Geschäftsaufgaben mit langen Kontexten performt Anthropic Claude aktuell sehr gut; für multimodale Inhalte ist Google Gemini stark; für souveräne europäische Lösungen kommt Apertus zunehmend in Betracht.

Kann ich ein LLM auf meinen eigenen Servern betreiben?

Ja, mit Open-Weight-Modellen wie Apertus, Llama oder Mistral. Der Hardware-Aufwand ist erheblich (GPU-Server mit 40–80 GB VRAM für mittelgrosse Modelle). Für die meisten KMU ist der Betrieb über API eines Cloud-Anbieters mit solider Datenschutzbasis wirtschaftlicher.

Ist ein LLM dasselbe wie ChatGPT?

Nein. ChatGPT ist ein Produkt von OpenAI, das auf der GPT-Modellfamilie basiert. "LLM" ist der Oberbegriff für die zugrundeliegende Technologie — Claude, Gemini, Apertus sind andere LLMs. ChatGPT als Marke hat die Technologie in den Mainstream gebracht, ist aber nicht mit ihr gleichzusetzen.

Quellen

ETH Zürich, Apertus — fully open, transparent, multilingual language model (2025): ethz.ch
Google Research, Attention Is All You Need (Vaswani et al., 2017): arxiv.org
Anthropic, Claude Model Family: anthropic.com
EPFL, AI and Machine Learning Research: epfl.ch
Bundesamt für Justiz, Künstliche Intelligenz — Schweizer Regulierung: bj.admin.ch

glossarllmsprachmodellkikmuschweiz

Nie wieder einen Anruf verpassen

fonea beantwortet Ihre Anrufe 24/7 in allen Schweizer Landessprachen. Ab CHF 90/Monat.

Jetzt starten

30 Tage Geld-zurück-Garantie. Monatlich kündbar.