Lokale LLMs sind kein Ersatz für Frontier. Sie sind die andere Hälfte.

Gerade läuft eine laute Bewegung für lokale, quelloffene oder in der Schweiz gehostete Sprachmodelle. Wir gehören selbst dazu — unser eigenes Anonymisierungs-System läuft bewusst auf einem in der Schweiz gehosteten Modell, aus guten Gründen. Genau deshalb stört uns ein Argument, das in dieser Bewegung zum Dogma wird.

Open-Source-Modelle hinkten Frontier nur noch «vier Monate» hinterher, also reiche lokal. Das ist für einen KMU-Betrieb im Wettbewerb die falsche Schlussfolgerung. Und die vier Monate messen das Falsche.

Kurz vorweg: Was heisst «Frontier»?

Als Frontier-Modelle bezeichnet man die jeweils leistungsfähigsten Sprachmodelle am Markt — die Spitze dessen, was heute technisch möglich ist. Die bekanntesten sind Claude (von Anthropic), GPT (OpenAI), Gemini (Google) und Grok (xAI). Diese Modelle laufen in den Rechenzentren der Anbieter, nicht auf eigener Hardware. «Lokal» meint das Gegenteil: Modelle, die man selbst betreibt — im eigenen Haus oder bei einem Schweizer Anbieter. Frei verfügbar, aber praktisch immer eine Stufe unterhalb der Frontier-Spitze.

Zwei Dinge werden vermischt: Souveränität und Fähigkeit

Datenhoheit ist ein reales Argument. Wer sensible Daten verarbeitet, hat gute Gründe, ein Modell in der Schweiz zu betreiben — wir tun es. Aber Souveränität sagt nichts über Fähigkeit. Wo meine Daten liegen, und was ein Modell leisten kann, sind zwei verschiedene Achsen. Die Lokal-Front argumentiert auf der ersten Achse und überträgt das Urteil auf die zweite. Genau hier lohnt sich ein zweiter Blick.

Die «vier Monate» messen die Prüfung, nicht die Praxis

Der behauptete Rückstand wird an Benchmarks gemessen. Auf Benchmarks holen offene Modelle tatsächlich schnell auf. Was nicht in vier Monaten nachzieht, ist das, was im Betrieb zählt: zuverlässiger Werkzeug-Einsatz, langer Kontext, der über viele Seiten nicht zerfällt, und Verlässlichkeit über mehrstufige Abläufe hinweg. Eine Aufgabe, die zehn aufeinander aufbauende Schritte korrekt durchhalten muss, ist etwas anderes als eine Benchmark-Frage. Genau diese Dimension wandert langsamer — und sie ist die, die anspruchsvolle Geschäftsprozesse tragen.

Wo die Grenze für ein KMU real verläuft

Der massgebliche Vergleich ist nicht «bestes lokales Modell auf einem GPU-Cluster gegen Frontier». Es ist «was ein KMU auf vertretbarer Hardware betreiben kann gegen Frontier». Auf dieser realistischen Linie gibt es heute eine Fähigkeits-Spitze, die lokal nicht erreichbar ist: ein Grossfirmen-Vertragswerk gegen interne Vorgaben prüfen, eine Ausschreibung (RFP) sauber beantworten, eine ISO-Zertifizierung mit ihren Querverweisen begleiten, ernsthaft Software entwickeln. Das sind keine repetitiven Aufgaben — es sind genau die mehrstufigen, kontextreichen, die Frontier von lokal trennen.

Und hier liegt die eigentliche Chance: Frontier hebt ein KMU auf ein Niveau, das früher Grossfirmen mit ganzen Fachabteilungen vorbehalten war. Eine Ausschreibung, für die ein Konzern ein Team aufstellt, wird für den kleinen Betrieb beherrschbar. Das ist kein Effizienz-Gewinn am Rand, sondern Wettbewerbsfähigkeit auf Enterprise-Niveau. Wer hier ausschliesslich lokal fährt, weil es ins Souveränitäts-Narrativ passt, optimiert das Argument, nicht das Ergebnis.

Wichtig — und das relativiert uns selbst: Für eng umrissene Aufgaben kann lokal nicht nur reichen, sondern gewinnen. In unserem eigenen System schlug ein kompaktes, in der Schweiz gehostetes Modell einen viel grösseren Konkurrenten bei einer klar definierten Aufgabe. Grösser ist nicht besser. Aber «reicht für diese eine Aufgabe» ist eben nicht «reicht für den anspruchsvollsten Prozess im Haus».

Die Antwort ist ein Mix — und Frontier baut ihn

Wir sehen im Betrieb keinen Entweder-oder-Zustand, sondern eine Arbeitsteilung:

Lokal / CH-gehostet für Repetitives, Datensensibles, Hochvolumiges: Klassifizieren, Extrahieren, Standard-Antworten, alles wo die Aufgabe klar umrissen und das Modell verlässlich genug ist.
Frontier für das Anspruchsvolle: mehrstufiges Reasoning über grosse, heterogene Kontexte — die Verträge, die Ausschreibungen, die Zertifizierung, die Entwicklung.

Der entscheidende Punkt, der in der Debatte fehlt: Frontier zahlt nicht nur zur Laufzeit ein, sondern zur Entwurfszeit. Man nutzt das starke Modell, um den Rahmen zu bauen, in dem das günstige lokale Modell zuverlässig läuft — die Prompts, die Prüf- und Testfälle, die Leitplanken. Frontier wird zum Werkmeister für die lokale Flotte. So bekommt ein KMU beides: tiefe Fähigkeit dort, wo sie zählt, und günstigen, souveränen Betrieb für das Volumen.

Unser Standpunkt

Lokale und CH-gehostete Modelle sind richtig und wichtig — wir setzen selbst darauf. Aber sie ersetzen Frontier nicht, sie ergänzen es. Wer als KMU im Wettbewerb steht, kann es sich nicht leisten, die Fähigkeits-Spitze aus ideologischen Gründen liegen zu lassen.

Bleibt ein Punkt: Das gilt für heute. Die Lücke verschiebt sich, lokale Modelle werden besser, und manches, was jetzt Frontier braucht, wird morgen lokal laufen. Wer die Lage seriös beurteilt, datiert sein Urteil — statt eine Momentaufnahme zur Dauerwahrheit zu erklären. Die Frage bleibt dieselbe, ihre Antwort wandert: nicht «lokal oder Frontier», sondern «welche Aufgabe gehört heute auf welches Modell — und wer baut den Rahmen dafür».

Wo man anfängt. Bevor man Modelle wählt, sollte man die Aufgaben kennen. Ein nüchterner KI-Audit macht genau das: Er geht die Prozesse im Betrieb durch und sortiert sie — was ist repetitiv und datensensibel genug fürs lokale Modell, was ist so anspruchsvoll, dass es Frontier braucht, und wo lohnt sich der Aufwand überhaupt nicht. Das ist die belastbarere Grundlage für eine KI-Strategie als die Frage, welches Modell gerade die Schlagzeilen macht. Wer hier sauber anfängt, baut den Mix von Anfang an richtig.

Nicht «lokal oder Frontier». Sondern: welche Aufgabe gehört auf welches Modell — und wer baut den Rahmen dafür.

Georges Leuenberger im Dialog mit Claude Opus 4.8 · Stand Juni 2026