LLMs sind für die Linguistik nutzlos: Eine kritische Analyse
Large Language Models (LLMs) sind für die Linguistik nutlos, weil sie probabil Modelle mit massivem Datenbedarf sind, die die mind‑interne rekursive Hierarchie menschlicher Sprache nicht erfassen können.
Hauptbehauptung: LLMs sind nicht geeignet für linguistische Analysen, da sie sich ausschließlich auf die Verarbeitung externer Wortketten stützen.
Methodische Schwäche: LLMs erfordern große Mengen an Trainingsdaten, um Muster zu erkennen, anstatt die interne, regelbasierte Struktur der Sprache abzubilden.
Menschen‑basierte Sprachmechanik: Im Gegensatz zu LLMs entsteht menschliche Sprache durch ein inneres Rechenwerk, das hierarchische Gedankenstrukturen rekursiv generiert.
Entwicklung mit minimalem Input: Der menschliche Sprachentwicklungsprozess benötigt nur sehr wenig externe Stimulation, um komplexe Sprachstrukturen zu erlernen.
Unterscheidungsfähigkeit: Das mentale Sprachsystem kann leicht zwischen „echter“ und „unmöglicher“ Sprache unterscheiden, was LLMs nicht tun können.
Interdisziplinäre Felder: Der Beitrag verbindet Computation and Language (cs.CL) mit Neurons and Cognition (q-bio.NC).
Autor*innen: Johan J. Bolhuis, Andrea Moro, Stephen Crain, Sandiway Fong.
Publikationsdetails: arXiv‑Nummer 2512.13441, Version 1, eingereicht 15 Dezember 2025, PDF‑ und HTML‑Zugriff verfügbar.
Schlüsselstatement im Abstract: „Large Language Models are useless for linguistics… the language system grows with minimal external input… can readily distinguish between real language and impossible languages.“
Diskussionsfokus: Erläuterung, warum probabilistische Datenmodelle nicht die kognitiven Prozesse reproduzieren, die für Sprachverstehen notwendig sind.
Fragen zur Vertiefung
- Warum sind probabilistische LLMs laut Bolhuis für linguistische Forschung unbrauchbar?
- Welche Eigenschaften des menschlichen Sprachsystems verhindern, dass LLMs „echte“ Sprache generieren?
- Wie erklärt die Arbeit die Fähigkeit menschlicher Sprache, mit minimalem Input zu wachsen und unmögliche Sprachen zu erkennen?
Quelle: https://arxiv.org/abs/2512.13441
