Zipf'sches Gesetz: Wie viele Wörter musst du lernen?

Stufe 1 von 2 – Vorhersage

Szenario: Du lernst die 100 häufigsten deutschen Wörter auswendig – zum Beispiel:

die der und in den von zu das mit sich ist er auf …

Wie viel Prozent eines typischen deutschen Zeitungsartikels verstehst du dann (gemessen an der Anzahl der Wörter, die du kennst)?

Das Zipf'sche Gesetz – Wortfrequenz-Visualisierung

Das Häufigste Wort kommt doppelt so oft vor wie das zweithäufigste, dreimal so oft wie das dritthäufigste – und so weiter. Die Kurve fällt extrem steil ab. Klicke auf „Kurve animieren", um das Muster zu sehen.

X-Achse: Wortrang (logarithmisch) · Y-Achse: relative Häufigkeit (logarithmisch) · Farbige Marker: kumulative Abdeckungsprozente

Kumulative Textabdeckung

Top 100 Wörter ~50 %

die, der, und, in, von, zu …

Top 500 Wörter ~65 %

Grundwortschatz A1–A2

Top 1.000 Wörter ~78 %

Grundwortschatz B1

Top 3.000 Wörter ~90 %

Alltägliches Textverständnis

Stufe 2 von 2 – Anwenden

Aufgabe: Du möchtest einen deutschen Zeitungsartikel lesen und dabei mindestens 90 % der vorkommenden Wörter kennen. Wie viele der häufigsten deutschen Wörter (Lemmata) musst du dafür ungefähr kennen?

Was bedeutet das für dein Sprachenlernen?

🎯 Priorisiere Top 500 zuerst. Der Lerngewinn pro Wort ist bei den häufigsten Wörtern am größten. Schon Top-500 erreichen ~65 % Abdeckung.

📋 Nutze Häufigkeitslisten. A1/A2-Wortlisten des Goethe-Instituts und SUBTLEX-Frequenzlisten basieren auf realen Textkorpora – kein Raten nötig.

📄 Spaced Repetition nutzen. Apps wie Anki oder Quizlet wiederholen Wörter genau dann, wenn du sie fast vergessen hast – maximale Langzeitwirkung.

📈 Grenznutzen beachten. Von 3.000 auf 10.000 Wörter steigt die Abdeckung nur noch von 90 % auf ~98 %. Die ersten 3.000 Wörter sind die rentabelste Investition.

Das Zipf'sche Gesetz (Zipf, 1949): In jeder natürlichen Sprache gilt f(r) = C / r – die Häufigkeit des r-ten häufigsten Wortes ist proportional zu 1/r. Das häufigste Wort kommt doppelt so oft vor wie das zweithäufigste, dreimal so oft wie das dritthäufigste. Diese extreme Ungleichverteilung macht es möglich, mit einem vergleichsweise kleinen Wortschatz schon große Teile jedes Textes zu verstehen.

Quellen: Zipf (1949); Nation (2001) „Learning Vocabulary in Another Language"; SUBTLEX-DE (Brysbaert et al.).

Wie viele Wörter brauche ich wirklich?