Simulation · Sprachen lernen
Wie viele Wörter brauche ich wirklich?
Entdecke das Zipf'sche Gesetz: Warum schon die häufigsten 3.000 Wörter für 90 % Textverständnis reichen – und wie du Vokabeln sinnvoll priorisierst.
1
Vorhersage
2
Kurve
3
Prüfen
Stufe 1 von 2 – Vorhersage
Szenario: Du lernst die 100 häufigsten deutschen Wörter auswendig –
zum Beispiel:
die
der
und
in
den
von
zu
das
mit
sich
ist
er
auf
…
Wie viel Prozent eines typischen deutschen Zeitungsartikels verstehst du dann (gemessen an der Anzahl der Wörter, die du kennst)?
Das Zipf'sche Gesetz – Wortfrequenz-Visualisierung
Das Häufigste Wort kommt doppelt so oft vor wie das zweithäufigste, dreimal so oft wie das dritthäufigste – und so weiter. Die Kurve fällt extrem steil ab. Klicke auf „Kurve animieren", um das Muster zu sehen.
X-Achse: Wortrang (logarithmisch) · Y-Achse: relative Häufigkeit (logarithmisch) · Farbige Marker: kumulative Abdeckungsprozente
Kumulative Textabdeckung
Top 100 Wörter
~50 %
die, der, und, in, von, zu …
Top 500 Wörter
~65 %
Grundwortschatz A1–A2
Top 1.000 Wörter
~78 %
Grundwortschatz B1
Top 3.000 Wörter
~90 %
Alltägliches Textverständnis
Stufe 2 von 2 – Anwenden
Aufgabe: Du möchtest einen deutschen Zeitungsartikel lesen und
dabei mindestens 90 % der vorkommenden Wörter kennen.
Wie viele der häufigsten deutschen Wörter (Lemmata) musst du dafür ungefähr kennen?
Was bedeutet das für dein Sprachenlernen?
Priorisiere Top 500 zuerst.
Der Lerngewinn pro Wort ist bei den häufigsten Wörtern am größten.
Schon Top-500 erreichen ~65 % Abdeckung.
Nutze Häufigkeitslisten.
A1/A2-Wortlisten des Goethe-Instituts und SUBTLEX-Frequenzlisten
basieren auf realen Textkorpora – kein Raten nötig.
Spaced Repetition nutzen.
Apps wie Anki oder Quizlet wiederholen Wörter genau dann, wenn du
sie fast vergessen hast – maximale Langzeitwirkung.
Grenznutzen beachten.
Von 3.000 auf 10.000 Wörter steigt die Abdeckung nur noch
von 90 % auf ~98 %. Die ersten 3.000 Wörter sind die rentabelste Investition.
Das Zipf'sche Gesetz (Zipf, 1949): In jeder natürlichen Sprache
gilt f(r) = C / r – die Häufigkeit des r-ten häufigsten Wortes ist proportional
zu 1/r. Das häufigste Wort kommt doppelt so oft vor wie das zweithäufigste,
dreimal so oft wie das dritthäufigste. Diese extreme Ungleichverteilung macht
es möglich, mit einem vergleichsweise kleinen Wortschatz schon große Teile
jedes Textes zu verstehen.
Quellen: Zipf (1949); Nation (2001) „Learning Vocabulary in Another Language"; SUBTLEX-DE (Brysbaert et al.).
Quellen: Zipf (1949); Nation (2001) „Learning Vocabulary in Another Language"; SUBTLEX-DE (Brysbaert et al.).