Amerikanische Vokale: Die komplette Übersicht – und warum fünf Buchstaben nicht reichen

Das englische Alphabet bietet uns exakt fünf Vokale an. Sechs, wenn man das y an guten Tagen mitzählt. Sprich einmal cat, father, saw, day, care und about laut aus und achte auf den ersten Vokal in jedem Wort: Derselbe einzelne Buchstabe a hat deinen Mund gerade dazu gezwungen, sechs völlig unterschiedliche Dinge zu tun. Die Buchstaben sind nur ein grober Code. Die tatsächlichen Laute dahinter sind eine ganz andere Geschichte – und es gibt viel mehr davon als Buchstaben, um sie aufzuschreiben.

Wer amerikanisches Englisch spricht, formt im Mund rund zwanzig verschiedene Vokallaute. Die genaue Zahl hängt davon ab, wie man zählt – Phonetik-Experten können darüber wunderbar streiten. Das eigentliche Problem für uns Lernende ist jedoch: Die englische Rechtschreibung verrät dir fast nie, auf welchen Laut du gerade zielen musst. Through, though, thought, tough, thorough: fünf Schreibweisen, aus denselben Buchstaben zusammengebaut, aber fünf völlig verschiedene Vokale. Genau deshalb ordnet dieser Artikel alle amerikanischen Vokale nach dem einzigen Kriterium, auf das Verlass ist – nämlich danach, was dein Mund physisch tut.

Englisch schreibt seine Vokale mit fünf Buchstaben, produziert in der amerikanischen Standardaussprache aber rund zwanzig unterschiedliche Vokallaute. Sie lassen sich in drei Familien einteilen: die einfachen Vokale (stabile Einzellaute wie in see, cat, moon), die Diphthonge (gleitende Vokale, die sich während des Sprechens bewegen, wie day und go) und die r-gefärbten Vokale (ein Vokal, der mit dem amerikanischen R verschmilzt, wie in car und bird). Die genaue Anzahl ist bewusst unscharf: Diese Übersicht listet zweiundzwanzig auf, aber viele Amerikaner fassen die Vokale in cot und caught zusammen, und auch das Schwa /ə/ und der Vokal in fun werden oft als ein einziger Laut gezählt. Die wichtigste Gewohnheit, die du hier mitnehmen kannst: Hör auf, dich auf die Schreibweise zu verlassen. Lerne jeden Vokal anhand seines Klangs und der Mundform, die ihn erzeugt.

Fünf Buchstaben, viel mehr Laute

Ein Vokal ist der offene, klingende Kern einer Silbe. Wenn du einen Vokal sprichst, strömt die Luft ungehindert aus deinem Mund, ohne irgendwo blockiert oder verengt zu werden. Deine Zunge und deine Lippen formen lediglich den leeren Raum – und genau die Größe und Position dieses Raums unterscheiden einen Vokal vom anderen. Konsonanten sind das exakte Gegenteil: Sie entstehen, indem die Atemwege geschlossen oder verengt werden (die Lippen treffen sich für das /b/, die Zunge stoppt die Luft für das /t/). Jede Silbe ist um einen Vokal herum aufgebaut. Er trägt die Betonung und das meiste Volumen. Der Vokal ist der Teil der Silbe, der singt.

Weil sich der Raum in deinem Mund um winzige Millimeter anpassen lässt, ist die theoretische Anzahl an Vokalen riesig, und die Grenzen zwischen ihnen sind fein. Spanisch begnügt sich mit fünf Vokalen. Japanisch ebenfalls mit fünf. Das Englische hat sich aus historischen Gründen, die nichts mit Logik zu tun haben, für gut viermal so viele entschieden – und schreibt sie dann beharrlich mit denselben fünf Buchstaben auf, die es aus dem Lateinischen geerbt hat. Diese Diskrepanz ist der Kern des Problems. Wer englische Vokale so ausspricht, wie die Buchstaben es nahelegen, liegt meistens falsch. Die Schrift war einfach nie eine verlässliche Landkarte für den Klang.

Deshalb ist diese Übersicht nach Lauten geordnet, nicht nach dem Alphabet. Jeder Vokal bekommt hier ein Ankerwort (ein häufiges Wort mit unmissverständlichem Vokal) und das IPA-Symbol, das Phonetiker dafür verwenden. Wenn du dir das Ankerwort einprägst, hast du einen festen mentalen Griff für diesen Laut – ganz egal, wie wild ein bestimmtes englisches Wort ihn auch schreiben mag.

Wie man Vokale beschreibt

Jeder Vokal wird durch drei Dinge definiert, die dein Mund tut. Sobald du lernst, sie physisch zu spüren, kannst du jeden Vokal korrekt platzieren, ohne ihn mühsam auswendig zu lernen.

Das Erste ist die Öffnung deines Kiefers, in der Phonetik Zungenhöhe genannt. Sag see und danach saw. Bei see ist dein Kiefer fast geschlossen und der Vokal fühlt sich hoch oben im Mund an; bei saw fällt der Kiefer nach unten und der Vokal liegt tief. Das Zweite ist die Position des Zungenrückens – vorn oder hinten. Sag see und dann moon: Der Kiefer bleibt bei beiden fast geschlossen, aber bei see schiebt sich die Zunge weit nach vorn, bei moon zieht sie sich zurück. Dazwischen liegt die zentrale Position. Das Dritte ist die Form deiner Lippen. Bei moon runden sie sich zu einem kleinen Kreis, bei see spreizen sie sich breit. Im Englischen sind fast alle gerundeten Vokale gleichzeitig hintere Vokale, diese beiden Merkmale gehen also Hand in Hand.

Trägt man jeden Vokal auf diesen Achsen ein (hoch bis tief, vorn bis hinten), erhält man die Figur, die Phonetiker als schiefes Viereck zeichnen – das Vokaltrapez. Darin sitzt see in der oberen linken Ecke, moon oben rechts, der cat-Vokal unten links und das weit offene father in Richtung unten rechts. Du musst dir dieses Diagramm nicht aufzeichnen, um diesen Artikel zu nutzen, aber das Konzept dahinter ist elementar: Vokale existieren in einem fließenden Raum. Die unten benannten Vokale sind schlicht die bestimmten Punkte in diesem Raum, die das Englische als bedeutungstragend markiert hat.

Für das amerikanische Englisch sind noch zwei weitere Unterscheidungen extrem wichtig. Die erste ist die Gespanntheit. Einige Vokale werden an den äußersten Rändern des Mundraums mit Muskelspannung geformt und einen Tick länger gehalten (wie der Vokal in sheep). Ihre kürzeren, entspannteren Partner sitzen etwas weiter innen (der Vokal in ship). Diese gespannt-ungespannten Paare sind die größte Fehlerquelle für Lernende, weil viele Sprachen nur einen einzigen Vokal haben, wo das Englische zwei verlangt.

Die zweite Unterscheidung ist, ob ein Vokal gleitet. Ein einfacher Vokal hält eine stabile Position. Ein Diphthong beginnt an einem Punkt und gleitet zu einem anderen, während du ihn noch aussprichst – deshalb fühlen sich Wörter wie day und go an, als wären sie in Bewegung.

Die einfachen Vokale

Dies sind die stabilen Vokale mit nur einer einzigen Mundposition – Phonetiker nennen sie Monophthonge. Im amerikanischen Englisch gibt es neun davon. Lies jedes Ankerwort laut vor und halte den Vokal ganz ruhig; keiner dieser Laute darf sich bewegen, während du ihn sprichst.

Laut	IPA	Ankerwort	Respelling	Wo er im Mund sitzt
SEE-Vokal	/i/	see, beat, sea	ee	Hoch und vorn, gespannt, Lippen gespreizt
SIT-Vokal	/ɪ/	sit, ship, bit	ih	Hoch und vorn, ungespannt (das entspannte see)
BED-Vokal	/ɛ/	bed, met, bet	eh	Mitte vorn
CAT-Vokal	/æ/	cat, bat, sad	a	Tief und vorn, der typischste amerikanische Vokal überhaupt
FATHER-Vokal	/ɑ/	father, hot, cot	ah	Tief und hinten, Kiefer weit geöffnet
SAW-Vokal	/ɔ/	saw, caught, sought	aw	Tief-mitte hinten, Lippen leicht gerundet
BOOK-Vokal	/ʊ/	book, full, look	uu	Hoch und hinten, ungespannt, leicht gerundet
MOON-Vokal	/u/	moon, fool, who	oo	Hoch und hinten, gespannt, Lippen gerundet
FUN-Vokal	/ʌ/	fun, luck, cut	uh	Mitte-zentral; sein unbetonter Zwilling ist das Schwa

Drei dieser Zeilen verbergen die Kontraste, über die deutschsprachige Lernende am häufigsten stolpern: zwei gespannt/ungespannt-Paare und ein Vokal, den es im Deutschen schlichtweg nicht gibt.

Das erste Paar ist /i/ gegen /ɪ/: sheep und ship, beat und bit. Der see-Vokal ist gespannt, die Zunge liegt hoch und weit vorn, und der Klang wird einen Bruchteil länger gehalten. Der sit-Vokal ist seine entspannte Version, etwas tiefer, kürzer und weicher. Wir Deutschen neigen massiv dazu, beides als unser standarddeutsches /iː/ (wie in Miete) auszusprechen – und schon klingt ship eher nach sheep. Das zweite Paar ist /u/ gegen /ʊ/: fool und full, pool und pull. Dieselbe Beziehung zwischen gespannt und entspannt, nur hinten im Mund.

Der dritte Stolperstein ist der cat-Vokal /æ/. Ihn gibt es im Deutschen nicht. Er liegt tiefer als der bed-Vokal und sehr viel weiter vorn als der father-Vokal. Es ist der Laut, der verhindert, dass cat in sich zusammenfällt und wie cot (mit dumpfem a) oder ket (mit deutschem ä) klingt. Wenn dein cat immer wieder in Richtung ket abrutscht, bist du in bester Gesellschaft – dieser Laut erfordert von deutschen Muttersprachlern das meiste Training und bringt den größten hörbaren Effekt.

Ein kleiner, aber wichtiger Vorbehalt an dieser Stelle: Der father-Vokal /ɑ/ und der saw-Vokal /ɔ/ verschmelzen in weiten Teilen der USA derzeit zu einem einzigen Laut (der sogenannte Cot-Caught-Merger). Für einen Großteil der Amerikaner, besonders im Westen und im Landesinneren, klingen cot und caught völlig identisch. Für andere Sprecher, meist im Nordosten und im Süden, bleiben sie getrennt. Beides ist fehlerfreies amerikanisches Englisch. Wenn du bei einem bestimmten Amerikaner keinen Unterschied zwischen cot und caught hörst, hat er diesen Merger – und du kannst beruhigt denselben Vokal für beide verwenden.

Diphthonge – Vokale in Bewegung

Ein Diphthong (Doppellaut) ist ein Vokal, der nicht stillhält. Er beginnt an einer Position und gleitet innerhalb derselben Silbe zu einer anderen. Dein Mund ist also die ganze Zeit in Bewegung, während du sprichst. Sag einmal langsam day und spüre, wie sich dein Kiefer leicht schließt und sich deine Zunge gegen Ende in Richtung der see-Position hebt. Diese Bewegung macht ihn zum Diphthong; als flacher, starrer Vokal gesprochen, klingt das Wort sofort fremd, selbst wenn der Startpunkt richtig war.

Laut	IPA	Ankerwort	Respelling	Die Gleitbewegung
DAY-Diphthong	/eɪ/	day, way	ay	beginnt knapp über bed, gleitet hinauf in Richtung ee
MY-Diphthong	/aɪ/	my, why	ahy	beginnt tief, gleitet hinauf in Richtung ee
BOY-Diphthong	/ɔɪ/	boy, toy	oy	beginnt gerundet und hinten, gleitet hinauf in Richtung ee
NOW-Diphthong	/aʊ/	now, how	ow	beginnt tief, gleitet zurück in Richtung oo
GO-Diphthong	/oʊ/	go, row	oh	beginnt mitte-hinten, gleitet hinauf in Richtung oo

Fällt dir etwas auf? Alle fünf Diphthonge gleiten in Richtung einer der beiden hohen Ecken des Mundes, zu ee oder oo. Genau das tut ein Diphthong: Er wandert von einer offenen Position zu einer geschlossenen. Als Deutschsprachige haben wir hier einen echten Vorteil, da wir Doppellaute wie in Haus, mein oder heute gut kennen. Der häufigste Fehler ist es, die Gleitbewegung bei day oder go abzukürzen, sodass der Vokal am Ende doch flach herauskommt. Ein starres o in go ist in Spanisch oder Deutsch normal, aber ein amerikanisches Ohr wartet auf die Bewegung – fehlt sie, klingt das Wort falsch. Die Lösung: Übertreibe die Bewegung am Anfang ganz bewusst. Sie wird beim flüssigen Sprechen von allein auf ein natürliches Maß schrumpfen.

Ein weiterer Laut gehört streng genommen in diese Familie, allerdings mit einem Sternchen. Der Klang in cute, few und use (der CUTE-Laut, /ju/) wird in vielen Vokaltabellen für Lernende zu den Diphthongen gezählt, so auch bei SayWaader. Eigentlich ist es ein konsonantischer y-Gleitlaut (/j/), gefolgt vom moon-Vokal. Er verhält sich aber wie eine feste Einheit und lässt sich am besten direkt mit den anderen zusammen üben.

Die r-gefärbten Vokale

Hier trennen sich die Wege zwischen amerikanischem Englisch und dem Rest der Welt. Und für uns Deutsche liegt hier eines der auffälligsten Akzent-Merkmale überhaupt.

In einem rhotischen Akzent wie dem amerikanischen Standardenglisch wartet das R nicht brav, bis der Vokal fertig ist. Stehen Vokal und R in derselben Silbe, verschmilzt das amerikanische R nahtlos mit dem Vokal und formt ihn ganz um die Zungenposition des R herum. Das Ergebnis ist eine kleine Gruppe von Vokalen, die ihr R bereits fest in sich tragen. Das britische Englisch lässt diese R-Laute am Silbenende einfach fallen, und das Deutsche macht daraus ein weiches, vokalisiertes „a“ (das -er in Wasser wird zu [ɐ]). Das tief im Mund gehaltene, nach hinten gekrümmte oder gebündelte amerikanische R /ɹ/ mitten im Vokal ist das Markenzeichen dieses Akzents.

Laut	IPA	Ankerwort	Respelling	Notizen
CAR R-Vokal	/ɑr/	car, star, heart	ar	der father-Vokal mit R
MORE R-Vokal	/ɔr/	more, four, door	or	der saw-Vokal mit R
BIRD R-Vokal	/ɜr/	bird, word, first	ur	betont; das reine R als Vokal
MOTHER R-Vokal	/ər/	mother, better	er	unbetont; das r-gefärbte Schwa
HAIR R-Vokal	/ɛr/	hair, care, fair	air	die bed-Region mit R
NEAR R-Vokal	/ɪr/	near, here, beer	eer	die sit-Region mit R
TOUR R-Vokal	/ʊr/	tour, cure, jury	uur	die book-Region mit R; am seltensten, und poor / sure sind meist zu MORE verschmolzen

Die beiden Laute, die hier die Hauptarbeit leisten, sind der bird-Vokal und der mother-Vokal. Sie sind im Grunde derselbe r-gefärbte Klang – einmal betont, einmal unbetont (Phonetiker fassen sie oft in jeweils einem Symbol zusammen: /ɝ/ für das betonte bird und /ɚ/ für das unbetonte mother). Bird, word, first tragen ihn mit Betonung; die endlosen -er-Endungen in mother, better, water, teacher tragen ihn ohne. Beide sind schlicht das reine amerikanische R, das den Job eines Vokals übernimmt. Das mechanische Problem mit der Zungenposition ist hier exakt dasselbe wie beim Konsonanten R. Die vollständige Mechanik dieser Zungenhaltung erklären wir im Artikel über das amerikanische R, und die unbetonte -er-Endung ist schlicht die r-gefärbte Ecke des Schwa-Lauts.

Der Vokal, der alle anderen schluckt

Es gibt noch einen weiteren Vokal, und in reiner Häufigkeit schlägt er alle bisher genannten um Längen: das Schwa, /ə/. Es ist dieses kleine, neutrale „uh“ in der ersten Silbe von about und in der letzten von sofa. Es ist der Laut, auf den eine Silbe in sich zusammenfällt, wenn sie ihre Betonung verliert. Alles kollabiert früher oder später zum Schwa. Photograph behält in der letzten Silbe einen vollen cat-Vokal (FOH-tuh-graf); in photography verliert genau diese Silbe ihre Betonung und der Vokal löst sich zu einem Schwa auf (fuh-TAH-gruh-fee). Der Vokal hat sich nicht geändert, weil andere Buchstaben im Wort stehen. Er hat sich geändert, weil die Betonung weitergewandert ist.

Genau das ist der Grund, warum sich die Vokal-Tabelle oben manchmal so liest, als würde sie eine Sprache beschreiben, die du im echten Gespräch gar nicht hörst. Im fließenden amerikanischen Englisch dürfen nur die betonten Silben ihren vollen Vokal aus der Tabelle behalten. Alles Unbetonte reduziert sich in Richtung Schwa. Deshalb besteht ein amerikanischer Satz aus einer Handvoll kristallklarer Vokale, die den Rhythmus vorgeben, und einer großen Menge an genuschelten „uh“s, die die Lücken dazwischen füllen.

Hier hast du als Deutschsprachiger übrigens einen echten Startvorteil: Du kennst das Schwa auswendig. Es ist exakt das unbetonte „-e“ am Ende von Wörtern wie Sonne, bitte oder Gedanke. Du musst es nur mutiger ins Englische übertragen. Das Schwa bekommt in unserem Schwa-Artikel die ausführliche Aufmerksamkeit, die es verdient. Für diese Übersicht reicht es zu wissen: Der Vokal, den du auf dem Papier liest, ist der Vokal, den eine Silbe hat, wenn sie betont wird – was bei den meisten Silben im realen Sprechen schlicht nicht der Fall ist.

Warum du der Schreibweise nicht trauen darfst

Der einzige Grund, warum englische Vokale überhaupt so eine komplexe Landkarte brauchen – während spanische oder italienische Vokale fast selbsterklärend sind –, ist simpel: Die englische Rechtschreibung hat vor Jahrhunderten aufgehört, die tatsächliche Aussprache abzubilden, und den Anschluss nie wieder gefunden. Zwei Muster stiften das meiste Chaos.

Eine Schreibweise, viele Laute. Der Buchstabe a ist der cat-Vokal in cat, der father-Vokal in spa, der saw-Vokal in all, der day-Diphthong in table, der hair-Vokal in care und ein Schwa in about. Die Buchstabenfolge ou steht für einen Vokal in soup, einen anderen in out, noch einen anderen in though, wieder einen anderen in touch und nochmals einen anderen in could. Du kannst den Vokal niemals mit letzter Sicherheit aus den Buchstaben ablesen.

Ein Laut, viele Schreibweisen. Umgekehrt ist es genauso chaotisch. Der see-Vokal /i/ wird auf sechs verschiedene Arten geschrieben: in see, sea, field, machine, key und people. Der day-Diphthong taucht als day, rain, eight, they und break auf. Immer derselbe Laut, aber fünf oder sechs verschiedene Verkleidungen.

Darüber hinaus grätscht uns oft das Deutsche dazwischen: Wir neigen dazu, vor jedem Vokal am Wortanfang einen winzigen Knacklaut (den glottalen Verschlusslaut) zu setzen. Das Englische tut das nicht – hier sollen Vokale an den Wortgrenzen weich ineinanderfließen (Linking).

Wenn dir also ein neues englisches Wort begegnet, versuche gar nicht erst, von der Schreibweise auf den Klang zu schließen. Schlage den Vokal nach (die IPA-Schrift im Wörterbuch, die Lautschrift in einer App oder einfach dein Ohr bei einem Muttersprachler) und hefte den Klang direkt an das Wort. Die Tabelle oben gibt dir dafür die kompakte Liste der tatsächlichen Ziele. Die Schreibweise ist nur das unzuverlässige Etikett außen auf der Verpackung.

Übungssätze

Lies jede Zeile laut, zweimal, schön langsam. Diese Sätze sind randvoll mit den Kontrasten, auf die es ankommt: den gespannt-ungespannten Paaren, dem cat-Vokal, den gleitenden Diphthongen und den r-gefärbten Vokalen. Die tückischen Vokale sind durch die englische Lautumschrift (Respelling) markiert.

Ein Tipp für deutsche Zungen: Achte ganz besonders auf die Endkonsonanten bei Wörtern wie „cab“, „bad“ oder „road“. Im Deutschen machen wir harte Konsonanten am Wortende automatisch stimmlos (Auslautverhärtung) – aus „road“ wird bei uns „roat“. Im Englischen muss der Konsonant weich und stimmhaft bleiben. Als Faustregel hilft dabei: Halte den Vokal davor bewusst etwas länger – im Englischen ist der Vokal vor einem stimmhaften Endkonsonanten hörbar länger als vor einem stimmlosen.

Did you see the ship leave? Did you SEE the SHIHP leave?
The pool is full by noon. The POOL is FUUL by NOON.
I can't catch the last cab. I KANT KACH the LAST KAB.
She bought a small ball. She BAWT a SMAWL BAWL.
Look at the full moon tonight. LUUK at the FUUL MOON tonight.
My boy found a toy downtown. MAHY BOY found a TOY downtown.
The bird heard the word first. The BURD HURD the WURD FURST.
Her father parked the car. Her FAH-ther parked the KAR.
Go slow on the open road. GOH SLOH on the open ROHD.
Take the same way home today. TAYK the SAYM WAY home toDAY.

Wenn sich eine Zeile nach anstrengender Arbeit anfühlt, drossle das Tempo so weit herunter, bis jeder Vokal voll ausgebildet ist. Bring den Satz erst dann wieder auf Sprechgeschwindigkeit. Das Ziel ist es, den Kontrast jederzeit auf Abruf abfeuern zu können – damit dein ship nie wieder ungewollt beim sheep anlegt.

Was deine Muttersprache damit zu tun hat

Dein Startpunkt beim Englischlernen hängt primär davon ab, wie fein deine Muttersprache ihre eigenen Vokale unterteilt. Eine Sprache mit einem Fünf-Vokal-System muss die rund zwanzig englischen Laute zwingend in fünf Schubladen quetschen. Eine Sprache mit einem ohnehin schon üppigen Vokalinventar hat weniger dieser harten Kollisionen, bringt dafür aber ganz eigene Lücken mit.

Deine Muttersprache	Vokalinventar vs. Englisch	Worauf du dich konzentrieren musst
Spanisch	✗ Fünf Vokale a e i o u, jeder einzelne stabil und rein; keine gespannt-ungespannten Paare, und die mittleren Vokale e und o bleiben starr, wo das Englische sie gleiten lässt (day, go)	Der Startpunkt mit den meisten Kollisionen. Trainiere zuerst die gespannt/ungespannt-Paare (sheep/ship, fool/full), dann den cat-Vokal und achte darauf, die Diphthonge am Ende nicht flach abzuwürgen.
Italienisch	✗ Sieben Vokale kennt die Kontraste von bed vs. day und saw vs. go, hat aber keinen Qualitätskontrast bei Gespanntheit und keinen cat-Vokal	Ähnlich wie beim Spanischen. Der cat-Vokal und die ungespannten sit/book-Vokale sind die Hauptziele. Auch hier müssen die gleitenden Vokale geschützt werden.
Japanisch	✗ Fünf Vokale a i u e o mit einem separaten lang/kurz-Kontrast, der nicht mit der englischen Gespanntheit übereinstimmt	Die ungespannten Vokale (sit, book) und der cat-Vokal fehlen hier. Vorsicht: Englische „Länge“ ist meist eine veränderte Zungenposition, nicht nur reine zeitliche Dauer.
Mandarin-Chinesisch	~ Mittelgroß, ganz andere Struktur eine Handvoll Vokalphoneme mit vielen kontextabhängigen Varianten; die 儿化 (erhua) R-Endung sorgt für etwas Vertrautheit mit r-gefärbten Endsilben	Der Stau vorne im Mund macht die Arbeit: see/sit, bed/cat. Die r-gefärbten Vokale fallen dank Erhua meist leichter, auch wenn das Mandarin-R nicht exakt das amerikanische ist.
Koreanisch	~ Sieben oder acht Vokale ein recht reiches System, aber die see/sit-Region und die bed/cat-Region neigen dazu, in jeweils einen Laut zusammenzufallen	Konzentriere dich darauf, diese beiden vorderen Paare aufzuspalten und den cat-Vokal zu treffen. Die Diphthonge machen meist wenig Probleme.
Hindi	~ Reichhaltige, qualitätsbasierte Paare zehn oder elf Vokale, deren kurz/lang-Paare sich in der Qualität ähnlich unterscheiden wie im Englischen; cat landet aber oft auf bed oder father	Der cat-Vokal und der Kontrast zwischen saw und go sind die Hauptziele. Die muttersprachlichen Qualitätspaare sind ein enormer Vorteil, um die englische Gespanntheit zu hören.
Arabisch	✗ Drei Qualitäten a i u, jeweils kurz und lang; der ganze überfüllte vordere englische Raum (see/sit/bed/cat) fällt in ein oder zwei Schubladen	Die vorderen Vokale müssen Stück für Stück auseinandergezogen werden. Erwarte am Anfang, dass sit, bed und cat für dich völlig gleich klingen, und trenne sie ganz bewusst.
Französisch	~ Reichhaltig, aber monophthongisch viele Vokale, darunter auch vordere gerundete (die dem Englischen fehlen), aber die französischen Vokale sind rein, ohne gleitende Diphthonge	Das reiche Inventar hilft bei den einfachen Vokalen enorm. Die Arbeit liegt bei den Gleitbewegungen: Day und go müssen wandern, sie dürfen nicht starr bleiben. Vorsicht auch bei den ungespannten sit und book.
Deutsch	✓ Reichhaltig, mit Gespanntheit besitzt gespannt/ungespannt-Paare (bieten/bitten), das Schwa (Sonne) und ähnliche Diphthonge – der größte Startvorteil aller großen Muttersprachen	Wir klagen auf hohem Niveau, müssen aber feintunen. Der cat-Vokal fehlt uns völlig. Außerdem müssen wir das typisch deutsche, am Ende vokalisierte R (das -er in Mutter ist ein Vokal!) durch das gebündelte, tief im Mund sitzende amerikanische R ersetzen. Und: Weg mit der Auslautverhärtung (bed nicht als bet sprechen) und dem Knacklaut vor Vokalen am Wortanfang!
Portugiesisch (Brasilien)	~ Sieben orale Vokale plus Nasale offen/geschlossen-Kontraste in der Mitte helfen, aber keine typisch englischen gespannt/ungespannt-Paare, und Vokale am Wortende werden oft angehoben	Die ungespannten Vokale (sit, book) und der cat-Vokal sind die Ziele. Vermeide es, Endvokale in Richtung ee oder oo hochzuziehen.
Russisch	~ Fünf oder sechs Vokale mit starker unbetonter Reduktion; die Unterscheidungen zwischen see/sit und das cat sind nicht muttersprachlich	Trenne see von sit und baue den cat-Vokal neu auf. Die russische Gewohnheit, Vokale in unbetonten Silben massiv zu reduzieren, hilft dem englischen Schwa enorm – auch wenn die vollen Vokale Arbeit brauchen.

Das wiederkehrende Muster quer durch diese Tabelle ist offensichtlich: Vorne im Mund ballen sich für fast jeden die Probleme. Das see/sit-Paar, das bed/cat-Paar und der cat-Vokal für sich genommen sind exakt die Kontraste, die die meisten Sprachen nicht ziehen. Genau dort lohnt sich also die investierte Zeit am schnellsten. All das ist kein Fehler deines Gehörs. Es sind schlicht Unterscheidungen, die das Englische trifft und deine Muttersprache eben nicht. Und du kannst absolut lernen, sie zu hören und zu produzieren.

FAQ

Wie viele Vokallaute gibt es im amerikanischen Englisch?

Rund zwanzig, aber die genaue Zählung wird lebhaft debattiert und hängt davon ab, wie man definiert. Viele Nachschlagewerke landen bei etwa fünfzehn, wenn sie die einfachen Vokale und Diphthonge zählen und die r-gefärbten Vokale schlicht als Vokal-plus-R statt als eigenständige Laute behandeln. Die Klangbibliothek von SayWaader zählt zweiundzwanzig: neun einfache Vokale, sechs Diphthonge und sieben r-gefärbte Vokale. Zwei spezifische Eigenheiten verschieben die Zahl oft nach unten: Viele Amerikaner fassen die Vokale in cot und caught zusammen (was einen Laut abzieht), und das Schwa /ə/ sowie der Vokal in fun werden phonetisch oft als ein einziger Laut behandelt, der sich je nach Betonung verändert.

Was ist der Unterschied zwischen einem Monophthong und einem Diphthong?

Ein Monophthong ist ein Vokal, der die ganze Zeit, während du ihn sprichst, eine stabile, unbewegliche Position hält – wie der Vokal in see oder cat. Ein Diphthong hingegen ist ein Vokal, der innerhalb einer einzigen Silbe von einer Position zu einer anderen gleitet – wie der Vokal in day (der nach oben Richtung ee gleitet) oder in now (der zurück Richtung oo wandert). Das amerikanische Englisch hat neun Monophthonge und fünf Kern-Diphthonge (sechs, wenn du den cute-Laut /ju/ mitzählst). Der häufigste Fehler von Lernenden ist es, die Gleitbewegung beim Diphthong zu früh abzubrechen, sodass der Vokal flach und fremd klingt.

Warum klingen 'cot' und 'caught' für einige Amerikaner völlig gleich?

Wegen des Cot-Caught-Mergers. Das ist eine lautliche Verschmelzung, bei der der father-Vokal /ɑ/ und der saw-Vokal /ɔ/ zu einem einzigen hinteren Vokal zusammengefallen sind. Dieser Wandel ist über den Westen und weite Teile des amerikanischen Landesinneren verbreitet – dort klingen cot und caught oder don und dawn identisch. Sprecher in Teilen des Nordostens und im Süden halten sie hingegen noch streng getrennt. Da beides fehlerfreies amerikanisches Standardenglisch ist, kannst du, wenn ein Sprecher sie verschmilzt, problemlos denselben Vokal für beide nutzen.

Welcher amerikanische Vokal ist für Nicht-Muttersprachler am schwersten?

Für die meisten Lernenden – und ganz besonders für Deutschsprachige – ist es der cat-Vokal /æ/, also der Laut in cat, bad und map. Viele Sprachen haben an genau dieser Stelle im Mund keinen Vokal. Deshalb wird er oft in Richtung des bed-Vokals gezogen (und cat klingt plötzlich nach deutschem ket) oder in Richtung des father-Vokals (cat klingt dann wie cot). Dicht dahinter folgen die gespannt-ungespannten Paare vorne im Mund (see vs. sit) und hinten im Mund (moon vs. book), weil sie verlangen, dass man einen gewohnten Vokal plötzlich in zwei verschiedene aufspalten muss.

Sind r-gefärbte Vokale wirklich echte Vokale oder nur ein Vokal plus ein R?

Beide Beschreibungen sind üblich. In einem rhotischen Akzent wie dem amerikanischen Standardenglisch verschmilzt das R so extrem mit dem vorhergehenden Vokal, dass Phonetiker das Ergebnis oft als einen einzigen r-gefärbten Vokal notieren (das /ɝ/ in bird, das /ɚ/ in mother). Andere Analysen sehen darin schlicht einen normalen Vokal, gefolgt vom Konsonanten R. Für dich als Lernenden spielt diese Unterscheidung kaum eine Rolle. Wichtig ist nur, dass das amerikanische R den Vokal fundamental verändert und – im Gegensatz zum britischen oder deutschen R – am Silbenende immer voll ausgesprochen werden muss. Die mechanischen Details dazu findest du im Artikel über das amerikanische R.

Muss ich die IPA-Symbole auswendig lernen, um diese Übersicht zu nutzen?

Es hilft ungemein, ist aber keine Pflicht. Die Ankerwörter erledigen die eigentliche Arbeit: Wenn du jeden Vokal fest an ein Wort knotest, das du ohnehin schon perfekt aussprechen kannst (see, cat, moon), kannst du den Vokal jedes unbekannten Wortes nachschlagen, indem du ihn einfach mit einem deiner Ankerwörter abgleichst. Das IPA-Symbol ist vor allem extrem nützlich, wenn du ein Wörterbuch liest – dort verrät dir das winzige /ɪ/ gegenüber dem /i/ auf den ersten Blick, ob ein Wort den sit-Vokal oder den see-Vokal verlangt.

end of article

Die fünf Vokal-Buchstaben im Englischen sind schlicht ein historischer Unfall. Sie werden dich belügen, solange du versuchst, englische Wörter durch ihre Linse zu betrachten. Du musst dir nun keine zwanzig neuen phonetischen Symbole einpauken. Verknüpfe einfach jeden Vokal fest mit einem Ankerwort, das du ohnehin in deinem Wortschatz hast. Greif dir gezielt die zwei oder drei Kontraste heraus, die das Deutsche von sich aus nicht trennt, und trainiere sie, bis der Unterschied automatisch abläuft. Diese Übersicht dient dir dann einfach als Landkarte, zu der du jederzeit zurückkehren kannst, wenn dich ein Wort überrascht.

Amerikanische Vokale: Die komplette Übersicht – und warum fünf Buchstaben nicht reichen

Fünf Buchstaben, viel mehr Laute

Wie man Vokale beschreibt

Die einfachen Vokale

Diphthonge – Vokale in Bewegung

Die r-gefärbten Vokale

Der Vokal, der alle anderen schluckt

Warum du der Schreibweise nicht trauen darfst

Übungssätze

Was deine Muttersprache damit zu tun hat

FAQ

Von SayWaader Editorial

Die Regel lesen ist der Anfang.
Sie umzusetzen ist die Arbeit.

Fünf Buchstaben, viel mehr Laute

Wie man Vokale beschreibt

Die einfachen Vokale

Diphthonge – Vokale in Bewegung

Die r-gefärbten Vokale

Der Vokal, der alle anderen schluckt

Warum du der Schreibweise nicht trauen darfst

Übungssätze

Was deine Muttersprache damit zu tun hat

FAQ

Von SayWaader Editorial

Weiterlesen

Shadowing — Die eine Technik, die deinen Akzent am stärksten verändert

Ship vs. Sheep – Warum /ɪ/ und /iː/ zwei verschiedene Vokale sind

Amerikanisches Englisch für spanische Muttersprachler: 11 Fehler, die deine Herkunft verraten

Die Regel lesen ist der Anfang.Sie umzusetzen ist die Arbeit.

Die Regel lesen ist der Anfang.
Sie umzusetzen ist die Arbeit.