「発音の違いは聞き取れるのに、自分では発音できない」のはなぜか？（知覚と産出のギャップを解明）

Q: 耳のトレーニングやミニマル・ペアの練習で、本当に発音が良くなるのですか？

はい、その効果は研究でも実証されています。ミニマル・ペアとは、right と light、あるいは sheep と ship のように、1つの音だけが異なる単語のペアのことであり、これにより特定の音の対立だけを孤立させて練習できます。実験によると、難しい音の対立を「聞き分ける」訓練だけを集中的に受けた学習者が、その後、直接発声の練習をしていないにもかかわらず、以前より正確に発音できるようになることがわかっています。耳の中の「的」がシャープになることで、口がより正確に狙いを定められるようになるからです。発音学習において、リスニングは単なる準備運動ではなく、極めて重要な役割を担っています。

自分の間違いが「聞こえてしまう」。だからこそ、もどかしいのです。

単語を発音した瞬間、それが間違っていることに口を出たそばから気づきます。そこでもっとゆっくり、慎重に、今度こそはと意識して言い直してみても、やはり同じ箇所で同じように間違えてしまいます。エラーを出した瞬間に耳がそれを察知して警告を出しているのに、口がどうしてもその修正指示を受け付けてくれないのです。

これは、発音を改善していく過程で最も戸惑う段階の一つですが、事前に警告してくれる人はほとんどいません。「音が正確に聞き取れるようになれば、正しく発音できるようになるのも時間の問題だ」と思われがちだからです。しかし実際には、お手本となるターゲットの音を完璧に聞き取り、自分の発音との違いもはっきりと分かっているのに、どうしてもその差を埋められない単語にぶつかることがあります。まるで自分に欠陥があるかのように感じるかもしれませんが、事態はまったく逆です。あなたの「耳」が「口」よりも先に進歩した証拠であり、これこそが正しい学習の順序なのです。

**まだ自分では発音できない音を聞き取れるようになるのは正常なことであり、失敗ではなく進歩の証です。**発音も含め、ほぼすべての運動技能において知覚（perception）は産出（production）に先行します。つまり、体が正しい動きを覚えるよりも先に、耳がターゲットの音を正確に判断できるようになるのです。これは、音を捉える感覚が、音を作る筋肉の習慣よりも早く研ぎ澄まされている状態だと言えます。このギャップを埋めるのに「力み」は禁物です。ミニマル・ペアを使った集中的なリスニングで音の輪郭をさらにシャープにし、無理に力を入れるのではなくゆっくりと優しく発音し、筋肉の習慣が追いつくまでの数週間をじっくりと待ちましょう。

誰も教えてくれない「もどかしい中間段階」

人は新しい音を習得する過程を「壁」のように想像しがちです。つまり、最初は聞き取ることも発音することもできないが、ある日突然、両方が同時にできるようになる、というイメージです。しかし実際の学習には、その「壁のイメージ」から抜け落ちている中間段階が存在します。他人の発音はもちろん、自分の発音であっても音の違いは聞き取れるのに、口はどうしても古い自己流の発音に戻ってしまう段階です。つまり、「実行する力（口）」が追いつくより先に、「判断する力（耳）」だけが先に身についている状態なのです。

この居心地の悪さの正体は明確です。音の違いが聞き取れなかった頃は、何がずれているのかさえ分からなかったので、何も気になりませんでした。「無知は平穏」だったのです。しかし今や、発音するたびに自分自身によるリアルタイムの厳しい審査が伴います。単語を口にするたびに耳がそれを採点し、「まだ違う」という評価を下すのです。耳が良くなればなるほど、そのダメ出しの声は大きくなります。多くの学習者は、これを退歩だと勘違いしてしまいます。1ヶ月前は平気だったのに今はこんなにイライラしているのだから、下手になっているのだと感じてしまうのです。しかしそれは、新たな「知覚」のスイッチが入ったからこその不快感です。検知できないエラーに対して苛立つことは不可能です。

ですから、この段階でまずすべきことは、今起きていることの正体を正しく認識し、「自分には耳が悪い、才能がない」と思い込むのをやめることです。ギャップが気になって仕方がないという事実こそが、あなたの耳が正常に機能している何よりの証拠です。単に、口の筋肉が耳よりも遅い時計で動いているだけなのです。

なぜ「知覚」は「産出」に先行するのか

耳が先に正解に辿り着くのには理由があります。そしてこれは、言語学習に限った話ではありません。私たちが身体を使うスキルを学ぶ際の、ごく一般的なメカニズムなのです。

これまでに体を使って習得してきたことを思い浮かべてみてください。ピアノの練習では、自分の指が正しい鍵盤を確実に叩けるようになるずっと前から、間違った音を出せばすぐに耳で気づけたはずです。テニスのサーブでも、自分の腕でスムーズなフォームを再現できる前から、プロの美しいサーブとぎこちない素人のサーブを見分けることはできたでしょう。良い結果を「認識」することと、それを「実行」することは、それぞれ別のシステムで動いており、認識のシステムの方が先に成熟するのです。発音も、こうしたスポーツや楽器と同じ運動技能（モータースキル）の一つです。音を出す行為は、舌、唇、顎、声帯をほんの一瞬の間に正確な位置へ動かす、素早く高度に調整された連鎖運動です。その動きが「どんな音になるべきか」を正確に知っていても、筋肉を動かすためのプログラムが自動的に手に入るわけではありません。筋肉のプログラムは、テニスのサーブと同じように、反復によって少しずつ構築されていくものなのです。

ただし、発音にはテニスのサーブにはない複雑な事情があります。私たちは生まれてからずっと、母語のための古い運動プログラムを使い続けてきました。日本語を母語とする場合、乳幼児期に日本語の音素カテゴリーが脳にインストールされ、最初の1年の間に、日本語で重要な音の違いにだけ敏感になり、それ以外の違いは無視するように脳のチューニングが完了しています。この音のカテゴリーは、決してニュートラルなものではありません。音声学の研究者は、母語の音素カテゴリーが「磁石」のように機能すると説明しています。新しい音が既存のカテゴリーの近くに落ちると、その中心へと強く引き寄せられ、本来の新しい音としてではなく、馴染みのある「似た音」として聞こえ、発音されてしまうのです。

だからこそ、日本人にとって最も難しいのは、完全に未知の音ではなく、日本語の音に近い「似て非なる音（ニアミス）」なのです。比較対象がない完全に新しい音であれば、脳内にまっさらな新カテゴリーを築くことができます。しかしニアミスの音は、古いカテゴリーに捕獲され、「一番近い音」のファイルに分類されてしまうのです。

自分自身の声に潜む死角

この背景には、さらにもう一つの厄介な罠が潜んでいます。冒頭でお話しした、発音した瞬間に耳が捉える「明らかなエラー」は、実は脳の監視をすり抜けるほど大きかった一部のミスに過ぎません。それ以外の多くのエラーは、自分では気づかないまま通り過ぎています。自分が話している時、あなたの耳は完全な客観性を保てていません。脳内にはすでに「これから何を言おうとしているか」という予測があり、話す勢いの中で、実際に口から出た音よりも、自分が「言おうと意図した音」の方を聞き取ろうとするバイアスがかかるのです。最も大きなズレだけがこのフィルターを通過するため、一部のエラーはリアルタイムで痛いほど自覚できます。しかし、小さなズレは見過ごされ、実際には間違って発音している単語でも「今のは完璧に言えた」と錯覚してしまうのです。

録音して自分の声を聞くことは、この「予測による自己音声の錯覚」を取り払ってくれます。再生された音声には何のフィルターもかかっていないため、生の信号がそのまま耳に届きます。そして多くの人がその結果に愕然とします。「自分の声がこんな風に聞こえていたなんて」と。ただ宙に向かって発音練習をするよりも、自分の声を録音することがはるかに効果的である理由はここにあります。自分の発音を「死角」から引きずり出し、他人の声を聞き分ける時と同じ、すでに正しく機能している「優れた耳」の前に差し出すことができるからです。多くの学習者は、自分のライブの音声で音の違いに気づくよりずっと前に、他人の声であればその違いを明確に聞き取ることができます。録音は、そのギャップを埋める架け橋なのです。リアルタイムでエラーに気づけるようになった後でも、録音は自分が気づかずに見過ごしている小さなミスを拾い上げてくれるため、長く重宝するツールとなります。

力任せの発音が逆効果になる理由

口が思い通りに動かない時、私たちの自然な本能は「無理やり押し通そう」とすることです。舌をこわばらせ、顎に力を入れ、喉を締め付け、より大きな声で力強く発音し、努力さえすれば正しい音の枠に押し込めることができるかのように頑張ってしまいます。しかし、これはほぼ確実に裏目に出ます。理由は2つあります。

1つ目は、身体の動きそのものに関する理由です。ほとんどの新しい英語の音は、小さく、リラックスした、精密な動きを必要とします。そして「力み」は精密さの最大の敵です。緊張した舌は不器用になります。力を込めると、目的の音には本来関係のない筋肉まで動員してしまい、求めている微細な調整がさらに難しくなってしまうのです。

2つ目の理由は運動学習に関するものです。緊張して歪んだ音を無理やり出すたびに、あなたは何かを練習していることになりますが、それは「緊張して歪んだ音を出す練習」に他なりません。修正されないまま反復すれば、意図した音ではなく、実際にやってしまった間違った動きが体に刻み込まれていきます。力んだ発音を10回繰り返しても、1回の綺麗な音にはなりません。後で解きほぐさなければならない「力みの癖」を蓄積しているだけなのです。

ここが、非常に理不尽に感じられる部分でしょう。純粋な筋肉運動として捉えれば、努力すればするほど結果は悪くなります。なぜなら、人間の体において「努力（頑張ろうとすること）」と「緊張（力むこと）」はほぼ同じジェスチャーであり、その緊張が動きを台無しにしてしまうからです。ここを切り抜ける方法は、もっと力を入れることではありません。力を抜き、スピードを落とし、より注意深く聞くことなのです。

無理に発音するより、まずはリスニングを

力任せに発音するのが間違ったアプローチだとすれば、正解は何でしょうか？その答えは主に、「耳」をもっと意図的に使うことにあります。音声学の研究における直感に反する発見の一つは、「知覚（リスニング）の訓練が、結果的に産出（スピーキング）を向上させる」ということです。場合によっては発音練習を一切しなくても効果が出ます。ある有名な研究では、英語の /r/ と /l/ の違いについて、純粋に「聞く」だけの訓練を受けた日本人の被験者が、その後、口を動かす練習をまったくしていないにもかかわらず、以前よりも正確に（完璧ではないにせよ、測定可能なレベルで）その対立を発音できるようになりました。耳のなかでターゲットの音の輪郭がシャープになったことで、口の筋肉がより明確な「的（まと）」を狙えるようになったのです。

これを実践する方法が、ミニマル・ペア（最小対）を使ったリスニングです。ミニマル・ペアとは、たった1つの音だけが異なる2つの単語の組み合わせのことであり、これを使うことで、鍛えたい音の違いだけに焦点を絞ることができます。学習者を最も苦しめるのは、たいてい先ほど述べた「ニアミス」の音です。すでに自分が持っている音のカテゴリーに近すぎるため、耳が2つの音を同じ箱に放り込んでしまうのです。だからこそ、耳でしっかりと2つの音を切り離す訓練に時間をかける価値があります。

対立する音	ミニマル・ペア	つまずきやすい学習者
/r/ vs /l/	right / light	日本語、韓国語話者
/iː/ vs /ɪ/	sheep / ship	スペイン語、アラビア語話者など多数
/θ/ vs /s/	think / sink	フランス語、ドイツ語、日本語話者
/v/ vs /w/	vine / wine	ヒンディー語、ドイツ語話者
/æ/ vs /ɛ/	bad / bed	スペイン語、イタリア語話者など多数

（※日本語の「ラ行」の子音は、アメリカ英語のフラップ T と同じ「歯茎弾き音」という音であり、アメリカ英語の R とも L とも全く異なります。日本語話者はこの既存の「ラ行」の箱に両方を引き寄せてしまいがちなため、まずは耳でそれぞれの違いを明確に分離することが特に重要になります）

まずはこうしたペアを「耳」だけで練習してください。1人だけでなく、複数のネイティブスピーカーがその2つの単語を発音している録音を探します。たった1人の声だと、その人の独特の癖を覚えるだけになってしまいます。複数の話者のバリエーションを聞くことで、音の違いそのものを本質的に学ぶことができます。そして、文字を見なくても、速いスピードで再生されても、毎回確実に2つの音を聞き分けられるようになるまで聴き込んでください。これが知覚の土台です。自分ではできていると思い込んでいても、実はこの土台がまだ固まっていない学習者は少なくありません。耳のなかで2つの単語が明確に別の音として聞こえるようになって初めて、発音練習に取り組む価値のある「的」が用意されたことになります。

いざ実際に口を動かす段階になったら、ゆっくりと進めましょう。会話のスピードよりもずっと遅く、不自然に感じるくらいまで落とし、ゴールを急ぐのではなく「今、舌がどこにあるか」を感じながら、スローモーションに近い感覚で音を作ります。ゆっくりやることには2つの意味があります。1つは、監視するための時間を確保することです。動きが間違った方向に進み始めたら、まだ修正可能な段階で気づくことができます。もう1つは、フルスピードで無意識に発動してしまう「古い運動プログラム」の呪縛を解くことです。自分の発音を録音して確認し、ネイティブのお手本と比べ、微調整し、もう一度発音する。このゆっくりとした、リラックスした、注意深いループこそが、筋肉の習慣を変えるのです。速く、緊張した状態で回数をこなしても、古い溝をさらに深く彫り込むだけです。スローモーションで確実に音が出せるようになったら、会話のペースに向けて少しずつスピードを戻していきましょう。そうすれば、実際に話す時にも新しい口の動きを維持できるようになります。

「待つこと」も立派なテクニック

たとえすべてを正しくこなしたとしても、耳が新しい音を完璧に捉えるようになってから、口がそれを意のままに発音できるようになるまでにはタイムラグがあります。そして、どれだけ強く願っても、そのラグをゼロにすることはできません。運動の習慣は、独自のスケジュールで定着していくものだからです。今日練習した動きは、練習をやめた後も、とくに睡眠中などに定着のプロセスを進めます。そのため、その日の練習中よりも、1日か2日経ってから急に効果が現れることがよくあります。火曜日にはどうしてもできなかった発音が、木曜日にはあっさりできるようになるのはこのためです。週末に90分間ぶっ続けで練習するよりも、1回10分の集中した練習を数日間に分けて複数回行う方がはるかに効果的です。なぜなら、記憶と筋肉の「定着（consolidation）」は、セッションの最中ではなく、セッションの合間に起こるからです。これは、あらゆるスキルの練習に共通する「分散学習」の原則です。

したがって、ここで言う「忍耐（待つこと）」は、単なる気休めや「頑張り続けろ」という精神論ではありません。それは正しい「テクニック」なのです。知覚と産出のギャップは、明確な原因を持つ現実的なタイムラグであり、その期間中にやるべきことは、耳に良質な音のデータを送り続け、ゆっくりと優しく発音練習をし、筋肉の習慣が定着するのを「待つ」ことです。この仕組みを理解している学習者は、タイムラグを失敗だとみなすのをやめ、力任せに発音するのをやめます。だからこそギャップが縮まるのです。一方、ギャップにパニックを起こして無理に力を込めてしまう人は、そこから抜け出せなくなります。力むこと自体が、古い間違った音を固定化する原因だからです。

すべての音を改善するのにどのくらいの期間がかかるのか、より広い視点から知りたい方は、数週間から数ヶ月にわたるタイムラインを解説したこちらの記事をご覧ください。

読者からの質問

発音の違いは聞き取れるのに、自分で正しく発音できないのはなぜですか？

音を聞き取ることと、音を発音することは別のシステムで動いており、「聞く」システムの方が先に成熟するからです。正しい音だと認識するのは知覚であり、その音を作るのは舌、唇、顎、声帯の連鎖的な運動技能です。ほぼすべての身体的スキルにおいて、良い結果を判断する能力は、それを実際にやってのける能力よりも先に現れます。手が正しい鍵盤を弾けるようになる前に、間違った音が耳でわかるのと同じです。まだ言えない音の違いが聞き取れるのはごく正常なことであり、才能がないわけではなく、耳が口よりも先行して成長している証拠です。

新しい発音を学ぶ際、常に「知覚」が「産出」より先に来るのでしょうか？

基本的にはその通りです。口の筋肉が正確に狙いを定めるには、まず耳の中にターゲットの明確なイメージができている必要があります。しかし多くの学習者は、自分が思っているほど知覚の土台が固まっていません。集中的なリスニングやミニマル・ペアの練習を通じて音の正確なメンタルモデルを構築することこそが、発音練習を実りあるものにするための前提条件となります。耳を鍛えるトレーニングが結果的にスピーキングを向上させるのはこのためです。

耳のトレーニングやミニマル・ペアの練習で、本当に発音が良くなるのですか？

はい、その効果は研究でも実証されています。ミニマル・ペアとは、right と light、あるいは sheep と ship のように、1つの音だけが異なる単語のペアのことであり、これにより特定の音の対立だけを孤立させて練習できます。実験によると、難しい音の対立を「聞き分ける」訓練だけを集中的に受けた学習者が、その後、直接発声の練習をしていないにもかかわらず、以前より正確に発音できるようになることがわかっています。耳の中の「的」がシャープになることで、口がより正確に狙いを定められるようになるからです。発音学習において、リスニングは単なる準備運動ではなく、極めて重要な役割を担っています。

無理に音を出そうとしたり力んだりすると、かえって発音が悪くなるのはなぜですか？

ほとんどの音声は、小さく、リラックスした、精密な動きで作られるため、緊張はその精密さを壊してしまうからです。力むと、目的の音に関係のない筋肉までこわばり、微細な調整がさらに難しくなります。また、発音練習は「実際にやった動き」を体に定着させる行為です。そのため、無理をして緊張し、歪んだ音を出してしまうと、その「緊張した状態」が習慣として刻み込まれてしまいます。解決策は、力で押し切ろうとするのではなく、モデル音声と照らし合わせながら、ゆっくりと優しく音を作ることです。

録音を聞くと発音の間違いに気づくのに、話している最中には気づけないのはなぜですか？

話している最中の脳は、実際に口から出た音よりも「自分が言おうと意図した音」を予測して聞いている部分があるからです。自分の運動計画と期待値によって、リアルタイムの認識のギャップが埋め合わされてしまいます。録音はこの予測フィルターを外し、生の信号を聞かせてくれるため、多くの人が自分の再生音声に驚くのです。自分の発音を録音して聞き返すことは、自分の声の「死角」をなくし、他人の声を聞き分けるのと同じ客観的な耳で自分を審査する最も確実な方法です。

音を聞き取れるようになってから、実際に言えるようになるまでのギャップを埋めるには、どのくらい時間がかかりますか？

対象となる音や、知覚と運動習慣のズレの大きさによって異なりますが、通常は数日ではなく、短く頻繁な練習を「数週間」続ける必要があります。運動の習慣は、睡眠中など練習と練習の合間に定着していくため、1回の長い練習よりも、何日にもわたって分散させた練習の方が効果的です。また、セッションの最中よりも、その1〜2日後に急に進歩が見られることもよくあります。このギャップは現実のタイムラグであり原因が存在するため、無理に抵抗して力むのではなく、優しく練習を続けながら習慣が追いつくのを「待つ」ことが最も有効な対処法です。

end of article

「聞き取れる音」と「発音できる音」のギャップは、あなたの中で何かが確実に変化し始めていることを示す最も明確なサインです。それは、耳が口のレベルを追い越した時にだけ現れるものであり、努力と力任せで両者を強引にくっつけようとするのをやめた時に初めて解消されます。リスニングを研ぎ澄まし、ゆっくりと静かに練習を続け、待ち時間も「メソッドの一部」として受け入れてください。決して効果が出ていないサインではありません。必要な数週間をかければ、必ず口の筋肉は追いついてきます。「口」は「耳」よりも時間がかかるものなのです。それが学習の正しい順序というものです。

「発音の違いは聞き取れるのに、自分では発音できない」のはなぜか？（知覚と産出のギャップを解明）

誰も教えてくれない「もどかしい中間段階」

なぜ「知覚」は「産出」に先行するのか

自分自身の声に潜む死角

力任せの発音が逆効果になる理由

無理に発音するより、まずはリスニングを

「待つこと」も立派なテクニック

読者からの質問

著者： SayWaader 編集部

ルールを読むのは始まりにすぎない。
実際に発音するのが本番だ。

誰も教えてくれない「もどかしい中間段階」

なぜ「知覚」は「産出」に先行するのか

自分自身の声に潜む死角

力任せの発音が逆効果になる理由

無理に発音するより、まずはリスニングを

「待つこと」も立派なテクニック

読者からの質問

著者： SayWaader 編集部

続きを読む

「発音の訛り」が抜けるまでどのくらいかかる？ 現実的な学習期間と、成果を分ける5つの要因

Ship と Sheep の違い — /ɪ/ と /iː/ は「長さ」ではなく「全く別の母音」

スペイン語話者のためのアメリカ英語発音：母語が透けて見える11の癖

ルールを読むのは始まりにすぎない。実際に発音するのが本番だ。

「発音の訛り」が抜けるまでどのくらいかかる？現実的な学習期間と、成果を分ける5つの要因

ルールを読むのは始まりにすぎない。
実際に発音するのが本番だ。