Light 和 right 听起来一模一样。Vote 变成了 boat。而 desk 凭空多出了英语里根本没有的元音:de-su-ku。
如果你的母语是日语,你肯定听过这三种发音,甚至可能就是你自己发出来的。这不是因为你不用心或耳朵不灵敏,而是两股力量叠加作用的结果。第一股力量源于语言结构:日语的发音系统十分规整,由辅音加元音构成节拍,有五个元音和一个流音,并且使用音高系统而非重音;而英语却总是对你的发音器官提出这个系统从未见过的要求。第二股力量则是其他语言鲜少面临的:英语早已“潜伏”在日语之中。几十年前,成千上万的英语单词涌入日本,化身为片假名,成为了日常词汇。因此,当你试图说出一个英语单词时,大脑往往会先递给你它的片假名“双胞胎”——发音完整,脱口而出。其他学习者是“读错”了英语单词,而日语母语者则是流利地读出了一个恰好长得像英语的“日语单词”。
这就是为什么这篇文章强调“戒除”(unlearn)而不是“学习”。下面的这些发音模式都是日语给你植入的习惯,其中几个更是造成了大部分的发音偏差。
日语的音节结构是辅音加元音,英语有两个流音而日语只有一个,且日语缺乏 /v/、两个 TH 音以及唇齿相依的 /f/ 音。 因此,遇到辅音连缀时,日语母语者会自动插入元音(street → su-to-rii-to);light 和 right 会合并成日语的闪音;think 会往 sink 靠拢;see 则会偏向 she。此外,日语用音高而非重音来标记单词,导致英语听起来平坦乏味。片假名更是将这一切固化成了死记硬背的词汇。比起个别辅音的偏差,多余的元音和扁平的节奏是口音的主要来源,这也往往是需要最先戒除的习惯。
为什么日语会让美音变得困难
在进入正题前,我们先理清几个语言结构上的事实,因为它们解释了后续所有的现象。
日语的辅音总是伴随元音出现。 日语的基本单位是辅音加元音的节拍:ka、mi、to。辅音不会堆叠,单词能且只能以鼻音 n(ん)结尾。英语则恰恰相反,经常出现像 street 中的 str 这样的辅音连缀,而且单词几乎能以任何辅音结尾(如 milk、desk、fifth)。当英语要求你的发音器官做出日语无法构建的口型时,你的口腔就会用日语的方式来“修复”它:给每个辅音都分配一个元音。正是这种修复机制,导致了下文中最容易被识别的两种口音模式。
日语只有一个流音。 ra, ri, ru, re, ro 中的辅音,是舌尖的快速闪动。英语有两个流音,/l/ 和 /r/,但都不是闪音。这两种英语声音都会被生拉硬拽到你已有的那个流音上,这也是为什么英语课上会花那么多时间练习这一对最小配对词(minimal pair)。
部分英语辅音在日语中根本不存在。 日语里没有 /v/,所以 vote 借用了 /b/ 的音。没有 /θ/ 或 /ð/,所以 think 借用 /s/,this 借用 /z/。而日语 fu(ふ)中的 F,是双唇之间柔和的气流呼出,根本没有英语中上齿咬下唇的摩擦动作。
日语依靠音高而非重音来区分单词。 东京腔单靠旋律就能区分 HA-shi(筷子)和 ha-SHI(桥);这里的全大写字母代表音高(pitch),而不是拖长或加重。每个节拍的长度大致相同,没有任何音节会像英语的非重读元音那样弱化萎缩。英语的重音机制要沉重得多:重读音节会变得更长、更响亮,而周围的音节则会发生塌陷。如果把日语这种平缓的节拍带入英语,即使每个辅音都发对了,美国人听起来依然会觉得十分扁平。
片假名凌驾于这四个事实之上,并使其变得更加顽固。像 tee-bu-ru(table)这样的外来语,从你记事起就已经是普通的日语词汇了,那种“修复”早已固化其中。以下九种发音模式正是由此派生,我们将它们分为辅音偷换、音节修复和节奏三大类。
A组:五个辅音的偷梁换柱
1. L 和 R 双双落入日语的闪音陷阱
Light 和 right 听起来完全一样。Collect 和 correct、glass 和 grass 也是如此。
日语确实只有一个流音:ra, ri, ru, re, ro 中的闪音,舌尖轻轻击打上齿龈然后瞬间离开。英语的 /l/ 和 /r/ 则完全是另一回事。发 L 音 时,舌尖紧贴上齿龈并保持接触,气流从舌头两侧流出。发 美式 R 音 时,舌尖什么也不接触;舌头向后上方卷起,双唇往往会微微变圆。日语的闪音虽然和 L 音共用上齿龈这个位置,但它是一触即发,而不是保持接触,因此这两个英语发音都被同化成了闪音。
往好处想,这个闪音其实非常管用。它完全等同于美国人在发 water 和 better 时的 flap-T 音(/ɾ/),其他学习者往往需要花上好几周才能掌握,而你却早已驾轻就熟,只是现在它在兼职扮演另外两个辅音罢了。深层的问题在于感知:一辈子只听过一个类别后,这两个英语声音在你的大脑中落入了同一个抽屉。听不出区别,自然也就无法可靠地发出区别。因此,必须先用最小配对词做听力训练。L 与 R 辨音文章 详细解析了这两者的发音位置和听力训练方法。
训练:拖长 L 音,慢慢数节拍,llllight,感受舌尖持续的接触;然后尝试发 right,把舌尖放低,双唇微圆。如果你感觉到舌尖有弹击的动作,说明你又滑回到日语的习惯里了。
2. V 塌陷为 B
Vote 听起来像 boat。Very 听起来像 berry。Vest 听起来像 best。
日语里没有 V 音。片假名里虽然有专门的字母(ヴ),但大多数人还是会把它读成 /b/,甚至在日常拼写中都懒得区分:Venus 通常和 bonus 用同一个 b 行的假名书写,所以这两个词的辅音开头变成了一样的。这两个声音的发音部位截然不同:发 /b/ 时,双唇紧闭然后爆破;发 /v/ 时,上齿搭在下唇上,带声带振动的气流从缝隙中摩擦而出。V 与 W 辨析文章 详尽拆解了 V 的发音机制。
训练:交替念 boat, vote, boat, vote。在念 vote 时,让上齿咬住下唇先振动摩擦整整一秒钟,然后再发出后面的元音。
3. TH 靠向了 S
Think 变成了 sink。Three 变成了 su-rii,这里的 TH 被换成了 S,同时 thr 这个辅音连缀也被塞进了一个起填充作用的元音(即下文第 6 点提到的修复机制)。而 this 中的浊辅音 TH 则滑向了 zis,有些说话者甚至会发成 dis。
日语中完全没有这两种 TH 音,最接近的嘶嘶声是 /s/(浊音则是 /z/),这就是为什么“thank you”进入片假名后变成了 san-kyuu。英语的 /θ/ 要求舌尖明显地放在上下齿之间或紧贴上齿背后,气流从舌面上方流过,它比锐利的 /s/ 嘶嘶声听起来更松弛、更低沉。TH 音文章 涵盖了两个 TH 音的详细教学和练习。
训练:对着镜子练习,起初可以夸张一点:在发 think 和 thanks 时,确保能看到舌尖伸出牙齿。如果看不到,说明你又缩回去发 /s/ 了。交替发 sink–think,直到你能自如切换发音位置,然后再在正常语速下把舌尖稍微往回收,贴在牙齿背后。
4. F 变成了双唇呼气
Food 偏向了 hood。First 听起来可能气声很重、很空洞。coffee 的片假名是 koo-hii,这是一个古早的外来词,F 音在当时被完全替换成了 H。
日语 fu(ふ)中的 F 是双唇间柔软的呼气声,就像在吹凉热汤,并且在母语系统中,它只出现在元音 u 之前。而英语的 F 音 是上齿和下唇之间的摩擦音,它可以出现在任何位置:fee, fa, fo, if, after。想发英语的 /f/ 时,日语母语者往往会下意识地用双唇呼气来替代,听起来软塌塌、不够清晰。而且,由于日语的 H 在 u 前也会自然变成同样的呼气声,英语中 F 和 H 开头的词就在这里汇流了:food 和 hood 在片假名里同写为 フード。解决这个问题只需纯粹机械的肌肉调整,见效极快。
训练:把上齿轻轻搁在下唇上,向外推气流,直到感觉嘴唇上有摩擦的振动,然后再释放并接入后面的元音:food, first, feel, coffee。
5. S 在 EE 和 I 前软化为 SH
See 偏向了 she。Sit 和 city 则会滑向你在开会时绝对不想说出口的那个词。
在日语中,锐利的 /s/ 嘶嘶声不能直接出现在 ee 元音之前。“sa-shi-su-se-so”这一行的第二个音会自动腭化,所以 si 理所当然地变成了 shi,片假名甚至把这种替换直接刻进了外来语的拼写里:cinema 变成了 shi-ne-ma,system 变成了 shi-su-te-mu。这个习惯顺理成章地进入了英语,出现在任何 /s/ 遇到 /iː/ 或 /ɪ/ 的地方。区别在于舌头和嘴唇:发 /s/ 时,舌尖紧贴上齿背后,双唇咧开;发 she 里的 SH 音 时,舌头向后缩,声音变得柔和且暗沉。
训练:咧开大大的微笑,发出一声长长的锐利的 sssss,然后直接滑入元音,不要让嘶嘶声变软:sssee。反复练习 she–see, sheet–seat,直到在正常语速下也能保持清晰的区别。
B组:日语强行塞入的元音
6. 辅音连缀被强行拆解
Street 在英语里本是一个音节,却被拉长成五个节拍:su-to-rii-to,其中长音 rii 还得算作两拍。Strike 变成了 su-to-rai-ku。Glass 变成了 gu-ra-su。
日语的辅音通常带着自己的元音一起出现,因此当英语连续堆叠两三个辅音时,日语的修复机制就会给每一个辅音派发一个元音。这种修复甚至有一套严密的规则:填充的元音通常是 u(gu-ra-su),而在 t 和 d 之后则变成 o(su-to-rii-to)。你可以在任何片假名外来语中听到这套系统的运作。但这带来的沟通成本极高,因为英语母语者是通过音节数量来识别单词的;一个音节数翻倍的单词,比一个只念错了一个辅音的单词更难辨认。因此,这个模式对交流的破坏性甚至比 L/R 不分还要大。
中文读者对这种“补元音”大概会会心一笑:普通话同样没有辅音连缀,词也基本不以辅音收尾,所以中国人念 street 也容易冒出类似的垫音。区别在于,日语是把这套修复连同片假名拼写一起背进了脑子里,所以改起来更费劲。
训练:在发声之前先用气声模拟辅音连缀。发出长长的无声 sss,直接滑入 t,再滑入 r,整个过程不带任何元音,直到真正遇到元音才加入声带振动:ssstreet。
7. 词尾长出一条元音尾巴
Milk 变成了 mi-ru-ku。Test 变成了 te-su-to。And 变成了 an-do。
同样的机制,不同的位置。日语单词唯一能用的辅音结尾是 n(ん),所以任何以其他辅音结尾的英语单词,词尾都会硬生生多出一条元音尾巴。英语单词几乎可以以任何辅音收尾,并且默认你会在那停住;对美国人的耳朵来说,这个被强行拴上的元音会被听成一个完整的多余音节,而绝不是什么微不足道的口音细节。
训练:读出单词并在最后的辅音处瞬间定住。念 milk 时,舌尖死死封住 /k/ 的位置,保持沉默。如果在这个闭合动作之后漏出了任何带声音的气流,那就是你的“元音尾巴”。
C组:时长、音高与消失的重音
8. 用时长代替口型
在日语中,单凭元音的长度就能改变词义:bi-ru 是大楼,bii-ru 是啤酒。片假名直接把英语的元音对套进这个时间模子里:sheep 被赋予长元音 shii-pu;而 ship 则发成短元音,末尾辅音变成促音双写 ship-pu,到了 rii-daa-ship-pu(leadership)里也依然是这个形态。Full 变成了 fu-ru,fool 变成了 fuu-ru。每一个单词的区分都只靠时长,元音本身的音质从未改变。
你对元音长度的敏感度绝对是一笔财富;要知道,大多数学习者根本听不出其中的区别。但完全依赖长度恰恰是个陷阱,因为英语的元音配对不仅在时间上有差异,在嘴型上的变化更是关键。ship 中的 短 I 音 /ɪ/ 需要下巴微微下降,舌头和嘴唇处于放松状态;而 sheep 中的 /iː/ 则是紧绷的,伴随一个刻意的微笑。美国耳朵对音质变化的敏感度绝不亚于对时长的敏感度,所以如果一个元音被缩短了但音质依然紧绷,他们仍然会把它听成 sheep。ship 与 sheep 辨析文章 详细讲解了这两种口型的区别。
训练:从 sheep 开始,不要只是把时间缩短,而是要放松:下巴微降,收起紧绷的微笑,平稳降落到 ship 上。反复练习 sheep–ship, heat–hit, fool–full,让嘴型的变化(而不是秒表的计时)来区分它们。
9. 英语需要重量,日语却只有平缓的音高
Banana 被读成 ba-na-na,三个等长的节拍,而不是 buh-NAN-uh——一个重拍领头,其余音节都向它收拢塌缩。
日语确实通过音高来区分单词,所以你对旋律的感知力没问题。问题在于,音高是日语中唯一会发生变化的东西:HA-shi 和 ha-SHI 在旋律上不同,但每个节拍的长度却保持一致,每个元音也都保留了饱满的色彩。英语的重音则是“三管齐下”:重读音节会变得更长、更响亮、更饱满,而非重读音节则向 schwa(中央元音) /ə/ 弱化萎缩。一旦把日语平缓的节拍带入英语,即使你每个辅音都咬得字正腔圆,整个句子听起来也依然扁平乏味,而且让母语者听着觉得莫名费劲。重音同样是识别单词的重要线索。如果把 hotel 的两个音节平均用力,美国听众可能要愣一下才反应过来,因为他们期待听到的旋律是 ho-TEL。单词重音文章和英语节奏文章从双向机制对此进行了深度解析。
训练:找出重读音节,把它的长度翻倍,让其他音节含糊带过:buh-NAN-uh,ho-TEL,kuhm-PYOO-ter。这可能让你觉得很夸张,但它比平稳、谨慎的发音要远远贴近真实的美国英语。
片假名滤镜
这些习惯之所以如此难以纠正,是因为对你来说,它们根本不是“错误”。它们是词汇。
对大多数学习者而言,每一个英语单词都是陌生的。但对日语母语者来说,成千上万的英语单词是“出厂自带”的:table 是 tee-bu-ru,hotel 是 ho-te-ru,McDonald’s 是 ma-ku-do-na-ru-do。它们每一个都是正确无误的日语单词,从小就学会,可以像提取其他母语词汇一样自动提取。这也解释了为什么用美式发音说 hotel 有时会让你觉得有点做作:日语那个词明明就摆在你的记忆里,改用英语发音听起来简直像是在卖弄。
你真正需要戒除的习惯,是把片假名“双胞胎”看作发音指南。它其实是另一种语言里的另一个词,只不过碰巧和英语单词同宗同源而已。Ma-ku-do-na-ru-do 有六个节拍;而 McDonald’s 只有三个音节,重音落在 DON 上。因此,当你遇到任何一个早就在片假名里见过的英语单词时,请把它当成一个全新的词汇来对待。用耳朵去学习它,记住它真实的音节数和重音位置,赶在片假名版本跳出来捣乱之前抢占先机。感知先于输出文章 更长篇幅地探讨了为什么耳朵必须走在前面。
口音探测器会告诉你什么
如果你把自己朗读某段文字的录音,喂给一个专门识别“日语母语者英语”的软件,它多半会标记出你混杂了多余的元音(包括中间插入的和词尾附带的)、L 和 R 混淆,以及平缓等长的节奏。我们在第 2 到第 5 点提到的辅音替换也会出现,但频率较低;而多余的元音和扁平的节奏则贯穿了你的每一个句子。
这个排名也是你纠音的优先级顺序。剔除多余的元音是这份清单中性价比最高的修正:它不需要你学习任何新的声音,只需做减法,就能一次性消除几十个高频词汇中的虚假音节。平铺直叙的节奏排在第二,因为它为你说的每一句话都蒙上了一层底色。L 和 R 的混淆固然最出名,但这是一个漫长的感知训练过程;你可以现在就开始听力训练,让它在后台默默运行,同时集中精力去落实那些能快速见效的修正。
常见问题
日语只需要一个流音,所以经过母语长期训练的大脑,会把接收到的所有 L 和 R 统统归入一个围绕母语闪音建立的类别里。嘴巴的动作其实是简单的部分;耳朵才是真正的瓶颈。在听力感知训练让大脑能够把这两个英语声音分门别类之前,单纯练习舌头位置就像是在射击耳朵根本看不见的靶子。先多听最小配对词(light/right, glass/grass),然后再加上物理发音的对比:L 音舌尖紧贴齿龈,R 音舌尖什么也不碰。
日语的音节结构是一个辅音加一个元音,因此英语的辅音连缀或词尾辅音在日语里找不到合法的位置。为了修补这些空缺,口腔会自动塞入填充元音:desk 加上了两个(de-su-ku),而单音节的 street 则被拉伸成了五个节拍(su-to-rii-to)。片假名将这些填充的元音直接写进了英语单词的日语拼写中,所以在正式上英语课之前很久,这些修补过的形式就已经作为词汇被死记硬背下来了。这就是为什么即便是英语极好的日本人,也很难彻底改掉这个习惯。
会的,而且方式很特别:英语单词的片假名版本是真实的日语词汇,它们深植记忆且能自动触发,所以往往比从零开始重建的英语发音冒出来得更快。解决办法是停止把片假名看作英语的发音指南。把 tee-bu-ru 和 table 当作两种完全不同语言里的两个独立单词,并纯粹通过耳朵去学习那个英语单词。
从需要克服的辅音清单上看其实并不长:L 和 R 的区分、/v/、两个 TH 音、在 ee 前 s 软化为 sh,以及齿唇相依的 /f/。日语母语者甚至自带两个明显优势:能完美充当美音 flap-T 的闪音,以及对元音长度极度敏锐的耳朵。真正的挑战在结构层面:打破辅音加元音的音节习惯,以及从基于音高的平稳节奏转换为英语的轻重音节奏。这两点贯穿了每一个句子,这也是为什么即便每个音发得都很接近,日式英语口音依然辨识度极高的原因。
多余的元音。去掉辅音连缀中(street,而不是 su-to-rii-to)和词尾(milk,而不是 mi-ru-ku)的填充元音。这种纠正极其难得,它根本不需要你发任何新音,只需要把英语中并不存在的节拍删掉就行,而且一旦掌握,几十个日常高频词汇的发音都会瞬间改善。出于同样的原因,重音位置的优先级排第二:它影响着每一句话。L/R 的区分固然重要,但这是一个缓慢的感知重建过程,最好把它作为并行任务,而不是首要目标。
要达到始终如一的清晰度(即听众不再要求你重复),大多数日语母语者经过两三个月的刻意练习,集中纠正多余元音和重音位置就能做到。L/R 的对比则需要更长时间,因为不仅要重新训练嘴巴,还要重新训练耳朵;最小配对词的听力练习效果往往需要以月而非周来衡量。关于口音改善周期的文章 详细拆解了这些阶段。
这份清单看起来很长,但美式英语中最难的两座大山并不在里面。你已经自带了其他学习者花几周才能练成的闪音,而且你天生就能听出元音长度的差异。你和母语者之间最大的阻碍,其实在于做减法。试着把自己朗读一段文字的声音录下来,数一数里面多出来的填充元音:大多数人会发现,每一个句子里都有两三个单词拖着英语根本不曾要求的多余节拍。只要花上两周时间去剔除它们,哪怕只是在谨慎的朗读中做到,你整体的口音感觉都会发生质的改变;假以时日,自然流利的日常口语也会随之脱胎换骨。