Light dan right terdengar persis seperti kata yang sama. Vote berubah menjadi boat. Lalu desk ketambahan vokal yang sama sekali tidak pernah ada dalam bahasa Inggris aslinya: de-su-ku.
Kalau bahasa ibumu adalah bahasa Jepang, kamu pasti pernah mendengar ketiga contoh tadi, mungkin malah keluar dari mulutmu sendiri. Alasannya bukan karena kamu kurang teliti atau pendengaranmu buruk. Ada dua dorongan besar yang saling bertumpuk di sini. Pertama adalah faktor struktural: bahasa Jepang memberikan sistem bunyi yang rapi ke mulutmu—terdiri dari ritme konsonan-plus-vokal, lima vokal, satu konsonan likuida (seperti R atau L), dan sistem nada (pitch) yang menggantikan tekanan (stress). Sementara itu, bahasa Inggris terus-menerus menuntut hal-hal yang sama sekali di luar sistem tersebut. Dorongan kedua adalah sesuatu yang tidak dialami penutur bahasa lain dalam skala sebesar ini: bahasa Inggris sudah lama menetap di dalam bahasa Jepang. Ribuan kata bahasa Inggris masuk ke Jepang beberapa dekade lalu, diubah menjadi katakana, dan sekarang menjadi kosakata bahasa Jepang sehari-hari. Jadi, saat kamu ingin mengucapkan sebuah kata bahasa Inggris, ingatanmu sering kali menyodorkan versi katakananya lebih dulu—secara otomatis, dengan pelafalan yang sudah jadi. Pelajar bahasa lain mungkin salah melafalkan kata bahasa Inggris, tapi penutur bahasa Jepang dengan fasih melafalkan kata bahasa Jepang yang kebetulan mirip dengan bahasa Inggris.
Itulah kenapa artikel ini mengajakmu untuk “menghentikan kebiasaan” (unlearn) ketimbang “mempelajari” (learn). Pola-pola di bawah ini adalah kebiasaan yang sudah telanjur dipasang oleh bahasa Jepangmu, dan beberapa di antaranya adalah penyebab utama aksenmu terdengar tebal.
Bahasa Jepang membangun suku kata dengan pola konsonan-plus-vokal, hanya punya satu likuida di saat bahasa Inggris punya dua, dan tidak memiliki /v/, kedua bunyi TH, serta gesekan gigi-ke-bibir /f/. Akibatnya, kelompok konsonan yang berderet ketambahan vokal ekstra (street → su-to-rii-to), light dan right melebur menjadi satu bunyi ketukan (tap) lidah, think berubah jadi sink, dan see bergeser jadi she. Di samping itu, bahasa Jepang membedakan kata dengan nada (pitch) alih-alih tekanan (stress), sehingga bahasa Inggris yang kamu ucapkan terdengar rata dan datar. Katakana akhirnya mengunci semua pola ini ke dalam kosakata yang kamu hafal. Vokal ekstra dan ritme datar inilah yang paling kuat membentuk aksenmu; buanglah dua kebiasaan ini lebih dulu.
Kenapa bahasa Jepang bikin bahasa Inggris Amerika jadi sulit
Kita perlu meletakkan beberapa fakta struktural di awal, karena inilah yang menjelaskan semua pola berikutnya.
Konsonan bahasa Jepang selalu menempel dengan vokal. Unit dasar bahasa Jepang adalah ketukan konsonan-plus-vokal: ka, mi, to. Konsonan tidak bisa berderet tumpang tindih, dan satu-satunya konsonan yang diizinkan menutup sebuah kata adalah nasal n (ん). Bahasa Inggris justru sebaliknya, mereka biasa menumpuk konsonan seperti str dalam street dan mengakhiri kata dengan hampir semua bunyi (milk, desk, fifth). Ketika bahasa Inggris menyodorkan bentuk mulut yang tidak ada di bahasa Jepang, mulutmu otomatis menambalnya dengan cara Jepang: memberi setiap konsonan itu vokal pendampingnya sendiri. Tambalan struktural inilah dalang utama di balik dua pola paling kentara di bawah nanti.
Bahasa Jepang hanya punya satu likuida. Konsonan dalam ra, ri, ru, re, ro adalah ketukan (tap) cepat ujung lidah ke gusi di belakang gigi atas. Bahasa Inggris punya dua likuida, /l/ dan /r/, dan tak satu pun dari keduanya adalah bunyi tap. Akibatnya, kedua bunyi bahasa Inggris itu ditarik ke satu-satunya bunyi yang kamu miliki. Dari sinilah muncul pasangan minimal (minimal pair) yang paling sering dilatih di kelas bahasa Inggris.
Beberapa konsonan bahasa Inggris memang tidak ada di inventaris aslinya. Tidak ada /v/, jadi vote meminjam bunyi /b/. Tidak ada /θ/ atau /ð/, jadi think meminjam /s/ dan this meminjam /z/. F dalam bahasa Jepang (fu) adalah hembusan napas lembut dari kedua bibir, bukan gesekan gigi menempel di bibir bawah seperti F bahasa Inggris.
Bahasa Jepang membedakan kata dengan nada, bukan tekanan. Bahasa Jepang dialek Tokyo membedakan HA-shi (sumpit) dari ha-SHI (jembatan) murni lewat melodinya saja; huruf kapital di sini menandakan nada tinggi (pitch), bukan durasi yang diperpanjang atau suara yang lebih keras. Setiap suku kata mempertahankan durasi ketukan yang kurang lebih sama, dan tidak ada vokal yang mengecil (hollow out) seperti halnya vokal tak bertekanan dalam bahasa Inggris. Tekanan (stress) bahasa Inggris ibarat mesin yang lebih berat: suku kata yang mendapat penekanan (stressed) menjadi lebih panjang dan lebih keras, sementara suku kata di sekitarnya mengecil dan melebur. Kalau kamu membawa ketukan Jepang yang serba rata ini ke bahasa Inggris, hasilnya akan terdengar datar di telinga orang Amerika, bahkan ketika setiap konsonan yang kamu ucapkan sudah benar.
Katakana memayungi keempat fakta tersebut dan membuatnya mengeras jadi kebiasaan menetap. Kata serapan seperti tee-bu-ru (table) sudah menjadi kosakata bahasa Jepang biasa bagimu sejak kecil, lengkap dengan segala tambalan dan penyesuaian pelafalannya. Sembilan pola di bawah ini merupakan produk dari mesin bahasamu tersebut, yang bisa dikelompokkan ke dalam pertukaran konsonan, perbaikan suku kata, dan ritme.
Grup A: Lima pertukaran konsonan
1. L dan R sama-sama mendarat di bunyi tap Jepang
Light dan right terdengar identik. Begitu juga collect dan correct, serta glass dan grass.
Bahasa Jepang benar-benar hanya memiliki satu bunyi likuida: bunyi tap dalam ra, ri, ru, re, ro, di mana ujung lidah menyentuh tonjolan gusi tepat di belakang gigi atas lalu langsung memantul terlepas. /l/ dan /r/ bahasa Inggris adalah dua hal yang sama sekali berbeda. Untuk bunyi L, ujung lidah menekan tonjolan gusi itu dan bertahan di sana sementara udara mengalir lewat sisi-sisinya. Untuk R Amerika, ujung lidah sama sekali tidak menyentuh apa pun; lidah menggumpal ke atas dan ditarik ke belakang, dan bibir sering kali sedikit membulat. Bunyi tap Jepang memang menempati posisi gusi yang sama dengan L, tetapi lidah langsung memantul seketika dan tidak menahan kontak, akibatnya kedua bunyi bahasa Inggris tadi sama-sama tertarik ke pola ini.
Namun, kemampuanmu membunyikan tap ini sebenarnya kabar baik. Ini adalah bunyi yang persis sama dengan yang dipakai orang Amerika untuk bunyi flap-T dalam kata water dan better (/ɾ/)—sebuah bunyi yang biasanya butuh waktu berminggu-minggu bagi pelajar bahasa lain untuk dikuasai. Hanya saja, saat ini bunyimu sedang “nyambi” menjadi dua konsonan yang berbeda. Masalah yang lebih mendalam ada pada persepsi telingamu: setelah seumur hidup hanya mendengar satu kategori bunyi, dua bunyi bahasa Inggris itu terlempar ke keranjang mental yang sama. Kamu tidak bisa mengucapkan perbedaan konsonan jika kamu belum bisa mendengarnya. Latihan pendengaran lewat pasangan kata yang mirip (minimal pairs) harus diutamakan. Artikel L vs R membahas posisi mulut sekaligus panduan melatih telinga secara mendetail.
Latihan: tahan bunyi L dengan hitungan lambat, llllight, rasakan sentuhan yang terus-menerus di gusi belakang gigi atas, lalu ucapkan right dengan posisi ujung lidah turun rendah dan bibir sedikit membulat. Kalau lidahmu sempat memantul memukul gusi (tap), berarti kamu kembali ke gaya bahasa Jepang.
2. V melebur menjadi B
Vote terdengar seperti boat. Very terdengar seperti berry. Vest terdengar seperti best.
Bahasa Jepang tidak punya bunyi V. Katakana memang punya huruf untuk itu (ヴ), tapi kebanyakan orang tetap membacanya sebagai /b/ juga, dan ejaan sehari-hari sering kali tak mau repot: Venus biasanya ditulis dengan deretan awal B yang sama dengan bonus, sehingga keduanya berbagi konsonan pertama. Padahal kedua bunyi ini diproduksi di tempat yang berbeda: untuk /b/, kedua bibir terkatup rapat dan membuka mendadak; sementara untuk /v/, gigi atasmu bertumpu di bibir bawah dan udara bersuara mendengung melewati celah kecilnya. Artikel V vs W membedah bunyi V ini lebih jauh.
Latihan: ucapkan bergantian boat, vote, boat, vote, dan saat mengucapkan vote, tahan dengungan gigi-di-bibir selama satu detik penuh sebelum bunyi vokalnya keluar.
3. TH bersandar pada S
Think berubah menjadi sink. Three memanjang jadi su-rii, di mana TH ditukar dengan S dan deretan thr ditambal vokal sisipan (kebiasaan poin nomor 6 yang ikut nimbrung). Sementara bunyi TH bersuara dalam this bergeser menjadi zis, atau bagi sebagian orang menjadi dis.
Kedua bunyi TH tidak eksis dalam bahasa Jepang. Desisan terdekat yang tersedia hanyalah /s/ (atau /z/ untuk yang bersuara), itulah sebabnya “thank you” diadopsi ke katakana menjadi san-kyuu. /θ/ bahasa Inggris menuntut ujung lidah diletakkan secara nyata di antara atau tepat di belakang gigi atas, membiarkan udara mengalir melewatinya secara halus, bukan desisan tajam /s/. Artikel TH mengupas kedua varian TH dan cara melatihnya.
Latihan: gunakan cermin dan lebih-lebihkan sedikit posisinya di awal: dorong ujung lidahmu sampai terlihat jelas melewati gigi untuk kata think dan thanks. Kalau lidahmu tidak kelihatan, berarti kamu mundur lagi jadi /s/. Latihlah bergantian sink–think sampai kamu bisa memindahkan posisi lidah sesuka hati, lalu perlahan tarik lidah ke belakang gigi atas untuk kecepatan bicara normal.
4. F meniup udara dari dua bibir
Food bergeser menjadi hood. First terdengar sangat mendesah (breathy) dan berongga. Lalu kata katakana untuk coffee adalah koo-hii, serapan bahasa kuno di mana F muncul sebagai H.
F bahasa Jepang dalam fu (ふ) adalah hembusan napas lembut dari antara kedua belah bibir, mirip suara orang yang sedang meniup kuah panas, dan secara natural bunyi ini hanya eksis sebelum huruf u. Sebaliknya, F bahasa Inggris adalah gesekan antara gigi atas dan bibir bawah, yang bisa menempel pada huruf apa saja: fee, fa, fo, if, after. Saat mencoba melafalkan /f/ bahasa Inggris, mulut penutur Jepang menggantinya dengan tiupan dua bibir tadi, menghasilkan suara yang terlalu halus dan kurang tegas. Dan karena H bahasa Jepang kebetulan berubah menjadi tiupan yang persis sama saat berada sebelum u, kata-kata berawalan F dan H bahasa Inggris pun melebur: food dan hood sama-sama diserap sebagai フード dalam katakana. Untungnya, cara memperbaiki ini murni mekanis dan cepat.
Latihan: istirahatkan gigi atasmu secara rileks di bibir bawah, dorong udara perlahan sampai kamu merasakan getaran gesekan di bibir, lalu lepaskan untuk membentuk kata food, first, feel, coffee.
5. S melembut menjadi SH sebelum EE dan I
See condong berbunyi seperti she. Sit dan city bergeser mendekati kata-kata umpatan yang mungkin tak ingin kamu bunyikan saat rapat kerja.
Dalam bahasa Jepang, desisan /s/ yang tajam tidak diizinkan untuk berdiri langsung di depan vokal ee. Deretan sa-shi-su-se-so mempalatalisasi suku kata keduanya, jadi si otomatis terucap shi, dan katakana membawa perubahan ini secara mentah-mentah ke dalam kata serapan: cinema menjadi shi-ne-ma, system memanjang jadi shi-su-te-mu. Kebiasaan ini lalu ikut terbawa saat membunyikan /s/ bahasa Inggris yang bertemu dengan /iː/ atau /ɪ/. Letak perbedaannya ada di lidah dan bibir: untuk /s/ ujung lidahmu tetap rapat di dekat gigi depan atas dan bibir membentuk senyuman melebar; untuk bunyi SH seperti dalam she, lidah sedikit ditarik mundur, suaranya melembut, dan bunyinya teredam membulat (dark).
Latihan: senyum lebar dan tahan desisan sssss yang tajam, lalu meluncurlah langsung ke bunyi vokalnya tanpa membiarkan desisannya jadi lunak: sssee. Latihlah bergantian she–see, sheet–seat sampai kontrasnya tidak tertukar walau diucapkan dengan cepat.
Grup B: Vokal sisipan bahasa Jepang
6. Deretan konsonan dipecah-pecah
Street, yang dalam bahasa Inggris hanyalah satu suku kata, memanjang jadi lima ketukan: su-to-rii-to, dengan porsi rii dihitung ganda. Strike melar jadi su-to-rai-ku. Glass menjadi gu-ra-su.
Konsonan bahasa Jepang biasanya selalu membawa vokalnya sendiri. Maka, ketika bahasa Inggris menumpuk dua atau tiga konsonan sekaligus, kebiasaan Jepang otomatis memperbaiki tumpukan tersebut dengan menyisipkan satu vokal untuk setiap konsonan. Sistem perbaikan ini bahkan punya aturan baku: vokal penambalnya rata-rata adalah u (gu-ra-su), tapi akan berubah jadi o jika mengikuti bunyi t dan d (su-to-rii-to). Kamu bisa melihat pola ini pada semua kata pinjaman katakana. Di sinilah penutur bahasa Indonesia justru punya keunggulan kecil: lidah kita sudah biasa dengan tumpukan konsonan awal seperti str dalam struktur dan stres, jadi kluster yang bikin mulut Jepang menyisipkan vokal tidak otomatis menjadi jebakan bagi kita. Taruhan dari kebiasaan ini sangat besar karena telinga orang Amerika bergantung pada hitungan suku kata untuk mengenali sebuah kata; kata yang diucapkan dengan jumlah suku kata dua kali lipat jauh lebih membingungkan ketimbang satu konsonan yang meleset. Itu sebabnya pola ini lebih merusak pemahaman ketimbang masalah L dan R yang tertukar.
Latihan: bisikkan deretan konsonannya saja sebelum menyuarakannya. Tahan desisan tak bersuara sss yang meluncur langsung ke t lalu ke r, tanpa vokal apa pun terselip, lalu tambahkan suaramu tepat saat kamu mencapai vokal aslinya: ssstreet.
7. Kata menumbuhkan vokal ekor
Milk menjadi mi-ru-ku. Test menjadi te-su-to. And menjadi an-do.
Sama seperti pola mesin di atas, tapi posisinya berbeda. Mengingat satu-satunya konsonan yang sah menutup kata dalam bahasa Jepang adalah n, maka setiap kata bahasa Inggris yang berakhir selain huruf itu akan otomatis dipasangi “vokal ekor”. Bahasa Inggris sendiri bisa mengakhiri kata dengan nyaris konsonan apa pun dan benar-benar berhenti di sana. Bagi telinga orang Amerika, vokal ekor semacam ini terdengar sebagai satu suku kata utuh, bukan sekadar aksen kecil yang tak berarti. Menariknya, kebiasaan penutur bahasa Indonesia di sini berlawanan arah: kita justru lebih sering menyederhanakan tumpukan konsonan akhir (teks terucap tes, kompleks jadi komplek) ketimbang menambah vokal di belakangnya seperti orang Jepang.
Latihan: ucapkan katanya, lalu bekukan posisi mulutmu tepat di konsonan akhir. Akhiri milk dengan lidah menempel rapat saat mengunci bunyi /k/ lalu diam. Jika terdengar suara apa pun setelah penutupan mulut itu, berarti vokal ekormu masih bocor.
Grup C: Durasi, nada, dan hilangnya penekanan
8. Durasi mengerjakan tugas yang seharusnya dikerjakan posisi mulut
Dalam bahasa Jepang, perubahan makna kata bisa ditentukan murni lewat durasi: bi-ru adalah gedung, tapi bii-ru adalah bir. Katakana memaksakan pasangan vokal bahasa Inggris ke dalam pola tempo ini: sheep mendapat jatah vokal panjang, shii-pu, sementara ship dibuat pendek tapi dengan konsonan penutup yang digandakan, ship-pu, bentuk yang sama yang dipakainya dalam rii-daa-ship-pu (leadership). Full menjadi fu-ru dan fool menjadi fuu-ru. Semuanya membedakan makna sekadar lewat hitungan waktu (durasi ketukan), sementara kualitas suara vokalnya tidak pernah berubah.
Kepekaan telingamu terhadap panjang vokal ini sebenarnya aset luar biasa, sebab kebanyakan pelajar dari bahasa lain malah sama sekali tak bisa mendengar perbedaan durasi itu. Tapi jebakannya muncul kalau kamu hanya mengandalkan durasi, sebab pasangan kata dalam bahasa Inggris dibedakan oleh bentuk mulut sama besarnya dengan oleh durasi waktu. /ɪ/ I-pendek dalam ship dibunyikan dengan rahang sedikit turun serta lidah dan bibir yang kendur; sementara /iː/ dalam sheep adalah vokal tegang, diucapkan dengan bibir tersenyum tertarik kencang. Telinga orang Amerika menyimak perubahan kualitas itu setidaknya sama pentingnya dengan durasi, sehingga vokal yang kamu pendekkan tapi tetap tegang akan tetap terdengar seperti sheep. Artikel ship vs sheep membahas posisi mulut ini lebih dalam.
Latihan: berangkat dari kata sheep, fokuslah untuk merilekskan rahang alih-alih sekadar memendekkan suaranya: turunkan rahang sedikiiiit saja, kendurkan bibir, dan mendaratlah di ship. Latihlah sheep–ship, heat–hit, fool–full, biarkan mulutmu—bukan sekadar ketukan waktumu—yang membuat perbedaannya.
9. Nada (pitch) berjalan rata saat bahasa Inggris membutuhkan bobot penekanan (stress)
Banana dilafalkan ba-na-na, tiga ketukan berdurasi sama, bukannya buh-NAN-uh, satu ketukan panjang bertenaga yang mengempiskan dua ketukan di kiri kanannya.
Bahasa Jepang memang membedakan kata lewat nada (pitch), jadi kemampuanmu menangkap melodi cukup bagus. Masalahnya, bagi bahasa Jepang, nada adalah satu-satunya komponen yang digerakkan: HA-shi dan ha-SHI dibedakan lewat melodi, tapi setiap ketukan punya durasi sama dan setiap vokal berbunyi penuh. Sementara tekanan (stress) bahasa Inggris menggerakkan tiga hal sekaligus: suku kata yang ditekan (stressed) menjadi lebih panjang, lebih keras, dan lebih berisi, sementara bagian yang tidak ditekan (unstressed) akan menyusut mendekati bunyi schwa /ə/. Jika kamu membawa pola Jepang yang serba seimbang tadi, bahasamu memang akan benar secara suku kata demi suku kata, tetapi akan terdengar datar dan anehnya menguras perhatian pendengar. Tekanan (stress) adalah syarat pengenalan kata. Jika kamu memberi beban rata ke tiap suku kata hotel, pendengar Amerika butuh jeda untuk memproses kata tersebut, karena yang mereka tunggu adalah ritme jomplang ho-TEL. Artikel tekanan kata (word stress) dan artikel ritme membahas cara kerja mesin ini secara menyeluruh.
Latihan: pilih suku kata yang menjadi pusat tekanan, perpanjang durasinya dua kali lipat, dan biarkan suku kata lainnya mengecil seolah menggumam: buh-NAN-uh, ho-TEL, kuhm-PYOO-ter. Rasanya memang akan sangat dibesar-besarkan, tapi nyatanya itu justru jauh lebih natural bagi telinga Amerika ketimbang suku kata rapi yang serba merata.
Filter katakana
Satu alasan kuat kenapa berbagai kebiasaan di atas sulit diluruskan adalah karena bagimu, semua itu sama sekali bukan kesalahan. Itu adalah kosakatamu yang sah.
Bagi sebagian besar pelajar bahasa lain, setiap kata bahasa Inggris itu 100% asing. Sementara buat penutur bahasa Jepang, ribuan kata bahasa Inggris sudah terpasang rapi sejak kecil: tee-bu-ru untuk table, ho-te-ru untuk hotel, ma-ku-do-na-ru-do untuk McDonald’s. Masing-masing adalah bahasa Jepang sungguhan yang valid, dipelajari dari kecil, dan keluar dari ingatan sama otomatisnya seperti kata Jepang asli lainnya. Ini juga yang membuat pengucapan hotel gaya Amerika kadang terasa agak “dibuat-buat”: toh, versi bahasa Jepangnya sudah nongkrong santai di kepalamu, jadi memaksakan pakai versi Inggrisnya bisa terasa agak berlebihan.
Kebiasaan terpenting yang perlu dihilangkan adalah berhenti memperlakukan kembaran katakananya sebagai panduan melafalkan bahasa Inggris. Itu adalah kata yang berbeda, dalam bahasa yang berbeda, dan hanya kebetulan punya nenek moyang yang sama. Ma-ku-do-na-ru-do itu enam ketukan; McDonald’s hanya tiga suku kata dengan seluruh beban menumpuk di DON. Perlakukan setiap kata bahasa Inggris yang kamu temukan—sekalipun kamu sudah kenal versi katakananya—sebagai kata baru. Kenali lewat pendengaran, hafalkan hitungan suku kata aslinya, ketahui di mana pusat stresnya, sebelum otak telanjur menarik versi katakana tersebut secara otomatis. Artikel perception-before-production membahas lebih dalam kenapa telingamu harus jadi pembuka jalannya.
Apa yang akan diungkap oleh pendeteksi bahasa ibu
Jika kamu meminta perangkat lunak pendeteksi bahasa Inggris yang dikhususkan untuk aksen Jepang guna menganalisis rekaman suaramu membaca sebuah paragraf, program itu kemungkinan besar akan langsung menandai campuran masalah dari tiga hal ini: vokal ekstra (baik di ekor maupun di tengah), peleburan L/R, dan ritme kalimat yang datar serba rata. Pertukaran konsonan di poin 2 sampai 5 memang akan terdeteksi, tapi frekuensinya relatif rendah; sebaliknya, vokal sisipan dan ritme menyentuh hampir tiap kalimat.
Urutan deteksi itu juga yang seharusnya jadi prioritas perbaikanmu. Membuang vokal-vokal sisipan adalah perbaikan paling besar dampaknya dalam daftar ini: kamu tidak diminta mempelajari bunyi baru apa pun, cukup menghapus apa yang berlebih. Penghapusan kecil ini saja sudah membuang puluhan suku kata palsu dari kosakata harianmu. Irama yang datar ada di urutan kedua, karena ini mewarnai seluruh ucapanmu. Masalah L/R memang yang paling terkenal, tapi perbaikannya adalah proyek pendengaran jangka panjang; mulailah latihan telinga sejak sekarang dan biarkan ia berjalan di latar belakang sembari perbaikan-perbaikan cepat tadi membuahkan hasil.
FAQ
Bahasa Jepang hanya butuh satu konsonan likuida, sehingga otak yang terlatih dengan bahasa Jepang otomatis mengelompokkan setiap L dan R yang mereka dengar ke dalam satu kategori utama yang didasarkan pada bunyi ketukan (tap) asli mereka. Gerakan mulut sebenarnya hal yang gampang; hambatan terbesarnya ada di telinga. Selama kamu belum berhasil mengajari otakmu memisahkan kedua bunyi ini jadi dua laci berbeda lewat latihan pendengaran, berlatih posisi lidah ibarat memanah sasaran yang tak bisa dilihat mata. Dengarkan beda pasangan minimal (seperti light/right, glass/grass) terlebih dulu, baru masukkan gerak fisik: tahan ujung lidah menempel di gusi belakang gigi atas untuk L, biarkan ujung lidah mengambang tanpa menyentuh apa pun untuk R.
Aturan suku kata bahasa Jepang mewajibkan format satu konsonan bergandeng satu vokal, sehingga tumpukan konsonan murni bahasa Inggris, atau konsonan yang teronggok sendiri di ekor kata, sama sekali tidak punya tempat yang legal. Mulut otomatis menambalnya dengan vokal ekstra: desk ditempeli dua vokal tambahan (de-su-ku) dan kata tunggal street melar panjang jadi lima ketukan (su-to-rii-to). Katakana kemudian membakukan vokal penambal ini ke ejaan kosakata sehari-hari. Akibatnya, kamu terbiasa memakai kata “tambalan” ini sebelum kamu masuk kelas bahasa Inggris, dan ini sangat mendarah daging sekalipun penguasaan grammar-mu luar biasa.
Tentu saja, dan gangguannya sangat spesifik: bahasa Inggris versi katakana adalah kosakata bahasa Jepang tulen yang dihafal otomatis dan fasih, jadi wajar jika kata ini muncul di otak jauh lebih cepat ketimbang melafalkan kata bahasa Inggris dari nol. Solusinya, berhenti menjadikan versi katakana sebagai tolok ukur. Perlakukan tee-bu-ru dan table sebagai dua entitas terpisah dari dua bahasa yang berbeda, dan pelajarilah kata bahasa Inggris murni dari bunyinya.
Daftar tantangan konsonannya sebenarnya tidak terlalu panjang: pemisahan L/R, /v/, dua bunyi TH, melembutnya s ke sh sebelum ee, serta gesekan gigi-ke-bibir pada /f/. Lagipula, penutur bahasa Jepang berangkat dengan dua kekuatan luar biasa, yaitu bunyi tap yang 100% identik dengan flap-T Amerika, serta indera pendengaran yang amat tajam soal panjang vokal. Lompatan tersulit sejatinya ada di wilayah struktural: meruntuhkan paksaan susunan konsonan-plus-vokal serta berpindah dari ritme nada serba merata ke ritme melompat-lompat bahasa Inggris (stress). Dua komponen struktural inilah yang ada di tiap kalimat, membuat aksen Jepang terdengar amat kental bahkan ketika bunyinya sendiri sudah terucap dengan nyaris benar.
Vokal ekstra. Menghilangkan bunyi sisipan pada tumpukan konsonan (street, bukan su-to-rii-to) serta menahan vokal ekor di akhir kata (milk, bukan mi-ru-ku) adalah langkah ajaib yang sama sekali tidak menuntutmu membunyikan bunyi baru; kamu cukup berhenti menambah-nambahi hal yang tidak diminta oleh bahasa Inggris. Manfaatnya akan langsung terdengar pada puluhan kosakatamu. Penempatan stress adalah prioritas keduamu, sebab dampaknya merata di tiap kalimat. Soal L/R memang krusial, tapi jalannya sangat pelan dan butuh telinga yang diatur ulang; jadikan itu program paralel, jangan menjadikannya target perbaikan semalam.
Untuk bisa mencapai konsistensi di mana pendengar tak lagi memintamu mengulang ucapan (intelligibility), sebagian besar penutur bahasa Jepang sampai ke titik itu dalam dua atau tiga bulan kerja terfokus pada vokal sisipan dan penempatan stress. Kontras L/R memang jauh lebih lama karena telingalah yang mesti dilatih ulang, bukan sekadar lidah; pembiasaan pasangan minimal yang konsisten baru terasa efeknya setelah hitungan bulan, bukan minggu. Artikel pendamping soal lini masa membedah tahapan-tahapannya.
Daftarnya mungkin terkesan panjang, tapi percayalah, dua hal tersulit dari bahasa Inggris Amerika bahkan tidak masuk ke daftar tersebut. Kamu sudah menguasai bunyi tap yang butuh berminggu-minggu dipelajari oleh penutur bahasa ibu lainnya, dan telingamu sudah telanjur tajam soal seberapa panjang sebuah vokal. Rintangan terbesar antara bahasa Inggrismu dan telinga orang Amerika hanyalah soal melakukan “pengurangan”. Cobalah rekam dirimu saat membaca satu paragraf bahasa Inggris, lalu hitung jumlah vokal sisipan yang ada: umumnya orang Jepang menjejalkan setidaknya dua atau tiga vokal lebih yang tak pernah diminta. Berkonsentrasilah menghapus sisipan ekstra tersebut selama dua minggu, mulailah saat sedang membaca santai. Praktik sederhana ini akan mengubah drastis profil aksenmu; kelancaran ucapan akan otomatis menyusul asal kamu rajin berlatih.