Berapa lama?
Pertanyaan ini paling sering muncul di kotak masuk DM kami. Kurang lebih bunyinya begini: berapa minggu sampai orang berhenti bertanya dari mana asalku? Berapa tahun sampai aku bisa bicara di meeting tanpa harus terus-terusan memikirkan gerakan mulut dan lidahku?
Jawaban jujurnya adalah sebuah rentang waktu, bukan angka pasti. Dan rentang ini baru masuk akal setelah kamu menentukan apa arti kata menghilangkan bagimu.
Kebanyakan orang mengira mereka sedang menanyakan satu hal. Padahal, sebenarnya ada tiga pertanyaan berbeda di baliknya. Dan ketiganya punya lini masa yang sangat berbeda.
Sebagian besar pembelajar dewasa bisa bicara bahasa Inggris dengan jelas—langsung dipahami pada kesempatan pertama—hanya dalam 8 sampai 12 minggu latihan terfokus pada dua atau tiga fitur bunyi utama. Perubahan menyeluruh pada ritme dan tekstur aksen butuh waktu 6 sampai 12 bulan. Terdengar 100% sama dengan penutur asli butuh bertahun-tahun, dan sebagian besar orang tidak pernah (dan tidak perlu) sampai ke sana. Faktor penentu kecepatan terbesarnya bukanlah usia, bakat, atau bahasa pertamamu, melainkan kualitas feedback yang kamu terima dan seberapa sering kamu mendapatkannya.
Jawaban jujurnya adalah sebuah rentang waktu, tergantung pada tujuanmu
Kata menghilangkan menyembunyikan tiga tujuan yang berbeda. Setiap tujuan punya tenggat waktunya sendiri.
Tujuan 1: Berhenti diminta mengulang ucapan. Ini adalah versi paling sederhana dari pertanyaan tadi, dan biasanya inilah yang sebenarnya dimaksud oleh kebanyakan orang. Harga yang mereka bayar bukanlah “Aku punya aksen”, melainkan “Aku harus mengulang ucapanku terus-menerus.” Ini murni masalah kejelasan (clarity), dan bisa diperbaiki dengan cepat. Sebagian besar pembelajar mencapainya dalam 8 sampai 12 minggu latihan terfokus pada dua atau tiga fitur bunyi utama—biasanya tentang pola tekanan kata (stress) ditambah satu atau dua konsonan tertentu yang sering membuat pendengar bingung (seperti bunyi /θ/ dalam think yang sering terucap ‘tink’ oleh penutur Indonesia).
Tujuan 2: Membangun laras bahasa Amerika yang jelas dan bisa kamu aktifkan kapan saja. Bunyi flap-T yang konsisten, bisa membedakan can dan can’t (can yang lemah menyusut jadi /kən/ sementara can’t tetap bervokal penuh), menggunakan bentuk pelemahan kata (weak forms) pada suku kata tanpa tekanan, dan menempatkan schwa di posisi yang tepat. Pekerjaan ini jelas lebih besar. Kamu tidak lagi sekadar menambal tiga atau empat bunyi, tapi mengubah ritme dasar saat kamu bicara. Karena ritme bahasa Indonesia cenderung datar dan tidak memampatkan suku kata, beralih ke ritme bahasa Inggris menuntut pembiasaan baru. Estimasi realistisnya: 6 sampai 12 bulan latihan rutin (beberapa kali seminggu, dengan feedback). Pada akhirnya, kamu akan punya “mode bicara” atau laras bahasa khusus yang bisa kamu nyalakan untuk percakapan penting dan kamu matikan saat santai bersama keluarga.
Tujuan 3: Terdengar sama persis dengan penutur asli. Inilah yang sering dijual oleh banyak iklan kursus. Padahal, ini adalah hasil yang paling jarang terjadi dengan rasio investasi waktu terburuk. Orang dewasa yang berhasil mencapainya biasanya punya kombinasi latihan pendengaran yang luar biasa tajam, ribuan jam praktik, feedback profesional, dan bahasa ibu yang sejak awal memang dekat dengan bahasa Inggris. Estimasi realistisnya jika kamu bersedia membayar harganya: 3 sampai 5 tahun kerja keras, dan kebanyakan orang tetap tidak pernah sampai ke sana. Dan ingat, tidak ada yang salah dengan tidak sampai ke tahap itu.
Dua tujuan pertama sangat mungkin dicapai oleh hampir semua orang. Tujuan ketiga sebagian besar hanyalah janji pemasaran.
Jika pertanyaanmu bermuara pada Tujuan 1 atau Tujuan 2, kamu hanya butuh hitungan minggu dan bulan, bukan bertahun-tahun. Angka-angka di atas adalah estimasi yang jujur. Alasan artikel ini ditulis adalah karena angka-angka tersebut sering terkubur oleh konten “5 menit sehari selama 30 hari” yang menjanjikan hasil terlalu muluk, atau sebaliknya, terlalu meremehkan usahanya.
5 faktor penentu yang memengaruhi hasil
Setelah kamu menentukan tujuanmu, rentang waktunya akan bergantung pada lima faktor ini. Urutannya disusun berdasarkan seberapa besar dampaknya terhadap kesuksesanmu.
1. Jam latihan yang terfokus
Bukan sekadar jam terbang berbicara bahasa Inggris. Bukan total jam kamu menonton serial TV Amerika. Bukan pula jam kerjamu saat kamu menggunakan bahasa Inggris untuk presentasi bisnis. Latihan terfokus adalah aktivitas yang sangat spesifik. Kamu melatih satu bunyi atau satu pola ritme, merekam suaramu sendiri, mendengarkan ulangnya, lalu mengoreksinya. Dua puluh menit melakukan rutinitas ini jauh lebih berharga daripada dua jam ngobrol santai tak terarah.
Sebagai patokan kasarnya, inilah hasil yang bisa didapat dari akumulasi jam latihan tersebut:
| Waktu yang diinvestasikan | Ekspektasi realistis yang bisa dicapai |
|---|---|
| Total 10 jam | Satu bunyi (misalnya flap-T) mulai konsisten saat dilatih perlahan, tapi belum bisa diandalkan dalam percakapan nyata |
| 30 jam | Target bunyimu mayoritas sudah otomatis dalam percakapan; kamu mulai tidak perlu memikirkannya lagi |
| 75 jam | Fitur bunyi kedua dan ketiga mulai mengejar; flap-T menjadi bawaanmu; pelemahan kata (weak forms) mulai masuk secara alami |
| 150 jam | Perubahan laras bahasa (register) yang nyata dan bisa kamu andalkan untuk percakapan penting |
| 500+ jam | Perubahan aksen yang sangat substansial; kamu mungkin dikira native speaker pada beberapa materi tertentu |
Berlatih 20 hingga 30 menit sehari, lima hari seminggu, akan membawamu ke angka 20 sampai 30 jam dalam tiga bulan—syarat minimum untuk Tujuan 1. Lakukan secara konsisten selama enam bulan dan kamu mulai menyentuh wilayah Tujuan 2. Hitung-hitungannya tidaklah menyiksa. Kuncinya ada pada kata terfokus.
Aturan praktisnya begini: setiap satu jam latihan terfokus bernilai kira-kira sama dengan sepuluh jam paparan santai (seperti nonton film) dalam hal mengubah cara memproduksi bunyi. Paparan santai melatih telingamu untuk memetakan bunyi—ini prasyarat penting. Namun, tanpa sengaja menggerakkan otot mulutmu secara sadar, hal itu takkan mengubah kebiasaan motorik yang mendorong apa yang benar-benar kamu ucapkan.
2. Kualitas masukan (feedback)
Ini adalah variabel terbesar sekaligus yang paling sering diremehkan.
Tanpa feedback, mulutmu akan terus melakukan apa yang selalu ia lakukan. Kamu bisa melatih kata water seribu kali, tapi kalau kamu tidak sadar bahwa kamu masih mengucapkan T yang keras alih-alih mengepakkan lidahmu (seperti menyisipkan bunyi R tunggal ringan dalam bahasa Indonesia), seribu pengulangan itu takkan mendekatkanmu pada target. Kamu malah membuat pengucapan yang keliru makin permanen di kepalamu.
Kualitas feedback kira-kira terbagi dalam empat tingkatan. Pujian dari penutur asli adalah jenis masukan yang paling buruk. Komentar “Bahasa Inggrismu bagus!” adalah bentuk kesopanan, bukan tentang pengucapanmu. Sang penutur asli tidak berbohong; mereka hanya tak terlatih untuk menyimak fitur bunyi spesifik yang sedang kamu latih.
Satu tingkat di atasnya: merekam suaramu sendiri tanpa daftar evaluasi. Kamu mendengar suaramu (ini langkah krusial), tapi kamu tidak tahu apa yang harus dinilai, sehingga kamu mungkin tidak menyadari kesalahanmu atau malah fokus pada hal yang keliru.
Tingkat berikutnya baru memberikan perbedaan nyata: merekam suara sendiri dengan daftar evaluasi spesifik. Pilih satu fitur (entah flap-T, schwa, atau can tanpa tekanan), rekam dirimu membaca kalimat yang sama sepuluh kali, lalu dengarkan khusus untuk menyoroti fitur tersebut. Kamu akan sadar bahwa kamu mengucapkannya dengan benar 70% dan meleset 30%, dan angka itu sudah cukup menjadi bahan evaluasi.
Tingkat teratas adalah pelatih (coach) atau alat feedback AI yang bisa mengoreksi fonem secara spesifik. Pelatih manusia yang hafal target bunyimu adalah standar emas. Alat feedback AI adalah pilihan kedua yang tepercaya; ia tidak kenal lelah, tidak merasa canggung saat mengoreksimu, dan bisa memberimu rincian per fitur 20 kali sehari jika kamu mau. Kombinasi yang paling sering dipakai pembelajar yang cepat sukses adalah siklus rekam-sendiri ditambah pengecekan dari pihak eksternal.
Fakta pahitnya: penghambat laju kemajuan orang dewasa bukanlah motivasi. Hambatannya adalah tidak ada seorang pun di sekitarmu yang mampu mendengar apa yang tidak bisa kamu dengar. Feedback adalah kepingan puzle yang hilang bagi hampir semua orang yang merasa progresnya jalan di tempat.
3. Bahasa pertamamu
Faktor ini memang nyata, tapi efeknya lebih kecil dari anggapan banyak orang.
Bahasa pertamamu memengaruhi bunyi mana yang akan sulit diucapkan, bukan apakah kamu bisa mengubahnya. Penutur bahasa Indonesia atau Spanyol yang terbiasa memproduksi variasi bunyi R tunggal (satu sentuhan lidah pendek) akan lebih mudah memproduksi flap-T, karena letak lidahnya ada di titik yang kurang lebih sama; kita tidak perlu memelajari bunyinya dari nol, cukup membiasakan diri kapan harus menyisipkannya. Sebaliknya, penutur bahasa Mandarin tidak punya padanan bunyi ini sehingga harus membangunnya dari awal. Artinya, butuh beberapa jam ekstra untuk melatih otot mulut, tapi itu bukanlah plafon yang tidak bisa ditembus.
Dampak bahasa pertama yang jauh lebih masif sebenarnya ada pada masalah ritme. Bahasa seperti Spanyol, Prancis, dan Indonesia memberikan durasi dan pembobotan yang hampir sama rata pada setiap suku kata (syllable-timed). Bahasa Inggris secara struktural amat berbeda: bahasa ini sangat memampatkan suku kata tanpa tekanan dan mereduksi vokalnya (stress-timed). Schwa hidup di celah-celah suku kata yang terkompresi ini. Menyesuaikan diri dengan ritme bahasa Inggris mewajibkanmu membongkar seluruh insting jeda bicaramu, tak sekadar menukar bunyi satu per satu. Hal ini tidak mustahil dilewati, tapi pastinya butuh waktu berminggu-minggu ekstra.
Kenyataan jujurnya: bahasa pertamamu mungkin hanya menambah atau mengurangi sekitar 20–30% dari total estimasi waktu standar. Ia sama sekali tidak menggandakan lamanya latihan, dan tidak membuat target-target di atas jadi mustahil dicapai.
4. Apa yang kamu maksud dengan “menghilangkan”
Inilah faktor yang kerap lupa diperhitungkan, padahal ia yang paling menentukan.
Pembelajar yang memilih Tujuan 1 (kejelasan komunikasi) akan mencapainya dengan cepat dan merasa puas. Namun, mereka yang menargetkan Tujuan 3 (terdengar persis layaknya penutur asli) sering kali mundur di bulan keempat walau sudah membuat progres hebat, lantaran frustrasi membandingkan diri dengan standar yang mustahil. Standar Tujuan 3 yang sering diangankan pembelajar biasanya berupa aksen pembaca berita nasional yang luar biasa netral—sebuah tolok ukur fiktif yang bahkan tidak selaras dengan keragaman aksen mayoritas penutur asli Amerika di dunia nyata (seperti logat orang Texas, Boston, atau Selatan). Penutur asli atau native itu bermakna menguasai bahasa tersebut sejak kecil secara natural, bukan berarti tanpa logat kedaerahan.
Keputusan paling berdampak yang bisa kamu ambil sejak hari pertama adalah mendefinisikan targetmu berdasarkan hal-hal yang bisa kamu ukur sendiri perubahannya. Aku ingin berhenti disuruh mengulang ucapan. Aku ingin mengirim voice note tanpa merasa risi mendengarkan suaraku sendiri. Itu adalah target konkret yang sangat masuk akal dicapai, biasanya dalam 12 minggu saja.
“Aku ingin menghilangkan aksenku” sama sekali tak mencerminkan kriteria itu. Target itu tak punya alat ukur, standarnya abu-abu, dan dibandingkan dengan kelompok acuan semu yang sebenarnya tak ada di dunia nyata.
5. Identitas dan resistensi psikologis
Faktor kelima ini kerap dibahas dalam literatur pembelajaran bahasa kedua (SLA) tapi jarang sekali disinggung dalam iklan-iklan kursus komersial. Orang dewasa yang mengaitkan aksennya dengan identitas budaya biasanya akan mengalami fase mandek (plateau) tanpa menyadarinya. Mulutnya berubah sedikit, tapi secepat kilat kembali ke mode awal. Penolakan ini lumrahnya terjadi di alam bawah sadar—kamu berusaha menambahkan aksen Amerika yang fasih, tapi ada sisi di dalam dirimu yang diam-diam enggan melakukannya.
Resistensi ini makin kentara kalau kamu mengejar Tujuan 3, di mana menghilangkan jejak suara dari mana kamu berasal terasa bagaikan mengkhianati keluargamu, negara asalmu, atau versi dirimu di masa lalu. Progresmu pun jalan di tempat secara senyap.
Kamu tidak bisa sekadar menyuruh penolakan itu pergi. Kamu harus mengakuinya, memisahkannya dari anggapan “Ah, aku cuma butuh lebih banyak latihan,” dan pada akhirnya memutuskan target mana yang benar-benar sepadan dengan usahamu. Begitu keputusan itu diambil, estimasi waktu yang kamu butuhkan biasanya akan terlihat sangat jelas.
Gambaran nyata di minggu ke-4, ke-12, dan tahun pertama
Untuk memberikan pijakan konkret dari angka-angka di atas, inilah gambaran perjalanan yang biasanya dilalui pembelajar saat mereka mempraktikkan satu atau dua fitur secara jujur.
Di minggu ke-4 (≈10 jam latihan terfokus). Kamu sudah bisa memproduksi target bunyimu secara konsisten saat sedang latihan mandiri. Jika membaca teks yang sudah disiapkan, kamu bisa melafalkannya dengan pas. Namun, dalam percakapan kasual, kamu lebih sering luput menerapkannya. Inilah titik terberat dalam membentuk kebiasaan—tidak ada perubahan kasat mata yang disadari orang lain selain dirimu sendiri, dan kamu pun gampang bimbang apakah kamu betul-betul sudah ada kemajuan.
Di minggu ke-12 (≈30 jam). Target bunyimu mayoritas sudah keluar secara otomatis saat ngobrol. Kamu tanpa sadar mengucapkannya dengan presisi. Teman-temanmu perlahan mulai berkomentar, “Bahasa Inggrismu makin gampang dipahami deh,” meski mereka tak bisa menunjuk letak persis perubahannya. Orang di kantor berhenti memintamu mengulangi ucapan. Sebagian besar orang yang sanggup melalui tantangan mental di minggu ke-4 rata-rata akan sukses mencapai titik ini.
Bulan ke-6 (≈75 jam). Fitur suara kedua dan ketiga mulai mengejar ketertinggalan. Flap-T telah menjadi bawaan alamimu. Kamu memakai bentuk pelemahan kata tanpa beban (the terdengar lumer menjadi thuh, of menjadi uhv). Tempo bicaramu secara keseluruhan sudah berubah secara meyakinkan. Kenalan yang berbulan-bulan tak berjumpa akan langsung menyadari bedanya.
Tahun ke-1 (≈150 jam). Transisi laras bahasa yang luar biasa. Kamu punya kapabilitas penuh untuk memutar tuas ke mode Amerika yang lebih “bersih” di acara-acara genting, lalu rileks dengan ritme lidah aslimu ketika sedang bersantai di sofa rumah. Inilah versi pamungkas yang sebenarnya diidamkan mayoritas pembelajar. Kamu sudah berhasil menanamkan satu “suara ekstra” di atas suara pribadimu.
Tahun ke-3 sampai 5 (≈500–1000 jam). Perubahan aksen yang ekstrem kalau kamu konsisten merawat durasi latihanmu. Kamu bisa jadi dikira penutur asli (bergantung pada topik dan lawan bicaramu). Praktiknya, banyak orang sudah setop menambah jam terbang jauh sebelum tahap ini karena Tujuan 1 dan 2 sebetulnya sudah melunasi semua kebutuhan mereka.
Grafiknya tidak pernah melaju mulus secara linear. Awalnya progres akan terasa luar biasa lambat. Kemudian, kamu mungkin merasakan loncatan besar, sebelum akhirnya menemui fase mentok (plateau). Lantas, saat endapan kebiasaan baru rampung, lonjakan performa berikutnya akan kembali muncul secara tak terduga. Fase plateau sejatinya adalah proses ketika kebiasaan baru sedang mengendap di bawah sadarmu; kamu tidak merasakan ada hasil karena prosesnya masih tersembunyi. Saat endapan itu rampung, barulah lompatan drastis berikutnya tampak. Kalau kamu selalu menilai hasil saat sedang berada di persimpangan plateau, kamu pasti akan menyimpulkan latihanmu percuma.
Satu hal tentang kata “menghilangkan”
Judul artikel ini sengaja memakai kata menghilangkan karena istilah itulah yang mampir di riwayat pencarianmu. Tapi, kata itu sendiri sebenarnya menjebak dan butuh kita sanggah sejenak sebelum artikel ini berakhir.
Aksenmu merekam rekam jejak setiap kota yang pernah kamu singgahi dan tiap bahasa yang merawat tumbuh kembangmu. Hal yang sebetulnya bisa dimodifikasi adalah sekumpulan kebiasaan pelafalan minor di dalam aksen tersebut, yang nyata-nyata kerap mengundang miskomunikasi. Ubah bagian itu, dan simpan sisanya untuk dirimu sendiri. Versi dirimu yang memancarkan aksen Amerika di kantor adalah orang yang sama dengan yang asyik bercengkerama dengan logat bahasa ibunya di ruang makan keluarga.
Jika kamu penasaran pada bedah panjang argumen ini, silakan baca esai khusus ini: ‘Menghilangkan Aksen’? Pertanyaanmu Salah. Ringkasannya: jadikan kejelasan komunikasi (clarity) sebagai tujuan utama. Terdengar Amerika adalah efek samping wajar saat kamu melakukannya dengan gemilang di sana. Namun, menjadikan efek samping tersebut sebagai target utama justru berisiko membuat pelafalanmu terdengar canggung dan kehilangan arah.
Tanya Jawab
Tidak ada batasan kaku. Benar, orang dewasa memelajari pelafalan lebih lambat dibandingkan anak-anak, tapi mereka jelas memelajarinya. “Hipotesis periode kritis” yang mungkin berseliweran di telingamu awalnya dirumuskan hanya untuk pemerolehan bahasa ibu (first language). Ketika coba dipaksakan ke ranah pelafalan bahasa kedua pada orang dewasa, hipotesis ini justru telah lama digugat dan dibantah dalam belantara literatur linguistik. Perkara usia dampaknya tak sebombastis anggapan awam. Prediktor keberhasilan terbesar untuk orang dewasa adalah apakah kamu punya akses terhadap feedback tajam dan apakah kamu sigap menerapkannya.
Puluhan tahun menuturkan bahasa Inggris sambil repot mengurus tenggat kerja bukanlah ekuivalen dari berjam-jam latihan terfokus pada anatomi bunyi. Para pendatang jangka panjang yang sama sekali tak mendapat feedback terang-terangan umumnya akan menyentuh batas atasnya (plateau) di beberapa tahun awal dan mogok permanen di sana—ini lazim disebut oleh ilmuwan bahasa dengan istilah fossilization (riset termutakhir memanggilnya stabilization, karena fase mentok ini bisa ditabrak hancur asalkan intervensinya tepat). Usaha ganti haluan bukanlah angan kosong. Amunisi yang hilang hanyalah masukan (feedback). Latihan mandiri tanpa evaluasi eksternal tak bedanya dengan mementaskan kembali kebiasaan-kebiasaan jadulmu.
Secara teknis, tidak bisa untuk urusan memproduksi bunyi. Paparan hiburan bertubi-tubi ampuh mempertajam radar pendengaranmu dalam mengenali kekhasan bunyi Amerika beserta alur ritmenya. Sayangnya, memori telinga tidak otomatis membajak tuas motorik lidahmu. Maraton Friends semalaman suntuk tidak akan mengajari otot rahangmu bergerak presisi.
Secara jujur: mendedikasikan modal satu jam per minggu yang langsung dilahap sekaligus tidak bakal ampuh mendongkrak otot lidahmu. Isunya bukan terletak pada akumulasi jam terbang, tapi durasi jedanya. Tiga sesi pendek berisi 15 menit (total 45 menit/minggu) memberikan dampak yang jauh lebih kuat ketimbang mengurung diri 60 menit sekaligus. Mengulik pelafalan itu merawat rentetan memori otot pendek namun diulang sesering mungkin, bukan dipacu bagai lari maraton. Tiga hari seminggu kira-kira adalah garis start minimal agar kebiasaan barumu tak gampang menguap.
Nyaris mustahil terjadi. Ribuan pembelajar di luar sana yang terbukti sukses merakit mode Amerika yang memukau tetap luwes memantik aksen asli mereka ketika berbicara bahasa ibunya, plus instingtif pindah gigi ke gaya bahasa Inggris aslinya kalau sedang guyon bareng sirkel pertemanannya. Apa yang berhasil kamu tuai adalah satu mode laras bahasa (register) tambahan di lemarimu, bukan untuk menghanguskan mode lamamu.
Ada yang iya, tapi tidak sedikit juga yang berujung sia-sia. Garis batas di antara keduanya adalah apakah program tersebut menyetor evaluasi super spesifik buat fitur bunyi incaranmu, alih-alih tepuk tangan semu macam “Kerja bagus!” atau “Coba lagi ya!”. Membedah rekaman suaramu dibekali daftar centang (checklist) sudah pasti jauh lebih efektif. Sebaliknya, sekadar membeo dari dikte aplikasi yang tanpa interaksi timbal balik alias tanpa feedback tidak berujung ke mana-mana, sedrastis apa pun biaya langganan bulanannya.
Kebanyakan pembelajar dewasa menyerah persis saat jerih payah mereka hampir membuahkan hasil. Garis finisnya bukanlah menunggu semua orang di sekitarmu takjub menyaksikan betapa sempurnanya bahasa Inggrismu. Garis finis sesungguhnya adalah momen senyap ketika kamu sadar bahwa sudah sepekan penuh ini, tak ada satu pun client atau kerabat yang memintamu mengulangi ucapan. Latihan terfokus selama 8 sampai 12 minggu pada deretan fitur bunyi yang tepat dijamin sukses mengantarkanmu memetik buah perjalanannya. Ya, misi memoles diri hingga tahunan lamanya memang selalu terbuka menunggumu di depan mata sana, tapi kamu tak wajib menceburkan diri kalau memang tak perlu. Target yang paling sederhana dan irit tenaga di atas sebetulnya adalah jawaban inti dari ribuan pertanyaan para pembaca artikel ini.