Light e right saem como a mesma palavra. Vote vira boat. E desk ganha vogais que o inglês nunca deu a ela: de-su-ku.
Se a sua língua materna é o japonês, você já ouviu essas três situações, provavelmente na sua própria voz. O motivo não é desleixo nem falta de ouvido para o idioma. São duas forças se somando, uma em cima da outra. A primeira é estrutural: o japonês entrega à sua boca um sistema sonoro muito organizado, construído com batidas de consoante-mais-vogal, cinco vogais, uma única consoante líquida e um sistema de tom em vez de acento tônico. Enquanto isso, o inglês continua exigindo coisas que esse sistema nunca construiu. A segunda força é algo com que nenhuma outra língua lida nessa escala: o inglês já mora dentro do japonês. Milhares de palavras inglesas chegaram décadas atrás, foram convertidas para o katakana e viraram vocabulário cotidiano no Japão. Assim, quando você vai buscar uma palavra em inglês, a sua memória muitas vezes entrega primeiro a gêmea em katakana, já pronunciada por inteiro, de forma automática. Outros estudantes pronunciam palavras inglesas erradas. Falantes de japonês pronunciam fluentemente palavras japonesas que, por acaso, se parecem com as inglesas.
É por isso que este artigo fala em “desaprender” em vez de “aprender”. Os padrões abaixo são hábitos que o seu japonês instalou, e são poucos os que causam a maior parte do estrago.
O japonês constrói sílabas unindo consoante e vogal, tem apenas uma líquida onde o inglês tem duas, e não possui o /v/, os dois sons do TH, nem o /f/ com os dentes no lábio. Por isso, os encontros consonantais ganham vogais extras (street → su-to-rii-to), light e right se fundem no tap japonês, think se apoia no som de sink, e see escorrega para she. Além disso, o japonês marca as palavras pelo tom (pitch) em vez do acento tônico, então o inglês sai plano e uniforme. O katakana fixa tudo isso como vocabulário memorizado. As vogais inseridas e o ritmo plano carregam muito mais o seu sotaque do que qualquer consoante isolada; desaprenda esses dois primeiro.
Por que o japonês dificulta o inglês americano
Aqui vão alguns fatos estruturais de partida, porque eles explicam tudo o que vem a seguir.
As consoantes japonesas viajam com uma vogal. A unidade básica do japonês é uma batida de consoante-mais-vogal: ka, mi, to. As consoantes não se empilham, e a única consoante na qual uma palavra pode terminar é o nasal n (ん). O inglês faz exatamente o oposto: empilha encontros consonantais como o str em street e termina palavras em quase qualquer coisa (milk, desk, fifth). Quando o inglês entrega à sua boca um formato que o japonês não consegue montar, a sua boca conserta do jeito japonês: ela dá a cada consoante a sua própria vogal. Esse único ajuste está por trás dos dois padrões mais fáceis de reconhecer logo abaixo.
O japonês tem uma única líquida. A consoante em ra, ri, ru, re, ro é um toque rápido da ponta da língua (o tap). O inglês tem duas líquidas, /l/ e /r/, e nenhuma delas é um tap. Ambas acabam sendo puxadas para o som que você já tem, e é daí que vem o par mínimo mais treinado nas aulas de inglês.
Algumas consoantes do inglês simplesmente não existem no inventário. Não há /v/, então vote pega o /b/ emprestado. Não há /θ/ ou /ð/, então think pega o /s/ emprestado e this usa o /z/. E o F japonês em fu é um sopro suave entre os dois lábios, não o atrito dos dentes no lábio inferior do inglês.
O japonês marca as palavras pelo tom, não pelo acento tônico. O japonês de Tóquio distingue HA-shi (hashi, os pauzinhos) de ha-SHI (ponte) apenas pela melodia; as letras maiúsculas aqui marcam o tom alto, não uma duração ou volume maior. Cada batida mantém mais ou menos a mesma duração, e nenhuma sílaba se esvazia como acontece com as vogais átonas do inglês. O acento tônico do inglês é uma maquinaria mais pesada: a sílaba tônica fica mais longa e mais forte, enquanto as sílabas ao redor encolhem. Se você levar a batida uniforme do japonês para o inglês, o resultado vai soar plano para os ouvidos americanos, mesmo quando cada consoante estiver perfeita.
O katakana se assenta sobre esses quatro fatos e os endurece. Uma palavra importada como tee-bu-ru (table) é uma palavra japonesa comum para você desde a infância, já com as adaptações embutidas. Os nove padrões abaixo saem dessa mesma maquinaria, divididos em trocas de consoantes, consertos de sílabas e ritmo.
Grupo A: Cinco trocas de consoantes
1. L e R caem no tap japonês
Light e right saem idênticas. O mesmo acontece com collect e correct, glass e grass.
O japonês tem exatamente uma líquida: o tap de ra, ri, ru, re, ro, onde a ponta da língua bate na crista logo atrás dos dentes superiores e solta na mesma hora. O /l/ e o /r/ do inglês são bichos diferentes. Para um L, a ponta da língua pressiona a crista atrás dos dentes e segura, enquanto o som flui pelas laterais. Para um R americano, a ponta não toca em nada; a língua se encolhe para trás, e os lábios costumam se arredondar um pouco. O tap divide com o L o mesmo espaço naquela crista, mas ele rebate instantaneamente em vez de manter o contato, então os dois sons do inglês acabam sendo puxados para ele.
O tap em si é uma ótima notícia. É exatamente o mesmo som que os americanos usam para o flap-T em water e better (/ɾ/) — aquele mesmo som do “r” brando no português em palavras como “caro” ou “barata”. Outros estudantes de inglês passam semanas tentando construir esse som. O seu só está fazendo hora extra no lugar de outras duas consoantes. O problema mais profundo é de percepção: depois de uma vida inteira ouvindo apenas uma categoria, os dois sons do inglês caem na mesma gaveta mental, e você não consegue produzir de forma confiável um contraste que não consegue ouvir. O treinamento auditivo com pares mínimos precisa vir em primeiro lugar. O artigo sobre L e R detalha as duas posições da boca e os exercícios de escuta.
Exercício: segure o L por um tempo, bem devagar, llllight, sentindo o contato contínuo, e depois diga right com a ponta da língua estacionada embaixo e os lábios um pouco arredondados. Se você sentir uma batidinha, é porque voltou para o japonês.
2. O V se funde com o B
Vote soa como boat. Very soa como berry. Vest soa como best.
O japonês não tem o som do V. O katakana tem uma letra para ele (ヴ), mas a maioria dos falantes também lê isso como /b/, e a grafia cotidiana nem se dá ao trabalho: Venus geralmente é escrito com a mesma família silábica do “b” de bonus, então as duas compartilham a primeira consoante. Os dois sons são feitos em lugares diferentes: para um /b/, os dois lábios se pressionam e estouram; para um /v/, os dentes superiores descansam no lábio inferior e o ar vibra por esse espaço. O artigo sobre V e W destrincha o som do V em detalhe.
Exercício: alterne boat, vote, boat, vote, e no vote segure a vibração do dente no lábio por um segundo inteiro antes de a vogal chegar.
3. O TH se apoia no S
Think vira sink. Three vira su-rii, o TH trocado por um S e o encontro consonantal thr remendado com uma vogal de preenchimento. E o TH sonoro de this escorrega para zis, ou para alguns falantes, dis.
Nenhum dos dois sons do TH existe no japonês, e o chiado mais próximo no inventário é o /s/ (ou /z/ para o sonoro). É por isso que thank you entrou no katakana como san-kyuu. O /θ/ do inglês exige que a ponta da língua fique visivelmente entre ou logo atrás dos dentes com o ar fluindo sobre ela, produzindo um som mais solto e opaco do que o chiado agudo do /s/. O artigo sobre o TH cobre os dois sons do TH e seus exercícios.
Exercício: use um espelho e exagere no começo: empurre a ponta da língua visivelmente para fora dos dentes em think e thanks. Se você não conseguir ver a língua, é porque recuou para um /s/. Alterne sink–think até conseguir inverter o posicionamento sob comando; depois, volte a língua para ficar logo atrás dos dentes quando ganhar velocidade.
4. O F é soprado pelos dois lábios
Food vai para o lado de hood. First pode sair muito soprado e oco. E a palavra em katakana para coffee é koo-hii, um empréstimo antigo em que o F se manifestou como um H.
O F japonês em fu (ふ) é um sopro suave entre os dois lábios, o som de quem está esfriando a sopa, e nativamente ele só vive antes do u. O F do inglês é o atrito entre os dentes superiores e o lábio inferior, e ele vai em qualquer lugar: fee, fa, fo, if, after. Ao tentar fazer um /f/ em inglês, a boca japonesa o substitui pelo sopro de dois lábios, que soa suave e sem foco. E como o H japonês nativamente se torna esse mesmo sopro antes do u, palavras inglesas com F e com H acabam se misturando aí: food e hood compartilham a mesma escrita em katakana, フード. A correção é puramente mecânica e rápida.
Exercício: descanse os dentes superiores levemente sobre o lábio inferior, empurre o ar até sentir atrito no lábio, e então solte em food, first, feel, coffee.
5. O S suaviza para SH antes de EE e I
See pende para she. Sit e city escorregam para palavras que você preferiria não dizer no meio de uma reunião.
No japonês, o chiado agudo do /s/ não consegue sentar diretamente na frente de uma vogal ee ou i. A fileira sa-shi-su-se-so palataliza seu segundo membro, então o si automaticamente sai como shi, e o katakana insere a troca direto nos empréstimos: cinema vira shi-ne-ma, system vira shi-su-te-mu. Esse hábito viaja para o inglês onde quer que um /s/ encontre um /iː/ ou /ɪ/. A diferença está na língua e nos lábios: para o /s/, a ponta fica perto, logo atrás dos dentes superiores, e os lábios se espalham num sorriso; para o SH de she, a língua recua e o som fica abafado e escuro.
Exercício: dê um sorriso largo e segure um sssss afiado, depois deslize direto para a vogal sem deixar o chiado suavizar: sssee. Repita she–see, sheet–seat até que o contraste se mantenha rápido.
Grupo B: As vogais que o japonês insere
6. Encontros consonantais são quebrados
Street, uma sílaba em inglês, estica para cinco batidas: su-to-rii-to, com o longo rii contando em dobro. Strike vira su-to-rai-ku. Glass vira gu-ra-su.
Uma consoante japonesa normalmente viaja com a sua própria vogal, então, quando o inglês empilha duas ou três consoantes seguidas, o ajuste do japonês dá a cada uma delas uma vogal própria. O remendo até tem regras: a vogal de preenchimento costuma ser o u (gu-ra-su), e muda para o depois de t e d (su-to-rii-to). Se você é brasileiro, conhece esse mecanismo de cor: é o mesmo impulso que faz a gente enfiar um “i” em “advogado” (adivogado) ou falar “Facebooki” e “hip-hopi” — a diferença é só a vogal que cada língua escolhe enfiar. Dá para ouvir o sistema funcionando em qualquer palavra do katakana. O custo na comunicação é alto porque o ouvinte americano usa a contagem de sílabas para reconhecer palavras: uma palavra que chega com o dobro de sílabas é mais difícil de identificar do que uma com apenas uma consoante errada. Por isso, esse padrão prejudica mais a compreensão do que a fusão entre L e R.
Exercício: sussurre o bloco de consoantes antes de usar a voz. Um sss longo e sem voz escorregando direto para o t e depois para o r, sem vogal em lugar nenhum, e só coloque a voz quando chegar na vogal verdadeira: ssstreet.
7. As palavras ganham uma vogal no final
Milk vira mi-ru-ku. Test vira te-su-to. And vira an-do.
Mesma engrenagem, posição diferente. A única consoante com a qual uma palavra japonesa pode terminar é o n, então uma palavra em inglês terminada em qualquer outra consoante ganha uma vogal grudada no final. É a mesma lógica que faz o brasileiro virar love em “lóvi” e club em “clúbi”. O inglês termina palavras em quase qualquer consoante e confia que você vai parar ali. O ouvido americano escuta essa vogal grudada como uma sílaba inteira a mais, não como um leve toque de sotaque.
Exercício: diga a palavra e congele na consoante final. Termine milk com a língua travada no /k/ e mantenha o silêncio. Se escapar qualquer som vocalizado depois de travar, foi a vogal de final de palavra.
Grupo C: Duração, tom e o acento tônico que falta
8. A duração faz o trabalho que o formato da boca deveria fazer
No japonês, apenas a duração do som já muda a palavra: bi-ru é um prédio, bii-ru é uma cerveja. O katakana derrama os pares de vogais do inglês nesse mesmo molde de tempo: sheep ganha uma vogal longa, shii-pu, enquanto ship sai curta com sua consoante final dobrada, ship-pu (o formato que ela mantém dentro de rii-daa-ship-pu, leadership). Full vira fu-ru e fool vira fuu-ru. Toda versão carrega a diferença no tempo de duração, e a qualidade da vogal nunca se altera.
O seu ouvido para a duração das vogais é um grande trunfo; a maioria dos estudantes simplesmente não consegue ouvir essa distinção. A armadilha é se apoiar só na duração, porque os pares do inglês diferem tanto no formato da boca quanto no tempo. O I-curto /ɪ/ de ship solta um pouco o maxilar e deixa a língua e os lábios relaxados; o /iː/ em sheep é tenso, como um sorriso apertado. Os ouvidos americanos prestam atenção nessa mudança de qualidade da vogal pelo menos tanto quanto na duração, então uma vogal encurtada, mas ainda tensa, continua soando como sheep. O artigo sobre ship e sheep percorre as posições da boca.
Exercício: começando em sheep, relaxe em vez de apenas encurtar: deixe o maxilar um pouquinho mais baixo, o sorriso frouxo, e aterrisse em ship. Repita sheep–ship, heat–hit, fool–full, deixando que a boca, e não o cronômetro, faça a diferença.
9. O tom fica linear onde o inglês exige peso
Banana sai como ba-na-na, três batidas iguais, em vez de buh-NAN-uh, uma batida pesada com o resto encolhido em volta.
O japonês distingue as palavras pelo tom (pitch), então seu ouvido para melodia funciona perfeitamente. O tom é simplesmente a única coisa que o japonês move: HA-shi e ha-SHI diferem na melodia, mas cada batida mantém a mesma duração e toda vogal mantém sua cor por inteiro. O acento tônico do inglês move três coisas de uma vez: a sílaba tônica fica mais longa, mais forte e mais cheia, enquanto as átonas encolhem na direção do schwa /ə/. Transfira a batida uniforme do japonês e você terá um inglês correto sílaba por sílaba, mas que ainda soa plano e estranhamente cansativo de acompanhar. O acento também é uma pista de reconhecimento. Ponha o mesmo peso em todas as sílabas de hotel e um ouvinte americano pode levar um instante para identificar a palavra, porque estava esperando por ho-TEL. O artigo sobre acento tônico e o artigo sobre ritmo explicam o mecanismo pelos dois lados.
Exercício: escolha a sílaba tônica, dobre a duração dela e deixe as outras meio resmungadas: buh-NAN-uh, ho-TEL, kuhm-PYOO-ter. Vai parecer exagerado, e mesmo assim vai chegar muito mais perto do inglês americano natural do que sílabas contadas e certinhas.
O filtro do katakana
O motivo pelo qual esses hábitos resistem à correção é que, para você, eles não são erros. Eles são vocabulário.
Para a maioria dos estudantes, toda palavra em inglês é estrangeira. Para os falantes de japonês, milhares de palavras inglesas já chegam pré-instaladas: tee-bu-ru para table, ho-te-ru para hotel, ma-ku-do-na-ru-do para McDonald’s. Cada uma delas é uma palavra japonesa correta, aprendida cedo, lembrada de forma tão automática quanto qualquer outra. E é também por isso que dizer hotel com sotaque americano pode parecer um pouco forçado: a palavra japonesa está bem ali na sua memória, e a inglesa soa como se você estivesse querendo se exibir.
O hábito a desaprender é tratar o termo gêmeo do katakana como um guia de pronúncia. Ele é uma palavra diferente, em um idioma diferente, que por acaso compartilha a mesma origem. Ma-ku-do-na-ru-do tem seis batidas; McDonald’s tem três sílabas com o peso no DON. Então, trate qualquer palavra em inglês que você conheceu primeiro no katakana como se fosse inédita. Aprenda pelo ouvido, com a contagem real de sílabas e o acento tônico marcado, antes que a versão em katakana possa se intrometer. O artigo sobre percepção antes da produção desenvolve melhor por que o ouvido precisa ir na frente.
O que um detector de língua materna diria
Se você entregasse um áudio seu lendo um parágrafo para um software treinado no inglês de falantes nativos de japonês, ele provavelmente apontaria uma mistura das vogais inseridas (de ambos os tipos), a fusão entre o L e o R, e o ritmo plano e uniforme. As trocas de consoantes dos itens 2 a 5 também aparecem, mas com menos frequência; as vogais e o ritmo, por outro lado, tocam cada frase que você diz.
Esse ranking também é a ordem de prioridade. As vogais inseridas são a correção de maior impacto desta lista: removê-las não exige som novo nenhum, só uma exclusão, e elimina sílabas falsas de dezenas de palavras cotidianas de uma só vez. O ritmo plano vem em segundo lugar, porque ele colore tudo o que você fala. A confusão L/R é a mais famosa, mas é um projeto longo de percepção auditiva; comece o treinamento do ouvido agora e deixe isso rodando em segundo plano enquanto as correções mais rápidas vão se fixando.
Perguntas frequentes
O japonês precisa de apenas uma consoante líquida, então o cérebro treinado em japonês guarda todo L e R que entra numa mesma categoria baseada no tap (aquela batida rápida na crista dos dentes). A boca é a parte mais fácil; o ouvido é o gargalo. Até que os exercícios de percepção ensinem o cérebro a separar os dois sons do inglês em gavetas diferentes, praticar a posição da língua é atirar num alvo que o ouvido não consegue ver. Ouça pares mínimos (light/right, glass/grass) primeiro, e depois adicione o contraste físico: ponta da língua segurada contra a crista para o L, ponta não tocando em nada para o R.
Uma sílaba japonesa é uma consoante mais uma vogal, então um encontro consonantal em inglês ou uma consoante no final da palavra não tem um espaço permitido na estrutura. A boca remenda cada lacuna com uma vogal de preenchimento: desk ganha duas (de-su-ku) e street, que tem uma sílaba, estica para cinco batidas (su-to-rii-to). O katakana escreve essas vogais de preenchimento na grafia japonesa das palavras inglesas, então essas formas adaptadas são memorizadas como vocabulário muito antes das aulas de inglês. É por isso que o hábito sobrevive até em pessoas com um nível de inglês excelente.
Prejudica sim, de um jeito bem específico: as versões em katakana das palavras em inglês são vocabulário real do japonês, memorizado e automático, então elas sobem à mente mais rápido do que a pronúncia do inglês construída do zero. A solução é parar de tratar a palavra do katakana como guia da palavra em inglês. Trate tee-bu-ru e table como duas palavras diferentes de dois idiomas diferentes, e aprenda a versão em inglês pelo ouvido.
A lista de consoantes é curta: a separação entre L e R, o /v/, os dois sons do TH, a queda do “s” para “sh” antes de ee, e o /f/ com os dentes no lábio. Além disso, os falantes de japonês já começam com duas ótimas vantagens: o tap, que funciona perfeitamente como o flap-T do americano (o T de water), e um ouvido muito afiado para a duração das vogais. O maior obstáculo é estrutural: quebrar o hábito das sílabas formadas só por consoante-e-vogal e trocar o ritmo uniforme, baseado em tom, pelo acento tônico do inglês. Essas duas características passam por todas as frases, e é por isso que o inglês com sotaque japonês é reconhecível mesmo quando cada som está bem próximo do original.
As vogais inseridas. Abandonar as vogais de preenchimento nos encontros consonantais (street, não su-to-rii-to) e nos finais de palavras (milk, não mi-ru-ku) é a rara correção que não pede som novo nenhum, apenas que você delete batidas que o inglês nunca pediu. A recompensa atinge dezenas de palavras do dia a dia de uma só vez. A colocação do acento tônico é a segunda prioridade, pelo mesmo motivo: mexe com cada frase dita. O L e o R importam, mas é um projeto de percepção demorado; conduza esse em paralelo, e não como prioridade número um.
Para atingir uma clareza consistente, em que as pessoas param de pedir para você repetir, a maioria dos falantes de japonês chega lá em dois a três meses de trabalho focado nas vogais inseridas e na colocação do acento tônico. O contraste entre L e R demora mais porque o ouvido tem que ser treinado, não apenas a boca; o trabalho constante com pares mínimos só vai mostrar resultado ao longo de meses, não semanas. O artigo companheiro sobre prazos detalha as etapas.
A lista parece longa, mas duas das coisas mais difíceis no inglês americano não estão nela. Você já faz o tap (tepe) que os outros estudantes passam semanas tentando construir para dizer water, e você já ouve a diferença de duração nas vogais. A maior parte do que fica entre o seu inglês e o ouvido americano é simplesmente subtração. Grave você mesmo lendo um parágrafo e conte as vogais de preenchimento: a maioria das pessoas encontra duas ou três palavras por frase carregando uma batida que o inglês não tem. Duas semanas cortando isso, nem que seja só numa leitura cuidadosa, muda como o sotaque inteiro é percebido; a fala espontânea vai acompanhar com a prática.