आप इसे सुन सकते हैं। और यही बात सबसे ज़्यादा झुंझलाहट पैदा करती है।
आप शब्द बोलते हैं, और मुँह से निकलते ही आपको पता चल जाता है कि आवाज़ गलत हो गई। इसलिए आप इसे दोबारा बोलते हैं, थोड़ा धीमे, ज़्यादा संभलकर, इस बार ध्यान रखते हुए कि गलती न हो। लेकिन आवाज़ फिर से उसी जगह, उसी तरह गलत निकलती है। आपके कान तुरंत उस गलती को पकड़ लेते हैं, लेकिन आपका मुँह उसे ठीक करने को राज़ी ही नहीं होता।
अपनी speech या accent को बदलने के सफर में यह सबसे उलझाने वाला दौर होता है, और कोई आपको इसके बारे में पहले से नहीं बताता। हम मान लेते हैं कि अगर हम एक सही आवाज़ को सुन सकते हैं, तो उसे बोल पाना बस अगला ही कदम होगा। फिर आप एक ऐसे शब्द पर अटकते हैं जहाँ आप target sound को बिल्कुल साफ सुन सकते हैं, अपनी गलत आवाज़ को भी सुन सकते हैं, दोनों के बीच का फर्क भी महसूस कर सकते हैं… लेकिन फिर भी उस gap को भर नहीं पाते। ऐसा लगता है जैसे कोई खराबी आ गई है। लेकिन असल में यह उल्टा है। यह इस बात का सबूत है कि आपके कान आपके मुँह से एक कदम आगे निकल चुके हैं — और सीखने का सही क्रम यही होता है।
अगर आप किसी आवाज़ को सुन सकते हैं लेकिन बोल नहीं पाते, तो यह normal है। यह फेल होने की नहीं, बल्कि progress की निशानी है। लगभग हर motor skill में हमारी perception (समझ) हमारी production (बोलने की क्षमता) से आगे चलती है: शरीर के निशाना लगाने से पहले कान लक्ष्य को पहचानना सीखते हैं। आपका दिमाग उस sound को आपके muscles से कहीं ज़्यादा तेज़ी से समझने लगता है। इस gap को भरने के लिए आपको ज़ोर नहीं लगाना है: minimal-pairs को ध्यान से सुनकर आवाज़ की पहचान को और तेज़ करें, ज़बरदस्ती करने के बजाय इसे धीरे-धीरे और आराम से बोलें, और अपने motor habit को वह समय दें (अक्सर कुछ हफ्ते) जिसकी उसे ज़रूरत है।
वह मुश्किल दौर जिसके बारे में कोई नहीं बताता
जब लोग कोई नया sound सीखने के बारे में सोचते हैं, तो उन्हें लगता है कि यह एक दीवार की तरह है: पहले आप न सुन पाते हैं न बोल पाते हैं, और फिर एक दिन अचानक दोनों चीज़ें होने लगती हैं। लेकिन असली learning में इन दोनों के बीच एक और stage आती है जिसके बारे में कोई बात नहीं करता। आप उस आवाज़ को दूसरों में, और धीरे-धीरे खुद में भी, पहचानने लगते हैं, लेकिन आपका मुँह अभी भी पुरानी आदत पर ही जाता है। यानी execution (करने की क्षमता) से पहले आपके पास judgment (परखने की क्षमता) आ जाता है।
यह झुंझलाहट बेवजह नहीं है। जब तक आप फर्क सुन नहीं पाते थे, तब तक आपको कोई परेशानी नहीं थी क्योंकि आपको पता ही नहीं था कि कुछ गलत है। उस अज्ञानता में एक सुकून था। अब हर कोशिश के साथ एक live review चलता है: आप शब्द बोलते हैं, आपके कान उसे grade देते हैं, और grade होता है “अभी भी गलत।” आपके कान जितने बेहतर होते जाते हैं, यह review उतना ही तेज़ होता जाता है। बहुत से learners इसे अपनी नाकामी मान लेते हैं। एक महीने पहले वे खुश थे, आज परेशान हैं, तो उन्हें लगता है कि वे पीछे जा रहे हैं। लेकिन असल में यह नई perception के चालू होने की आवाज़ है। आप उस गलती से परेशान नहीं हो सकते जिसे आप पकड़ ही न सकें।
इसलिए इस stage में सबसे पहले यह समझना ज़रूरी है कि यह हो क्या रहा है, और इसे यह मान लेना बंद करें कि आपमें talent नहीं है। यह mismatch आपको परेशान कर रहा है, यही इस बात का सुबूत है कि आपके कान सही काम कर रहे हैं। बस आपका मुँह थोड़ी धीमी घड़ी पर चल रहा है।
कान आगे क्यों चलते हैं?
कान सबसे पहले क्यों सीखते हैं, इसका एक ठोस कारण है — और यह सिर्फ भाषा तक सीमित नहीं है। हम कोई भी physical skill कैसे सीखते हैं, यह उसी का हिस्सा है।
आपने अपने शरीर से जो कुछ भी सीखा है, उसके बारे में सोचिए। पियानो पर आपकी उंगलियों के सही नोट तक पहुँचने से बहुत पहले ही आप गलत नोट को सुनकर पहचान सकते थे। आपके खुद के हाथ के एक smooth टेनिस सर्व करने से बहुत पहले ही आप देखकर बता सकते थे कि कौन सा सर्व अच्छा है और कौन सा खराब। एक सही नतीजे को पहचानना और उसे खुद कर पाना दो अलग-अलग systems पर काम करते हैं, और पहचानने वाला system हमेशा पहले तैयार होता है। Speech भी बाकी चीज़ों की तरह एक motor skill है। किसी sound को बोलना असल में movements का एक बहुत तेज़ और तालमेल भरा क्रम है — जीभ, होंठ, जबड़ा और आवाज़, सब कुछ एक सेकंड के हिस्से में अपनी सही जगह पर पहुँचते हैं। यह क्रम कैसा सुनाई देना चाहिए, यह जान लेने भर से उन muscles को चलाने वाला program आपके हाथ में नहीं आ जाता। वह program धीरे-धीरे, repetition और अभ्यास से ही बनता है, बिल्कुल टेनिस सर्व की तरह।
लेकिन speech में एक ऐसी उलझन है जो टेनिस सर्व में नहीं होती। आप पूरी ज़िंदगी अपने पुराने motor programs चलाते आ रहे हैं। आपकी पहली भाषा (जैसे कि हिंदी) ने बचपन में ही आपके दिमाग में sound categories का एक ढाँचा सेट कर दिया था। Researchers बताते हैं कि आपकी पहली भाषा की sound categories चुंबक (magnets) की तरह काम करती हैं: जब कोई नया sound किसी पुरानी category के आस-पास आता है, तो वह चुंबक उसे अपनी तरफ खींच लेता है। नतीजतन, आप उस नई आवाज़ को सुनने और बोलने के बजाय उसे अपने पुराने पहचाने हुए sound की तरह ही इस्तेमाल करने लगते हैं।
यही वजह है कि सबसे मुश्किल आवाज़ें वे नहीं होतीं जो बिल्कुल अनजान हों, बल्कि वे होती हैं जो हमारी पहले से जानी-पहचानी आवाज़ों के बेहद करीब होती हैं (“near-misses”)। मिसाल के तौर पर, हिंदी भाषी अक्सर अमेरिकन English के /t/ और /d/ को बोलते वक्त जीभ को पीछे मोड़कर ‘ट’ और ‘ड’ जैसी (retroflex) आवाज़ बना देते हैं, जबकि अमेरिकन English में इनके लिए जीभ आगे, दाँतों के पीछे वाली ridge को छूती है (alveolar)। ‘ट’ की पुरानी आदत इस नई, हल्की आवाज़ को अपनी तरफ खींच लेती है। इसी तरह vine और wine में हिंदी के ‘व’ की आदत आड़े आती है, क्योंकि हिंदी का ‘व’ /ʋ/ कहीं इन दोनों के बीच पड़ता है। एक बिल्कुल नई आवाज़, जिसके आस-पास कोई पुरानी आदत न हो, अपनी अलग category बना सकती है; लेकिन मिलती-जुलती आवाज़ें अक्सर सबसे करीबी पुरानी category में दबकर रह जाती हैं।
आपकी अपनी आवाज़ का blind spot
इन सबके पीछे एक और फंदा है। जिस live error की हमने शुरुआत में बात की थी — जिसे आपके कान तुरंत पकड़ लेते हैं — वह सिर्फ उतना हिस्सा है जो इतना तेज़ था कि आपके कानों तक पहुँच गया। आपकी बहुत सी गलतियाँ तो आपको सुनाई ही नहीं देतीं। जब आप बोलते हैं, तो आपके कान पूरी तरह से निष्पक्ष नहीं होते: आपके दिमाग को पहले से पता होता है कि आप क्या बोलने वाले हैं, और बोलने की जल्दबाज़ी में वह अक्सर वही सुनता है जो आप बोलना चाहते थे, न कि वह जो असल में मुँह से निकला। बड़ी गलतियाँ पकड़ में आ जाती हैं, लेकिन छोटी गलतियाँ खिसक जाती हैं, और आपको लगता है कि आपने एकदम सही बोला।
एक recording इस prediction को हटा देती है। जब आप अपनी ही आवाज़ को सुनते हैं, तब कोई बचाव नहीं होता। आप असली आवाज़ (raw signal) सुनते हैं, और लोग अक्सर इसे सुनकर चौंक जाते हैं: मुझे नहीं लगा था कि मेरी आवाज़ ऐसी आती है। इसीलिए हवा में बोलकर practice करने से ज़्यादा, खुद को record करना बहुत असरदार होता है। यह आपके उच्चारण को आपके उस “blind spot” से बाहर निकालता है और उन अच्छे कानों के सामने रखता है जो दूसरों की गलतियाँ आराम से पकड़ लेते हैं। यह recording ही उस gap को भरने का पुल है। और जब आप live बोलते समय गलतियाँ पकड़ने लगते हैं, तब भी recording आपके काम आती है, उन बारीकियों को पकड़ने के लिए जो आपके कानों से छूट जाती हैं।
ज़ोर लगाने से बात क्यों बिगड़ती है?
जब मुँह आपकी बात नहीं मानता, तो हमारी सबसे स्वाभाविक आदत होती है ज़ोर लगाना: जीभ को सिकोड़ना, जबड़े पर ज़ोर डालना, गले को कसना। हम इसे और ज़ोर से, और मेहनत से बोलने की कोशिश करते हैं, जैसे कि सिर्फ ताकत के दम पर हम उस sound को सही जगह पर बिठा देंगे। लेकिन यह तरीका हमेशा उल्टा पड़ता है, इसके दो कारण हैं।
पहला कारण mechanical है। ज़्यादातर नए sounds के लिए छोटे, सटीक और relaxed movements की ज़रूरत होती है। Tension (तनाव) precision का सबसे बड़ा दुश्मन है। एक कसी हुई जीभ हमेशा अनाड़ी होती है। जब आप ज़ोर लगाते हैं, तो आप उन muscles का इस्तेमाल करने लगते हैं जिनका उस target sound से कोई लेना-देना ही नहीं है, और इस तरह आप सही आवाज़ निकालने को और भी मुश्किल बना देते हैं।
दूसरा कारण learning से जुड़ा है। हर बार जब आप ज़ोर लगाकर उस आवाज़ का एक बिगड़ा हुआ, tense वर्ज़न निकालते हैं, तो आप असल में उसी की practice कर रहे होते हैं। बिना सुधारे बार-बार दोहराने से आपकी वही गलत आदत पक्की होती जाती है, वह नहीं जो आप बोलना चाहते थे। दस बार ज़ोर लगाकर की गई कोशिशें मिलकर एक साफ आवाज़ नहीं बनातीं; वे सिर्फ एक गलत आदत को पक्का करती हैं जिसे बाद में आपको सुधारना पड़ेगा।
यह बात थोड़ी गलत लग सकती है। आप जितनी ज़्यादा कोशिश करेंगे (muscles पर ज़ोर डालकर), नतीजा उतना ही बुरा होगा, क्योंकि शरीर में effort और tension लगभग एक ही चीज़ हैं, और tension किसी भी movement को बिगाड़ देता है। इसलिए आगे बढ़ने का रास्ता ज़ोर लगाना नहीं, बल्कि आराम से, धीमे होकर और ज़्यादा ध्यान से सुनना है।
ज़बरदस्ती नहीं, ध्यान से सुनना ज़रूरी है
अगर ज़ोर लगाना सही तरीका नहीं है, तो सही तरीका क्या है? ज़्यादातर काम आपके कान करेंगे, अगर आप उनका सही इस्तेमाल करें। Research से एक बेहद चौंकाने वाली बात सामने आई है कि अपनी perception (सुनने की क्षमता) को train करने से आपकी production (बोलने की क्षमता) भी सुधर जाती है, वह भी बिना मुँह से अभ्यास किए। एक मशहूर study में जापानी speakers को सिर्फ English /r/ और /l/ के बीच का फर्क सुनने की training दी गई थी। नतीजतन, बाद में उन्होंने इन दोनों आवाज़ों को ज़्यादा सटीकता से बोला। एकदम सही नहीं, लेकिन पहले से काफी बेहतर — और वह भी मुँह से बिना एक भी शब्द बोले। कानों में target को साफ करने से मुँह को निशाना लगाने के लिए एक बेहतर लक्ष्य मिल गया।
इसे असल में लागू करने का तरीका है “minimal-pair listening”। Minimal pair ऐसे दो शब्द होते हैं जिनमें सिर्फ एक sound का फर्क होता है, ताकि आप जिस contrast की practice कर रहे हैं, ध्यान सिर्फ उसी पर रहे। Learners को सबसे ज़्यादा दिक्कत उन “near-misses” वाले जोड़ों में आती है, जहाँ नई आवाज़ आपकी किसी पुरानी जानी-पहचानी आवाज़ के इतनी करीब होती है कि आपके कान दोनों को एक ही मान लेते हैं।
| फर्क (The contrast) | Minimal pair | किसे मुश्किल होती है? |
|---|---|---|
| /r/ vs /l/ | right / light | जापानी, कोरियन |
| /iː/ vs /ɪ/ | sheep / ship | स्पैनिश, अरबी, हिंदी और कई अन्य |
| /θ/ vs /s/ | think / sink | फ्रेंच, जर्मन, जापानी, हिंदी |
| /v/ vs /w/ | vine / wine | हिंदी, जर्मन |
| /æ/ vs /ɛ/ | bad / bed | स्पैनिश, इटैलियन और कई अन्य |
पहले ऐसे किसी जोड़े पर सिर्फ सुनकर काम करें। सिर्फ एक आवाज़ नहीं, बल्कि कई अलग-अलग native speakers की recordings ढूँढें। किसी एक आवाज़ को सुनने से आप सिर्फ उसी आवाज़ की खासियतों के आदी हो जाते हैं; अलग-अलग speakers को सुनने से आप असल में उस sound का फर्क सीखते हैं। तब तक सुनें जब तक कि आप बिना देखे, और यहाँ तक कि तेज़ speed में भी दोनों के बीच का फर्क न बता सकें। यही आपकी perception की बुनियाद है, और कई learners के लिए यह उतनी मज़बूत नहीं होती जितना वे सोचते हैं। जब आपके कानों में दोनों शब्द बिल्कुल अलग सुनाई देने लगें, तभी मुँह से practice करने का कोई फायदा है।
जब आप बोलने की practice शुरू करें, तो बहुत धीमे बोलें। इसे अपनी normal बातचीत की speed से भी नीचे ले जाएँ, इतना धीमे जितना आपको अजीब लगे। अपनी जीभ की position को महसूस करें, न कि जल्दी से शब्द खत्म करने की कोशिश करें। धीमापन दो काम करता है। पहला, यह आपको अपनी गलतियों को पकड़ने और सुधारने का समय देता है। दूसरा, यह आपके पुराने automatic program की पकड़ को कमज़ोर करता है, जो ज़्यादातर full speed में ही active होता है। फिर अपनी recording से खुद को check करें, native वर्ज़न से तुलना करें, adjust करें और फिर से बोलें। यह धीमा, शांत और ध्यान से किया गया loop ही आपकी आदत को बदलता है। तेज़ और कसी हुई आवाज़ में बार-बार बोलने से सिर्फ पुरानी आदतें और पक्की होती हैं। जैसे-जैसे धीमी speed पर आपकी पकड़ मज़बूत हो, speed को थोड़ा-थोड़ा करके वापस normal बातचीत के level पर लाएँ।
धैर्य (Patience) भी एक technique है
सब कुछ सही करने के बाद भी, आपके कानों के आवाज़ पहचानने और मुँह के उसे सही बोलने के बीच एक समय का अंतर (lag) होता है। आप सिर्फ अपनी चाहत से इस समय को शून्य नहीं कर सकते। Motor habits अपने समय पर ही पक्की होती हैं। आज आपने जिस movement की practice की है, वह आपके रुकने के बाद भी सेट होती रहती है, खासकर जब आप सोते हैं। इसके नतीजे अक्सर practice वाले दिन नहीं, बल्कि एक या दो दिन बाद दिखाई देते हैं। इसलिए ऐसा अक्सर होता है कि जो sound मंगलवार को नहीं बन रहा था, वह गुरुवार को अचानक से बिल्कुल सही निकलने लगता है। लंबे समय तक एक ही बार में घिसने से बेहतर है, छोटे-छोटे intervals में अभ्यास करना: weekend पर एक साथ 90 मिनट ज़ोर लगाने से कहीं ज़्यादा असरदार है, रोज़ कुछ बार 10 मिनट ध्यान से practice करना। क्योंकि नई आदत practice के दौरान नहीं, बल्कि practice sessions के बीच के समय में बनती है। हर skill को सीखने के पीछे यही spacing effect काम करता है।
इसलिए यहाँ धैर्य (patience) रखना कोई सांत्वना नहीं है, बल्कि यह बिल्कुल सही technique है। Perception और production के बीच का gap एक असली चीज़ है जिसका एक ठोस कारण है। इस gap के दौरान आपका काम है अपने कानों को train करते रहना, मुँह से धीमे और आराम से practice करना, और आदत को सेट होने देना। जो learners इस बात को समझते हैं, वे इस lag को अपनी नाकामी मानना बंद कर देते हैं और ज़बरदस्ती करना छोड़ देते हैं — और इसी से यह gap खत्म होता है। जो लोग इस gap को देखकर घबरा जाते हैं और ज़ोर लगाते हैं, वे उसी में फँसे रह जाते हैं, क्योंकि वह ज़ोर लगाना ही पुरानी आदत को बनाए रखता है।
अगर आप यह जानना चाहते हैं कि आपकी सभी आवाज़ों में बदलाव आने में कितना समय लगता है, तो the timeline article में इसके बारे में विस्तार से बताया गया है।
पाठकों के सवाल
क्योंकि किसी आवाज़ को सुनना और उसे बोलना अलग-अलग systems पर काम करते हैं, और सुनने वाला (hearing) system पहले तैयार होता है। किसी sound के सही होने की पहचान करना perception है; जबकि उसे बोलना एक motor skill है — जीभ, होंठ, जबड़े और गले का एक तेज़ और तालमेल भरा movement। हर physical skill की तरह, यहाँ भी सही नतीजे को पहचानने की क्षमता उसे कर पाने की क्षमता से पहले आती है। जैसे आप पियानो पर सही नोट बजाने से पहले ही गलत नोट को सुनकर पहचान सकते हैं। अगर आप कोई फर्क सुन पा रहे हैं लेकिन बोल नहीं पा रहे, तो यह बिल्कुल normal है। इसका मतलब है कि आपके कान आपके मुँह से आगे निकल चुके हैं, न कि आपमें टैलेंट की कमी है।
आम तौर पर हाँ। इससे पहले कि आपका मुँह सही निशाना लगा सके, आपके कानों में उस target की एकदम साफ तस्वीर होनी चाहिए। बहुत से learners को लगता है कि उनकी perception अच्छी है, जबकि असल में वह उतनी पक्की नहीं होती। ध्यान से सुनकर और minimal-pair की practice करके उस sound का एक सही mental model बनाना बहुत ज़रूरी है। इसी वजह से जो training सिर्फ कानों (सुनने) पर focus करती है, वह अक्सर बोलने (production) की क्षमता को भी सुधार देती है।
हाँ, और इसके ठोस सुबूत मौजूद हैं। Minimal pair ऐसे दो शब्द होते हैं जिनमें सिर्फ एक आवाज़ का फर्क होता है, जैसे right और light या sheep और ship। यह उस खास contrast को अलग करके सिखाता है। Lab studies में देखा गया है कि जिन learners को सिर्फ मुश्किल आवाज़ों का फर्क सुनने की training दी गई, वे बाद में बिना बोले अभ्यास किए ही उन आवाज़ों को ज़्यादा सटीकता से बोलने लगे। कानों में एक साफ target होने से मुँह को बेहतर दिशा मिलती है। Pronunciation सुधारने में ‘सुनना’ सिर्फ वॉर्म-अप नहीं है, बल्कि यह असल काम का एक बहुत बड़ा हिस्सा है।
क्योंकि ज़्यादातर speech sounds के लिए बहुत छोटे, रिलैक्स्ड (relaxed) और सटीक movement की ज़रूरत होती है, और तनाव (tension) इस सटीकता को खत्म कर देता है। जब आप ज़ोर लगाते हैं, तो आप उन muscles को भी कस लेते हैं जिनकी ज़रूरत उस आवाज़ के लिए नहीं होती। इसके अलावा, आप जो भी करते हैं, उसी की practice होती है। ज़ोर लगाकर निकाली गई एक खराब और कसी हुई आवाज़, असल में उसी खराब आवाज़ की आदत को पक्का करती है। इसका सही तरीका यह है कि ज़बरदस्ती करने के बजाय, आवाज़ को धीमे और आराम से निकालें और एक सही model (जैसे native speaker की recording) से उसकी तुलना करें।
क्योंकि जब आप बोल रहे होते हैं, तो आपका दिमाग वह नहीं सुनता जो असल में आपके मुँह से निकला है, बल्कि काफी हद तक वह सुनता है जो वह बोलना चाहता था। आपका दिमाग उस gap को तुरंत भर देता है। एक recording इस परदे को हटा देती है और आपको असली आवाज़ सुनाती है, इसीलिए लोग अक्सर अपनी ही आवाज़ सुनकर हैरान रह जाते हैं। खुद को record करना और उसे सुनना, अपनी आवाज़ को उस ‘blind spot’ से बाहर निकालने का सबसे बेहतरीन तरीका है। इससे आप अपनी आवाज़ को उन्हीं निष्पक्ष कानों से परख पाते हैं जिनसे आप दूसरों को सुनते हैं।
यह इस बात पर निर्भर करता है कि वह आवाज़ कौन सी है और आपकी पुरानी आदतें कितनी गहरी हैं। लेकिन आम तौर पर इसमें कुछ दिन नहीं, बल्कि कुछ हफ्तों की लगातार, छोटी-छोटी practice लगती है। Motor habits practice sessions के बीच के खाली समय में, खासकर सोते वक्त सेट होती हैं। इसलिए एक ही दिन में घंटों पसीना बहाने के बजाय, कई दिनों तक थोड़ा-थोड़ा अभ्यास करना ज़्यादा असरदार होता है। अक्सर ऐसा होता है कि किसी session के तुरंत बाद नहीं, बल्कि एक या दो दिन बाद सुधार नज़र आता है। यह gap बिल्कुल असली है और इसका एक कारण है। इसलिए सबसे सही तरीका यह है कि आराम से practice करते रहें और आदत को अपनी रफ्तार से सेट होने दें, न कि उससे ज़बरदस्ती करें।
जो आप सुन सकते हैं और जो आप बोल पाते हैं, उसके बीच का gap इस बात का सबसे साफ इशारा है कि कुछ सच में बदल रहा है। यह gap तभी दिखाई देता है जब आपके कान आपके मुँह से आगे निकल जाते हैं, और यह तभी भरता है जब आप महज़ ज़ोर लगाकर उन दोनों को एक साथ लाने की कोशिश करना बंद कर देते हैं। अपने सुनने के अभ्यास को तेज़ रखें, मुँह से practice धीमे और शांत तरीके से करें, और इस इंतज़ार को अपनी नाकामी मानने के बजाय इस तरीके का एक हिस्सा मानें। इसे वे हफ्ते दें जिनकी इसे ज़रूरत है, और आपका मुँह अपने आप आपके कानों के पीछे-पीछे आ जाएगा। यह हमेशा आपके कानों से धीमा ही होने वाला था; सीखने का यही सही क्रम है।