चीनी कीबोर्ड कैसा दिखता है?

आपने शायद इसे एक पूरे अंग के रूप में कल्पना की है - सैकड़ों और हजारों चाबियों के साथ मीटर की एक जोड़ी बनाने वाली एक भव्य। वास्तव में, अधिकांश चीनी लोग नियमित QWERTY लैटिन कीबोर्ड का उपयोग करते हैं। लेकिन इसके साथ इतने भिन्न चित्रलिपि टाइप करना कैसे संभव हो सकता है? हमने अपने कर्मचारी जूलिया ड्रेसिस को इस बारे में बताने के लिए कहा। उसका लंबे समय से चला आ रहा प्यार और काम उसे चीन से जोड़ता है।



पृष्ठभूमि: टाइपराइटर



कई हज़ार वर्षों तक, चालाक चीनी एक पूंछ के साथ वर्णों की संख्या 50,000 तक लाने में कामयाब रहा। और यद्यपि रोज़मर्रा के जीवन में आवश्यक संकेतों की संख्या को दसियों हज़ारों में नहीं मापा जाता है, वैसे भी, जो कुछ भी कह सकता है, पुराने प्रिंटिंग हाउस का मानक सेट 9,000 अक्षर है।



लंबे समय तक, सेट "प्रत्येक चरित्र के लिए - एक अलग मुद्रण तत्व" सिद्धांत के अनुसार किया गया था। इसलिए, मुझे इस तरह से राक्षस कारों के साथ काम करना पड़ा:



छवि

1947 में शुआनगे के एक टाइपराइटर (ऑपरेटिंग सिद्धांत का आविष्कार जापानी क्योटो सुगिमोटो ने 1915 में किया था)।



इसका मुख्य तत्व एक स्याही पैड पर स्थित चित्रलिपि का एक बैंक है। एक यांत्रिक प्रणाली चित्रलिपि के ऊपर तय की गई है: एक संभाल, पकड़ के लिए एक "पैर" और कागज की एक शीट के साथ एक बॉबिन। पूरे तंत्र, संभाल के बाद रील के साथ, चालक के प्रयासों के कारण बाएं, दाएं, आगे और पीछे जाने में सक्षम है। पाठ को टाइप करने के लिए, इंजीनियर लंबे समय तक वांछित चरित्र के लिए आवर्धक ग्लास के साथ खोज करता है, इसके ऊपर सिस्टम रखता है और, पेन को दबाकर, "पैर" को सक्रिय करता है, जो चरित्र को पकड़ लेता है और, कागज की शीट पर इसे अनप्रिंट करता है। इस मामले में, शीट के साथ बोबिन को थोड़ा घुमाया जाता है, जिससे अगले चरित्र के लिए जगह मिलती है। बेशक, इस तरह के कुल पर मुद्रण प्रक्रिया बेहद धीमी है - एक अनुभवी ऑपरेटर प्रति मिनट 11 से अधिक वर्ण नहीं डायल कर सकता है।



1946 में, प्रसिद्ध चीनी दार्शनिक लिन यूटांग ने एक नए प्रकार पर बनाए गए टाइपराइटर के एक प्रकार का प्रस्ताव रखा - उनके घटक भागों में चित्रलिपि का अपघटन।



छवि

विद्युतचुंबकीय लिन युतांग टाइपराइटर, 1946



समग्र पूर्ववर्तियों के विपरीत, नई मशीन अपने लैटिन समकक्षों से अधिक नहीं थी, और इस पर कुछ चाबियाँ थीं। तथ्य यह है कि चाबियाँ पदानुक्रम के अनुरूप नहीं थीं, लेकिन उनके घटक भागों के लिए। डिवाइस के केंद्र में "मैजिक आई" थी: जब ड्राइवर ने चाबियों के संयोजन को दबाया, तो चरित्र का एक प्रकार "आंख" में दिखाई दिया। चयन की पुष्टि करने के लिए, एक अतिरिक्त फ़ंक्शन कुंजी दबाना आवश्यक था। केवल 64 कुंजी के साथ, ऐसी मशीन आसानी से 90,000 वर्णों का एक सेट और 50 वर्ण प्रति मिनट की गति प्रदान कर सकती है!



हालांकि लिन यूटांग अपने आविष्कार के लिए संयुक्त राज्य अमेरिका में एक पेटेंट प्राप्त करने में कामयाब रहे, यह कभी भी जनता के पास नहीं गया। यह आश्चर्य की बात नहीं है, क्योंकि उस समय इस तरह के एक उपकरण का उत्पादन लगभग 120,000 डॉलर था। इसके अलावा, जिस दिन रेमिंगटन कंपनी के लिए प्रस्तुति निर्धारित की गई थी, मशीन ने काम करने से इनकार कर दिया - यहां तक ​​कि जादू की आंख ने भी मदद नहीं की। विचार को बेहतर समय तक सुरक्षित रूप से स्थगित कर दिया गया था।



लेकिन कंप्यूटर के व्यापक उपयोग के युग में, लिन युतांग ने अपने घटक भागों में चित्रलिपि को कम करने के विचार को एक नया जीवन दिया। इसने चीनी वर्णों में प्रवेश के लिए संरचनात्मक विधियों का आधार बनाया, जिसके बारे में हम अभी बात करेंगे।

(वैसे, 80 के दशक में, ताइवानी कंपनी MiTAC ने अपनी संरचनात्मक इनपुट पद्धति, सिम्प्लेक्स को भी सीधे लिन यूटांग की कोडिंग प्रणाली के आधार पर विकसित किया था।)



संरचनात्मक तरीके



कम से कम एक दर्जन ऐसे तरीके ज्ञात हैं, और ये सभी चित्रलिपि की ग्राफिक संरचना पर आधारित हैं। चीनी अक्षर एक ही भागों (तथाकथित अंगूर) से इकट्ठी पहेली हैं। इन अंगूरों की संख्या इतनी महान नहीं है - 208, और वे पहले से ही एक नियमित कीबोर्ड में "shoved" हो सकते हैं। सच है, हमें प्रति कुंजी लगभग 8 अंगूर मिलते हैं, लेकिन इस समस्या को आसानी से हल किया जा सकता है।



सबसे आम संरचनात्मक इनपुट विधियों में से एक है जिक्सिंग को मारना (वुबिंग ज़िक्सिंग - "पांच लाइनों पर इनपुट")। यह कैसे काम करता है? मैं आपको तुरंत चेतावनी देता हूं: मुश्किल।



वास्तव में, सभी चीनी पात्रों को चार समूहों में बांटा गया है:

  1. 5 बुनियादी लक्षण (一, 丨, 丶, 乙, 25) और 25 अन्य बहुत अक्सर इस्तेमाल किए जाने वाले अक्षर (उनमें से प्रत्येक में इसके साथ जुड़ी एक कुंजी है)।
  2. चित्रलिपि, जिसके बीच में अंगूर के बीच एक निश्चित दूरी होती है। उदाहरण के लिए, वर्ण 苗 में अंगूर 田 और between होते हैं, जिनके बीच एक दूरी होती है (हालांकि प्रेस पर वे थोड़े "संकुचित" होते हैं और आप सोच सकते हैं कि उनके बीच कोई दूरी नहीं है)।
  3. हाइरोग्लिफ़ जिनके अंगूर एक दूसरे से जुड़े हुए हैं। इस प्रकार, वर्ण hem एक क्षैतिज रेखा से जुड़ा हुआ एक अंगूर है; 尺 अंगूर के 尸 और फ्लिप होते हैं।
  4. हाइरोग्लिफ़ जिसका कण्ठस्थच्छेदन या आच्छादन। उदाहरण के लिए, चरित्र 本 ग्रैपेस 一 और का चौराहा है।


ठीक है, हमने मानसिक रूप से उस चरित्र को तोड़ दिया है जिसे हम अंगूर में पेश करने वाले हैं। आगे क्या है? सबसे पहले, मार लेआउट को देखो:



छवि



पहली नज़र में, अंगूर बेतरतीब ढंग से स्थित प्रतीत हो सकते हैं। वास्तव में ऐसा नहीं है। बुनियादी विशेषताओं की संख्या के अनुसार कीबोर्ड को पांच क्षेत्रों में विभाजित किया गया है, (चित्र में उन्हें अलग-अलग रंगों में चिह्नित किया गया है)। प्रत्येक ज़ोन के अंदर, कुंजियाँ क्रमांकित होती हैं - कीबोर्ड के केंद्र से किनारों तक। यह संख्या 1 से 5 तक दो अंकों से बनी होती है, जिसके आधार पर ग्रैफे को आधार बनाया जाता है।



खैर, आइए प्रवेश करने के लिए सबसे आसान अंगूरों के साथ शुरू करें - प्रत्येक कुंजी के लिए पूंजी अंगूर (वे तालिका में बड़े प्रिंट में दिखाए गए हैं)। उनमें से प्रत्येक 25 अक्सर इस्तेमाल किए जाने वाले पात्रों में से एक का प्रतिनिधित्व करता है, जो ऊपर चर्चा की गई थी। इस तरह के हाइरोग्लिफ में प्रवेश करने के लिए, बस संबंधित कुंजी पर चार बार दबाएं। यह पता चला है कि 金 = QQQQ, Y = YYYY, आदि।



छवि



इस प्रकार, U = यू + ई + एम + सी। चार से अधिक अंगूरों से मिलकर चित्रलिपि दर्ज करने के लिए, आपको पहले तीन अंगूर और आखिरी में प्रवेश करना होगा।



सबसे मुश्किल काम दो या तीन अंगूरों से मिलकर चित्रलिपि में प्रवेश करना है। चूंकि उनमें से बहुत सारे हैं, अनिवार्य रूप से एक ही कुंजी संयोजन का दावा करते हुए, कई हाइरोग्लिफ दिखाई देंगे। उनके बीच अंतर करने के लिए, डेवलपर्स एक विशेष कोड के साथ आए। इस कोड में दो अंक होते हैं, पहला वर्ण की अंतिम वर्ण रेखा का क्रम संख्या होता है, और दूसरा वर्ण की समूह संख्या होती है (उन चार समूहों को याद करें जिनमें वर्ण विभाजित हैं)।



सौभाग्य से, जब सबसे अधिक इस्तेमाल किए जाने वाले वर्ण टाइप करते हैं, तो आपको कोड के बारे में नहीं सोचना होगा, क्योंकि अक्षर पहले दो या तीन टैप के बाद स्क्रीन पर दिखाई देंगे। और 24 सबसे अधिक बार सामना किए गए वर्णों को एक क्लिक के साथ दर्ज किया जा सकता है (चाबियाँ उन्हें सौंपी गई हैं)।



संरचनात्मक इनपुट की कमियां स्पष्ट हैं: यह जटिल है - केवल इसके विवरण का पाचन संस्करण ऊपर था! इस पर महारत हासिल करने के लिए, चीनी भी एक विशेष कविता कविता के साथ आए। लेकिन संरचनात्मक विधि नेत्रहीन इनपुट की संभावना को खोलती है, जिससे अधिकतम टाइपिंग की गति 160 वर्ण प्रति मिनट हो जाती है। इसलिए, पेशेवर टाइपसेटर्स इसका उपयोग करते हैं। और मत भूलना: प्रति मिनट 160 वर्ण - यह एक ही मिनट में लगभग 500 कीस्ट्रोक्स है!



संरचनात्मक इनपुट के लिए, सबसे आम QWERTY कीबोर्ड का अक्सर उपयोग किया जाता है - आखिरकार, उस पर चित्रलिपि का स्थान अभी भी सीखना है। लेकिन कभी-कभी आप की-बोर्ड की चाबी के साथ ऐसे कीबोर्ड पा सकते हैं:



छवि



सच है, मैंने चीन में अपने पूरे समय में ऐसे कीबोर्ड नहीं देखे हैं :)



ध्वन्यात्मक तरीके



इन टाइपिंग विधियों का उपयोग करने वाले टाइपराइटर बस अस्तित्व में नहीं आते हैं - ध्वन्यात्मक तरीके कंप्यूटर के लिए विशेष रूप से अपनी उपस्थिति का श्रेय देते हैं। सब के बाद, ध्वन्यात्मक विधि का उपयोग करते हुए, आप स्वयं चरित्र में प्रवेश नहीं करते हैं, लेकिन इसका उच्चारण - और सिस्टम पहले से ही वांछित चरित्र पाता है। लेकिन यहाँ समस्या यह है: चीनी में इतने सारे वर्ण हैं कि दर्जनों चित्रलिपि एक ही उच्चारण के अनुरूप हो सकते हैं। आवश्यक चरित्र, एक नियम के रूप में, सूची से मैन्युअल रूप से चुना जाना चाहिए, जो इनपुट प्रक्रिया को धीमा करता है। T9 जैसे भविष्य कहनेवाला सिस्टम बचाव के लिए आते हैं।



सबसे आम ध्वन्यात्मक विधि प्रसिद्ध पिनयिन है । इसके आधार पर, एक ध्वन्यात्मक इनपुट प्रणाली बनाई गई थी, जो विंडोज सिस्टम के मानक एशियन लैंग्वेज पैक (संस्करण XP से शुरू) में शामिल है, इससे पहले, इसे अतिरिक्त रूप से स्थापित किया जाना था। आइए देखें कि यह कैसे काम करता है।



उदाहरण के लिए, हम शब्द "ब्लॉगर" को शुरू करना चाहते हैं - वांग्मिन

पहले हम वांग (या विकल्पों की संख्या को कम करने के लिए टोन के साथ wang3) टाइप करते हैं। स्पेस बार दबाने के बाद, वैन को पढ़ने के साथ वर्ण प्रतिस्थापित किया जाता है। लेकिन यह वह वैन नहीं है जिसकी हमें जरूरत है। उस पर राइट क्लिक करें:



छवि



मैचों की लंबी कड़ी निकलती है। हम अपनी आँखें तोड़कर, वहाँ अपनी वैन की तलाश कर सकते हैं या बस शब्द के दूसरे शब्दांश में प्रवेश कर सकते हैं - मिनट। प्रणाली चतुर है - यह खुद को शब्दकोष में वैनमिन शब्द मिलेगा और स्वचालित रूप से वांछित वैन और सही मिनट का चयन करेगा। बनजई, हमने किया!



छवि



Google Pinyin और Sogou Pinyin इनपुट सिस्टम आगे बढ़ गए हैं - वे उपयोगकर्ता की प्राथमिकताओं को याद करते हैं और संदर्भ के आधार पर सही शब्द सुझाते हैं।

यहाँ एक उदाहरण है कि Google पिनयिन किस तरह एक उग्र क्रम का विश्लेषण करता है



छवि



और सही सेट विकल्प का उत्पादन करता है:

मैंने वांग झिझी को याओ मिंग (हम दो चीनी एनबीए खिलाड़ियों के बारे में बात कर रहे हैं) के साथ एक ही मैच में खेलते देखा । यह विशेष रूप से अच्छा है कि नाम सही ढंग से लिखे गए हैं।



ताइवान में, पिनयिन प्रणाली का एक विकल्प है - ज़ुयिन इनपुट। लैटिन वर्णमाला का उपयोग नहीं किया गया है, लेकिन चित्रलिपि जैसे आइकन के साथ शब्दांश वर्णमाला। चूंकि वर्णमाला में कुछ आइकन हैं, इसलिए उन्हें कीबोर्ड पर बिखेरना आसान है। हांगकांग में स्थानीय बोली के लिए रोमनकरण का अपना संस्करण है - ज्योतपिंग, इसे ध्वन्यात्मक इनपुट के लिए भी सक्रिय रूप से उपयोग किया जाता है।



ध्वन्यात्मक इनपुट प्रणालियों का मुख्य नुकसान अपेक्षाकृत कम टाइपिंग गति है - प्रति मिनट लगभग 50 वर्ण (अपने 160 वर्ण प्रति मिनट के साथ किल जिक्सिंग के साथ तुलना)। तथ्य यह है कि पिनयिन विधि द्वारा हाइरोग्लिफ़ का इनपुट औसतन छह कीस्ट्रोक्स के लिए होता है, जबकि जब जीक्सिंग को मारकर प्रवेश किया जाता है , तो चार पर्याप्त होंगे। इसके अलावा, इस विधि द्वारा अंधा डायल करना संभव नहीं है। और फिर, आपको पिनयिन / ज़ुयिन को जानने की ज़रूरत है, जो हर चीनी के लिए उपयुक्त नहीं है, क्योंकि ज्ञान के स्कूल की पहली कक्षा से (यदि कोई थे) वे थोड़े से मौसम में कामयाब रहे। और यह याद रखना हमेशा आसान नहीं होता है कि कुछ दुर्लभ चित्र कैसे पढ़े जाते हैं। इसलिए, चीन में, मारने jixing अधिक से अधिक लोकप्रियता प्राप्त कर रहा है। हालांकि, पिनयिन को संरचनात्मक तरीकों की तुलना में सीखना आसान है। खैर, एक विदेशी इस तरह की प्रणाली आत्मा के लिए एक बाम की तरह है।



जैसा कि हम देख सकते हैं, ध्वन्यात्मक इनपुट के लिए हमें कुछ विशेष कीबोर्ड की भी आवश्यकता नहीं है - लैटिन QWERTY लेआउट वाला कोई भी कीबोर्ड पर्याप्त है। ठीक है, उदाहरण के लिए, आपके सामने वाला व्यक्ति काफी उपयुक्त है :)



संकर विधियाँ



ये विधियाँ ध्वन्यात्मक और संरचनात्मक इनपुट विधियों का एक संयोजन हैं। सबसे सरल उदाहरण यिनक्सिंग विधि ( यिनक्सिंग - "ध्वनि और रूप") है। चरित्र प्रतिलेखन में प्रवेश करके और ग्राफिक तत्व की ओर इशारा करके टाइप किया जाता है। ग्राफिक तत्वों का एक सीमित सेट कीबोर्ड पर रखा गया है, इसलिए सैद्धांतिक रूप से उन्हें याद रखना मुश्किल नहीं है।



व्यवहार में, हाइब्रिड इनपुट सिस्टम धीरे-धीरे मर रहे हैं। उन्हें संरचनात्मक प्रणालियों के जटिल संयोजन और प्रतिलेखन के अच्छे ज्ञान को जानने के लिए एक ही समय में उपयोगकर्ता की आवश्यकता होती है। एक चीज़ को पूरी तरह से मास्टर करना आसान है।



तो वहाँ एक "मानक" विधि है?



लेकिन नहीं। चीन में, संरचनात्मक मार विधि और ध्वन्यात्मक पिनयिन सबसे लोकप्रिय हैं। ताइवान में, वे ज़ुयिन की ध्वन्यात्मक विधि से प्यार करते हैं (क्योंकि कई ने इसे स्कूल में पढ़ाया था, न कि पिन्यिन ) और कांजी की अप्रचलित संरचनात्मक विधि। यह 1976 में वापस आविष्कार किया गया था और तब से इसकी सभी कमियों को बरकरार रखा गया है: इस विधि के साथ विराम चिह्नों को दर्ज करना बहुत मुश्किल है, आपको हमेशा चरित्र को तोड़ने का सही तरीका और जटिल लेआउट को याद रखना चाहिए (कई ताइवानी लोग मॉनिटर पर इसे निराशाजनकता से भी चिपकाते हैं)। हांगकांग में, तंजी को स्कूल में पढ़ाया जाता है और इसे अन्य सभी तरीकों से स्पष्ट रूप से पसंद किया जाता है।



मान्यता आधारित तकनीक



यह पता चला है कि सूचीबद्ध कीबोर्ड इनपुट विधियों में से कोई भी आदर्श नहीं है। यह आश्चर्य की बात नहीं है कि चीनियों ने अपनी आखिरी उम्मीद - मान्यता के लिए चिपके रहने का फैसला किया। अब भाषण और लिखावट दोनों की मान्यता विंडोज 7 के मानक भाषा पैक में शामिल है। यह माना जाता है कि उपयोग करने से पहले सिस्टम को "सीखने की विधि" में लगाने के लिए कम से कम 15 मिनट के लिए इसे अपनी लिखावट और भाषण सुविधाओं के लिए उपयोग करने का समय देना बेहतर होता है।



लेकिन मान्यता पर आधारित विधियों को व्यापक वितरण नहीं मिला है। कीबोर्ड इनपुट को अभी भी अधिक विश्वसनीय माना जाता है।



बोली जाने वाली चीनी की मान्यता इस तथ्य से जटिल है कि सही उच्चारण करने वाले लोगों का अनुपात इतना बड़ा नहीं है। द्वंद्वात्मक विशेषताएं यहां और वहां आती हैं और पूरी तस्वीर को खराब करती हैं। विदेशी लोगों के बारे में जिनके लिए चार स्वरों में महारत हासिल करना पहले से ही एक उपलब्धि है, और बात करने की कोई आवश्यकता नहीं है।



लिखावट चित्रलिपि सरल लगती है, और अब कई पीडीए हैं जो इस इनपुट विधि का समर्थन करते हैं। लेकिन यह विधि व्यापक उपयोग तक नहीं पहुंची है। तथ्य यह है कि अधिकांश चीनी लोग इटैलिक को लिखित रूप में लिखते हैं और उनके लिए प्रत्येक सुविधा की धीमी ड्राइंग पर स्विच करना मुश्किल हो सकता है। अक्सर समस्या यह है कि वे बस लाइनों के सामान्य आदेश को याद नहीं करते हैं, क्योंकि वे संक्षिप्त रूपों को लिखने के लिए उपयोग किए जाते हैं! इसलिए यह पता चला है कि मान्यता-आधारित इनपुट मुख्य रूप से भाषा सीखने वालों के लिए उपयुक्त है, जो कि ऑनलाइन शब्दकोश सक्रिय रूप से उपयोग कर रहे हैं। उदाहरण के लिए, लोकप्रिय Nciku की साइट पर , सभी को माउस के साथ वांछित चरित्र बनाने के लिए आमंत्रित किया जाता है, और फिर सिस्टम द्वारा प्रस्तुत विकल्पों में से चुनें:



छवि



और फिर भी यह मौजूद है!



छवि

एक प्रयोगात्मक चीनी कीबोर्ड, अर्थहीन और निर्दयी।



आखिरकार, आपने इसकी कल्पना कैसे की?

हां, हां, हजारों की-बोर्ड वाली चीनी कीबोर्ड मौजूद हैं। सच है, स्पष्ट कारणों के लिए, वे बड़े पैमाने पर उत्पादन में नहीं जाते हैं, एक तरह की कलाकृति शेष है।

लेकिन, आपको स्वीकार करना चाहिए कि यह महसूस करना अभी भी अच्छा है कि ऐसा कोई कीबोर्ड कहीं है!



हैप्पी प्रोग्रामर डे!



जूलिया ड्रेसिस,

चीनी भाषा के नेता



PS आप लिंग्वो टीम ब्लॉग पर चीनी भाषा और चीनी संस्कृति के बारे में मेरे अन्य लेख पढ़ सकते हैं।



(लेख wikipedia.org और magazeta.com की छवियों का उपयोग करता है)



अद्यतन: जूलिया ड्रेसिस अब हैबे पर है - दलिमन , कृपया प्यार और अनुग्रह करें।



All Articles