Friday, April 10, 2009

ယူနီကုဒ္ ျမင္းရိုင္းႏွင့္ ဘိုင္နရီ ေခတ္လြန္ ျမန္မာစာ ယဥ္ေက်းမႈ

Posted on 11:22 AM by nweminthit

ဤသုေတသန ေဆာင္းပါးကို ေရးခ်င္ျခင္း၊ ေျပာလိုခ်င္း ဆႏၵ အျမစ္တြယ္ ေနသည္မွာ ၾကာျမင့္ၿပီ ျဖစ္သည္။ ဘိုင္နရီေခတ္ (Binary Era)၊ အိုင္တီ ေခတ္ (IT Era) တြင္ ျမန္မာစာ၊ ျမန္မာစကား ႏွင့္ ယူနီကုဒ္ တို႔၏ ရႈပ္ေထြး က်ယ္ျပန္႔လွေသာ ျပႆနာမ်ား အေၾကာင္း ေဆြးေႏြးမႈမ်ား၊ ျငင္းခုန္မႈမ်ား ေတြ႕တိုင္း၊ ျမင္တိုင္း၊ ၾကားမိတိုင္းတြင္ တစ္စံုတစ္ခုကို ဝင္ေရာက္ ေဆြးေႏြး ေျပာဆို လိုျခင္း ဆိုသည့္ ျပင္းျပေသာ ဆႏၵအား အရင္းခံသည္ ဟုဆိုႏိုင္ပါ၏။ သို႔ေသာ္လည္း ေျပာေရးသာရွိ၊ ေျပာစရာ မရွိ ဆိုသလို ေျပာခ်င္ေသာ အေၾကာင္းအရာႏွင့္ ပတ္သတ္၍ကား ထဲထဲဝင္ဝင္၊ ပိုင္ပိုင္ ႏိုင္ႏိုင္ သိကၽြမ္း နားလည္သူ မဟုတ္သျဖင့္ ေျပာႏိုင္ေသာ အစြမ္းမဲ့ကာ ႏႈတ္ဆိတ္ ေနခဲ့ရ၏။ ယခုေတာ့ အဆိုပါ ကိစၥမ်ားႏွင့္ ပတ္သက္၍ ထဲဝင္ ပိုင္ႏိုင္စြာ သိကၽြမ္းသူ အျဖစ္ မဟုတ္ေစကာမူ အၿပီးသတ္ ရယူသံုးစြဲသူ (End User) တစ္ဦး အေနျဖင့္ ေသာ္ လည္းေကာင္း၊ ျမန္မာစာ ျမန္မာစကားကို အမ်ား လက္ခံ သေဘာတူညီေသာ ခိုင္မာတည္တံ့သည့္ စံႏႈန္း၊ နည္းစနစ္ တစ္ခု ျဖင့္ ဘိုင္နရီေခတ္၏ ယူနီကုဒ္ ျမင္းရိုင္းအား ကၽြမ္းက်င္ပိုင္ႏိုင္စြာ စီးနင္းၿပီး တိုးတက္ဖြံ႕ၿဖိဳးမႈ ဆီသို႔ ဆက္လက္ ဦးတည္ေစလိုေသာ ျမန္မာ လူမ်ိဳး တစ္ေယာက္၏ ဆႏၵရင္း၊ ေစတနာ ျဖင့္ေသာ္ လည္းေကာင္း ဖတ္ရႈေလ့လာ၊ မွတ္သားမိသမွ် အသိဥာဏ္အား အျခခံ၍ ဤေဆာင္းပါးအား ေရးသား လိုက္ရပါေၾကာင္းႏွင့္ ဝိုင္းဝန္း၊ ေဝဖန္၊ အႀကံျပဳ၊ မွတ္ခ်က္ခ်၊ ေဆြးေႏြးျခင္းမ်ား လြတ္လပ္စြာ ျပဳလုပ္ႏိုင္ၾကပါေၾကာင္း စာဖတ္သူ အေပါင္းအား ေလးစားစြာ အသိေပးလိုပါ၏။


ဘိုင္နရီ ေခတ္၏ ယူနီကုဒ္ ျမင္းရိုင္း


စက္မႈ အင္ဂ်င္နီယာႏွင့္ စြမ္းအင္ အင္ဂ်င္နီယာ ဘာသာရပ္မ်ား (Mechanical & Dynamic Engineering) တြင္ ျမင္းေကာင္ေရ အား (Horsepower) ဆိုသည့္ စြမ္းအင္ (Power) ကိုတိုင္းတာေသာ အတိုင္းအတာ (Unit) တစ္ခုရွိသည္။ စက္မႈေခတ္ေျပာင္း ေတာ္လွန္ေရး၏ အစဟု ဆိုႏိုင္ေသာ ကာလ (၁၇၀၂-ခုႏွစ္) ၊ စက္မႈ သိပၸံပညာရွင္ (Thomas Savery) ႏွင့္ (James Watt) တို႔မွ ျမင္း တို႔၏ သန္မာ ျဖတ္လတ္လွေသာ ခြန္အားကို စံထား သတ္မွတ္ကာ စက္ပစၥည္း မ်ားအတြက္ စြမ္းအင္ အတိုင္းအတာ အျဖစ္ စတင္တီထြင္ သံုးစြဲ လာခဲ့ၾကျခင္း ျဖစ္သည္။

ယေန႔ အိုင္တီ ေခတ္ေျပာင္း ေတာ္လွန္ေရး တြင္ စြမ္းေဆာင္ရည္ ျမင့္လွေသာ ကြန္ျပဴတာ ဆိုသည့္ Binary စနစ္ သံုး ဂဏန္းႏွစ္လံုး (Digital) ပစၥည္းမ်ား ေပၚထြန္းလာ ၿပီးေနာက္ ကမာၻ အႏွံ႕အျပားရွိ အသီးသီးေသာ ႏိုင္ငံ၊ လူမ်ိဳး အေပါင္းတို႕သည္လည္း သန္မာ ျဖတ္လတ္လွၿပီး အင္အား ေကာင္းမြန္လွသည့္ ယူနီကုဒ္ (Unicode) ဆိုေသာ ျမင္းရိုင္းႀကီး ကို စီးႏွင္ကာ အသီးသီးေသာ အေပ်ာ့ထည္မ်ား (Softwares)၊ အသံုးခ် ညႊန္ၾကားခ်က္ အစုမ်ား (Applications)ကို မိမိတို႔ကိုယ္ပိုင္ ဘာသာစကား ျဖင့္ မိမိတို႔ ကိုယ္ပိုင္ ယဥ္ေက်းမႈသို႔ ျပဳလုပ္ဖန္တီးၿပီး သကာလ သတင္းႏွင့္ နည္းပညာ ေခတ္ႀကီး (IT Era or Digital Era) အတြင္း အေျပးအလႊား ျဖတ္သန္း ခရီးႏွင္လ်က္ ရွိၾကသည္။



ဝွက္စာဖြဲ႔ျခင္း (Character Encoding) ႏွင့္ ASCII Code နည္းစနစ္၏ ကန္႔သတ္ခ်က္မ်ား


ကိန္းဂဏန္း အတိုင္းအတာမ်ားကို ေဖာ္ျပရန္ အလင္းလႊတ္ ဒိုင္အုတ္မီးလံုးမ်ား (Light Emitting Diode-LED) ကိုသာ အသံုးျပဳသည့္ အန္နာေလာ့ဂ္ (Analog) ေခတ္ ကြန္ျပဴတာ မွသည္ တစ္ပိုင္းလွ်ပ္ခံ ပစၥည္း (Transistor)၊ လွ်ပ္သို (Capacitor) ႏွင့္ လွ်ပ္ခံ (Resistor) အစရွိသည္တို႔ကို သံုးေသာ ဘိုင္နရီေခတ္၊ တဖန္ ဘိုင္နရီေခတ္ အလြန္ တစ္ပိုင္း လွ်ပ္ကူး ပစၥည္းမ်ား (Semiconductors) ႏွင့္ တစ္ပိုင္းလွ်ပ္ခံ၊ လွ်ပ္သို၊ လွ်ပ္ခံ ပစၥည္းမ်ားကို ဆီလီကြန္ အလႊာတစ္လႊာ ထဲတြင္ စုေပါင္းထည့္သြင္း အသံုးျပဳေသာ ေပါင္းစပ္လွ်ပ္စီး ပတ္လမ္းပစၥည္းမ်ား (Integrated Circuit – IC)၊ မိုက္ခရို ပရိုဆက္ဆာ (Microprocessor) မ်ား စသည္တို႔အား အသံုးျပဳေသာ ယေန႔ေခတ္၊ အခ်ိန္အထိ ကြန္ျပဴတာ ဆိုသည့္ စြမ္းေဆာင္ရည္ျမင့္ ဂဏန္းႏွစ္လံုး စက္ပစၥည္း ကိရိယာ (Digital Devices) မ်ားကို လူတို႔ ခိုင္းလို၊ ေျပာဆိုလိုသည့္ အမိန္႔မ်ား၊ စာမ်ားအား နားလည္ လုပ္ေဆာင္ ေပးရန္ အတြက္ စက္နားလည္ေသာ ဘာသာစကား ျဖစ္သည့္ ဝွက္စာဖြဲ႕ျခင္း (Character Encoding) နည္းလမ္းမ်ားျဖင့္ အမိန္႔ေပး ခိုင္းေစ၊ အသံုးျပဳ လုပ္ေဆာင္ ခဲ့ၾကသည္။ တဖန္ ထိုဝွက္စာဖြဲ႕ထားေသာ စက္သာ နားလည္သည့္ ဘာသာစကားကို စက္ပစၥည္းကိရိယာ၏ အထြက္ရလာဒ္ (Output Result) တြင္ လူတို႔နားလည္ေသာ ဘာသာစကားျဖစ္ေအာင္ ဝွက္စာ ေဖာ္ျခင္း (Decoding or Parsing) အမႈကို ျပန္ျပဳရ၏။ ထိုသို႔ ကြန္ျပဴတာ ႏွင့္တကြ အျခားေသာ ဒီဂ်စ္တယ္ ပစၥည္းမ်ားတြင္ ဝွက္စာဖြဲ႕ျခင္း ႏွင့္ ဝွက္စာေဖာ္ျခင္း လုပ္ငန္း (၂) ရပ္ကို ပင္ ယေန႔ သတင္းႏွင့္နည္းပညာ ေခတ္တြင္ ကြန္ျပဴတာ အစီအစဥ္ေရးဆြဲျခင္း သို႔မဟုတ္ Computer Programming ဟု ေခၚဆိုေနၾကျခင္း ျဖစ္၏။

ဤေနရာတြင္ အဓိကထား ေဆြးေႏြး ေျပာဆိုလိုသည္မွာ ဝွက္စာဖြဲ႕ျခင္း (Character Encoding) အပိုင္းျဖစ္သည္။ အမ်ား သိၾကသည့္ အတိုင္း ကမာၻေပၚတြင္ ဝွက္စာႏွင့္ တြဲဘက္ သိျမင္တတ္ၾကသည္မွာ ေရဒီယို ဆက္သြယ္ေရး ျဖစ္သည္။ ကြန္ျပဴတာ ေလာက၏ အေျခခံ အက်ဆံုးေသာ ႏွင့္ ယေန႔ထက္တိုင္ ဖြံ႕ၿဖိဳးသံုးစြဲလာသည့္ ဝွက္စာဖြဲ႕ျခင္း နည္းစနစ္ ASCII Code (American Standard Code for Information Interchange) အားလည္း ေရဒီယို ဆက္သြယ္ေရး စနစ္ ၏ ေက်ာ္ၾကားေသာ ဝွက္စာဖြဲ႕ျခင္း နည္းလမ္း ျဖစ္သည့္ ေမာ့စ္ဆ္ကုဒ္ (Morse Code) အိုင္ဒီယာ ကိုပင္ အေျချပဳ ဖန္တီးခဲ့ၾက၏၊

မူလ ပထမ ASCII Code မ်ားတြင္ Morse Code ၏ အေျခခံ မူလကုဒ္မ်ား ျဖစ္သည့္ အဂၤလိပ္ အကၡရာ (English Alphabets) - ၂၆ လံုး ႏွင့္ ကိန္းဂဏန္း (Numerical Digits) - ၁၀ လံုးသာ ပါရွိခဲ့သည္။ ေနာက္ပိုင္း ကာလမ်ားတြင္ အကၡရာမ်ားကို အႀကီးအေသး ခြဲျခား သတ္မွတ္ျခင္း၊ ပုဒ္ျဖတ္၊ ပုဒ္ရပ္ သေကၤတ (Comma, Full Stop, Exclamation Mark, Semi-Columns) မ်ား၊ သခ်ာၤဆိုင္ရာ သေကၤတမ်ား (Plus, Minus, Multiple, Divide, Percent, Greater Than & Less Than) ၊ ေငြေၾကး သေကၤတမ်ား ($)၊ အျခား အထူး သေကၤတမ်ား ( [ ], { }, &, *, |, \, /, ~,`, ^) ၊ ပံုႏွိပ္ျခင္း မျပဳႏိုင္ေသာ အကၡရာမ်ား (Space Key, Delete Key, Ctrl Key, Shift Key. etc) အစရွိသည္ တို႔ကိုပါ ထပ္မံထည့္သြင္း လာခဲ့ၿပီး ပံုႏွိပ္ႏိုင္ေသာ အကၡရာမ်ား (Printable Characters) - ၉၄ လံုး ႏွင့္ ပံုႏွိပ္ျခင္း မျပဳႏိုင္ေသာ အကၡရာမ်ား (Non-printing Characters) - ၃၃ လံုး တို႔ျဖင့္ ASCII Code စနစ္တြင္ အကၡရာ- ၁၂၈ လံုး သို႔ ေရာက္ရွိ အဆံုးသတ္ခဲ့သည္။ (Space Key ကို မျမင္ႏိုင္ေသာ ရုပ္ပံုေဖာ္ျပခ်က္ (Invisible Graphic) တစ္ခု အျဖစ္ အသံုးျပဳေသာ ေၾကာင့္ ထည့္သြင္း ေရတြက္ျခင္း မျပဳ)

ဘိုင္နရီ ေခတ္၏ ဂလိုဘယ္ ယဥ္ေက်းမႈ ႏွင့္ ျပည္တြင္းမႈ ျပဳျခင္း ျဖစ္စဥ္မ်ား (Localizations) ႏွင့္ အေတြ႕တြင္ ရိုမန္ ႏွင့္ လက္တင္ အကၡရာမ်ား (Roman Characters) အေပၚ၌သာ အလံုးစံု ဗဟိုျပဳထားေသာ ASCII Code စနစ္ သည္ အားနည္းခ်က္ေပါင္း မ်ားစြာတို႔ ျဖင့္ ၿပိဳင္ဘက္မရွိ ပထမေနရာမွ ေလ်ာက်ၿပိဳဆင္း ခဲ့ရေလ၏။ အဘယ့္ေၾကာင့္ နည္း။ ASCII Code ျဖင့္ ဝွက္စာဖြဲ႕ျခင္း နည္းစနစ္တြင္ မူလ ရိုမန္ ႏွင့္ လက္တင္ အကၡရာ ၂၆-လံုး ႏွင့္ ကိန္းဂဏန္းမ်ား သေကၤတမ်ား အပါအဝင္ စုစုေပါင္း အကၡရာ- ၁၂၈ လံုး အတြက္ အဓိက ေလးလံုးဂဏန္း (Four Digits) 0000 မွ 1111 အထိသာ ကုဒ္နံပါတ္မ်ား အတြက္ ေနရာသတ္မွတ္ထားၿပီး၊ အျခားေသာ ဘာသာစကားမ်ား အတြက္ ေနရာ ထပ္မံ တိုးခ်ဲ႕သတ္မွတ္ျခင္း မျပဳႏိုင္ေတာ့ေခ်။ သို႔အတြက္ ကြန္ျပဴတာတြင္ ကမာၻေပၚရွိ ရိုမန္ဘာသာစကား အျပင္ အျခားေသာ ဘာသာစကား သံုးစြဲသူမ်ား (China, Japan, Russia, Arabic… etc) ၏ အကၡရာမ်ား၊ စာလံုးမ်ား အတြက္ ၄င္းတို႔၏ သက္ဆိုင္ရာ ဘာသာအလုိက္ အကၡရာမ်ားကို ကုဒ္နံပါတ္ေနရာ (Code Space) သတ္မွတ္ေပးရန္ လိုအပ္လာ၏။


ဒါျဖင့္ ယူနီကုဒ္ဆိုတာ ဘာလဲ? ဘာ့ေၾကာင့္ အေရးပါတာလဲ?


သို႔အတြက္ ကမာၻေပၚရွိ လူမ်ိဳး အသီးသီး တို႔၏ ဘာသာစကား၊ အကၡရာမ်ားအား ကြန္ျပဴတာတစ္လံုး အတြင္း သဟဇာတ ျဖစ္စြာ ထည့္သြင္း အသံုး ျပဳႏိုင္ရန္ အတြက္ လည္းေကာင္း၊ ISO 8859 ကဲ့သို႔ ကန္႔သတ္ခ်က္မ်ားစြာ ရွိေနေသာ ASCII ၏ ဝွက္စြာဖြဲ႔ျခင္း နည္းစနစ္ (Character Encoding) ကို ေရွာင္လႊဲ အသံုးျပဳႏိုင္ရန္ အတြက္ ေသာ္လည္းေကာင္း ကြန္ျပဴတာ ပညာရွင္တို႔ အသီးသီး အသက ႀကံဆေဆာင္ရြက္ ခဲ့ၾကရာတြင္ Xerox Company မွ Joe Becker ၊ Apple Company မွ Lee Collins and Mark Davis တို႔ ကနဦးျပဳ ေလ့လာ ေဆာင္ရြက္ခဲ့ၾကေသာ “ယူနီကုဒ္ ဟု ေခၚတြင္သည့္ ႏိုင္ငံတကာ/ဘာသာစကားမ်ိဳးစံု အကၡရာမ်ား ဝွက္စာဖြဲ႕ျခင္း နည္းစနစ္” သည္ ၁၉၈၇-ခုႏွစ္တြင္ “ယူနီကုဒ္-၈၈“ အမည္ျဖင့္ စာတမ္းတစ္ခု စတင္ထြက္ရွိလာခဲ့သည္။

၁၉၈၉ - ႏွစ္ဦးပိုင္းႏွင့္ ၁၉၉၀ ခုႏွစ္မ်ားတြင္ ယူနီကုဒ္ အဖြဲ႕သို႔ Ken Whistler ၊ Mike Kernaghan ႏွင့္ Karen Smith-Yoshimura၊ RLG အဖြဲ႕မွ Joan Aliprand ၊ Sun Microsystems မွ Gleen Wright ၊ Microsoft မွ Michel Suignard ႏွင့္ Asmus Freytag တို႔ စသျဖင့္ ပူးေပါင္း ပါဝင္လာခဲ့ၾကၿပီးေနာက္ ၁၉၉၁-ခုႏွစ္၊ ဇန္နဝါရီလ-၃ ရက္ေန႔တြင္ အေမရိကန္ ႏိုင္ငံ၊ ကယ္လီဖိုးနီးယား ျပည္နယ္တြင္ “ယူနီကုဒ္ အက်ိဳးတူပူးေပါင္း ေဆာင္ရြက္ေရး အဖြဲ႔ႀကီး” (Unicode Consortium) အား တည္ေထာင္ ဖြဲ႔စည္းခဲ့ၾကသည္။ ထိုႏွစ္ထဲတြင္ပင္ ယူနီကုဒ္စနစ္ ၏ ပထမ တည္းျဖတ္မူအား ပံုႏွိပ္ ျဖန္႔ခ်ီခဲ့သည္။

ယူနီကုဒ္ စနစ္တြင္ ဝွက္စာဖြဲ႕ရာ၌ ASCII Code စနစ္မွာကဲ့သို႔ အကၡရာမ်ား၊ ကိန္းဂဏန္းမ်ား ကို ရုပ္ပံု ေဖာ္ျပခ်က္မ်ား (Glyphs) ျဖင့္ ကိုယ္စားမျပဳပဲ အကၡရာ၊ ကိန္းဂဏန္း တစ္လံုးခ်င္းစီ အလိုက္ Code Point ဟုေခၚသည့္ ကိုယ္ပိုင္ ထူးျခားေသာ ဂဏန္းတန္ဖိုးမ်ား သတ္မွတ္ထားရွိေပးၿပီး ၎ အကၡရာမ်ားကို ဝဘ္ဘေရာက္ဇာ မ်ား၊ Word Processing မ်ားတြင္ ျပန္လည္ ဝွက္စာေဖာ္ ျပသရာတြင္လည္း သတ္မွတ္ထားသည့္ ကုဒ္နံပါတ္ အလိုက္ စိတၱဇနာမ္မ်ား သက္သက္ ကိုသာ ေဖာ္ျပျခင္း ျဖစ္ၿပီး အရြယ္အစား၊ ပံုသဏၭာန္၊ ေဖာင့္ထ္ ႏွင့္ ပံုစံ တို႔အေပၚတြင္သာ အဓိက အမွီျပဳ ထားရသည့္ ေဆာ့ဖ္၀ဲရ္ အမ်ားစုတို႔၏ အျမင္အာရံု ပံုေဖာ္ျခင္းနည္းစနစ္ (Visual Rendering) အား အသံုးျပဳမႈကို ေလ်ာ့ခ်ႏိုင္ခဲ့၏။


ယူနီကုဒ္တြင္ အကၡရာမ်ားအား Code Point မ်ားျဖင့္ သတ္မွတ္ သိမ္းဆည္းပံု နည္းစနစ္ တစ္မ်ိဳး

ယူနီကုဒ္ နည္းစနစ္တြင္ အကၡရာမ်ား၊ ကိန္းဂဏန္းမ်ားကို ေနရာေပး သတ္မွတ္ရန္ Code Space တစ္ခုအတြက္၊ Code Point ေပါင္း ၁,၁၁၄,၁၁၂ ခုျဖင့္ အကြာ အေ၀း 0hex မွ 10FFFFhex ထိ သတ္မွတ္ထားရွိသည္။ (စကားခ်ပ္ - ASCII Code စနစ္၏ အကြာအေဝး သတ္မွတ္ခ်က္ 0000 မွ 1111 ထိ အကၡရာ ၁၂၈-လံုး ႏွင့္ ႏႈိင္းယွဥ္ၾကည့္ႏိုင္သည္။) ဤေနရာတြင္ အကၡရာမ်ားအား တန္ဖိုး သတ္မွတ္ ေဖာ္ျပရန္ အတြက္ ယူနီကုဒ္ ဆိုသည္အား လြယ္ကူစြာ ရည္ညႊန္းခ်က္ ေပးႏိုင္ေသာ “U+” ဆိုသည့္ စာလံုး ႏွင့္ ၎၏ ေနာက္မွ အကၡရာ တစ္ခုခ်င္းစီ အလိုက္ ကိုယ္စားျပဳေသာ Hexadecimal နံပါတ္ ၄-လံုး မွ ၈-လံုး အထိ တြဲရက္ ေဖာ္ျပေလ့့ရွိသည္ကို မွတ္သား ထားႏိုင္သည္။ ဥပမာ အားျဖင့္ အေျခခံ ဘာသာစံု အကန္႔ (Basic Multilingual Plane -BMP) တြင္ “U+0058” ဆိုသည္က Latin Capital Letter – “X” အား ကိုယ္စားျပဳၿပီး၊ Supplementary Multilingual Plane – SMP တြင္ ပါဝင္ေသာ “U+1000” ဆိုသည္က ျမန္မာဘာသာစကား ၏ ပထမ အကၡရာ “က” အား ကုိယ္စားျပဳပါသည္။ ယူနီကုဒ္ နည္းစနစ္ တစ္ခုလံုး (Code Space) အတြက္ အထက္ပါ အတိုင္း အကၡရာမ်ား၏ ကိုယ္စားျပဳ ကိန္းဂဏန္းမ်ား (Code Points) ကို အကန္႔မ်ား (Plane) ျဖင့္ ခြဲျခား သတ္မွတ္ထားရာတြင္ စုစုေပါင္း အကန္႔ ၁၇-ကန္႔ အတြက္ ၁-ကန္႔စီ လ်င္ Code Point ေပါင္း ၆၅,၅၃၆ - ခု ျဖင့္ အတန္း ၂၅၆ - တန္း ႏွင့္ ၂၅၆ ေနရာ စီ သတ္မွတ္ထားရွိသည္။
ေအာက္ပါ ပံုတြင္ ယူနီကုဒ္ နည္းစနစ္၏ ေနရာ ႏွင့္ အကန္႔ ၊ အကြာအေဝး သတ္မွတ္ခ်က္မ်ားကို ေလ့လာၾကည့္ရႈႏိုင္သည္။


Unicode Code Planes

ဤသို႔ ႀကီးမား က်ယ္ျပန္႔လွေသာ ယူနီကုဒ္ ျဖင့္ ဝွက္စာဖြဲ႕ျခင္း နည္းစနစ္ သည္ ကြန္ျပဴတာ ေလာက၏ ကနဦး သမိုင္းဝင္ အကၡရာ ၁၂၈ -လံုး သာပါဝင္ေသာ ASCII Code စနစ္ႀကီး တစ္ခုလံုး အား သူ၏ ပထမ အကန္႔သာျဖစ္ေသာ BMP အတြင္းသို႔ Code Point ရာႏႈန္း အနည္းငယ္သာ အသံုးျပဳ၍ ေအာင္ျမင္စြာ ထည့္သြင္းပစ္ခဲ့ျခင္း ျဖင့္ ယူနီကုဒ္ နည္းစနစ္အား တစ္ကမာၻလံုးရွိ လူမ်ိဳးတိုင္း က်ယ့္ျပန္႔စြာ ပါ၀င္ အသံုးျပဳႏိုင္ေၾကာင္းကို ျပသႏိုင္ခဲ့သည္။ ထို႔အျပင္ ကမာၻေပၚရွိ ဘာသာစကားတိုင္း၏ အကၡရာတိုင္း တို႔အား နည္းစနစ္ တစ္ခုတည္းေအာက္ရွိ တိက်ေသာ ကိုယ္ပိုင္ ေနရာေပးမႈႏွင့္ ကိန္းဂဏန္း တန္ဖိုးသတ္မွတ္မႈ ကိုသာ အသံုးျပဳသျဖင့္ ဘာသာစကား တစ္ခုမွ အျခားတစ္ခုသို႔ လြယ္ကူစြာ ဘာသာျပန္ႏိုင္ျခင္း၊ ယူနီကုဒ္၏ စံသတ္မွတ္ခ်က္မ်ားကို Adobe Systems, Apple, Google, HP, IBM, Microsoft, Sun Microsystems ႏွင့္ Yahoo အစရွိသည့္ ဦးေဆာင္ ေဆာ့ဖ္ဝဲရ္ ထုတ္လုပ္ေသာ ေကာ္ပိုေရးရွင္းႀကီးမ်ား ကိုယ္တိုင္ လက္ခံသံုးစြဲၾကၿပီး မည္သည့္ Platform, မည္သည့္ Program, မည္သည့္ ေဆာ့ဖ္ဝဲရ္ ထုတ္ကုန္ ပစၥည္း၌ မဆို မိမိ တို႔ ကိုယ္ပိုင္ ဘာသာစကားျဖင့္ လြယ္ကူစြာ အသံုးျပဳႏိုင္ျခင္း၊ ယူနီကုဒ္ နည္းစနစ္ကို အသံုးျပဳၿပီး အင္တာနက္ ေဒတာေဘ့စ္မ်ားတြင္ မိမိတို႔ ကိုယ္ပိုင္ ဘာသာစကားျဖင့္ ပညာရပ္ဆိုင္ရာ ဘာသာရပ္ အဘိဓာန္မ်ား တည္ေဆာက္ျခင္း၊ သိလိုေသာ အေၾကာင္း အရာမ်ားအား လြယ္ကူစြာ ရွာေဖြႏိုင္ျခင္း အစရွိေသာ မေရ မတြက္ႏိုင္ေသာ အက်ိဳးေက်းဇူးမ်ားစြာ တို႔ကိုပါ ရရွိေစပါသည္။

သို႔ အတြက္ ယူနီကုဒ္၏ အဓိပၸါယ္ကို ေအာက္ပါ အတိုင္း ျမန္မာဘာသာျဖင့္ သတ္မွတ္ေဖာ္ျပလို၏။

“ယူနီကုဒ္ ဆိုသည္မွာ မည္သည့္ ဘာသာစကား (Language)၊ မည္သည့္ အေျခခံ အေဆာက္အဦး (Platform)၊ မည္သည့္ ညႊန္ၾကားခ်က္ အစုအေဝး (Program) ၌ မဆို အကၡရာ တစ္ခုခ်င္းစီ အလိုက္ ကိန္းဂဏန္း တန္ဖိုးသတ္မွတ္ ေပးႏိုင္ေသာ ဝွက္စာဖြဲ႕ျခင္း နည္းစနစ္ (Character Encoding) ျဖစ္သည္။ ”

ၿပီးခဲ့ေသာ ဧၿပီလ - ၂၀၀၈ ခုႏွစ္တြင္ ထြက္ရွိခဲ့သည့္ ယေန႔ေခတ္၏ ေနာက္ဆံုးေပၚ ယူနီကုဒ္ ၅.၁.၀ တြင္ ကမာၻေပၚရွိ ဘာသာစကားမ်ား၏ အကၡရာ ေပါင္း ၁၀၀,၇၁၃ လံုးပါရွိခဲ့ၿပီး၊ ျမန္မာ၊ ဗီယက္နမ္ တို႔၏ ျဖည့္စြက္ျပင္ဆင္ခ်က္ အကၡရာသစ္မ်ား အပါအဝင္ အျခားေသာ ဘာသာစကား ၁၃-ခု တို၏ အကၡရာအသစ္မ်ား ပါရွိခဲ့သည္။ ၎ မတိုင္မွီ ေနာက္ဆံုး တည္းျဖတ္မူ (Version) ျဖစ္ေသာ ယူနီကုဒ္ ၅.၀.၀ တြင္ အကၡရာစာလံုး သတ္မွတ္ခ်က္ေပါင္း ၉၉,၀၈၉ - လံုး ပါဝင္ခဲ့ၿပီး ယူနီကုဒ္ နည္းစနစ္တစ္ခုလံုး အတြက္ “ႏိုင္ငံတကာ စံျပဳအဖြဲ႕အစည္း” မွ စံသတ္မွတ္ခ်က္ နံပါတ္မွာ ISO/IEC 10646 ျဖစ္သည္။

No Response to "ယူနီကုဒ္ ျမင္းရိုင္းႏွင့္ ဘိုင္နရီ ေခတ္လြန္ ျမန္မာစာ ယဥ္ေက်းမႈ"

Leave A Reply

အေျပာမ်ား

Related Posts with Thumbnails