Zawgyi Nor & SyB

Zawgyi Normalization နဲ့ syllable breaking ကို ဒီနေ့တော့ RC version လေးပြီးသွားတယ်။ အံဩဖွယ်ရာကောင်းတာက ကျွန်တော် အများကြီးရေးထားတဲ့ pattern တွေကို ၁၀ ကြောင်းတည်းနဲ့ ရေးလို့ရသွားတာပဲ။ ကိုယ့်အချိန်တွေတောင် ကိုယ်နှမြောတယ်။ အတွေ့အကြုံဆိုတာက လက်တွေ့ကနေ ရယူရတာပဲ။ အတွေ့အကြုံရှိမှပဲ လုပ်ရ ကိုက်ရတာ မြန်မှာ။ အခု စုစုပေါင်း pattern 51 ခုနဲ့ ပြီးသွားတယ်။ အမှန်တိုင်းဆိုရင်

ပိသာ = ပိဿာ
ပြသနာ = ပြဿနာ
ေ၇=ရေ
၇ာ=ရာ
၇ွ=ရွ

စတာတွေ ထပ်ဖြည့်ထားတာကြောင့်လည်း ပါတယ်။ အမှန်တိုင်းဆို normalization က တော်တော်အရေးပါတယ်။ အစက ကိုညီလင်းဆက် ပြောတုန်းက အမှုမဲ့အမှတ်မဲ့ပဲလေ။ syllable breaking အကြောင်း ကိုရဲမြတ်သူပြောတုန်းက ဘယ်နေရာမှာသုံးမလဲ သေချာမပြောတတ်ဘူး။ နောက်တော့ ornagai ကိုလုပ်မှပဲ normalization , syllable breaking တွေ အရေးပါတာကို သိတော့တယ်။ ကိုရဲမြတ်သူနဲ့ ကိုညီလင်းဆက် ပြောဘူးတာတွေက တော်တော်လေးကို အထောက်အကူဖြစ်သွားတယ်။ ကိုညီလင်းဆက်ရဲ့ data တွေက အထောက်အကူပေးတယ်။ ယခုလက်ရှိ ရေးထားတာကတော့ ကိုစိုးမင်း python နဲ့ရေးထားတာလောက် မြန်မှာတော့ မဟုတ်လောက်ဘူး။ သူ့မြန်နှုန်းက ကြောက်စရာကြီး :D ။ 60 MB/s ဆိုလား မသိဘူး။ online မှာကတော့ loading ကြောင့်လား connection ကြောင့်လားတော့ မသိဘူး နည်းနည်းနှေးတယ်။ အခု RC version မှာ ပြဿနာမရှိရင် opensource နဲ့ opentech ချတော့မှာ ဖြစ်လို့ ဝိုင်းစစ်ပေးစေချင်ပါတယ် :) Syllable Breaking ကို http://myanmarwords.pikay.org/ ကနေ စစ်ဆေးခဲ့ပါတယ်။ :)

Leave a Reply

Your email address will not be published. Required fields are marked *

*

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>