Zawgyi syllable breaking

အခုတလော breaking တွေလုပ်ရတာ မူးနောက်နေတာပဲ။ ကိုစိုးမင်းကိုတော့ တော်တော်လေး လေးစားတယ်။ သူလုပ်ထားတာ တော်တော်လေးမြန်တယ်။ နောက်ပြီး မှန်လည်းမှန်တယ်။ ခက်တာက PHP နဲ့တွဲသုံးလို့မရတာပဲ။ နောက်ပြီးတော့ PHP library ကလည်း ကိုယ်ပိုင် server မှ အဆင်ပြေမှာဆိုတော့ ကိုယ့်ဘာသာကိုယ် PHP နဲ့ရေးလိုက်တာ။ normalize က လွယ်တယ်။ syllable breaking က ထင်တာထက် ပိုခက်တယ်။ ဘုန်းကြီးဝတ်နေတုန်းက လက်နဲ့ အကြမ်းချရေးခဲ့ပြီးပေမယ့် လက်တွေ့မှာတော့ ထင်သလိုမရဘူး။ အများကြီးပြန်ပြင်ရတယ်။ ရတဲ့ပုံစံနဲ့ ရေးရတယ်။ အခုတော့ pattern ပေါင်း ၇၅ ခုရှိနေပြီ။ အခုက အကြမ်းအဆင့်ပဲရှိသေးတယ်။ အချောသတ်ရအုံးမယ်။ အဲဒီ breaking လေးရရင် ornagai မှာ မြန်မာစာ search အတွက် တော်တော်အဆင်ပြေပြီ။ ကျွန်တော် အခု စဉ်းစားနေတာ 0 width space သုံးမလို့။ အဲဒါက size တော့ ပိုများသွားမယ်။ ဒါပေမယ့် searching ပိုင်း သိသိသာသာ တိုးလာမယ်။ ပိုလည်း မြန်ပြီး တိကျလာလိမ့်မယ်။ ဥပမာ တံ ဆိုတဲ့ စာလုံးကို ရှာရင် တံ လည်းထွက်မယ်။ တုံ လည်းထွက်မယ်။ တုံး လည်းထွက်လာမှာပဲ။ တနည်းပြောရင် တံ = တုံ = တုံး ဆိုတာက ရလဒ် တစ်ခုတည်းမှာ ထွက်နေပြီ။ 0 width space တွေသာ ထည့်လိုက်မယ်ဆိုရင် တံ ဆိုတဲ့ result ကိုပဲ ပြတော့မယ်။ ဒါကြောင့် query က ပိုမြန်လာနိုင်မယ်။ database size က ပိုကြီးသွားမယ်။ စာလုံးတိုင်းမှာ 0 width space ပါလာတာကြောင့်ပါ။ result တွေကတော့ ထိရောက်ပြီး ကျုံသွားမှာတော့ သေချာတယ်။ အခုတော့ တော်တော်လေး ပြီးနေပြီ။ စစ်ဆေးဆဲပဲ။ ပြီးရင် အဲဒီ Normalization နဲ့ syllable breaking ကို open technology ချမယ်။ ဘာဖြစ်လို့လည်းဆိုတော့ အခြား searching တွေအတွက်ပါ အသုံးပြုနိုင်အောင်။ နောက်ပြီးရင် wordpress အတွက် plugin လုပ်မယ်။ ဒါဆိုရင် ကိုယ့် site မှာ က ိ ု နဲ့ပဲ ရှာရှာ က ု ိ နဲ့ပဲရှာရှာ ရလဒ်က တူသွားမယ်။ နောက်ပြီး မြန်မာစာအတွက် တိကျတဲ့ result တွေရလာလိမ့်မယ်။

2 thoughts on “Zawgyi syllable breaking

Leave a Reply

Your email address will not be published. Required fields are marked *

*

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>