I can’t understand MCF

ကျွန်တော်လည်း ဘိုဘို ကြိုက်ပါတယ်။ ဒါပေမယ့် website of the year ကို http://bobo.6te.net/ ကိုပေးလိုက်တာတော့ လုံးဝ လုံးဝ နားမလည်ဘူး။ MCF က လူတွေ website of the year ကို ဘာအချက်နဲ့ရွေးချယ်လိုက်တာလဲ။ နောက်ပြီး ကျယ်ကျယ်ပြန့်ပြန့်မကြည့်ဘူးလား။ ဒါမှမဟုတ် ဂျာနယ်တွေ ကြော်ငြာတွေပါတဲ့ အထဲကပဲရွေးတာလား။ သူ့ထက်စာရင် myanmardaily.net က ရသင့်တယ်လို့ထင်တယ်။ ဘာကြောင့် ဘိုဘို မရသင့်တာလဲဆိုတော့

Continue reading

စပယ် VS စံပယ်

ဘယ်ဟာမှန်လဲ။

Google Result
စပယ် 1,610
စံပယ် 6,460

တကယ်တန်းမှန်တာကတော့ စပယ် ပါ။ စပယ်ပန်းဆိုမှ မှန်ပါတယ်။ (အဖွားပြောတာပဲ)

Updated: စံပယ် က ၂ မျိုးရှိတယ်။ စံပယ် နေထိုင်တာကိုလည်း သုံးတယ်။ စံပယ်ပန်းကိုလည်း သုံးတယ်။ အရင်ခေတ်ကတော့ စံပယ်ကို စပယ် လို့ပဲသုံးတယ်ထင်တယ်။ ရှိတဲ့ အဖွားအားလုံးက စပယ်ပဲ သုံးတယ်။ စံပယ် မသုံးဘူးဗျ။ ခုခေတ်သုံးကတော့ စံပယ်ပဲ သုံးတော့တယ်နဲ့ တူတယ်။

ဘန်.. ဘန့်.. ဘန်း…

twitter တို့ wordpress , blogspot တို့ ပိတ်တာကိုတော့ ထားလိုက်။ ဘာလို့ ကိုညီလင်းဆက်နဲ့ ထူးတေဇာ site ပါ ပိတ်လိုက်တာလဲ မသိဘူး… နောက်ပြီး http://mashable.com/ ကိုလည်း ဘန်း တယ်ဆိုတော့ စဉ်းစားမရဘူး.. blog ဆိုတာနဲ့ ပိတ်တာလား.. ဒါမှမဟုတ် traffic တွေများလို့ပဲပိတ်တာလား.. ပိတ်စရာ အကြောင်းလည်း မရှိပဲနဲ့ ဘန်းတယ်ဆိုတော့… ???? >.<

Testing Windows Myanmar Translator Ver 1

upload

အရင် version ထက် အများကြီး တိုးတက်ကောင်းမွန်လာပါတယ်။ ဆက်ကြိုးစားဗျာ။ တောှတောှလေးကောင်းလာတယ်။ သာမာန် စာလေးတွေကိုတော့ သိလာပြီ။ ဒါပေမယ့် လက်တွေ့ အသုံးပြုနေတဲ့စာတွေကိုတော့ မပြန်နိုင်သေးဘူး။ ၄ တန်း ကလေး knowledge လောက်ရှိလာပြီဗျ။ ver 1 လို့မခေါှသင့်သေးဘူး။ အခုအချိန်မှ beta လို့ခေါှသင့်တယ်လို့ ထင်တာပဲ။

Myanmar Search

မြန်မာစာတွေ ရှာဖို့အတွက် Search Theory လေး စဉ်းစားကြည့်ရအောင်.. ကျွန်တော်လက်ရှိကတော့ ဇော်ဂျီနဲ့ပဲ စဉ်းစားထားတယ်.. ဘာလို့လည်းဆိုတော့ လက်ရှိ website တွေအားလုံးက ဇော်ဂျီကို အသုံးပြုနေလို့ပါ…

ဇော်ဂျီမှာ ပြသနာရှိတယ်… အဲဒါကတော့ က ိ ု နဲ့ က ု ိ မတူတာပဲ.. သူ့မှာ rendering မပါဘူး.. ဒါကြောင့် ပြသနာဖြစ်နေတာ ( Unicode 5.1 မှာတော့ ဒီပြဿနာတွေ မရှိဘူး…. ) ဒါကြောင့် ဇော်ဂျီမှာ က ိ ု နဲ့ က ု ိ ရှာရင် ရတဲ့ result မတူဘူး… လက်ရှိ google မှာ ရှာရင်တောင် result မတူတာကိုတွေ့ရမယ်ဗျ…. ဒါက ပြဿနာတစ်ရပ်ပေါ့..

နောက်တစ်ခုက ကို နဲ့ ကိုး ဟာ အဓိပ္ပာယ်မတူသလို search result ထဲမှာ ရောမနေသင့်ဘူးထင်တယ်… ကို ကိုရှာရင် ကိုး | ကို့ | ကိုယ် | ကိုက် စတာတွေပါ ပါလာတယ်။ ဒါဟာမဖြစ်သင့်ဘူးထင်တယ်… ကို ရှာရင် ကို နဲ့ ဆိုင်တာပဲထွက်သင့်တယ်… ကိုး | ကိုး | ကိုယ် | ကိုက်တွေ မပါသင့်ဘူး….

နောက်ပြီး spell checking အဆင့်လည်း လိုတယ်… အကျီးအကျယ် | အကြီးအကြယ် | အကျီးအကြယ် | အကြီးအကျယ် မှာ ဘယ်ဟာမှန်သလဲ…. user မှားနေရင် စာလုံးပေါင်းမှားနေကြာင်းဖော်ပြပေးရမယ်…

ပထမအဆင့်က Normalization နဲ့ ဖြေရှင်းမယ်… ဒုတိယအဆင့်က syllable breaking နဲ့ ရှင်းမယ်.. အဲဒီ နှစ်ဆင့်က စဉ်းစားလို့ရပြီ..

နောက်ဆုံး spell checing က စဉ်းစားဆဲပဲ… word breaking အရင်လုပ်ရမယ်.. ပြီးရင် word dictionary နဲ့ တိုက်စစ်ရမယ်…. ကိုစိုးမင်းရေးထားတာကိုတွေ့တယ်.. PHP နဲ့ ကိုယ်တိုင်မရေးရသေးဘူး….

အဲဒီ ၃ ဆင့်ပြီးရင်တော့ ပထမဆုံး search လုပ်ဖို့ query ကို ရပြီ။ ပြီးရင် crawling အဆင့်ပေါ့. crawling မှာ ဝင်း | ဇော်ဂျီ | မြန်မာ ၃ စတာတွေကို detection သိရမယ်။ ဇော်ဂျီနဲ့ ရှာပေမယ့် အဲဒီစာလုံးတွေကိုပါ ရှာပေးနိုင်ရမယ်။

ဥပမာ ဝင်း ကို ဇော်ဂျီပြောင်းပြီး သိမ်းထားမယ်။ မြန်မာ ၃ ကိုလည်း ဇော်ဂျီ ပြောင်းပြီး သိမ်းထားမယ်။ ရှာတော့ ဇော်ဂျီနဲ့ပဲ။ ပြတော့လည်း ဇော်ဂျီနဲ့ပဲ။ ဝင်း ၊ မြန်မာ ၃ အတွက် သိတဲ့ system တစ်ခုကို ရှာကြည့်အုံးမယ်..

အဲ… စဉ်းစားမိတာ တစ်ခုရှိတယ်…

ကိုကိုရေ ဆိုပြီး google မှာ ရှာလိုက်ရင် content ထဲမှာ ကို()ကို()ရေ() ဖြစ်နေတယ်ဆိုရင်ကော။ () က 0widthspace ကို ပြောတာပါ။ google အနေနဲ့ ရှာတွေ့နိုင်မလား…. ???? အဲဒီအချက်ကို သိချင်နေတာ… :D လက်တွေ့ blog လေးတစ်ခုလုပ်ပြီး ရှာကြည့်အုံးမယ်..

စာကြွင်း ။ ။ ကိုစိုးမင်း blog မှာ python မတတ်ပေမယ့် သူ့ theory လေးတွေ တော်တော်ကောင်းတယ်ဗျ။

English Myanmar Translator

wmt

http://www.myanmarnlp.org.mm/

ဘာပဲဖြစ်ဖြစ်ကြိုဆိုပါတယ်ဗျာ။ ဒီအဖွဲ့အစည်းက ဒါတွေလုပ်ဖို့ ထားတာပဲ။ ၃ လ ထဲနဲ့ လုပ်ထားတာဆိုတော့ ဒီလောက်တော့ ရှိမှာပါ။ သူများတွေကတော့ codeproject က ဟာကို ယူပြီး ပြင်တယ်လို့ပြောတာပဲ။ ဟုတ်မဟုတ်တော့ မသိ။ စိတ်လည်း မဝင်စားပါ။ မြန်မြန်ဆန်ဆန်နဲ့ ဒီထက် ပိုကောင်းလာဖို့ မျှော်လင့်နေပါတယ်။ beta အစား alpha version ဆို ပိုမှန်မယ်ထင်တယ်။

ဟန်လင်း social Bookmarks

ဟိုးအရင်တုန်းက digg တို့ StumbleUpon တို့ သုံးဖူးတယ်။ ဒါပေမယ့်လည်း ကျွန်တော်က မကြိုက်တော့ နောက်ပိုင်းမသုံးဖြစ်တော့ဘူး။ အခု မြန်မာလူငယ် ထူးတေဇာ လုပ်ထားတဲ့ ဟန်လင်းကတော့ မြန်မာလုပ်ထားတာကတစ်ကြောင်းလူခြင်းရင်းနှီးတာက တစ်ကြောင်း နောက်ပြီးတော့ လုပ်မယ့်လုပ် အောင်မြင်အောင်လုပ်ဆိုပြီး အားပေးချင်တာက တစ်ကြောင်း ဟန်လင်းကို သုံးဖြစ်တယ်။ အများအားဖြင့် သုံးဖြစ်တာကတော့ google bookmarks ပဲ။ သူကတော့ ရိုးတယ်။ ရှင်းတယ်။ vote တွေဘာတွေ မပါဘူး။ ကိုယ့် တစ်ယောက်တည်းအတွက်ပဲလေ။ ဒါကြောင့် အမြဲသုံးဖြစ်တယ်။ ဟန်လင်းကတော့ vote တွေပါတယ်။တေဇာကတော့ firefox အတွက် addon ရေးပြီးပြီတော့ ပြောတယ်။ ဒါပေမယ့် ကျွန်တော်က စိတ်မရှည်တာနဲ့ ကိုယ်တိုင် bookmarks လေးလုပ်လိုက်တယ်။ Continue reading