Tip:
Highlight text to annotate it
X
ကၽြန္ေတာ္တို႔ အေျခခံ ေဝါဟာရ၊ အသံုးအႏွံဳး ေတြကို စ, ေျပာၾကရေအာင္
ျပႆနာမ်ားကို အမ်ိဳးအစား ခြဲျခားတဲ့ အခါ အသိညာဏ္ အတုမွာ လူေတာ္ေတာ္မ်ားမ်ား သိၾကတဲ့ ေဝါဟာရ၊ အသံုးအႏွံဳး ေတြကိုေပါ့
ပထမဦးဆံုး ေျပာမဲ့ စကားလံုးကေတာ့ အျပည့္အဝ ေလ့လာစူးစမ္းႏိုင္ျခင္း နဲ႔ တပိုင္းတစ ေလ့လာစူးစမ္းႏိုင္ျခင္းပါပဲ
အျပည့္အဝ ေလ့လာစူးစမ္းႏိုင္တဲ့ ပတ္ဝန္းက်င္ ဆိုတာ သင့္ရဲ႕ ေအးဂ်င့္ က အာရံုခံလိုက္တဲ့ အခါတိုင္း
ဘယ္အခ်ိန္မွာမဆို အေကာင္းဆံုး ဆံုးျဖတ္ခ်က္ခ်ႏိုင္ဖို႔အတြက္ ျပည့္စံုလံုေလာက္ေနတယ္ဆိုရင္ အဲဒါ အျပည့္အဝ ေလ့လာစူးစမ္းႏိုင္တဲ့ ပတ္ဝန္းက်င္ ပါပဲ
ကဲ ဥပမာဆိုပါေတာ့ ဖဲခ်ပ္ေတြ၊ ကဒ္ေတြနဲ႔ ကစားတဲ့ ကစားပြဲေတြမွာ
ကဒ္ေတြအကုန္ စားပြဲေပၚမွာ ျမင္ေနရၿပီဆိုရင္ အဲဒီကဒ္ေတြအကုန္လံုးဟာ
အေကာင္းဆံုးေရြးခ်ယ္မႈလုပ္ဖို႔ ေတာ္ေတာ္လံုေလာက္ေနသလိုပါပဲ
ေျပာင္းျပန္အေနနဲ႔ တပိုင္းတစ စူးစမ္းႏိုင္တဲ့ ပတ္ဝန္းက်င္မွာေတာ့
ေအးဂ်င့္ အတြက္ အေကာင္းဆံုး ဆံုးျဖတ္ခ်က္ခ်ႏိုင္ဖို႔ မွတ္ညာဏ္လိုအပ္ပါတယ္
ဥပမာ ပိုကာဝိုင္းတခုမွာ ကဒ္ေတြဟာ စားပြဲေပၚမွာ ေမွာက္လွ်က္ရွိေနေသးတယ္ဆိုရင္
ေရွ႕မွာ ဘာကဒ္ေတြ ရွိခဲ့တာကို မွတ္ထားျခင္းျဖင့္ ပိုေကာင္းတဲ့ ဆံုးျဖတ္ခ်က္ကို ခ်ႏိုင္မွာ ျဖစ္ပါတယ္
ဒါကို ပိုၿပီးရွင္းေအာင္ သေဘာေပါက္ေစဖို႔၊ ေအးဂ်င့္ က
သူရဲ႕ အာရံုခံ (sensor) နဲ႔ တံုျပန္မႈ (actuator) ေတြကို သံုးၿပီး ပတ္ဝန္းက်င္နဲ႔ ဘယ္လို အျပန္အလွန္ ဆက္ဆံသလဲ ဆိုတာ ၾကည့္ၾကရပါမယ္
ဒီအျပန္အလွန္ တံုျပန္ဆက္ဆံမႈဟာ ကြင္းဆက္ အမ်ားႀကီး ျဖစ္ေနတာျဖစ္ၿပီး
အာရံုခံ-တံုျပန္ (perception-action) ကြင္းဆက္လို႔ ေခၚပါမယ္။
ပတ္ဝန္းက်င္အမ်ားစုကို
လြယ္ကူေအာင္ ၎တို႔မွာ တစံုတခုေသာ အတိုင္းအတာအထိ ကိုယ္ပိုင္ အေျခအေန (internal state) ရွိတယ္ လို႔ ယူဆထားပါမယ္။
ဥပမာ အေနနဲ႔ ဖဲဝိုင္းတခုမွာ ဖဲခ်ပ္ေတြဟာ စားပြဲေပၚမွာ မလွန္ထားရေသးဘူးဆိုရင္
ခင္ဗ်ားရဲ႕ လက္ထဲမွာရွိတဲ့ ကဒ္ေတြဟာ အေျခအေနတခု ပါပဲ
အာရံုခံက ပတ္ဝန္းက်င္ တခုရဲ႕အေျခအေနတခုလံုးကို အၿမဲတမ္း ျမင္ႏိုင္တယ္ဆိုရင္
အဲဒါကို အျပည့္အဝ စူးစမ္းႏိုင္တဲ့ ပတ္ဝန္းက်င္လို႔ ေခၚတာပါပဲ
ပတ္ဝန္းက်င္ရဲ႕ တစိတ္တပိုင္းကိုသာ အာရံုခံက ျမင္ရႏိုင္တယ္ ဆိုရင္ေတာ့ တပိုင္းတစ ေလ့လာစူးစမ္းႏိုင္တဲ့ ပတ္ဝန္းက်င္လို႔ ေခၚတာပါပဲ
ပတ္ဝန္းက်င္ရဲ႕ ယခင္က အေျခအေနေတြကို မွတ္ထားႏိုင္ျခင္းက ကၽြန္ေတာ္တို႔ကို အခုခ်က္ခ်င္း အေနနဲ႔ မစူးစမ္းႏိုင္ေသးေပမဲ့
အပိုေဆာင္းနားလည္မႈေတြ ရေစပါတယ္
ဥပမာ အေနနဲ႔ ဘယ္လို ကစားပြဲမွာျဖစ္ျဖစ္ အရင္တုန္းက ခ်ခင္းထားတဲ့ ဖဲခ်ပ္အခ်က္အလက္မ်ားအရ
လူတေယာက္လက္ထဲမွာ ရွိမဲ့ ဖဲခ်က္ေတြကို ခန္႔မွန္းလို႔ ရတာမ်ိဳးကို တပိုင္းတစ စူးစမ္းေလ့လာႏိုင္တဲ့ ကစားပြဲမ်ားလို႔ သတ္မွတ္ၿပီး
မတူညီတဲ့ တြက္ခ်က္တုန္႔ျပန္မႈ လုပ္ဖို႔လိုပါတယ္
အဲဒီလို တပိုင္းတစသာ စူးစမ္းတြက္ခ်က္လို႔ ရႏိုင္တဲ့ ပတ္ဝန္းက်င္နဲ႔ ရင္ဆိုင္ရတဲ့ ေအးဂ်င့္ေတြ အတြက္
ပတ္ဝန္းက်င္ရဲ႕ အေျခအေနေဟာင္းေတြကို မွတ္မိေနေစဖို႔ အတြက္
ကိုယ္ပိုင္ မွတ္ညာဏ္ လိုအပ္ပါတယ္
ဒီအေၾကာင္းေတြကို 'hidden Markov' ပံုစံမ်ားအေၾကာင္း ေျပာတဲ့အခါ
ဒီဖြဲ႔စည္းပံုမ်ားမွာ အဲဒီလို ကိုယ္ပိုင္မွတ္ညာဏ္ေတြ ရွိတဲ့အေၾကာင္း အေသးစိတ္ေျပာဖို႔ ရွိပါတယ္
ဒုတိယေျပာမဲ့ ပတ္ဝန္းက်င္နဲ႔ ပတ္သက္တဲ့ ေဝါဟာရတခုကေတာ့
ပတ္ဝန္းက်င္ဟာ အစီအစဥ္က် ႀကိဳတင္ခန္႔မွန္းႏိုင္(deterministic) သလား၊ ပရမ္းပတာ ျဖစ္ခ်င္ရာျဖစ္ (stochastic) လားဆိုတာပါပဲ
အစီအစဥ္က် ႀကိဳတင္ခန္႔မွန္းႏိုင္တဲ့ ပတ္ဝန္းက်င္ဟာ
ေအးဂ်င့္က ဘယ္လို ျပဳမူရင္ ဘာ ျဖစ္လာႏိုင္မယ္ဆိုတာ သိႏိုင္တဲ့ဟာမ်ိဳးကို ေခၚတာပါ
ဥပမာ စစ္တုရင္ ကစားပြဲ တခုမွာ ခင္ဗ်ားက အကြက္တကြက္ကို ေရႊ႕ၿပီ ဆိုပါစို႔
ေရႊ႕လိုက္တဲ့ အကြက္ရဲ႕ အက်ိဳးသက္ေရာက္မႈဟာ ႀကိဳတင္တြက္ဆ ၿပီးသားျဖစ္ေနပါၿပီ
အရုပ္တခုကို ဘယ္ေနရာကိုပဲ ေရႊ႕လိုက္ ေရႊ႕လိုက္ ေရႊ႕ကြက္ဟာ ႀကိဳတင္တြက္ထားတဲ့ ေနရာကို ပဲ ေရႊ႕သြားတာပါ
အဲဒါကို deterministic လို႔ ေခၚတာပါပဲ
အံစာတံုး ပစ္ၿပီး ကစားရတဲ့ ကစားပြဲ မ်ိဳးကိုေတာ့ ျဖစ္ခ်င္ရာျဖစ္ (stochastic) ကစားပြဲ လို႔ ေခၚပါတယ္
အရုပ္ေတြကို အစီအစဥ္တက် ေရႊ႕လို႔ ရခ်င္ ရပါလိမ့္မယ္
အံစာတံုး ပစ္လို႔ ရလာမဲ့ အပြင့္ေတြကိုေတာ့
ခင္ဗ်ား ႀကိဳတင္ မတြက္ဆ ႏိုင္ပါဘူး
အံစာတံုး အပြင့္ ေတြဟာ က်ပန္း က်ခ်င္ရာ က်မွာျဖစ္တဲ့ အတြက္
ကၽြန္ေတာ္တို႔က stochastic လို႔ ေခၚပါမယ္
အျပတ္ (discrete) နဲ႔ ေတာက္ေလွ်ာက္ အဆက္မျပတ္ ျဖစ္ျခင္း (continuous) အေၾကာင္း ေျပာရေအာင္
အျပတ္ ပတ္ဝန္းက်င္ မွာ ဆိုရင္ ခင္ဗ်ားေရြးခ်ယ္ႏိုင္တဲ့ လုပ္ရပ္ (action) ေတြဟာ အေရအတြက္နဲ႔ အကန္႔အသတ္ရွိပါတယ္
ခင္ဗ်ား အာရံုခံစား တြက္ခ်က္ႏိုင္တာလဲ အကန္႔အသတ္ အေရအတြက္နဲ႔ပါ
ဥပမာ စစ္တုရင္ကိုပဲ ေျပာၾကပါစို႔ ေရႊ႕ႏိုင္တဲ့ ေရႊ႕ကြက္ အေနအထားဟာ အကန္႔အသတ္နဲ႔ ျဖစ္ပါတယ္
တကယ္ေရႊ႕ေတာ့လည္း ေရြးခ်ယ္စရာ အကန္႔အသတ္နဲ႔ ျဖစ္တာကို ေတြ႕ရမွာပါ
အဆက္မျပတ္ ျဖစ္တဲ့ ပတ္ဝန္းက်င္မွာေတာ့ ဒီလိုမဟုတ္ပါဘူး
ခင္ဗ်ား အာရံုခံၿပီး လုပ္ႏိုင္တဲ့ နည္းလမ္းေတြ အရာေတြက အကန္႔အသတ္မရွိေတာ့ပါဘူး
ဥပမာ မွ်ားတစင္းကို ပစ္မယ္ဆိုပါေတာ့ ဘယ္ေထာင့္ကေန ဘယ္ႏွ ဒီဂရီေစာင္း ပစ္မယ္ဆိုတာ အကန္႔အသတ္ မရွိေတာ့ပါဘူး
အဲ ဘယ္ေလာက္ျမန္ျမန္ ပစ္မယ္ဆိုတာပါေရာ ေပါ
ေနာက္ဆံုးအေနနဲ႔ ကိုက္ညီ (benign) တဲ့ ပတ္ဝန္းက်င္နဲ႔ ဆန္႔က်င္ (adversarial) တဲ့ ပတ္ဝန္းက်င္ အေၾကာင္းေျပာရေအာင္
ကိုက္ညီတဲ့ ပတ္ဝန္းက်င္ မွာ ပတ္ဝန္းက်င္က ျဖစ္ခ်င္ရာျဖစ္ေနတာ ျဖစ္မယ္
ေရြးခ်ယ္ႏိုင္စရာ ေတြ အမ်ားႀကီးရွိတာလည္း ျဖစ္ေနမယ္။ ဒါေပမဲ့ အဲဒီပတ္ဝန္းက်င္မွာ ရည္မွန္းခ်က္ ပန္းတိုင္ မရွိပဲ ျဖစ္ေနမယ္
ရည္မွန္းခ်က္ပန္းတိုင္ကို ဆန္႔က်င္ဘက္ျဖစ္ေစမဲ့ ဟာလည္း ရွိေနမယ္
ဥပမာ ရာသီဥတုဟာ ကိုက္ညီတဲ့ ပတ္ဝန္းက်င္ ျဖစ္တယ္
ျဖစ္ခ်င္ရာျဖစ္ေနလိမ့္မယ္၊ ခင္ဗ်ားလုပ္ရမဲ့ ဟာေတြအေပၚမွာ အက်ိဳးသက္ေရာက္မႈ ရွိေနလိမ့္မယ္
ဒါေပမဲ့ ခင္ဗ်ားကို ေအာင္ႏိုင္္ဖို႔ေတာ့ အဲဒီပတ္ဝန္းက်င္က မလုပ္ေနဘူး
ေျပာင္းျပန္အေနနဲ႔ ဆန္႔က်င္ဘက္ ပတ္ဝန္းက်င္ က်ေတာ့ ကစားပြဲအမ်ားစုလို (ဥပမာ စစ္တုရင္လို ဟာမ်ိဳးမွာ)
ျပိဳင္ဘက္က ခင္ဗ်ားကို အႏိုင္ရေအာင္ ႀကိဳးပမ္းေနတာကို ေတြ႕ႏိုင္တယ္
ဆန္႔က်င္ဘက္ ပတ္ဝန္းက်င္မွာဆိုရင္ အေကာင္းဆံုးတံုျပန္မႈကို လုပ္ႏိုင္ဖို႔အတြက္ ရွာရတာ ခက္ခဲေနတတ္တာကို ေတြ႕ရတယ္
ၿပိဳင္ဘက္က ခင္ဗ်ားကို အခ်က္က်က် ေလ့လာေနၿပီး ခင္ဗ်ားရႏိုင္တာေတြကို ပိတ္ဆို႔ ဟန္႔တားဖို႔လုပ္ေနတာကို ေတြ႕ရလိမ့္မယ္
ကိုက္ညီတဲ့ ပတ္ဝန္းက်င္နဲ႔ ျပန္ႏွိဳင္းယွဥ္ၾကည့္ရင္ အဲဒီပတ္ဝန္းက်င္က ဗရမ္းဗတာ ျဖစ္ခ်င္ျဖစ္ေနလိမ့္မယ္
ဒါေပမဲ့ ခင္ဗ်ားကို ဒုကၡေရာက္ေစဖို႔ စိတ္ဝင္တစား လုပ္ေနတာေတာ့ မဟုတ္ဖူး
ကဲ ခု ေျပာခဲ့တဲ့ အခ်က္ေတြ ဘယ္ေလာက္ခင္ဗ်ား နားလည္မလဲ ၾကည့္ရေအာင္
ညာဏ္စမ္းေလး ေျဖၾကည့္ ၾကမယ္
၄ ခု ျပန္ေျပာမယ္၊ အားလံုး ေလ့လာစူးစမ္းႏိုင္တဲ့ ပတ္ဝန္းက်င္နဲ႔ ၊ တဝက္တပ်က္ပဲ ေလ့လာစူးစမ္းႏိုင္တာ
ဗရမ္းဗတာ နဲ႔ ႀကိဳတင္တြက္ဆႏိုင္တာ၊ အျပတ္နဲ႔ စဥ္ဆက္မျပတ္ ပတ္ဝန္းက်င္
ဆန္႔က်င္တာနဲ႔ ကိုက္ညီတာ
က်ားထိုးတာနဲ႔ ပတ္သက္တဲ့ ေမးခြန္းေမးမယ္
မွန္တယ္ ထင္တဲ့ေနရာကို ေရြးၿပီး ေျဖေပးပါ တခုထက္ပိုမွန္ရင္လဲ မွန္တာေတြအားလံုးကို ေရြးေပးေပါ့
က်ားကစားျခင္းဟာ တဝက္တပ်က္ပဲ ေလ့လာစူးစမ္းႏိုင္တာ လို႔ ခင္ဗ်ားထင္ရင္ ဒီဟာကိုေရြးေပး
အဲသလို မဟုတ္ဖူးဆိုရင္ မေရြးပဲ ခ်န္ထားခဲ့ေပါ့
ဗရမ္းဗတာ ပတ္ဝန္းက်င္လား၊ ဒီဟာကို ေရြးေပးပါ
အဆက္မျပတ္လား ဒီဟာကိုေရြး၊ ဆန္႔က်င္တာလား ဒီဟာကို ေရြးလိုက္ေပါ့
က်ားထိုးတဲ့ အေၾကာင္း သိပ္နားမလည္ဘူး ဆိုရင္ အင္တာနက္မွာ ရွာၾကည့္လို႔ရတယ္
က်ားထိုး ကစားနည္း အေၾကာင္း နဲနဲပါးပါး ရွင္းျပထားတာေတြ ရွိတယ္။