Data Deduplication
Data Deduplication
Data Deduplication အကြောင်းမသွားခင်မှာ သူ့ရဲ့ Nature နဲ့ use case လေး ပြောပါရစေ။
ကျနော်တို့ စာဖတ်မယ်ဆိုပြီး Internet ကနေ ဖိုင်တဖိုင်ကို ဒေါင်းလုတ် လုပ်လိုက်တယ်။ ဒါပေမယ့် တကယ်တမ်းကျ ကျနော်တို့ မဖတ်အားသေးလို့ မဖတ်ဖြစ်သေးဘူး။ တပတ်၊ ၂ ပတ် ကြာသွားတယ်။ မေ့သွားတယ်။ နောက်တူညီတဲ့ဖိုင်တဖိုင်ကိုပဲ ထပ်ပီး ဒေါင်းလုတ်ဆွဲတယ်။ ဖိုင်က ၂ ဖိုင်ဖြစ်သွားတယ်။ ဒီတော့ ဖိုင်တဖိုင်ကို 1MB ပဲ ထားပါစို့။ ဖိုင်က ၂ ဖိုင်ဆိုတော့ 2MB ဖြစ်သွားပီ။ ဒီတော့ Capacity အနေနဲ့ကြည့်ရရင် မသက်သာဘူး။ ဒီတော့ Capacity ကိုချွေတာရတယ်။ Capacity ချွေတာတယ်ဆိုတာ Money ချွေတာတာပဲ။ နောက်ပီး အဲဒီဖိုင်တွေကို တနေရာနဲ့တနေရာ နက်ဝက်ပေါ်ကနေ ကူးကြပီ ဆိုပါစို့။ ဖိုင်ဆိုဒ်ကြီးရင် နက်ဝက် Bandwidth စားတယ်။ Storage မှာ Capacity က Money ဆိုရင် Network မှာ Bandwidth က Money ပဲ။ ဒီတော့ အကြမ်းဖျင်းအားဖြင့် Deduplication ဆိုတာ Capacity and Bandwidth သက်သာတယ်လို့သာ မှတ်ထားလိုက်ပါ။ နောက်တခုက.. Data Deduplication ကို သွားမယ်ဆိုရင် အရင်ဆုံး အကြမ်းဖျင်းအားဖြင့် Target-Based deduplication(Storage Appliance) and source deduplication(Backup server) ဆိုပီး ၂ မျိုး ၂ စား ခွဲခြားနိုင်ပါတယ်။
Source-based deduplication(Backup Server) : မှာဆိုရင် သူရဲ့အလုပ်လုပ်ပုံကရှင်းပါတယ်။ Data တွေကို Data Store(Storage Appliance) ဆီကို မပို့ခင်မှာ Client/ Server ဆိုဒ်မှာပဲ Deduplicate လုပ်ပါတယ်။ အဲတော့ Bandwidth သက်သာသလို Storage capacity ကိုလည်း ချွေတာရာ ရောက်ပါတယ်။
Target-Based deduplication (Storage Appliance): သူ့ရဲ့အလုပ်လုပ်ပုံကလည်းရှင်းပါတယ်။ Data တွေကို Storage Appliance ဆီရောက်ပီးတော့မှပဲ Optimize and Deduplicate လုပ်ပါတယ်။ အဲတော့ Bandwidth အနေနဲ့ကတော့ သိပ်မသက်သာဘူးပေါ့။ ဒါပေမယ့်လည်း
Backup server က storage နဲ့ချိတ်တဲ့ Connectivity မှာလည်း စကားပြောပါတယ်။ တချို့ကျ network နဲ့သွားသလို တချို့ကျ Fibre နဲ့သွားကြပါတယ်။ တကယ်တမ်းကျ Deduplication မှာ Process တွေက အများကြီးပါဘဲ။ Target based အောက်မှာဆိုရင် Post-Process deduplication, In-Line Deduplication စသဖြင့်ပေါ့။ Target-based deduplication သုံးမယ်ဆိုရင် In-Line Deduplication ကို Enable လုပ်ကြပါတယ်။ ဘာလို့လည်းဆိုတော့ In-Line Deduplication ကို Enable လုပ်ထားတယ်ဆိုရင် ပုံမှန်ထက်ပိုပြီး Bandwidth သက်သာစေပါတယ်။ အောက်ကပုံလေးတွေကို ထောက်ကြည့်ရင် ပိုရှင်းသွားပါလိမ့်မယ်။ Thanks you all.
Data Deduplication အကြောင်းမသွားခင်မှာ သူ့ရဲ့ Nature နဲ့ use case လေး ပြောပါရစေ။
ကျနော်တို့ စာဖတ်မယ်ဆိုပြီး Internet ကနေ ဖိုင်တဖိုင်ကို ဒေါင်းလုတ် လုပ်လိုက်တယ်။ ဒါပေမယ့် တကယ်တမ်းကျ ကျနော်တို့ မဖတ်အားသေးလို့ မဖတ်ဖြစ်သေးဘူး။ တပတ်၊ ၂ ပတ် ကြာသွားတယ်။ မေ့သွားတယ်။ နောက်တူညီတဲ့ဖိုင်တဖိုင်ကိုပဲ ထပ်ပီး ဒေါင်းလုတ်ဆွဲတယ်။ ဖိုင်က ၂ ဖိုင်ဖြစ်သွားတယ်။ ဒီတော့ ဖိုင်တဖိုင်ကို 1MB ပဲ ထားပါစို့။ ဖိုင်က ၂ ဖိုင်ဆိုတော့ 2MB ဖြစ်သွားပီ။ ဒီတော့ Capacity အနေနဲ့ကြည့်ရရင် မသက်သာဘူး။ ဒီတော့ Capacity ကိုချွေတာရတယ်။ Capacity ချွေတာတယ်ဆိုတာ Money ချွေတာတာပဲ။ နောက်ပီး အဲဒီဖိုင်တွေကို တနေရာနဲ့တနေရာ နက်ဝက်ပေါ်ကနေ ကူးကြပီ ဆိုပါစို့။ ဖိုင်ဆိုဒ်ကြီးရင် နက်ဝက် Bandwidth စားတယ်။ Storage မှာ Capacity က Money ဆိုရင် Network မှာ Bandwidth က Money ပဲ။ ဒီတော့ အကြမ်းဖျင်းအားဖြင့် Deduplication ဆိုတာ Capacity and Bandwidth သက်သာတယ်လို့သာ မှတ်ထားလိုက်ပါ။ နောက်တခုက.. Data Deduplication ကို သွားမယ်ဆိုရင် အရင်ဆုံး အကြမ်းဖျင်းအားဖြင့် Target-Based deduplication(Storage Appliance) and source deduplication(Backup server) ဆိုပီး ၂ မျိုး ၂ စား ခွဲခြားနိုင်ပါတယ်။
Source-based deduplication(Backup Server) : မှာဆိုရင် သူရဲ့အလုပ်လုပ်ပုံကရှင်းပါတယ်။ Data တွေကို Data Store(Storage Appliance) ဆီကို မပို့ခင်မှာ Client/ Server ဆိုဒ်မှာပဲ Deduplicate လုပ်ပါတယ်။ အဲတော့ Bandwidth သက်သာသလို Storage capacity ကိုလည်း ချွေတာရာ ရောက်ပါတယ်။
Target-Based deduplication (Storage Appliance): သူ့ရဲ့အလုပ်လုပ်ပုံကလည်းရှင်းပါတယ်။ Data တွေကို Storage Appliance ဆီရောက်ပီးတော့မှပဲ Optimize and Deduplicate လုပ်ပါတယ်။ အဲတော့ Bandwidth အနေနဲ့ကတော့ သိပ်မသက်သာဘူးပေါ့။ ဒါပေမယ့်လည်း
Backup server က storage နဲ့ချိတ်တဲ့ Connectivity မှာလည်း စကားပြောပါတယ်။ တချို့ကျ network နဲ့သွားသလို တချို့ကျ Fibre နဲ့သွားကြပါတယ်။ တကယ်တမ်းကျ Deduplication မှာ Process တွေက အများကြီးပါဘဲ။ Target based အောက်မှာဆိုရင် Post-Process deduplication, In-Line Deduplication စသဖြင့်ပေါ့။ Target-based deduplication သုံးမယ်ဆိုရင် In-Line Deduplication ကို Enable လုပ်ကြပါတယ်။ ဘာလို့လည်းဆိုတော့ In-Line Deduplication ကို Enable လုပ်ထားတယ်ဆိုရင် ပုံမှန်ထက်ပိုပြီး Bandwidth သက်သာစေပါတယ်။ အောက်ကပုံလေးတွေကို ထောက်ကြည့်ရင် ပိုရှင်းသွားပါလိမ့်မယ်။ Thanks you all.
Comments
Post a Comment