Semalt: Python ဖြင့်ဝဘ်ရေးခြင်း

Wi-Fi မရှိတဲ့အချိန်တွေမှာကြုံဖူးလား။ သို့ဆိုလျှင်သင်၏ကွန်ပျူတာပေါ်တွင်သင်၏ကွန်ပျူတာပေါ်တွင်မည်မျှလုပ်ဆောင်သည်ကိုဘယ်လောက်အထိမှီခိုအားထားနေသည်ကိုသင်သဘောပေါက်ပြီ။ အလေ့အကျင့်မရှိသောကြောင့်သင်သည်သင်၏အီးမေးလ်များကိုစစ်ဆေးခြင်း၊ သင်၏သူငယ်ချင်း Instagram ၏ဓါတ်ပုံများကိုကြည့်ခြင်းနှင့်သူတို့၏တွစ်တာများကိုဖတ်ရှုခြင်းများကိုတွေ့ရလိမ့်မည်။

ကွန်ပြူတာအလုပ်များတွင် ၀ က်ဘ်လုပ်ငန်းစဉ်များပါ ၀ င်သောကြောင့်သင်၏ပရိုဂရမ်များသည်လည်းအွန်လိုင်းသို့ ၀ င်ရောက်နိုင်ပါကအလွန်အဆင်ပြေလိမ့်မည်။ ဤသည်ကို web ခြစ် များအတွက်အမှုဖြစ်ပါတယ်။ ၀ က်ဘ်မှအကြောင်းအရာများကိုကူးယူရန်နှင့်လုပ်ငန်းစဉ်အတွက်ပရိုဂရမ်တစ်ခုကိုအသုံးပြုခြင်းပါဝင်သည်။ ဥပမာအားဖြင့်၊ ဂူးဂဲလ်သည်သူတို့ရှာဖွေရေးအင်ဂျင်အတွက်ဝက်ဘ်စာမျက်နှာများကိုအညွှန်းပြုရန်ခြစ်ရာပရိုဂရမ်အမျိုးမျိုးကိုအသုံးပြုသည်။

အင်တာနက်မှ ဒေတာများကို သင် ခြစ် နိုင်သည့်နည်းလမ်းများစွာရှိသည်။ ဤနည်းလမ်းတော်တော်များများသည် Python နှင့် R. ကဲ့သို့သောပရိုဂရမ်မျိုးစုံပြောရန်လိုအပ်သည်။ ဥပမာ Python တွင်သင်သည် Requests, Beautiful soup, Webbrowser နှင့် Selenium ကဲ့သို့သော module များစွာကိုသုံးနိုင်သည်။

'Requests' module သည်ကွန်နက်ရှင်ပြproblemsနာများ၊ ကွန်ယက်အမှားအယွင်းများနှင့်ဒေတာချုံ့ခြင်းစသည့်ခက်ခဲသောပြissuesနာများနှင့် ပတ်သက်၍ သင်ကိုယ်တိုင်စိတ်မပူစေဘဲဖိုင်များကိုအလွယ်တကူ download လုပ်နိုင်ရန်ခွင့်ပြုသည်။ ၎င်းသည် Python နှင့်မလုံလောက်ပါ၊ ထို့ကြောင့်၎င်းကိုသင်ပထမ ဦး စွာထည့်သွင်းရပါမည်။

Python ၏ 'urllib2' module တွင်အခက်အခဲများစွာရှိပြီးအသုံးပြုရန်ခက်ခဲသောကြောင့် module ကိုတီထွင်ခဲ့သည်။ ဒါဟာတကယ် install လုပ်ဖို့အတော်လေးလွယ်ကူသည်။ သင်လုပ်ရန်မှာ command line မှ pip install တောင်းဆိုမှုများကိုသာ run ရန်ဖြစ်သည်။ ထို့နောက်သင် module တစ်ခုမှန်ကန်စွာတပ်ဆင်ပြီးကြောင်းသေချာစေရန်ရိုးရှင်းသောစမ်းသပ်မှုတစ်ခုပြုလုပ်ရန်လိုအပ်သည်။ ထိုသို့လုပ်ရန်သင်သည်အပြန်အလှန်အကျိုးသက်ရောက်သော shell သို့ '>>> import requests' ကိုရိုက်နိုင်သည်။ အမှားမက်ဆေ့ခ်ျများမပေါ်လာပါကထည့်သွင်းမှုအောင်မြင်သည်။

စာမျက်နှာတစ်ခုကို download လုပ်ရန် 'requests.get ()' function ကိုစတင်ရန်လိုအပ်သည်။ ဒီ function က URL တစ်ခုရဲ့ string ကိုယူပြီး 'response' object ကိုပြန်ပေးတယ်။ သင့်တောင်းခံမှုအတွက်ဝက်ဘ်ဆာဗာပြန်လာသည့်တုံ့ပြန်မှုတွင်ဤတွင်ပါဝင်သည်။ သင်၏တောင်းဆိုမှုအောင်မြင်ပါက downloaded web page သည် text variable တွင် response object တစ်ခုအဖြစ်သိမ်းဆည်းပါလိမ့်မည်။

response object မှာများသောအားဖြင့်သင့်ရဲ့ download ဆွဲပြီးအောင်မြင်ခြင်းရှိမရှိရှာဖွေရန်အသုံးပြုသော status code attribute တစ်ခုရှိသည်။ ထိုနည်းတူစွာသင်သည် 'object_for_status ()' method ကို response object ပေါ်တွင်ခေါ်နိုင်သည်။ ဖိုင်ကို download လုပ်သည့်အမှားအယွင်းများရှိခဲ့ပါက၎င်းသည်ချွင်းချက်ဖြစ်စေသည်။ ၎င်းသည်မကောင်းသော download ပြုလုပ်သည့်အခါရပ်တန့်သွားစေရန်သေချာသည့်နည်းလမ်းဖြစ်သည်။

ဤနေရာမှ စ၍ သင် download လုပ်ထားသော web file ကိုသင်၏ hard drive တွင် 'open ()' နှင့် 'write ()' ကို သုံး၍ သိမ်းဆည်းနိုင်သည်။ သို့သော်စာသား၏ Unicode encoding ကိုထိန်းသိမ်းရန်အတွက်သင်သည် data data များကို binary data ဖြင့်အစားထိုးရန်လိုအပ်သည်။

အချက်အလက်များကိုဖိုင်တစ်ခုသို့ရေးရန် 'iter_content ()' နည်းလမ်းဖြင့် 'for' ကွင်းဆက်ကိုသင်အသုံးပြုနိုင်သည်။ ဤနည်းလမ်းသည်ကွင်းဆက်မှတဆင့်ကြားဖြတ်တစ်ခုစီတွင်အချက်အလက်အမြောက်အများကိုပြန်ပို့ပေးသည်။ အမြောက်အမြားတစ်ခုစီသည် bytes ဖြင့်ဖြစ်ပြီး၊ အရေအတွက်တစ်ခုချင်းစီတွင် bytes မည်မျှပါဝင်မည်ကိုသင်သတ်မှတ်ရမည်ဖြစ်သည်။ သင်ရေးသားပြီးသည်နှင့်ဖိုင်ကိုပိတ်ရန် 'close ()' ကိုခေါ်ပါ၊ သင်၏အလုပ်သည်ပြီးဆုံးသွားပြီ။

mass gmail