Skip to content

Commit a768b2e

Browse files
authored
fix 2.mdx
1 parent d1324df commit a768b2e

File tree

1 file changed

+2
-1
lines changed
  • chapters/my/chapter5

1 file changed

+2
-1
lines changed

chapters/my/chapter5/2.mdx

Lines changed: 2 additions & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -141,6 +141,7 @@ squad_it_dataset = load_dataset("json", data_files=data_files, field="data")
141141

142142
သင်က ကုမ္ပဏီတစ်ခုမှာ data scientist ဒါမှမဟုတ် coder အဖြစ် အလုပ်လုပ်နေတယ်ဆိုရင်၊ သင် analyze လုပ်ချင်တဲ့ datasets တွေဟာ remote server တစ်ခုမှာ သိမ်းဆည်းထားနိုင်ခြေ များပါတယ်။ ကံကောင်းစွာနဲ့ပဲ၊ remote files တွေကို load လုပ်တာက local files တွေကို load လုပ်တာလောက် ရိုးရှင်းပါတယ်။ local files တွေရဲ့ path ကို ပေးမယ့်အစား၊ `load_dataset()` function ရဲ့ `data_files` argument ကို remote files တွေ သိမ်းဆည်းထားတဲ့ URL တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုတဲ့ URL တွေဆီ ညွှန်ပြပါတယ်။ ဥပမာ၊ GitHub မှာ host လုပ်ထားတဲ့ SQuAD-it dataset အတွက်၊ ကျွန်တော်တို့ `data_files` ကို _SQuAD_it-*.json.gz_ URLs တွေဆီ အောက်ပါအတိုင်း ညွှန်ပြနိုင်ပါတယ်။
143143

144+
```py
144145
url = "https://github.com/crux82/squad-it/raw/master/"
145146
data_files = {
146147
"train": url + "SQuAD_it-train.json.gz",
@@ -189,4 +190,4 @@ squad_it_dataset = load_dataset("json", data_files=data_files, field="data")
189190
* **Glob Files**: Unix shell တွင် wildcard (ဥပမာ- `*`, `?`) များကို အသုံးပြု၍ pattern တစ်ခုနှင့် ကိုက်ညီသော ဖိုင်များကို ရှာဖွေခြင်း။
190191
* **URL (Uniform Resource Locator)**: web ပေါ်ရှိ အရင်းအမြစ်တစ်ခု (ဥပမာ- web page, file) ၏ လိပ်စာ။
191192
* **Data-wrangling Techniques**: ကုန်ကြမ်းဒေတာ (raw data) များကို ပိုမိုအသုံးဝင်ပြီး သန့်ရှင်းသော ပုံစံသို့ ပြောင်းလဲရန်အတွက် လုပ်ဆောင်သော လုပ်ငန်းစဉ်များ။
192-
* **UCI Machine Learning Repository**: Machine learning datasets များစွာကို စုစည်းထားသော repository တစ်ခု။
193+
* **UCI Machine Learning Repository**: Machine learning datasets များစွာကို စုစည်းထားသော repository တစ်ခု။

0 commit comments

Comments
 (0)