You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
كما ذكرنا سابقًا، البيانات موجودة في كل مكان. نحن فقط بحاجة إلى التقاطها بالطريقة الصحيحة! من المفيد التمييز بين البيانات **المهيكلة** و**غير المهيكلة**. البيانات المهيكلة عادةً ما تكون ممثلة في شكل منظم جيدًا، غالبًا كجدول أو مجموعة من الجداول، بينما البيانات غير المهيكلة هي مجرد مجموعة من الملفات. أحيانًا يمكننا أيضًا الحديث عن البيانات **شبه المهيكلة**، التي تحتوي على نوع من الهيكل الذي قد يختلف بشكل كبير.
12
+
كما ذكرنا سابقًا، البيانات موجودة في كل مكان. نحن فقط بحاجة إلى التقاطها بالطريقة الصحيحة! من المفيد التمييز بين البيانات **المهيكلة** و**غير المهيكلة**. البيانات المهيكلة عادةً ما تكون ممثلة في شكل منظم جيدًا، غالبًا كجدول أو عدد من الجداول، بينما البيانات غير المهيكلة هي مجرد مجموعة من الملفات. أحيانًا يمكننا أيضًا الحديث عن البيانات **شبه المهيكلة**، التي تحتوي على نوع من الهيكل الذي قد يختلف بشكل كبير.
| قائمة بأسماء الأشخاص وأرقام هواتفهم | صفحات ويكيبيديا مع روابط | نص موسوعة بريتانيكا |
17
-
| درجات الحرارة في جميع غرف المبنى كل دقيقة على مدار العشرين عامًا الماضية | مجموعة من الأوراق العلمية بصيغة JSON تحتوي على المؤلفين، تاريخ النشر، والملخص |مشاركة ملفات تحتوي على مستندات الشركة |
18
-
| بيانات العمر والجنس لجميع الأشخاص الذين يدخلون المبنى | صفحات الإنترنت | فيديو خام من كاميرا مراقبة |
17
+
| درجات الحرارة في جميع غرف المبنى كل دقيقة على مدار العشرين عامًا الماضية | مجموعة من الأوراق العلمية بصيغة JSON تحتوي على المؤلفين، تاريخ النشر، والملخص | ملفات مشاركة تحتوي على مستندات الشركة |
18
+
| بيانات العمر والجنس لجميع الأشخاص الذين يدخلون المبنى | صفحات الإنترنت | فيديو خام من كاميرا مراقبة |
19
19
20
20
## من أين تحصل على البيانات
21
21
22
22
هناك العديد من المصادر الممكنة للبيانات، وسيكون من المستحيل سردها جميعًا! ومع ذلك، دعونا نذكر بعض الأماكن النموذجية التي يمكنك الحصول على البيانات منها:
23
23
24
24
***مهيكلة**
25
25
-**إنترنت الأشياء** (IoT)، بما في ذلك البيانات من مختلف المستشعرات، مثل مستشعرات الحرارة أو الضغط، توفر الكثير من البيانات المفيدة. على سبيل المثال، إذا كان مبنى المكتب مجهزًا بمستشعرات إنترنت الأشياء، يمكننا التحكم تلقائيًا في التدفئة والإضاءة لتقليل التكاليف.
26
-
-**الاستبيانات** التي نطلب من المستخدمين إكمالها بعد عملية شراء أو بعد زيارة موقع إلكتروني.
26
+
-**استطلاعات الرأي** التي نطلب من المستخدمين إكمالها بعد عملية شراء أو بعد زيارة موقع إلكتروني.
27
27
-**تحليل السلوك** يمكن أن يساعدنا، على سبيل المثال، في فهم مدى تعمق المستخدم في الموقع، وما هو السبب النموذجي لمغادرة الموقع.
28
28
***غير مهيكلة**
29
29
-**النصوص** يمكن أن تكون مصدرًا غنيًا للرؤى، مثل الحصول على **درجة الشعور العام** أو استخراج الكلمات الرئيسية والمعاني الدلالية.
30
30
-**الصور** أو **الفيديو**. يمكن استخدام فيديو من كاميرا مراقبة لتقدير حركة المرور على الطريق، وإبلاغ الناس عن الاختناقات المرورية المحتملة.
31
-
-**سجلات خوادم الويب** يمكن استخدامها لفهم الصفحات الأكثر زيارة في موقعنا، ومدة الزيارة.
31
+
-**سجلات خادم الويب** يمكن استخدامها لفهم الصفحات الأكثر زيارة في موقعنا، ومدة الزيارة.
32
32
***شبه مهيكلة**
33
33
-**رسوم الشبكات الاجتماعية** يمكن أن تكون مصادر رائعة للبيانات حول شخصيات المستخدمين وفعالية نشر المعلومات بينهم.
34
34
- عندما يكون لدينا مجموعة من الصور من حفلة، يمكننا محاولة استخراج بيانات **ديناميكيات المجموعة** من خلال بناء رسم بياني للأشخاص الذين يلتقطون الصور مع بعضهم البعض.
@@ -47,27 +47,27 @@ CO_OP_TRANSLATOR_METADATA:
47
47
48
48
دعونا نأخذ مثالًا. لنفترض أن لدينا دورة في علم البيانات (مثل هذه الدورة) نقدمها عبر الإنترنت للطلاب، ونريد استخدام علم البيانات لتحسينها. كيف يمكننا القيام بذلك؟
49
49
50
-
يمكننا البدء بسؤال "ما الذي يمكن رقمنته؟" أبسط طريقة ستكون قياس الوقت الذي يستغرقه كل طالب لإكمال كل وحدة، وقياس المعرفة المكتسبة من خلال تقديم اختبار متعدد الخيارات في نهاية كل وحدة. من خلال حساب متوسط الوقت اللازم للإكمال عبر جميع الطلاب، يمكننا معرفة الوحدات التي تسبب أكبر صعوبة للطلاب والعمل على تبسيطها.
51
-
قد تجادل بأن هذه الطريقة ليست مثالية، لأن الوحدات يمكن أن تكون بأطوال مختلفة. ربما يكون من الأكثر إنصافًا تقسيم الوقت حسب طول الوحدة (بعدد الأحرف)، ومقارنة تلك القيم بدلاً من ذلك.
50
+
يمكننا البدء بسؤال "ما الذي يمكن رقمنته؟" أبسط طريقة ستكون قياس الوقت الذي يستغرقه كل طالب لإكمال كل وحدة، وقياس المعرفة المكتسبة من خلال تقديم اختبار متعدد الخيارات في نهاية كل وحدة. من خلال حساب متوسط الوقت للإكمال عبر جميع الطلاب، يمكننا معرفة الوحدات التي تسبب أكبر صعوبة للطلاب والعمل على تبسيطها.
51
+
قد تجادل بأن هذه الطريقة ليست مثالية، لأن الوحدات يمكن أن تكون بأطوال مختلفة. ربما يكون من الأكثر إنصافًا تقسيم الوقت على طول الوحدة (بعدد الأحرف)، ومقارنة تلك القيم بدلاً من ذلك.
52
52
عندما نبدأ في تحليل نتائج اختبارات الاختيار المتعدد، يمكننا محاولة تحديد المفاهيم التي يجد الطلاب صعوبة في فهمها، واستخدام تلك المعلومات لتحسين المحتوى. لتحقيق ذلك، نحتاج إلى تصميم الاختبارات بطريقة تجعل كل سؤال يرتبط بمفهوم معين أو جزء من المعرفة.
53
53
54
54
إذا أردنا أن نكون أكثر تعقيدًا، يمكننا رسم الوقت المستغرق لكل وحدة دراسية مقابل الفئة العمرية للطلاب. قد نكتشف أن بعض الفئات العمرية تستغرق وقتًا طويلًا بشكل غير مناسب لإكمال الوحدة، أو أن الطلاب ينسحبون قبل إكمالها. يمكن أن يساعدنا هذا في تقديم توصيات عمرية للوحدة وتقليل عدم رضا الناس الناتج عن التوقعات الخاطئة.
55
55
56
56
## 🚀 التحدي
57
57
58
-
في هذا التحدي، سنحاول العثور على المفاهيم ذات الصلة بمجال علم البيانات من خلال النظر في النصوص. سنأخذ مقالة من ويكيبيديا عن علم البيانات، ونقوم بتنزيل النص ومعالجته، ثم نبني سحابة كلمات مثل هذه:
58
+
في هذا التحدي، سنحاول العثور على المفاهيم ذات الصلة بمجال علم البيانات من خلال النظر في النصوص. سنأخذ مقالة من ويكيبيديا عن علم البيانات، ونقوم بتنزيل ومعالجة النص، ثم نبني سحابة كلمات مثل هذه:
59
59
60
-

60
+

61
61
62
-
قم بزيارة [`notebook.ipynb`](../../../../../../../../../1-Introduction/01-defining-data-science/notebook.ipynb':ignore') لقراءة الكود. يمكنك أيضًا تشغيل الكود ومشاهدة كيفية تنفيذ جميع تحويلات البيانات في الوقت الفعلي.
62
+
قم بزيارة [`notebook.ipynb`](../../../../1-Introduction/01-defining-data-science/notebook.ipynb':ignore') لقراءة الكود. يمكنك أيضًا تشغيل الكود ومشاهدة كيفية تنفيذ جميع تحويلات البيانات في الوقت الفعلي.
63
63
64
-
> إذا كنت لا تعرف كيفية تشغيل الكود في Jupyter Notebook، ألقِ نظرة على [هذه المقالة](https://soshnikov.com/education/how-to-execute-notebooks-from-github/).
64
+
> إذا كنت لا تعرف كيفية تشغيل الكود في Jupyter Notebook، يمكنك الاطلاع على [هذه المقالة](https://soshnikov.com/education/how-to-execute-notebooks-from-github/).
65
65
66
66
## [اختبار ما بعد المحاضرة](https://ff-quizzes.netlify.app/en/ds/quiz/1)
67
67
68
-
## الواجبات
68
+
## المهام
69
69
70
-
***المهمة 1**: قم بتعديل الكود أعلاه للعثور على المفاهيم ذات الصلة بمجالي **البيانات الضخمة** و**تعلم الآلة**
70
+
***المهمة 1**: قم بتعديل الكود أعلاه للعثور على المفاهيم ذات الصلة بمجالي **البيانات الضخمة** و**تعلم الآلة**.
71
71
***المهمة 2**: [فكر في سيناريوهات علم البيانات](assignment.md)
0 commit comments