موديل تدريبي للتنبؤ
يركز هذا المحتوى التقني على توضيح مفهوم البيانات بشتى أنواعها وأهميتها والتعامل معها بلغة R، كما يهدف أيضًا إلى تمثيل البيانات في رسوم بيانية التي تعطي نظرة شاملة وتسهّل عملية التنبؤ بالقيم المستقبلية.
الوصف
التعريف بالبيانات وأهميتها في العصر الحالي
R طرق استكشاف البيانات بلغة
طرق تمثيل البيانات في رسوم بيانية باستخدام R لغة
الأهداف
ماهي البيانات؟
هي مجموعة الحقائق والقياسات والمشاهدات التي تكون على شكل أرقام وحروف ورموز وأشكال خاصّة، تختصّ بفكرة وموضوع معيّن، والبيانات لا يكون لها معنى، ولهذا يتم تجميعها حتى يتم استخدامها.
المحتوى
هناك نوعان أساسيان من المتغيرات المستخدمة في البيانات:
المتغيرات النوعية هي المتغيرات التي تكون قيمها غير قابلة للعد أو الحساب وإنما هي خصائص أو تصنيفات، مثل: جنس الشخص واللغة وما إلى ذلك. ويمكن أن للمتغيرات النوعية قيم رقمية (مثال: 1 للإناث و 0 للذكور) لأن هذه الأرقام ليس لها معنى رياضي.
المتغيرات الكمية هي البيانات التي يمكن قياسها أو عدها وتكون بصورة رقمية ذات معنى رياضي وتنقسم أيضا إلى نوعين:
1- بيانات منفصلة: بيانات رقمية تحتوي على عدد محدود من القيم المحتملة. مثال: عدد العاملين في المكتب.
2- بيانات متصلة: هذا النوع من البيانات نحصل عليها من القياسات وبالتالي لا يمكن حساب قيمها ولكن يمكن قياسها. مثال على ذلك هو ارتفاع الشخص، والذي يمكنك وصفه باستخدام الفواصل العشرية.
البيانات وبرنامج R
مصادر البيانات
Google Datasets search
مرحلة استكشاف البيانات
ويمكنك أيضا استعمال الكود المرفق للتحقق من وجود Missing value في البيانات