الإحصاءات: التعريف، الأنواع، والأهمية
١١ دقيقة

الإحصاءات: التعريف، الأنواع، والأهمية

(الإحصاءات : statistics)

ما هي الإحصائيات؟

الإحصاء هو فرع من الرياضيات التطبيقية الذي يتضمن جمع ووصف وتحليل واستنتاج الاستنتاجات من البيانات الكمية. تعتمد النظريات الرياضية وراء الإحصاء بشكل كبير على حساب التفاضل والتكامل، والجبر الخطي، ونظرية الاحتمالات.

يُطلق على الأشخاص الذين يقومون بالإحصائيات اسم الإحصائيين. يهتمون بشكل خاص بتحديد كيفية استخلاص استنتاجات موثوقة حول مجموعات كبيرة وأحداث عامة من خلال سلوك وخصائص أخرى يمكن ملاحظتها في عينات صغيرة. تمثل هذه العينات الصغيرة جزءًا من المجموعة الكبيرة أو عددًا محدودًا من حالات ظاهرة عامة.

النقاط الرئيسية

  • الإحصائيات هي دراسة ومعالجة البيانات، بما في ذلك طرق جمعها ومراجعتها وتحليلها واستخلاص الاستنتاجات منها.
  • المجالان الرئيسيان في الإحصاء هما الإحصاء الوصفي والإحصاء الاستدلالي.
  • يمكن توصيل الإحصائيات بمستويات مختلفة تتراوح من الوصف غير الرقمي (المستوى الاسمي) إلى الرقمي بالإشارة إلى نقطة الصفر (المستوى النسبي).
  • يمكن استخدام العديد من تقنيات أخذ العينات لجمع البيانات الإحصائية، بما في ذلك العينة العشوائية البسيطة، العينة النظامية، العينة الطبقية، أو العينة العنقودية.
  • الإحصائيات موجودة في كل قسم من أقسام كل شركة وهي جزء لا يتجزأ من الاستثمار.

فهم الإحصاءات

تُستخدم الإحصائيات في جميع التخصصات العلمية تقريبًا، مثل العلوم الفيزيائية والاجتماعية وكذلك في الأعمال التجارية والطب والعلوم الإنسانية والحكومة والتصنيع. تُعتبر الإحصائيات في الأساس فرعًا من الرياضيات التطبيقية التي تطورت من تطبيق الأدوات الرياضية، بما في ذلك حساب التفاضل والتكامل والجبر الخطي، على نظرية الاحتمالات.

في الممارسة العملية، الإحصائيات هي الفكرة التي يمكننا من خلالها التعرف على خصائص مجموعات كبيرة من الأشياء أو الأحداث (السكان) من خلال دراسة خصائص عدد أصغر من الأشياء أو الأحداث المشابهة (عينة). جمع بيانات شاملة عن كامل السكان يكون مكلفًا جدًا أو صعبًا أو مستحيلًا في العديد من الحالات، لذا تبدأ الإحصائيات بعينة يمكن ملاحظتها بسهولة أو بتكلفة معقولة.

يقوم الإحصائيون بقياس وجمع البيانات حول الأفراد أو العناصر في عينة معينة وتحليل هذه البيانات لتوليد إحصاءات وصفية. يمكنهم بعد ذلك استخدام هذه الخصائص الملاحظة للبيانات العينية، والتي تُعرف بشكل صحيح باسم "الإحصائيات"، لاستنتاج أو تقديم تخمينات مستنيرة حول الخصائص غير المقاسة للسكان الأوسع، والمعروفة باسم المعلمات.

الإحصاءات الوصفية والاستدلالية

المجالان الرئيسيان في الإحصاء هما الإحصاء الوصفي، الذي يصف خصائص بيانات العينة والسكان، والإحصاء الاستدلالي، الذي يستخدم تلك الخصائص لاختبار الفرضيات واستخلاص الاستنتاجات. تشمل الإحصاءات الوصفية المتوسط (المعدل)، التباين، الالتواء، والتفلطح. تشمل الإحصاءات الاستدلالية تحليل الانحدار الخطي، تحليل التباين (ANOVA)، نماذج اللوغيت/بروبيت، واختبار الفرضية الصفرية.

الإحصائيات الوصفية

تركز الإحصائيات الوصفية بشكل أساسي على النزعة المركزية، والتباين، وتوزيع بيانات العينة. تعني النزعة المركزية تقدير الخصائص، وهو عنصر نموذجي لعينة أو مجتمع. وتشمل الإحصائيات الوصفية مثل المتوسط، الوسيط، والمنوال.

تشير التباين إلى مجموعة من الإحصائيات التي توضح مدى الاختلاف بين عناصر العينة أو المجتمع الإحصائي بناءً على الخصائص المقاسة. وتشمل مقاييس مثل النطاق، والتباين، والانحراف المعياري.

تشير التوزيعات إلى "الشكل" العام للبيانات، والذي يمكن تصويره على رسم بياني مثل المدرج التكراري أو مخطط النقاط، ويشمل خصائص مثل دالة التوزيع الاحتمالي، والانحراف، والتفلطح. يمكن للإحصاءات الوصفية أيضًا وصف الفروقات بين الخصائص الملاحظة لعناصر مجموعة البيانات. يمكن أن تساعدنا في فهم الخصائص الجماعية لعناصر عينة البيانات وتشكل الأساس لاختبار الفرضيات وإجراء التنبؤات باستخدام الإحصاءات الاستدلالية.

الإحصاء الاستدلالي

الإحصاء الاستدلالي هو أداة يستخدمها الإحصائيون لاستخلاص استنتاجات حول خصائص مجتمع ما، مستندة إلى خصائص عينة منه. كما يُستخدم لتحديد مدى اليقين في موثوقية تلك الاستنتاجات. بناءً على حجم العينة وتوزيعها، يمكن للإحصائيين حساب الاحتمالية بأن الإحصائيات، التي تقيس النزعة المركزية والتباين والتوزيع والعلاقات بين الخصائص داخل عينة البيانات، تقدم صورة دقيقة للمعايير المقابلة للمجتمع الكامل الذي أُخذت منه العينة.

تُستخدم الإحصاءات الاستدلالية لإجراء تعميمات حول مجموعات كبيرة، مثل تقدير متوسط الطلب على منتج من خلال دراسة عادات الشراء لعينة من المستهلكين أو محاولة التنبؤ بالأحداث المستقبلية. قد يعني هذا توقع العائد المستقبلي لأوراق مالية أو فئة أصول بناءً على العوائد في فترة عينة.

تحليل الانحدار هو تقنية مستخدمة على نطاق واسع في الاستدلال الإحصائي. يُستخدم لتحديد قوة وطبيعة العلاقة (الارتباط) بين متغير تابع وواحد أو أكثر من المتغيرات التفسيرية (المستقلة). غالبًا ما يتم تحليل ناتج نموذج الانحدار من حيث الأهمية الإحصائية، مما يعني أن النتيجة المستخلصة من الاختبارات أو التجارب ليست من المحتمل أن تكون قد حدثت بشكل عشوائي أو بالصدفة. بعبارة أخرى، تشير الأهمية الإحصائية إلى أن النتائج تعزى إلى سبب محدد توضحه البيانات.

المتوسط، الوسيط، والمنوال

المصطلحات "المتوسط"، "الوسيط"، و"المنوال" تندرج تحت مظلة النزعة المركزية. تصف هذه المصطلحات عنصراً يكون نموذجياً في مجموعة عينة معينة. يمكنك العثور على وصف المتوسط عن طريق جمع الأرقام في المجموعة ثم قسمة النتيجة على عدد ملاحظات مجموعة البيانات.

الرقم الأوسط في المجموعة هو الوسيط. نصف الأرقام المدرجة أعلى من الوسيط، والنصف الآخر أقل. ستكون قيمة المنزل الوسيطة في حي ما 350,000 دولار إذا كان هناك خمسة منازل تقع هناك وتقدر قيمتها بـ 500,000 دولار، 400,000 دولار، 350,000 دولار، 325,000 دولار، و300,000 دولار. قيمتان أعلى وقيمتان أقل.

النمط هو الرقم الذي يقع بين أعلى وأدنى القيم. يظهر بشكل متكرر في مجموعة البيانات.

فهم البيانات الإحصائية

جذر الإحصائيات يعتمد على المتغيرات. المتغير هو مجموعة بيانات يمكن عدها وتحدد خاصية أو سمة لعنصر ما. على سبيل المثال، يمكن أن تحتوي السيارة على متغيرات مثل العلامة التجارية، الطراز، السنة، الأميال، اللون، أو الحالة. من خلال دمج المتغيرات عبر مجموعة من البيانات، مثل ألوان جميع السيارات في موقف سيارات معين، تتيح لنا الإحصائيات فهم الاتجاهات والنتائج بشكل أفضل.

هناك نوعان رئيسيان من المتغيرات:

أولاً، المتغيرات النوعية هي سمات محددة غالباً ما تكون غير رقمية. العديد من الأمثلة المقدمة في مثال السيارة هي نوعية. أمثلة أخرى على المتغيرات النوعية في الإحصاء تشمل الجنس، لون العين، أو مدينة الميلاد. غالباً ما تُستخدم البيانات النوعية لتحديد النسبة المئوية لحدوث نتيجة معينة لأي متغير نوعي معين. التحليل النوعي غالباً لا يعتمد على الأرقام. على سبيل المثال، محاولة تحديد النسبة المئوية للنساء اللاتي يمتلكن مشروعاً تجارياً تحلل البيانات النوعية.

النوع الثاني من المتغيرات في الإحصاء هو المتغيرات الكمية. يتم دراسة المتغيرات الكمية بشكل رقمي ولا يكون لها وزن إلا عندما تتعلق بوصف غير رقمي. على غرار التحليل الكمي، فإن هذه المعلومات تعتمد على الأرقام. في مثال السيارة أعلاه، فإن المسافة المقطوعة هي متغير كمي، ولكن الرقم 60,000 لا يحمل أي قيمة إلا إذا تم فهم أنه يمثل إجمالي عدد الأميال المقطوعة.

يمكن تقسيم المتغيرات الكمية إلى فئتين. أولاً، المتغيرات المنفصلة لها قيود في الإحصاءات وتستنتج أن هناك فجوات بين القيم المحتملة للمتغيرات المنفصلة. عدد النقاط المسجلة في مباراة كرة القدم هو متغير منفصل لأن:

  1. لا يمكن أن تكون هناك أرقام عشرية.
  2. من المستحيل أن يسجل الفريق نقطة واحدة فقط.

الإحصائيات تستخدم أيضًا المتغيرات الكمية المستمرة. هذه القيم تمتد على طول مقياس. القيم المنفصلة لها حدود، لكن المتغيرات المستمرة غالبًا ما تُقاس بالأرقام العشرية. يمكن الحصول على أي قيمة ضمن الحدود الممكنة عند قياس ارتفاع لاعبي كرة القدم، ويمكن قياس الارتفاعات حتى 1/16 من البوصة، إن لم يكن أكثر.

يمكن للإحصائيين أن يحملوا ألقابًا ومناصب مختلفة داخل الشركة. كان متوسط التعويض الإجمالي للإحصائي الذي يمتلك من سنة إلى ثلاث سنوات من الخبرة هو 81,885 دولارًا اعتبارًا من ديسمبر 2023. وارتفع هذا الرقم إلى 109,288 دولارًا مع 15 عامًا من الخبرة.

مستويات القياس الإحصائي

هناك عدة مستويات للقياس الناتجة بعد تحليل المتغيرات والنتائج. يمكن للإحصائيات قياس النتائج بأربع طرق.

القياس على مستوى الاسمي

لا توجد قيمة رقمية أو كمية، ولا يتم تصنيف الخصائص. بدلاً من ذلك، تُعتبر القياسات على المستوى الاسمي مجرد تسميات أو فئات تُخصص لمتغيرات أخرى. من الأسهل التفكير في القياسات على المستوى الاسمي كحقائق غير رقمية حول متغير معين.

مثال: اسم رئيس الولايات المتحدة الذي تم انتخابه في عام 2020 كان جوزيف روبينيت بايدن جونيور.

القياس على مستوى الترتيب

يمكن ترتيب النتائج في تسلسل، ولكن جميع قيم البيانات لها نفس القيمة أو الوزن. على الرغم من أنها رقمية، لا يمكن طرح القياسات على مستوى الترتيب من بعضها البعض في الإحصائيات لأن ما يهم هو موقع نقطة البيانات فقط. غالبًا ما يتم دمج المستويات الترتيبية في الإحصائيات غير المعلمية ويتم مقارنتها مع المجموعة الكلية للمتغيرات.

مثال: كان الأمريكي فريد كيرلي ثاني أسرع رجل في أولمبياد طوكيو 2020 بناءً على أوقات سباق 100 متر.

قياس على مستوى الفترات الزمنية

يمكن ترتيب النتائج بترتيب معين، ولكن قد يكون للفروق بين قيم البيانات معنى الآن. غالبًا ما تُستخدم نقطتا بيانات لمقارنة مرور الوقت أو تغيير الظروف داخل مجموعة البيانات. غالبًا ما لا يوجد "نقطة بداية" لنطاق قيم البيانات، وقد لا يكون للتواريخ في التقويم أو درجات الحرارة قيمة صفرية ذات معنى جوهري.

قياس على مستوى النسبة

يمكن ترتيب النتائج بترتيب معين، وتصبح الفروق بين قيم البيانات ذات معنى. ولكن هناك نقطة بداية أو "قيمة صفرية" يمكن استخدامها لإضفاء قيمة إضافية على القيمة الإحصائية. النسبة بين قيم البيانات لها معنى، بما في ذلك المسافة عن الصفر.

مثال: أدنى درجة حرارة جوية مسجلة كانت -128.6 درجة فهرنهايت في القارة القطبية الجنوبية في عام 1983.

تقنيات أخذ العينات في الإحصاء

غالبًا ما يكون من غير الممكن جمع البيانات من كل نقطة بيانات داخل مجتمع للحصول على معلومات إحصائية. تعتمد الإحصائيات بدلاً من ذلك على تقنيات أخذ العينات المختلفة لإنشاء مجموعة فرعية ممثلة للمجتمع تكون أسهل في التحليل. في الإحصائيات، هناك عدة أنواع رئيسية من أخذ العينات.

العينة العشوائية البسيطة

العينة العشوائية البسيطة تتطلب أن يكون لكل عضو في المجتمع فرصة متساوية ليتم اختياره للتحليل. يتم استخدام المجتمع بأكمله كأساس لأخذ العينات، ويمكن لأي مولد عشوائي يعتمد على الحظ اختيار عناصر العينة. على سبيل المثال، يتم ترتيب 100 فرد ويتم اختيار 10 منهم بشكل عشوائي.

العينة النظامية

العينة المنتظمة تتطلب أيضًا عينة عشوائية، ولكن تقنيتها معدلة قليلاً لتسهيل تنفيذها. يتم توليد رقم عشوائي واحد لتحديد نقطة البداية، ثم يتم اختيار الأفراد على فترات منتظمة محددة حتى يكتمل حجم العينة. على سبيل المثال، إذا كان هناك 100 فرد مصطفين ومرقمين، وكانت نقطة البداية العشوائية هي الفرد السابع، يتم اختيار كل فرد تاسع لاحق (أي، السابع، السادس عشر، الخامس والعشرون، وهكذا) حتى يتم اختيار 10 عناصر للعينة.

العينة الطبقية

العينة الطبقية تتطلب مزيدًا من التحكم في عينتك. يتم تقسيم السكان إلى مجموعات فرعية بناءً على خصائص متشابهة. ثم تقوم بحساب عدد الأشخاص من كل مجموعة فرعية الذين سيمثلون السكان بالكامل. على سبيل المثال، يتم تجميع 100 فرد حسب الجنس والعرق. ثم يتم أخذ عينة من كل مجموعة فرعية بما يتناسب مع مدى تمثيل تلك المجموعة الفرعية للسكان.

العينة العنقودية

العينة العنقودية تتطلب وجود مجموعات فرعية أيضًا، ولكن يجب أن تكون كل مجموعة فرعية ممثلة للسكان. يتم اختيار المجموعة الفرعية بأكملها بشكل عشوائي بدلاً من اختيار أفراد بشكل عشوائي داخل المجموعة الفرعية.

استخدامات الإحصائيات

الإحصائيات بارزة في التمويل والاستثمار والأعمال ومجموعة واسعة من القطاعات. الكثير من المعلومات التي تراها والبيانات التي تُعطى لك مستمدة من الإحصائيات، والتي تُستخدم في جميع جوانب الأعمال.

  • تشمل الإحصائيات في الاستثمار متوسط حجم التداول، أدنى مستوى خلال 52 أسبوعًا، أعلى مستوى خلال 52 أسبوعًا، بيتا، والارتباط بين فئات الأصول أو الأوراق المالية.
  • تشمل الإحصاءات في الاقتصاد الناتج المحلي الإجمالي (GDP)، والبطالة، وتسعير المستهلك، والتضخم، وغيرها من مقاييس النمو الاقتصادي.
  • تشمل الإحصائيات في التسويق معدلات التحويل، ومعدلات النقر، وكميات البحث، ومقاييس وسائل التواصل الاجتماعي.
  • تشمل الإحصائيات في المحاسبة مقاييس السيولة والملاءة والربحية عبر الزمن.
  • تشمل الإحصائيات في تكنولوجيا المعلومات عرض النطاق الترددي، وقدرات الشبكة، ولوجستيات الأجهزة.

لماذا تُعتبر الإحصائيات مهمة؟

تُستخدم الإحصائيات لإجراء الأبحاث، وتقييم النتائج، وتطوير التفكير النقدي، واتخاذ قرارات مستنيرة بشأن مجموعة من البيانات. يمكن استخدام الإحصائيات للاستفسار عن أي مجال من مجالات الدراسة تقريبًا للتحقيق في سبب حدوث الأشياء، ومتى تحدث، وما إذا كان من الممكن التنبؤ بتكرارها.

ما الفرق بين الإحصاء الوصفي والإحصاء الاستدلالي؟

تُستخدم الإحصاءات الوصفية لوصف أو تلخيص خصائص عينة أو مجموعة بيانات، مثل متوسط المتغير أو الانحراف المعياري أو التكرار. تستخدم الإحصاءات الاستدلالية أي عدد من التقنيات لربط المتغيرات في مجموعة البيانات ببعضها البعض. مثال على ذلك هو استخدام تحليل الارتباط أو الانحدار. يمكن بعد ذلك استخدام هذه التقنيات لتقدير التنبؤات أو استنتاج السببية.

من يستخدم الإحصائيات؟

يتم إجراء الإحصائيات كلما تم جمع البيانات وتحليلها، وتُستخدم على نطاق واسع في مجموعة متنوعة من التطبيقات والمهن. وتشمل هذه الوكالات الحكومية، والبحث الأكاديمي، وتحليل الاستثمار، والعديد من المجالات الأخرى.

كيف تُستخدم الإحصائيات في الاقتصاد والتمويل؟

يقوم الاقتصاديون بجمع وتحليل جميع أنواع البيانات التي تتراوح من إنفاق المستهلكين وبدايات الإسكان إلى التضخم ونمو الناتج المحلي الإجمالي. في مجال التمويل، يقوم المحللون والمستثمرون بجمع البيانات حول الشركات والصناعات والمشاعر وبيانات السوق المتعلقة بالأسعار والحجم. يُعرف استخدام الإحصاءات الاستدلالية في هذه المجالات بالاقتصاد القياسي. تعتمد العديد من النماذج المالية المهمة، بما في ذلك نموذج تسعير الأصول الرأسمالية (CAPM)، ونظرية المحفظة الحديثة (MPT)، ونموذج تسعير الخيارات بلاك-شولز، على الاستدلال الإحصائي.

الخلاصة

الإحصائيات هي ممارسة تحليل البيانات واستخلاص الاستنتاجات من نتائج العينة. في مجموعة متنوعة من المجالات - من الوكالات الحكومية إلى المالية - تُستخدم الإحصائيات لجمع الاستنتاجات حول مجموعة بيانات معينة.

يمكن لدراسة الإحصاء أن تؤدي إلى مهنة كإحصائي، لكنها يمكن أن تكون أيضًا أداة مفيدة في الحياة اليومية. عندما تقوم بتحليل احتمالات فوز فريقك المفضل في Super Bowl قبل أن تضع رهانًا، أو تقييم جدوى استثمار ما، أو تحديد ما إذا كنت تدفع أكثر من اللازم مقارنة بمنتج أو خدمة، يمكن استخدام الإحصاء للحصول على رؤى حول النتائج المحتملة للأشياء أو الأحداث.