التشتت هو حالة التشتت أو الانتشار ، التشتت الإحصائي يعني مدى احتمال اختلاف البيانات العددية حول متوسط القيمة ، بعبارة أخرى ، يساعد التشتت على فهم توزيع البيانات. تعتبر مقاييس التشتت مهمة لأنها تساعد في فهم مقدار انتشار البيانات (أي اختلافها) حول القيمة المركزية ، يمكن حساب التشتت باستخدام مقاييس مختلفة مثل المتوسط والانحراف المعياري والتباين .

ما هو التشتت

التشتت في علم الإحصاء هو طريقة لوصف مدى انتشار مجموعة من البيانات ، عندما يكون لمجموعة البيانات قيمة كبيرة ، تكون القيم في المجموعة مبعثرة على نطاق واسع ، عندما تكون العناصر صغيرة في المجموعة ، يتم تجميعها بإحكام ، بشكل أساسي ، هذه المجموعة من البيانات لها قيمة صغيرة:

1 ، 2 ، 2 ، 3 ، 3 ، 4

وهذه المجموعة لها مجموعة أوسع:

0 ، 1 ، 20 ، 30 ، 40 ، 100

يمكن وصف انتشار مجموعة بيانات من خلال مجموعة من الإحصاءات الوصفية بما في ذلك التباين والانحراف المعياري والمدى الرباعي .

أنواع مقاييس التشتت

هناك نوعان رئيسيان من طرق التشتت في الإحصائيات وهما:

  • المقياس المطلق للتشتت .
  • المقياس النسبي للتشتت .

معامل التشتت

يتم حساب معاملات التشتت مع مقياس التشتت عند مقارنة سلسلتين تختلفان بشكل كبير في متوسطاتها. كما يستخدم معامل التشتت عند مقارنة سلسلتين بوحدة قياس مختلفة ، يشار إليها باسم C.D.

خصائص مقاييس التشتت

  • يجب تحديد مقياس التشتت بدقة .
  • يجب أن يكون من السهل حسابه وفهمه .
  • لا يتأثر كثيرًا بتقلبات الملاحظات .
  • بناء على جميع الملاحظات .

تصنيف مقاييس التشتت

يتم تصنيف مقياس التشتت على النحو التالي:

مقياس مطلق للتشتت  (ط)

التدابير التي تعبر عن تشتت الملاحظة من حيث المسافات ، أي المدى ، الانحراف الربعي.

المقياس الذي يعبر عن الاختلافات من حيث متوسط ​​انحرافات الملاحظات مثل متوسط ​​الانحراف والانحراف المعياري.

مقياس نسبي للتشتت

نستخدم مقياسًا نسبيًا للتشتت لمقارنة توزيعات مجموعة بيانات أو أكثر ولمقارنة الوحدة المجانية ،وهي معامل النطاق ، ومعامل الانحراف المتوسط ​​، ومعامل الانحراف الرباعي ، ومعامل التباين ، ومعامل الانحراف المعياري.

مقاييس التشتت الشائعة الاستخدام

يظهر مقياس التشتت تشتت البيانات ، يوضح تنوع البيانات عن بعضها البعض ويعطي فكرة واضحة عن توزيع البيانات ،  يُظهر مقياس التشتت التجانس أو عدم التجانس في توزيع الملاحظات.

الفكرة الرئيسية حول مقياس التشتت هي معرفة كيفية انتشار البيانات ، يوضح مدى اختلاف البيانات عن متوسط ​​قيمتها ، وبالتالي ، لوصف البيانات ، يحتاج المرء إلى معرفة مدى التباين ، هناك أربعة مقاييس شائعة الاستخدام للإشارة إلى التباين (أو التشتت) ضمن مجموعة من المقاييس، وهي:  المدى ، الانحراف الربعي ، متوسط ​​الانحراف ، الانحراف المعياري.

المدى

المدى أو النطاق هو الفاصل الزمني بين أعلى وأدنى درجة. المدى هو مقياس للتغير أو تشتت المتغيرات أو الملاحظات فيما بينها ولا يعطي فكرة عن انتشار الملاحظات حول بعض القيمة المركزية.

النطاق هو مؤشر للتغير، عندما يكون النطاق أكثر ، تكون المجموعة أكثر تغيرًا ، كلما كان النطاق أصغر ، كانت المجموعة أكثر تجانساً ،النطاق هو المقياس الأكثر شيوعًا لـ “انتشار” أو “مبعثر” الدرجات (أو المقاييس) ، عندما نرغب في إجراء مقارنة تقريبية للتنوع بين مجموعتين أو أكثر ، فقد نحسب النطاق.

Hs هي “أعلى درجة” و Ls هي أدنى درجة.

حساب النطاق (البيانات غير المجمعة) :

مثال 1:

درجات عشرة أولاد في الاختبار هم:

17 ، 23 ، 30 ، 36 ، 45 ، 51 ، 58 ، 66 ، 72 ، 77.

مثال 2:

عشرات الفتيات في الاختبار هم:

48 ، 49 ، 51 ، 52 ، 55 ، 57 ، 50 ، 59 ، 61 ، 62.

في المثال الأول ، أعلى درجة 77 نقطة وأقل درجة 17.

لذا فإن النطاق هو الفرق بين هاتين الدرجات:

النطاق = 77-17 = 60 .

مزايا المدى
  • إنه أبسط مقياس للتشتت .
  • سهل الحساب    .
  • سهل الفهم .
  • مستقل عن تغيير المنشأ .
عيوب المدى
  • لأنه يقوم على ملاحظتين متطرفتين ، وبالتالي تتأثر التقلبات .
  • النطاق ليس مقياسًا موثوقًا للتشتت .
  • يعتمد على تغيير المقياس .

الانحراف الرباعي

النطاق هو الفاصل الزمني أو المسافة على مقياس القياس الذي يتضمن حالات 100 بالمائة ، تعود قيود النطاق إلى اعتماده على القيمتين المتطرفتين فقط ،هناك بعض مقاييس التشتت التي تكون مستقلة عن هاتين القيمتين المتطرفتين ، الأكثر شيوعًا هو الانحراف الرباعي الذي يعتمد على الفاصل الزمني الذي يحتوي على 50 بالمائة من الحالات في توزيع معين .

يرمز إلى الانحراف الربعي أو الانحراف شبه الربعي هو

س = ½ × (Q3 – Q1)

مزايا الانحراف الرباعي
  • يتم التغلب على جميع عيوب النطاق من خلال الانحراف الرباعي .
  • يستخدم نصف البيانات .
  • مستقل عن تغيير المنشأ .
  • أفضل مقياس للتشتت في التصنيف المفتوح .
عيوب الانحراف الرباعي
  • يتجاهل 50٪ من البيانات .
  • يعتمد على تغيير المقياس .
  • ليس مقياسًا موثوقًا للتشتت .

الانحراف المتوسط

متوسط ​​الانحراف هو المتوسط ​​الحسابي لانحرافات سلسلة محسوبة من بعض مقاييس النزعة المركزية (الوسط أو الوسيط أو الوضع) ، وتعتبر جميع الانحرافات إيجابية ، وبعبارة أخرى ، يُعرف متوسط ​​انحرافات جميع القيم من المتوسط ​​الحسابي باسم متوسط ​​الانحراف ، عادةً ما يتم أخذ الانحراف عن متوسط ​​التوزيع.

متوسط ​​الانحراف عن المتوسط ​​A = 1⁄n [∑i | xi – A |]

بالنسبة للتردد المجمع ، يتم حسابه على النحو التالي:

متوسط ​​الانحراف عن المتوسط ​​A = 1⁄N [∑i fi | xi – A |]، N = ∑fi

هنا ، xi و fi هما على التوالي القيمة المتوسطة وتردد الفاصل الزمني للفئة ith.

مزايا الانحراف المتوسط
  • بناء على جميع الملاحظات .
  • يوفر قيمة دنيا عند أخذ الانحرافات من الوسيط .
  • مستقل عن تغيير المنشأ .
عيوب الانحراف المتوسط
  • لا يمكن فهمه بسهولة .
  • حسابها ليس سهلًا ويستغرق وقتا طويلًا .
  • يعتمد على تغيير المقياس .

الانحراف المعياري أو S.D. والتباين

الانحراف المعياري هو الجذر التربيعي الموجب للمتوسط ​​الحسابي لمربعات انحرافات القيم المعطاة من الوسط الحسابي الخاص بها ، يشار إليه بالحرف اليوناني سيجما ، σ. ويشار إليها أيضًا باسم متوسط ​​الانحراف التربيعي.

من بين العديد من مقاييس التشتت ، فإن المقياس الأكثر استخدامًا هو “الانحراف المعياري” ، كما أنه الأهم لأنه المقياس الوحيد للتشتت القابل للمعالجة الجبرية.

هنا أيضًا ، يتم النظر في انحرافات جميع القيم عن متوسط ​​التوزيع ، يعاني هذا المقياس من أقل العوائق ويوفر نتائج دقيقة ، يزيل عيب تجاهل العلامات الجبرية أثناء حساب انحرافات العناصر عن المتوسط ، بدلاً من تجاهل الإشارات ، قمنا بتربيع الانحرافات ، مما يجعلها كلها إيجابية.

تمارين على مقاييس التشتت

أوجد الفروق والانحراف المعياري للأرقام التالية: 1 ، 3 ، 5 ، 5 ، 6 ، 7 ، 9 ، 10.

المتوسط = 46/8 = 5.75

الخطوة 1: (1 – 5.75) ، (3 – 5.75) ، (5 – 5.75) ، (5 – 5.75) ، (6 – 5.75) ، (7 – 5.75) ، (9 – 5.75) ، (10 – 5.75)

= -4.75 ، -2.75 ، -0.75 ، -0.75 ، 0.25 ، 1.25 ، 3.25 ، 4.25

الخطوة 2: تربيع القيم أعلاه التي نحصل عليها ، 22.563 ، 7.563 ، 0.563 ، 0.563 ، 0.063 ، 1.563 ، 10.563 ، 18.063

الخطوة 3: 22.563 + 7.563 + 0.563 + 0.563 + 0.063 + 1.563 + 10.563 + 18.063

= 61.504

الخطوة 4: ن = 8 ، وبالتالي التباين (σ2) = 61.504 / 8 = 7.69 (3 ثوان)

الآن ، الانحراف المعياري (σ) = 2.77 (3sf)

احسب تباين الأرقام 3 ، 8 ، 6 ، 10 ، 12 ، 9 ، 11 ، 10 ، 12 ، 7.

سوف يكون التباين في الأرقام التالية 7.36.

مثال على مقاييس التشتت

لنفترض أنك طُلب منك مقارنة مقاييس التشتت لمجموعتي بيانات ، تحتوي مجموعة البيانات أ على العناصر 97،98،99،100،101،102،103 ومجموعة البيانات B تحتوي على العناصر 70،80،90،100،110،120،130 ، من خلال النظر في مجموعات البيانات ، يمكنك على الأرجح معرفة أن الوسيطات والوسيطات هي نفسها (100) والتي تسمى تقنيًا “مقاييس الاتجاه المركزي” في الإحصائيات.

، فإن النطاق (الذي يمنحك فكرة عن مدى انتشار مجموعة البيانات بالكامل) أكبر بكثير لمجموعة البيانات B (60) عند مقارنتها بمجموعة البيانات A (6). في الواقع ، ستكون جميع مقاييس التشتت تقريبًا أكبر بعشر مرات لمجموعة البيانات B ، وهو أمر منطقي نظرًا لأن النطاق أكبر بعشر مرات. على سبيل المثال ، ألق نظرة على الانحرافات المعيارية لمجموعتي البيانات:

الانحراف المعياري لـ A: 2.160246899469287.

الانحراف المعياري لـ B: 21.602468994692867.

الرقم لمجموعة البيانات B هو بالضبط عشرة أضعاف الرقم A.