الأمية الإحصائيه (١)…


الأمية الإحصائيه (١)

كان الكوميدى چورچ بيرنز (George Burns) مدخناً شرهاً، لم يغادر السيجار فمه قط. وعاش چورچ حتى كان عمره ١٠٣ سنوات. يتشبث المدخنون بهذه المعلومة (وهي صحيحة،) ويعطوها إهتماماً وأهمية أكثر من الإحصائيات العديدة التى تشير إلى وجود صلة بين التدخين وبين أمراض الرئة. هذه المقالة ليست عن التدخين وأضراره، بل هي عن ظاهرة الإستهتار بعلم الإحصاء وضعف الثقة فى نتائجه، وهو ما أسميه ‘الأمّية الإحصائيه’ (*).

دعنا نبدأ من البدايه: المعلومة التى ذكرتُها عن چورچ بيرنز تنتمى إلى نوع من المعلومات يُسمّى “البيانات القصصيه (anecdotal data)”. كلمة ‘قصصيه’ هنا لا تعنى أنها خيالية أو كاذبه، بل تعنى أنها حالة منفردة لا مدلول لها أبعد من معناها المباشر، (وهو أن چورچ بيرنز عاش ١٠٣ سنوات.) فى الكفة المقابلة نجد المنهج العلمى الذى يأخذ ١٠٠٠ مدخن و ١٠٠٠ لا يدخنون، ويتابعهم صحياً لمدة ٣٠ سنة، ثم يقارن نسبة المصابين بالأمراض المختلفة فى المجموعتين. والأمية الإحصائية هي ظاهرة ترجيح “حكاية” چورچ بيرنز على المنهج العلمى.

لم يكن المنهج العلمى شيئاً رسخه فينا الإنتقاء الطبيعى. عندما كان الإنسان البدائى يصادف أسداً أو تمساحاً، كان الشخص الذى يجرى تلقائياً بدون تفكير هو الذى يعيش ليوَرِّث جيناته إلى أجيال جديده. أما ذلك الذى كان يتريث لتقييم الإحتمالات وتحليل الإختيارات، فكان يصبح إفطاراً لهذا التمساح أو الأسد، قبل أن تتاح له فرصة توريث حكمتة المنهجية. ومع آلاف الأجيال أصبحت الأغلبية من النوع الذى لا يثق فى المنهج العلمى ويميل إلى تصديق الحكايات.

نعود إلى موضوعنا: قلتُ “يأخذ المنهج العلمى ١٠٠٠ مدخن …”. لماذا ١٠٠٠ وليس واحد أوإثنين؟ لأن هناك عوامل أخرى كثيرة لا يمكنك السيطرة عليها. ماذا يأكل هؤلاء الأشخاص؟ وأين يسكنون؟ هل يواظبون على التمرينات الرياضية؟ ما هي خواصهم الموروثه؟… إلخ. لذلك إذا أخذت مجموعة من الأشخاص، فإن تلك العوامل الفردية ستلغى بعضها البعض ما عدا العامل المشترك بين الجميع (وهو أنهم مدخنون فى المجموعه ‘أ’ وغير مدخنين فى المجموعه ‘ب’.) علمياً نقول إن هذا يرفع ‘نسبة الإشارة إلى الشوشره (signal-to-noise ratio)’.

لنفس هذا السبب يلزم أن يكون الإختيار عشوائياً. لأنك لو إخترت إحدى المجموعتين من نوع واحد، (كلهم من كبار السن مثلاً، أو كلهم يميلون إلى السمنه،) تكون قد أدخلت عاملاً مشتركاً آخر غير العامل الذى يهمك، (وهو التدخين)، وهذا من شأنه أن يشوش على النتيجة أو يطمسها. (الإختيار اللا-عشوائي هو فى العادة أكبر الأخطاء وأكثرها شيوعاً عند تطبيق علم الإحصاء.)

المجموعة التى إخترناها (سواء ١٠٠٠ أو أي عدد آخر) تسمى ‘العيّنه (sample)’. عندما تكون لدينا فرصة إنتقاء العينه، يستحسن أن تكون عشوائية كما ذكرنا. لكننا أحياناً نكون مرغمين على إستعمال العينة المتاحة لنا دون القدرة على الإنتقاء. فى هذه الحالة يعطينا علم الإحصاء طرقاً أخرى لفلترة النتائج من التشويش. (لهذا يدرس الطلاب هذا العلم سنوات طويلة ويحصلون فيه على درجات عليا.)

طبعاً من الصعب متابعة عينة حجمها ١٠٠٠ شخص. ماذا لو أخذنا ٥٠ مثلاً؟ لا بأس، لكننا سنكون أقل ثقة فى النتيجة لأن إحتمال أن يكون الخمسين لديهم بالصدفة نفس القابلية لمرض ما (وإن كان إحتمالاً ضئيلاً) ما زال أعلى من إحتمال أن يحدث هذا فى ١٠٠٠ شخص. وعلم الإحصاء يعطينا أرقاماً دقيقة لإحتمال الخطأ فى كلّ من الحالتين كما سنرى.

أكتفى بهذه الجرعة الآن، وسنلتقط الخيوط فى تعليق لاحق لنوضح الموضوع بأمثلة و أرقام.

لكن لماذا قررت أن أكتب عن علم الإحصاء بالذات؟ لأن الإحصاء علم “يُساء فهمه” (**)، لا يثق فيه عامة الناس بسبب نوادر فردية مثل حكاية چورچ بيرنز و نجاح ترامپ سنة ٢٠١٦ (على عكس ما تنبأت به إستطلاعات الرأي، وهي فرع من فروع الإحصاء.) والحقيقة هي أن علم الإحصاء من أكثر فروع الرياضيات دقة وفعالية. ولو لم يكن الإحصاء علماً حقيقياً لما كانت لدينا شركات تأمين ولا برامج ضمان جماعي ولا تخطيط إقتصادي ولا كازينوهات مونت كارلو ولاس ڤيجاس.
___________________________

*) ليست الأمية الإحصائية هي سبب الإدمان على التدخين. لكن المثال لا بأس به كمدخل للموضوع.
**) قال أحد السياسيين الأمريكيين: “هناك أكاذيب، ثم هناك أكاذيب ملعونه، ثم هناك الإحصاء!” هو بالطبع جاهل، لكنه محق فى نقطة جزئيه، هي أنه يمكن إساءة إستعمال الإحصائيات لتزييف الحقائق (بالإنتقاء والإغفال.)

يمكنك دعم الموقع من هنا
مؤسسة ندى لحماية الفتيات

Exit mobile version