معالجة البيانات
معالجة البيانات
لا شك أن المادة الخام كلما ازدادت جودتها كانت مخرجاتها من المنتجات أفضل، وهكذا البيانات عادةً ما تتطلَّب تنظيفًا قبل استخدامها لصنع وجبة إحصائية، لذلك ربما احتوت البيانات بعض المشكلات التي يجب تصحيحها قبل الشروع في معالجتها إحصائيًّا، منعًا من ظهور نتائج مشوَّهة في نهاية المطاف، فبدايةً قد تكون البيانات غير مكتملة، سواء أكان هذا الفقد في البيانات لأسباب يمكن التحكُّم بها أم لا، وفي كلتا الحالتين ينبغي الاهتمام بالحصول على البيانات المفقودة قدر المستطاع ومراعاتها منعًا من حدوث كارثة جرَّاء صنع نماذج تعتمد على بيانات ناقصة مثل حادثة مكوك الفضاء “تشالنجر”، وكذلك عدم التسرُّع في التحيُّز نحو بعض النتائج المعتمدة على بيانات غير مكتملة.
كذلك من الأخطاء الشائعة أيضًا عدم صحة بعض البيانات وانخفاض درجة الثقة المتعلقة بها، وقد ينشأ ذلك الخطأ بسبب أمور عدة منها عدم الاتفاق على المفاهيم العامة لبعض المصطلحات، على سبيل المثال: عندما تتم الاستعانة ببيانات عالمية من أكثر من دولة عن معدلات الهجمات الإرهابية نجد أن بعض تلك الدول تختلف فيما بينها في تعريف الأعمال الإرهابية، كذلك اختلاف المقاييس وطريقة تسجيل تلك البيانات التي قد تقلِّل من درجة الاعتماد عليها.
كما أن العامل البشري قد يتسبَّب في حدوث بعض الأخطاء في أثناء تجميع البيانات لعيِّنة ما، مما يفضي إلى نتائج كارثية في بعض الأحيان لا سيما مع اعتماد بعضهم على القيم الشاذة وتجاهل القيم المعبِّرة عن النسق العام للعينة، كذلك لا بدَّ من التفرقة بين البيانات التي ترصد واقعًا لا دخل للإنسان فيه، وبين تلك البيانات التي تعبِّر عن تجربة ما قام بها بعض الأفراد، فالصورة الأولى تعدُّ نقية إلى حدٍّ كبير بينما البيانات التجريبية جرى تحويرها نتيجة القدرة على التحكم في ظروف التجربة، لذلك كان لزامًا على الباحثين تطوير العديد من الأساليب والاستراتيجيات التي تعمل على تجنُّب مثل تلك الأخطاء في البيانات أو على معالجتها.
الفكرة من كتاب علم الإحصاء: مقدمة قصيرة جدًّا
رغم أن الأفكار والأساليب الإحصائية تمثِّل أساس جوانب الحياة الحديثة اليوم، فإن علم الإحصاء يُعاني سوء فَهْم جوهريًّا مؤسِفًا يُضلِّل الناس عن طبيعته الأساسية، لذا يهدف هذا الكتاب إلى منْح القارئ قدْرًا من الفهْم لمجال علم الإحصاء الحديث، بدايةً من التعريفات الأساسية والأساليب والنماذج المبسطة مرورًا بمشكلات الاستنتاجات وطرق معالجة البيانات، في محاولة جادة للتعبير عن طبيعة الفلسفة والأفكار والأدوات والأساليب الإحصائية القائمة اليوم.
مؤلف كتاب علم الإحصاء: مقدمة قصيرة جدًّا
ديفيد جيه هاند David J. Hand: أستاذُ الإحصاء في قسم الرياضيات بجامعة إمبريال كوليدج، ولد في 30 يونيو 1950، بالمملكة المتحدة، كان هاند أستاذًا للإحصاءات بالجامعة المفتوحة في عامي 1988 و1999، ثم انتقل إلى كلية إمبريال كوليدج في لندن، حصل على ميدالية غاي في الإحصاء من قبل الجمعية الإحصائية الملكية في عام 2002 وشغل منصب رئيسها في الفترة 2008-2009، ثم مرة أخرى من عام 2010 بعد استقالة برنارد سيلفرمان، كما تم انتخابه زميلًا في الأكاديمية البريطانية عام 2003.
ألَّفَ أكثر من عشرة كتبٍ عن البيانات والإحصائيات، منها: “مبادئ استخراج البيانات”، و”رفاهية الأمم: المعنى والدافع والقياس”، و”مبدأ الاحتمالية: لماذا تحدث المصادفات والمعجزات والأحداث النادرة طوال الوقت؟”.