منهجية التجارب العشوائية المتحكم بها
منهجية التجارب العشوائية المتحكم بها
Randomized Controlled Trials
يواجه الباحثون في العلوم الاجتماعية معضلة قياس التأثير المتوقع للسياسات التدخّلية التي يقترحونها، ذلك أن تقييم الأثر الناتج عن تدخل معين يتطلب عزل التأثير المتولد عن هذا التدخل عن التأثيرات المتولدة من مصادر أخرى. وجدت هذه المعضلة حلّاً مُرضياً لها في العلوم الطبيعية منذ العام 1920 على يد إحصائي بريطاني يدعى رونالد فيشر. قام فيشر في سعيه لقياس تأثير استخدام السماد على غلة البطاطا بتقسيم الحقل إلى قطع متساوية، واختار عشوائياً بعض القطع ليعاملها بالسماد، وأخرى تركها دون تسميد. ونظراً لأن القطع كافة خضعت لعوامل خارجية موحدة (مثل كمية المطر، والحرارة، ونوع التربة) استنتج فيشر أن فارق الغلة بين قطع الأرض المسمدة وغير المسمدة يمكن أن يعزى حصرياً إلى تأثير السماد.
انتشر استخدام منهج فيشر على نطاق واسع في القرن الماضي في مجالات مختلفة، أهمها مجال اختبار فعالية العقارات الطبية وأعراضها الجانبية. يتم هذا عبر اختيار عشوائي لمجموعتين من الأفراد الذين يعانون من مرض معين، وإعطاء إحداهما علاجاً معيناً (المجموعة المعاملة) والأخرى علاجاً وهمياً (مجموعة السيطرة). ويمكن أن يعزى الفارق بين التطور الصحي المتوسط للمجموعة المعاملة بالمقارنة مع مجموعة السيطرة إلى تأثير الدواء أو اللقاح الخاضع للاختبار.
من العلوم الطبيعية إلى العلوم الاجتماعية
انتقلت منهجية فيشر، التي باتت تطبق على نحو واسع في العلوم التجريبية، إلى أبحاث العلوم الاجتماعية (ودراسات اقتصاد التطوير بشكل خاص) منذ نحو عقدين من الزمن فقط، وحصلت على الاسم المميز: "التجارب العشوائية المتحكم بها". انتشر استخدام هذه المنهجية بشكل سريع. وتشير التقديرات إلى أن 20% من الدراسات التقييمية التي أجراها البنك الدولي خلال 2000-2010 كانت تتبع منهجية التجارب العشوائية المتحكم بها، لكن النسبة ارتفعت إلى 80% في السنوات الخمس اللاحقة.[1] حصلت المنهجية على مصادقة ودعم أكاديمي واحتفالي استثنائيين حين فاز ثلاثة اقتصاديين - ممن تبنوا هذه المنهجية وطوروها واستخدموها في أبحاثهم المتعددة - بجائزة نوبل للاقتصاد في العام 2019.[2]
مع انتشار تطبيق المنهجية، بات كل ما يتوجب على الباحثين فعله لتقييم سياسة أو تدخل ما، هو ضمان توفر الاختيار العشوائي لعيّنتين، وتعريض إحداهما للمحفز السياساتي المطلوب، ثم جمع المعلومات عن التباين في تطور العيّنتين. ويقوم الباحث في الخطوة اللاحقة بتحليل المعلومات، باستخدام التقنيات الإحصائية المتطورة، ثم استخلاص التوصيات.[3] أو أن يقارن الباحث سلوكاً معيناً تحت ظرفين مختلفين قائمين (مثلاً أن بعض الولايات الأمريكية تبيح الإجهاض وأخرى تحظره) وملاحقة الآثار التي يمكن أن يتركها هذا التباين على السلوك (على معدل الجريمة مثلاً، كما فعلت دراسة شهيرة وجدت أن هناك علاقة بين حظر الإجهاض وارتفاع الجرائم).[4]
سوف نلخّص هنا، من أجل توضيح أفضل لمنهجية التجارب العشوائية المتحكم بها، واحدة من أهم الدراسات التي فتحت الباب واسعاً أمام استخدام المنهجية لتقييم أثر السياسات التدخّلية في الدول النامية. شارك في وضع الدراسة مايكل كريمر، وهو واحد من الفائزين الثلاثة بجائزة نوبل.
تقييم أثر علاج ديدان البطن عند الأطفال
هدفت الدراسة إلى تقييم أثر معالجة ديدان البطن على تقليص فترات غياب التلاميذ عن المدارس، وزيادة تحصيلهم الدراسي في ريف كينيا.[5] تشير إحصاءات منظمة الصحة العالمية إلى أن نحو ربع سكان العالم يعانون من أمراض ديدان البطن، وأنها منتشرة بشكل خاص بين الأطفال في عمر المدارس في الدول الفقيرة. شملت الدراسة أكثر من 30 ألف تلميذ وتلميذة يدرسون في 75 مدرسة ابتدائية في مقاطعة قرب بحيرة فكتوريا، غرب كينيا. تم اختيار المدارس، وتقسيم التلاميذ إلى مجموعات، بطريقة عشوائية. وجرى توفير علاج دوري لدود البطن لبعض المجموعات دون مجموعات أخرى. وبعد 3 سنوات (1998-2001)، توصلت الدراسة عبر المقارنة بين متوسط أداء المجموعات المعالَجة وتلك التي لم يتم علاجها، إلى عدد من النتائج، أهمها:[6]
- أدى العلاج إلى تقليص أعراض المرض القوية والمتوسطة بنسبة لا تقل عن 31 نقطة مئوية لدى الأطفال المعالَجين، وتحسُّن نسبة أطوالهم إلى أعمارهم (مؤشر على تحسن التغذية)، مقارنة مع الأطفال غير المعالَجين.
- أن التعليم الصحي والإرشادات الصحية (بما فيها مراقبة النظافة، والتأكد من انتعال حذاء) كان لها أثر ضئيل جداً على التحسن الصحي الذي تحقق؛ أي أن التحسن جاء حصراً نتيجة العلاج الطبي.
- أدى علاج دود البطن إلى تقليص غياب التلاميذ، وارتفاع نسبة دوامهم في المدارس بمقدار 9.3 نقطة مئوية مقارنة بتلاميذ المدارس غير المعالَجة، لكن العلاج لم يترافق مع تحسن في الأداء التعليمي (درجات الامتحانات) للتلاميذ المعالَجين.
- ترافق علاج أطفال المدارس مع آثار إيجابية خارجية (Spillover) على الأطفال الآخرين الذين يعيشون على مسافة 3 كيلومترات من المدارس التي عولج تلاميذها، وذلك بسبب انخفاض العدوى في تلك المناطق. وقدرت الدراسة أن نسبة الإصابات المرضية انخفضت، والدوام المدرسي لتلاميذ المناطق المحيطة ارتفع. وتوصل البحث إلى أن نسبة الغياب الإجمالية في المدارس المعالجة تقلصت بمقدار الثلث بالمتوسط مقارنة مع المدارس غير المعالَجة.
- أن برنامج علاج دود البطن لدى تلاميذ المدارس الابتدائية فعال جداً من ناحية التكاليف، إذ إن إنفاق كل 100 دولار على العلاج ترافق مع زيادة 11.91 سنة تعليم للتلاميذ (نتيجة تقليص الغياب)، وهو ما يجعل هذا البرنامج أفضل من البدائل الأخرى من ناحية العائد على الاستثمار.
أفق جديد في دراسات تقييم السياسات
على الرغم من المراجعات النقدية الحادة التي ووجهت بها هذه الدراسة، فإنها كانت بمثابة فتح جديد. ليس فقط بسبب تبني الدول توصياتها عبر إطلاق حملات علاج وطنية لدود البطن (في كينيا ونيجيريا وفيتنام وعدد من ولايات الهند وغيرها)، ولكن أيضاً بسبب تنافس المنظمات الخيرية، الأهلية والدولية، على تمويل برامج محاربة الدود في الدول الفقيرة. وفر نشر الدراسة في واحدة من أهم المجلات الاقتصادية الأكاديمية شهادة اعتراف ساعدت على اعتماد المنهجية المستجدة وانتشار تطبيقها لاختبار التوصيات السياساتية ودعمها.
راجعت مجلة الإيكونومست الأبحاث التي نشرت (باللغة الإنكليزية) في المجلات الاقتصادية المتخصصة خلال الفترة 1990-2019 التي بلغ عددها نحو 910 آلاف دراسة، وتوصلت إلى أن نسبة الأبحاث التي تطرقت إلى دول في أفريقيا وآسيا (بما فيها دول الشرق الأوسط) ارتفعت من 17% في أول الفترة إلى 41% في آخرها.[7] وأرجعت المجلة أحد أسباب هذا الارتفاع إلى انتشار تطبيق منهجية التجارب العشوائية المتحكَّم بها، إذ أسبغ هذا المنهج على دراسات التنمية اعترافاً أكاديمياً بعد طول إهمال وتجاهل، وسمح بإجراء دراسات مكممة (ذات تحليلات ونتائج كمية) على اقتصاديات الدول الفقيرة، على الرغم من مشاكل غياب السلاسل الإحصائية الكاملة فيها.
لم يقتصر الأمر على التوسع الكمي، إذ امتدت استخدامات المنهج من تقييم التدخلات إلى مجالات متنوعة كثيرة، بدءاً من إصلاحات التعليم، وتحفيز دوام المعلمين وحضورهم، وتوفير القروض الصغيرة للفقراء، والاستعاضة عن مساعدات الغذاء العينية بالنقدية، واستخدام البطاقات الذكية في مخيمات اللجوء، وتوزيع فلاتر المياه وشبكات الحماية من البعوض، وانتهاء بالعوامل التي تؤثر في قرار الشبان القيام بالعمليات الانتحارية.[8]
يؤكد أنصار المنهج أن التوصيات التي تتولد من التجارب المتحكَّم بها تستند حصرياً إلى الوقائع المراقَبة، وأنها عملية وغير متناقضة وقابلة للتنفيذ. كما أن التجارب العشوائية هي تجارب شبه طبيعية تتولد عنها توصيات دقيقة وحذرة، ولا تتلوث بالأهواء السياسية والتوجهات الأيديولوجية المسبقة. بلغ تتويج المنهج ذروته مع الكلمات التي منحتها لجنة جائزة نوبل له: "إن منهج التجارب العشوائية المتحكم بها، الذي باتت له الآن سطوة تامة على اقتصاد التنمية، جعلته قادراً على تقديم حلول يمكن الركون إليها بشأن أفضل السبل لمحاربة الفقر".
أسباب سرعة انتشار المنهجية والنقد ضد المبالغة في فوائدها
يقف عدد من الأسباب وراء سرعة انتشار تطبيق المنهج، وترحيب هيئات مساعدات التنمية والتطوير به، من بينها التحيز العام تجاه النتائج والتوصيات ذات الطابع الكمي (مقارنة بالتوصيات التي لا تترافق مع حسابات رقمية وتحليلات كمية). يضاف إلى هذا إصرار الاقتصاديين على أن التوصيات السياساتية التي تتعلق بالاقتصاد الكلي (Macro) يجب أن تؤسس، وأن تجد تبريرها، على قاعدة الاقتصاد الجزئي (Micro)، أي على أرضية سلوك الفرد أو المنشأة في سعيهما لتعظيم المنفعة أو الأرباح على التوالي. أخيراً، هناك التحول الذي طرأ على تفضيلات الجهات المانحة للمساعدات وأولوياتها، لجهة التركيز على مشاريع صغيرة متعددة ترمي إلى إعطاء نتائج سريعة وظاهرة للعيان. ولجهة تمويل البرامج الهادفة إلى تصحيح سلوك الأفراد، والقضاء على العوائق التي تحول دون انطلاق المبادرات الفردية لتحسين ظروف الحياة، عوضاً عن تمويل مشاريع تأسيس البنى التحتية أو برامج مرتبطة بالسياسات الوطنية التنموية.
دار نقاش ساخن بين أنصار المنهجية الجديدة، وبين أولئك الذين يعتقدون أن التجارب العشوائية المتحكم بها لها فوائد في تطبيقات ومجالات معينة، لكنها لا ترقى إلى التعميمات المبالغ فيها التي يسبغها مشايعوها عليها، في المقابل، يقدّم المشككون بصلاحية المنهج الجديد، وبقدرته على توفير أدوات مثلى لتقييم سياسات محاربة الفقر، ثلاث حجج لدعم وجهة نظرهم:
- أن النتائج والتوصيات التي تتولد من التجارب العشوائية المتحكم بها تعاني من قصور في ما يتعلق بصحتها الخارجية والداخلية. فهي من الناحية الخارجية نتائج محلية إلى أبعد حدّ، ولا يمكن تعميمها إلى أي درجة، إذ إن نتائج تجربة ما في أحد أطراف الريف المغربي مثلاً، لا تصح بالضرورة في أرياف أخرى، لا بل يمكن ألا تتكرر حتى في طرف آخر من أطراف المغرب. أما من الناحية الداخلية، فغالباً ما يكون سلوك الأفراد في التجارب متنوعاً وغير متجانس، وتعبّر نتائج التجارب عن متوسطات للسلوك، وهي تغطي نطاقاً واسعاً من ردود الفعل التي تعكس مصالح متضاربة في معظم الأحيان.
- أن منهج التجارب العشوائية يهمل دور النظرية ويعتمد التجريب فقط. تلقي المنهجية بالتجارب وتترك النتائج تتحدث عن نفسها، تماماً كمن يلقي صنارة الصيد دون فكرة مسبقة عن أي شيء سيصطاد، فهي لا تعطي توجيهات شافية عن كيف يمكن محاربة الفقر، أو ضمان تحقق النمو المستدام، ثم إنها تخلق فجوة يصعب ردمها بين الاقتصاد الجزئي والاقتصاد الكلّي نظراً لأن التوصيات النابعة من التجارب المنفردة والمتعددة لا يمكن تأطيرها معاً بشكل ممنهج ومتماسك.
- أن الدول المتطورة أصبحت غنية نتيجة تحولات واسعة أثرت على مختلف مناحي الحياة، وليس نتيجة إجراءات محددة ذات طبيعة تكنوقراطية. إن قصص النجاح البارزة للحدّ من الفقر في القرن الماضي، كما في الصين، تحققت نتيجة التوسع في التجارة الدولية والإصلاح الراديكالي الشامل، وليس بسبب مجرد إجراءات محصورة لمعالجة دود البطن أو إصلاح التعليم مثلاً، ولا يستطيع منهج التجارب المقارن الإجابة عن الأسئلة الكبيرة، مثل: لماذا وكيف حصل هذا التطور العظيم؟
باختصار إذاً، لا شك في أن منهج التجارب العشوائية المتحكَّم بها حقق إنجازات أكاديمية وعملية مهمة في حقل اقتصاد التطوير، ومع ذلك يجب أيضاً الاعتراف بالمثالب التي يعاني منها المنهج، التي تترك حدوداً على صلاحية نتائجه، وتحدّ من فرص استخدامه في مجالات كثيرة.