منهجية مقترحة لإعادة التحقق من صدق وثبات الاختبارات النفسية
الدكتور : بوسالم عبد العزيز مدير مخبر القياس والدراسات النفسية
- جامعة البليدة2
ملخص : تهدف هذه المداخلة إلى تتبع واقع تطبيق الاختبارات النفسية غير المكيفة في الدراسات الأكاديمية المطبقة في البيئة الجزائرية من خلال تناول 82 مذكرة ماجستير وأطروحة دكتوراه (أنجزت في سبعة جامعات وطنية) في تخصصات علم النفس وعلوم التربية كمحاولة لمعرفة مدى موضوعية الإجراءات التي يقوم بها أصحاب الدراسات من خلال محاولتهم إعادة التحقق من صدق وثبات مختلف المقاييس والاختبارات التي طبقوها في دراساتهم بحجة النسبية الثقافية، (اختبارات أجنبية المنشأ واللغة والثقافة) وقد أشارت الدراسة التحليلية إلى أن جميع هذه الدراسات- باستثناء دراستين- توصلت تحاليلها الإحصائية إلى قبول قيم صدق وثبات هذه الاختبارات، وبالتالي تم تطبيقها كما هي وبدون أي تعديل، وكأن الافتراض النظري للنسبية الثقافية الذي بنيت عليه عملية إعادة التحقق من صلاحية الاختبارات افتراض غير سليم. بمعنى أن جميع الاختبارات يمكن أن تكون صالحة لجميع الثقافات، من حيث محتوى بنودها ومعايير تفسير نتائجها، وهذه مفارقة علمية تتضمن خللا نابعا من قصور في طرق إعادة التحقق من صدق وثبات هذه الاختبارات والمقاييس، بمعنى أن عملية التحقق غير سليمة وغير مناسبة لطبيعة السمات التي يقيسها الاختبار من جهة ولطبيعة المعطيات التي يفرزها التطبيق من جهة أخرى، مما يتطلب إعادة النظر في مفهوم إعادة التحقق من الخصائص السيكومترية للاختبارات التي تم بناءها في ثقافات مختلفة قبل إعادة تطبيقها في البيئة الجزائرية.
هذه الدراسة تقترح أساليب سيكومترية حديثة يمكن الاعتماد عليها لإعادة التحقق من خصائص أي اختبار قبل تطبيقه من دون التهافت على البعد الإحصائي المحض والثقة في نتائجه لتطبيق الاختبار والاقتناع بصلاحيته، كما تؤكد الدراسة على ضرورة الاستثمار في محاولات لتكييف عدد من الاختبارات على البيئة الجزائرية بدلا من هوس الأرقام التي تفضي إلى قيم مضللة لخصائص الاختبارات.
أهمية الدراسة وإشكاليتها:
من خلال الاطلاع على عدد من مذكرات الماجستير وأطروحات الدكتوراه تبين أن العديد من الباحثين يكتفون بالخصائص السيكومترية الواردة في الاختبارات وفق البيئات الأصلية التي بنيت فيها الاختبارات، أو العمل على استخراج دلالات صدق وثبات بطريقة كمية في شكل معاملات ثبات وصدق جديدة للاختبارات دون إجراء التعديلات التي تقتضيها عمليات التقنين لتتناسب والبيئة أو الثقافة الجديدة، ودون الأخذ بالاعتبار طبيعة السمة المقاسة وما يناسبها من دلالات صدق وثبات وخصائص الأفراد، ومدى توافق استخدام الدلالات في البيئتين الجديدة والأصلية الأمر الذي يستلزم التأمل قبل الثقة في النتائج الجديدة وتوظيفها لمختلف الأغراض؛ ومن هنا تظهر مشكلة الدراسة الحالية للوقوف على واقع دلالات الصدق والثبات المستخدمة في مذكرات الماجستير وأطروحات الدكتوراه عينة الدراسة . وبشكل أكثر تحديدًا فإن الدراسة الحالية تحاول الإجابة عن الأسئلة الآتية:
1 - ما هي الإجراءات التي يتبعها الباحثون لتقنين الاختبارات المستخدمة في رسائل الماجستير وأطروحات الدكتوراه عينة الدراسة.
2 - هل تختلف تكرارات استخدام دلالات صدق الاختبارات المقننة المستخدمة في رسائل الماجستير وأطروحات الدكتوراه عينة الدراسة.
3- هل يلتزم الباحثون بتبرير دواعي استخدامهم لأنواع معينة من الصدق والثبات لإعادة التحقق موضوعية الاختبارات التي يطبقونها في دراساتهم .
4- هل تختلف دلالات الثبات المستخدمة للتحقق من موضوعية الاختبارات عن تلك المستخدمة في الاختبارات الأصلية.
5- هل تتوافق أنواع دلالات صدق الاختبارات المقننة المستخدمة في مذكرات الماجستير وأطروحات الدكتوراه مع أنواع دلالات الصدق المستخدمة في البيئات الأصلية.
يعد القياس من القضايا الرئيسة التي تهتم بها العلوم الطبيعية، والعلوم السلوكية والإنسانية على حد سواء، وذلك لأن القياس يستند إلى الأساليب الكمية في التعبير الموضوعي الدقيق عن الظواهر المختلفة، وبدون ذلك يصبح العلم مقتصراً على الملاحظات الانطباعية العابرة، والتصنيف الكيفي والوصف اللفظي، والأحكام الذاتية.
فالدراسة الكمية للسلوك الإنساني تساعد في الدراسة العلمية له، وتقييمه تقييماً موضوعياً.وتكميم الفروق بين الأفراد والجماعات، وهذا يسهل فهم الظواهر السلوكية وتفسيرها، وتدقيق الاستنتاجات المستمدة من البيانات المتعلقة بها. وبذلك تسهم هذه الأساليب في تطوير منهجيات البحث، وطرق القياس وأدواته في العلوم السلوكية. (صلاح الدين علام، 2005،13)
فالنتائج التي توصلت إليها العلوم الطبيعية أو علوم المادة ومنه الخدمات الجليلة التي قدمتها للإنسانية، إنما متأتية من الدقة في عملية قياس مختلف الظواهر والسمات، كما أن الأدوات التي تستعملها إنما تمتاز بدرجات عالية من المصداقية، هذه الحقيقة دفعت المهتمين والباحثين في علم النفس إلى محاولة الوصول بالدراسات الإنسانية إلى درجة عالية من الموضوعية، هكذا بدأت المحاولات الأولى لقياس السلوك الإنساني مع دراسات وليام فونت في مخبره عندما سعى إلى الوصول إلى وضع قانون معمم لتفسير زمن الرجع عند الإنسان، لتستمر المحاولات لتكميم مختلف مظاهر شخصية الإنسان مرورا باختبار بنيه وسيمون لقياس الذكاء.
فجميع محاولات قياس السلوك البشري الإنسانية يمكن إدراجها في إطار السعي لتحقيق درجات من الموضوعية ترتقي بتفسير النتائج إلى درجة العلمية، لينصب الاهتمام على البحث عن أدوات بإمكانها أن تنقل الواقع كما هو، أي أدوات يمكن أن تقيس خصائص مثل الذكاء، الدافعية، التشاؤم، القلق النرجسية، الخوف، وغيرها بطريقة موضوعية، نظرا لأن القياس ليس غاية في حد ذاته بل هو وسيلة من أجل تحقيق غايات مختلفة تتعلق كلها بالأفراد والجماعات ولها بعد مصيري في كثير من الأحيان، أي أن مصير فرد ومستقبله قد يتقرر وفق نتائج مقياس أو اختبار معين، مما دفع الباحثين إلى التقصي عن أساليب علمية تسمح لهم بضمان درجات مقبولة من الموضوعية في أدواتهم، ومن هنا جاءت فكرة ضرورة توفر أدوات القياس على مستويات مقبولة من صفتي الصدق والثبات.
ونظرا لأهمية هاتين الخاصيتين في أدوات القياس بصفة عامة فسوف نحاول التذكير في البداية بالمعنى الصدق والثبات وفق النظرية الكلاسيكية ثم المفهوم الحديث للمفهومين، مع شرح الطرق التي يمكن أن يعتمدها الباحث في توفير درجات مقبولة من الخاصيتين، وهنا نركز على العديد من جوانب النقص والأخطاء المتكررة التي يقع فيها الباحثون وهم بصدد تقديم أدلة عن صدق وثبات أدواتهم، فنراهم يعتمدون كلية على البعد الكمي للصدق والثبات مع حرصهم على أن تكون هذه القيم مرتفعة ودالة، وفي الوقت نفسه يتغاضون عن مختلف الأبعاد التنظيرية للمفهومين.
يعتبر الصدق الصفة الأهم في أي أداة من أدوات القياس في كل العلوم السلوكية، وبدونه لا يمكن الاعتماد على نتائجها في اتخاذ أي قرار من القرارات الفردية أو الجماعية.
2-1- المفهوم الكلاسيكي لصدق الاختبار:
لقد شاع تعريف في مختلف المراجع والدراسات النفسية والتربوية يشير إلى أن معنى الصدق هو أن يقيس الاختبار فعلا القدرة أو السمة أو الاستعداد الذي وضع لقياسه، أي أن يقيس فعلا ما وضع لقياسه. فالمقياس الذي أعد لقياس سمة سيكولوجية (الدافعية مثلا) يكون مقياسا صادقا بمدى قدرته على قياس سمة الدافعية فعلا.(فيصل عباس، 1996)، ونتيجة لذلك سيطر هذا المعنى على أدبيات القياس وبناء الاختبارات من كتب ودراسات أكاديمية (بحوث الدكتوراه والماجستير، الدراسات المنشورة في المجلات العلمية المحكمة) هذه السيطرة استمرت في الكثير من البلدان وخاصة العربية منها على الرغم من التطور الذي عرفته نظريات القياس.
فالتعمق في دراسة هذا التعريف وربطه بمفهوم الصدق وفق النظرية الحديثة في القياس النفسي يبين أن التعريف ينطوي على نقص وقصور، بمعنى أن الاختبار يمكن أن يقيس السمة المراد قياسها ولكن لايتوفر على درجات مقبولة من الصدق، وعليه اقترحت الجمعية الأمريكية لعلم النفس (APA) إدخال بعد أخر للتعريف كمرحلة تاريخية أولى وهوقدرة الاختبار على تحقيق الغرض أو الهدف الذي وضع من أجله، بمعنى إدخال بعد التنبؤ كواحد من أهم أغراض عملية القياس في العلوم السلوكية. أي قدرة الاختبار على التنبؤ بأداء الأفراد في المستقبل، كأن نطبق اختبارا لقياس القدرة الميكانيكية ولكن الغرض من تطبيقه هو التنبؤ بمن يمكن أن ينجح مستقبلا في تخصص جامعي معين. فقد يكون الاختبار صادقا في قياس القدرة الميكانيكية للفرد ولكنه غير قادرا على التنبؤ بأدائه مستقبلا .
2-2- قراءة لنتائج الدراسة في ضوء المفهوم الحديث لصدق الاختبارات:
لقد كان لظهور نظرية الاستجابة لمفردات الاختبار دور بارزا في تطور النظرة إلى مختلف الخصائص السيكومترية للاختبارات النفسية وبالدرجة الأولى صفتي الثبات والصدق ويشير مفهوم الصدق وفق النظرية الحديثة للقياس إلى الاستدلالات الخاصة التي تخرج بها درجات الاختبار من حيث مناسبتها ومعناها وفائدتها. وتحقيق صدق الاختبار معناه تجميع الأدلة التي تؤيد هذه الاستدلالات، ولذلك يشير الصدق إلى مدى صلاحية استخدام درجات الاختبار في القيام بتفسيرات معينة، فإذا كان الاختبار يستخدم لوصف الدافعية فيجب أن تفسر الدرجات أو النتائج على أساس أنها تمثل الدافعية التي يقيسها الاختبار.
وقصد التحقق من مدى التزام الباحثين بالمفاهيم الجديدة للصدق أثناء إعادة التحقق من مستويات صدق الاختبارات التي يطبقونها في دراساتهم ويجدونها جاهزة ومبينة في بيئات غربية، قصد ذلك نعرض النتائج في الجدول التالي:
طبيعة القرار طبيعة الاختبار |
لصدق مقبول |
صدق غير مقبول |
المجموع |
صدق المحكمين |
42 |
00 |
42 |
صدق المحتوى |
22 |
00 |
22 |
صدق المحكات |
08 |
01 |
09 |
صدق المفهوم |
02 |
00 |
02 |
المجموع |
74 |
01 |
75 |
الجدول رقم (01): يبين طبيعة الاختبارات عينة الدراسة وطبيعة القرارات
بقبول أو رفض مستوى صدقها
من خلال الجدول الذي يبين أنواع الصدق التي أعتمد عليها الباحثون في دراساتهم -عينة البحث- البالغة 75 مذكرة وأطروحة، نلاحظ أن صدق المحكمين هو النوع الأكثر استعمالا بـ 42 مرة وقد أسفر على قبول مستوى صدق الاختبارات بنسبة 100% بالرغم من أن منطلق الباحثين هو افتراض أن هذه الاختبارات على اختلاف طبيعتها بنيت في بيئات غربية وقننت على عينات مختلفة من حيث الخصائص النفسية والاجتماعية والعقائدية، وعليه لجأ الباحثين إلى محاولة الإجابة على التساؤل، هل هذه الاختبارات صالحة للتطبيق على عينات جزائرية والأخذ بالنتائج وتفسيرها علميا لفهم السلوك وتقديم خدمات اجتماعية.
ومن خلال الجدول نجد أن 74 اختبارا كانت نتائج التحقق من مستوى صدقها تشير إلى ارتفاع مستواه وقبوله من طرف الباحث، مقابل حالة واحدة فقط توصل فيها الباحث إلى انخفاض مستوى صدق اختباره وهو اختبار ذكاء وأستعمل معه الباحث صدق المفهوم وتوصل إلى انخفاض معامل ارتباط ثلاثة بنود بالدرجة الكلية على الاختبار، فقام الباحث بتعديل محتوى البنود من المحتوى وأعاد التحقق من صدقها وتوصل إلى ارتفاع مستواه.
ولما كانت هناك علاقة بين نوع الصدق المعتمد للتحقق من صلاحية الاختبار وطبيعة السمة التي يقيسها، فقد رصدنا في المرحلة الثانية من الدراسة نوع الصدق و طبيعة أو نوع الاختبار المطبق .
نوع الصدق
طبيعة الاختبار |
المحكمين |
المحتوى |
المحكات |
المفهوم |
الذاتي |
المجموع |
شخصية |
13 |
07 |
04 |
02 |
02 |
28 |
مهني |
06 |
05 |
03 |
00 |
05 |
19 |
ميول واتجاهات |
05 |
03 |
00 |
01 |
06 |
15 |
قدرات خاصة |
04 |
04 |
03 |
00 |
03 |
14 |
ذكاء |
03 |
00 |
00 |
01 |
02 |
06 |
المجموع |
31 |
19 |
10 |
04 |
18 |
82 |
الجدول رقم (02) : طبيعة الاختبارات عينة الدراسة والنوع المستعمل لإعادة التحقق من الصدق
قبل البدء في تحليل النتائج الواردة في الجدول نشير إلى وجود خلط من طرف الباحثين في التسميات فيما يتعلق بصدق المحكمين، فأغلب الباحثين يعرض الاختبار على مجموعة من الخبراء ويسمي نوع الصدق بصدق المحكمين، وفي الحقيقة لا يوجد نوع من الصدق إسمه المحكمين فهو صدق المحتوى عن طريق المحكمين،
فعندما نقول صدق المحكمين فهل المحكم هو الذي صادق أم جانب محدد من جوانب الاختبار، إنه محتوى الاختبار وقياسه لما أعد أن يقيسه.وعلى الرغم من ذلك سوف نصنف الواحد الواحد في الحقيقة(صدق المحتوى) حسب التسمية التي أطلقها صاحب الدراية.
يتبين من الجدول أعلاه أن نوع الصدق الأكثر استعمالا من طرف الباحثين عينة الدراسة هو صدق المحتوى بتكرار 42 مرة أي بنسبة 56% من المجموع الكلي، هذا النوع أستعمل من طرف الباحثين بغض النظر عن طبيعة السمة التي يقيسها الاختبار، أي أن اللجوء إلى المحكمين أو الخبراء كما يسميهم البعض كان في جميع أنواع الاختبارات بغض النظر عن مدى ملائمة هذه الطريقة وكفايتها للتحقق من صلاحية الاختبار، ويأتي في الرتبة الثانية صدق المحتوى بمجموع 21 مرة أي بنسبة 28%، مع العلم أننا صنفنا هذا النوع حسب تسمية الباحث في الدراسة على الرغم من التداخل بين هذا النوع من الصدق وصدق المحكمين الذي يمكن اعتباره صدق محكمين في الوقت نفسه لأن ما يطلب من المحكم هو تقييم مدى قياس بنود الاختبار للسمة أو مؤشرات السمة المراد قياسها،و بالتالي فالهدف واحد وتسمية الأولى بصدق المحكمين هي في الحقيقة طريقة للتحقق من صدق محتوى الاختبار.
كما أستعمل بعض الباحثين صدق المحكات لإعادة التحقق من درجة صدق اختباراتهم بتكرار 09 مرات وبنسبة 12%، وأخيرا صدق المفهوم بتكرار 03 مرات 04%وهي أصغر نسبة، أي اقل أنواع الصدق استعمالا هي صدق المفهوم أو صدق الصدق العاملي الذي أصبح يعد أهم أنواع الصدق وأكثرها دقة ومناسبة لبعض أنواع الاختبارات.
من خلال هذه النتائج التي اعتمدت أنواع متعددة للصدق نقول أن الصدق أصبح ينظر إليه حسب (صلاح الدين علام،2009) إلى أنه مفهوما واحدا وخاصية واحدة للاختبار، وما أصطلح على تسميته بأنواع الصدق في بعض المراجع والاستعمالات المختلفة هي في الحقيقة إشارة إلى مؤشرات وطرائق لجمع الأدلة عن الصدق وليست نوع من أنواع الصدق، لذلك كلما كان الاختبار يحمل أكثر من مؤشر للصدق زادت ثقة الباحث فيه لقياس ما أعد لقياسه (Jenkins , 1978 : 93).
وبما أن الصدق يقدر من خلال استجابات الأفراد عند تطبيق الاختبار. لذا يكون موقفياً فهو يتأثر بالعوامل المؤثرة في عملية القياس في حد ذاتها. فإذا كانت درجة صدق الاختبار مرتفعة في موقف معين فإنه قد لايكون كذلك في موقفا آخر، فضلا عن انه محدد بطبيعة السلوك الذي يمثل الخاصية أو السمة المراد قياسها، بمعنى أننا عندما نقول بارتفاع درجة صدق اختبار معين في قياسه لسمة التفاؤل، فهو صالح لهذه السمة دون غيرها ولأفراد معينين لهم خصائص معلومة دون غيرهم.
كما أصبح البعد القيمي الاجتماعي لصدق الأدوات يشكل جزءا لايتجزأ من مفهوم الصدق،.ولذلك أضيف بعد جديد للصدق(دليل أو مؤشر جديد) يتمثل في المآل أو الغرض الاجتماعي لعملية القياس.
وقد أشارت جمعية علم النفس الأمريكية،(1985،APA(إلى أن السعي لتحقيق صدق الاختبار هو في الحقيقة عملية تجميع للأدلة التي نستدل بها على قدرة الاختبار على قياس ما اعد لقياسه، وقد حددت ثلاثة مؤشرات رئيسة لصدق المقاييس والاختبارات النفسية، هي صدق المحتوى، صدق المحك(التلازمي والتنبؤي) وصدق التكوين الفرضي أو المفهوم (APA ,1985 , 9).
2-3- صلاحية الاختبارات النفسية صفة كيفية وليست كمية:
كما سبقت الإشارة إليه فإن الدراسة توصلت إلى قبول الباحثين لمستويات صدق الاختبارات التي أعادوا التحقق من صدقها على الرغم من كونها اختبارات مبنية في بيئات غربية وعلى أفراد يفترض أنهم يختلفون في قيمهم وعاداتهم، وهذا ينطبق على الرأي الذي يشير إلى أن صدق الاختبارات النفسية صفة تتعلق بنتائج الاختبار وقدرتها على تقديم تفسير موضوعي لأداء الفرد على الاختبار، بمعنى أن الاهتمام يركز على التفسيرات التي تأخذها النتائج بالنسبة لعينة من الأفراد، وللوصل إلى درجة مقبولة من الصدق على الباحث أن يقدم مجموعة من الأدلة البعض منها نظري والأخر تجريبي إحصائي للقول بأن اختباره صالح لقياس السمة عند مجموعة من الأفراد خصائصهم معروفة ومحددة مسبقا.
وهنا نشير إلى أن ثبات الاختبار أصبح ينظر إليه وفق المفهوم الحديث للصدق على أنه دليل من أدلة صلاحية الاختبار وليس خاصية معزولة تحسب بصفة انفرادية، فمن خصائص الاختبار الصالح توفره على درجة من الثبات، فلا يمكن للباحث أن يجزم بصدق اختباره إذا لم يدلل على أن اختباره على درجة مقبولة من الثبات.
فالتوجه الحديث ينظر إلى الصدق على أنه يرتبك بمعنى الاختبار وتفسير النتائج، أي التركيز على صدق التكوين الفرضي للاختبار واعتبار الأنواع الأخرى جوانب متضمنة في صدق البناء، وقد تطور هذا التوجه من خلال كتابات كرونباك وميسيك(Messick ,Cronbach ,) حيث تم وصف الصدق بأنه نوع واحد فقط وهو صدق التكوين الفرضي.
كما أشار ابيل (Ebel) إلى أن الاختبار حين يتضمن أفضل التعاريف الإجرائية ، فإننا ليسنا بحاجة لبحث الصدق في هذه الحالة، فقيام الباحث بصياغة أهداف الاختبار بطريقة صريحة ودقيقة يعد دليلا على صدق الاختبار، إذ أن الأهداف الدقيقة والصريحة تدل على ما يقيسه الاختبار، فإن كان ذلك ما يريد الباحث قياسه فالاختبار صالح لذلك الاستخدام.
ويري منسيك (أحد منظري نظرية الصدق الحديثة) أن صدق المحتوى يقدم شواهد حكيمة عن انتماء الاختبار لمحتوى معين، فصدق المحتوى يركز على انتماء الاختبار لمحتوى ومدى تمثيله له إلا أنه لايقدم لنا ذلك دليلا ولا معلومات عن قدرة درجات الاختبار على تفسير أداء الأفراد.
فالاكتفاء بما يسمى صدق محتوى الاختبار يجعله يقتصر على الحكم على بنود الاختبار وليس على السلوكات التي تستثيرها هذه البنود، ويؤكد منسك أن " صدق المحتوى ينبغي ألا ينظر إليه على أنه خاصية في الاختبار ولكن يمكن اعتباره خاصية ترتبط بعلاقة الاختبار بالسمة المراد قياسها، فصدق المحتوى لايعد صدقا على الإطلاق بل مرحلة من مراحل بناء الاختبار.
فالرؤية الحديثة تنظر إلى صدق المحتوى ضمن إطار متكامل مرتكزا على شواهد أو أدلة صدق التكوين الفرضي، فصدق المحتوى والصدق التلازمي أو التنبؤي هي مجرد حالات خاصة أساسا بوضعيات معينة، بينما صدق التكوين الفرضي يعد الصدق الشامل من وجهة نظر حديثة،وعليه فإن أي دراسة لصدق اختبار من الاختبارات لا يتضمن صدق تكوينه الفرضي تعد عملية ناقصة.
فالمشكلة الأساسية التي تواجه القائمين ببناء الاختبارات هي كيفية صياغة قواعد يمكن الاسترشاد بها في تكوين المواصفات التي تحدد النطاق السلوكي لبنود الاختبار، والحقيقة أن صدق الاختبار يرتبط بمفهوم إمكانية التعميم الذي أشار إليه (1972، كرنباك Cronbach).وبذلك نستطيع تحديد النطاق السلوكي الذي يتميز بإمكانية تعميم أداء الأفراد على النطاقات السلوكية الأخرى. ويصعب إجراء هذه الطريقة عمليا لما تتطلبه من جهد ووقت كبي، حيث يرى (1978هامبلتون Hamilton) أن صدق التكوين الفرضي الذي نهتم فيه بصدق تفسير درجات الاختبار هو ما يجب أن توجه إليه الأبحاث المستقبلية في القياس النفسي (علام،1986).
نستخلص مما سبق أن تقدير المحكمين لصدق محتوى اختبار معين يركز على خواص مرتبطة بالاختبار وليس باستخدامه أو تفسير نتائجه وعلى اعتبار الصدق صفة ترتبط باستخدام درجات الاختبار من أجل اتخاذ قرارات معينة، فإن تقرير المحكمين لايعد دراسة جادة وكافية للتحقق من صدق الاختبار النفسي، ويبدو الأمر أكثر غموضا عندما نعتمد على صدق المحكمين لاختبارات تقيس سمات لاترتبط بمحتوى معين أي محتوى افتراضي، مثل قياس الاتجاهات والميول والدوافع والرغبات وصورة الذات والكثير من أبعاد الشخصية الأخرى، حيث لايمكن الحديث عن محتوى محدد، حيث تكون بنود الاختبار عبارة عن مؤشرات للسمة وليست عينة ممثلة لها.
فالتحكيم ينحصر دوره في الحكم على الجانب اللغوي ومحتوى الاختبار، أي الحكم على صياغة البنود ومدى قياسها لأهداف معينة، إلا أن هذا الحكم لا يرتبط بصلاحية البند نظرا لعدم قدرة التحكيم(الخبراء) على الغوض في جوانب مرتبطة بصدق البنود، لكون صدق البنود يرتبط بتفسير درجة الفرد على هذا البنود وليس سلامة البند لغويا أو ملائمته لمستوى المفحوص أو راي الخبير على أنه يقيس فعلا ما أعد لقياسه.
في إطار أهداف الدراسة فقد رصدنا أنواع الثبات التي أعتمدها الباحثين لإعادة التحقق من مستويات ثبات إختباراتهم، هذا التناول كان في إطار محاولة لتجاوز المقاربة النظرية للثبات وللمفهوم السائد والذي يعرّف الثبات على أنه قدرة الاختبار على تقديم النتائج نفسها أو نتائج متقاربة كلما أعيد تطبيقه على الافراد انفسهم وفي ظروف متشابهة.وبالتعمق في دراسة مفهوم الثبات يتبين أن هذا التعريف ناقص حسب ما يشير إليه بعض الباحثين منهم تيغزى محمد (2010) وصلاح الدين محمود علام (2000) فهو تعريفا يشير إلى نوع واحد فقط من الثباتوهو ثبات التجانس عبر الزمن، في حين همشت الأنواع الثلاثة الأخرى وهي ثبات التكافؤ وثبات التجزئة النصفية والإتساق الداخلي.
إن هذا النوع من الثبات يهدف في الدرجة الأولى إلى التحكم في أخطاء القياس العشوائية الناتجة بالأساس عن عدم إستقرار السمة المقاسة عبر الزمن، أو تللك الاخطاء التي مصدرها عامل الزمن بين التطبيقين الأول والثاني، في حين أن هذا النوع من الثباتلايستطيع تقدير أخطاء القياس الناتجة عن إفتقار الاختبار للتكافؤ(الصور المتكافئة)، أو تللك الأخطاء الناتجة عن نقص اتساق الاختبار(التجزئة النصفية والتجانس الداخلي) وبالتالي فالتعريف السابق يشير على طريقة واحدة ااتحقق من الثبات.
ومنه فالتعريف الأقرب إلى المعنى الدقيق لثبات الاختبار هو درجة إتساق ودقة درجاته، وهو ما أشارت إليه أناستازي ((Anastasi حين قولها أن الثبات يدل على مدى دلالة تباين درجات الأفراد الذين أجري عليهم الاختبار على الفروق الحقيقية في السمة المقاسة وليس الفروق الناتجة عن أخطاء القياس، وهي إشارة إلى إتساق درجات الاختبار، حيث يمكن تفسير التباين بإرجاعه إلى قدرات الأفراد وليس لعامل الصدفة وأخطاء القياس.
ومن المعلوم أن تباين الدرجات الكلية للمقياس (بالمقارنة مع مجموع تباين البنود) وطول الاختبار أو عدد بنوده، يمارسان تأثيرا قويا في قيم معاملات الثبات، ومن معاني ذلك أن العينة المطبق عليها ينبغي أن تكون غير متجانسة في السمة المقاسة، وبالتالي فإن بعض طرق حساب الثبات مؤشرا غير نقيا لإتساق بنود الاختبار في هذه الحالة.
هذه الحالة دفعت بعض علماء القياس أمثال مسيك وكرونباك وأناستازي إلى القول بضروة أن يشير الباحث عند تطبيقه لأي اختبار إلى مصدر الخطأ الذي تحكم فيه عند إختياره لطريقة دون أخرى من طرق حساب الثبات، مع تقديم التيبرير العلمي لهذا الاختيار.
في ظل هذا التجاذب حول مفهوم الثبات وأبعاده، ظهرت نظرية الاستجابة لبنود الاختبار(IRT) والتي قدمت مفهوما جديدا للثبات يدعى (دالة المعلومة) والتي نحصل عليها من تطبيق بند أو اختبار معين، هذه المعلومة تشير إلى مقدار الثقة في أننا حصلنا على معطيات تقودنا إلى تقدير قدرة فرد معين أو مجموعة من الأفراد في مستوى واحد من القدرة، أي أن كمية المعلومة نحصل عليها عند كل مستوى قدرة على طول تدرج القدرة، أو بمعنى آخر أننا نحصل على قيم متعددة لكمية المعلومات التي حصلنا عليها من الاختبار، إذا هي تختلف عن الثبات الذي هو عبارة عن مؤشر واحد فقط للاختبار لكل الأفراد الذين طبق عليهم.وتمثل دالة المعلومة عادة بمنحنى يبين أعلى وأقل درجة للسمة حصلنا عليها عند المستويات المختلفة.
وتختلف دالة المعلومة كمؤشر للثبات ما بين النظريتين التقليدية والحديثة في كون الثبات يعتمد على الاختبار ككل والمجموعة التي طبق عليها، ولهذا يكون تعميمه غير ممكنا.أما دالة المعلومة فهي تعتمد فقط على مقياس السمة وعلى منحنى استجابة البند، كذلك فإن الثبات مؤشرا للخطأ المعياري في القياس وهذا المؤشر ثابت على جميع مستويات الدرجة الحقيقية، بينما دالة المعلومة مؤشرا للخطأ المعياري في التقدير وهذا الخطأ يحسب عند كل مستوى من مستويات السمة المقاسة، مما يجعلنا نتعرف على دقة تقدير قدرة الفرد على كل مستوى من مستوياتها المختلفة وليس من خلال درجة كلية واحدة.
من خلال هذا المعنى الحديث لثبات الاختبار يمكننا رصد ما يجب على الباحث القيام به حتى يستدل على ثبات اختباره.
3-1- أبعاد همشتها الدراسات عند إعادة التحقق من ثبات الاختبارات:
إن إعادة التحقق من ثبات إختبار معين سبق لباحثين أخرين تقديره وفي أغلب الحالات هو صاحب الاختبار، هذه العملية تحتاح غلى تمعنا في الاختبار في حد ذاته مع مرعاة مجموعة من المعايير.
أ-الافتراضات النظرية:
لما كانت كل طريقة من طرق معامل الثبات تنطوي على مجموعة من الافتراضات النظرية تتعلق بطبيعة المعطيات من جهة وخصائص العينة وظروف التطبيق من جهة أخرى، فعلى الباحث ألا يهمل هذه الافتراضات وألا يكتفي فقط كما هو معمول به في الغالبية العظمى من الدراسات والبحوث بذكر نوع الثبات والقيمة العددية له، فمعامل ثبات التجزئة النصفية تتطلب إفترضات صارمة قلما أنتبه الباحثين لها ونادرا ما حاولوا التحقق منها عمليا، وهي التوازي ما بين درجات النصفين، والتساوي التام في قيم تباين خطأ القياس التي تنطوي عليها الدرجات وفي حالة عدم تحقق الوازي فإن الاعتماد على معدالة سبرمان- براون لتصحيح معامل ارتباط درجات النصفين يؤدي إلى تقديرمتحيز وغير دقيق لمعامل الثبات. وبالتالي قيمة الاختبار تصبح محل شكحسب كل من(Spearman- Brown) صاحبا المعادلة، وهو الافتراض الذي يتغاضى عنه الغالبية العظمى من الباحثين ويكتفون بتقديم قيمة واحدة تشير إلى معامل الثبات.
ب- طبيعة السمة أو الخاصية المقاسة :
إن طبيعة السمة أو الخاصية التي يتعامل معها الباحث من حيث كونها أحادية البعد أو متعددة الأبعاد، ومستوى قياسها(تصنيفي، رتبي، مسافات متساوية) وما ينتج من طبيعة القيم العددية المتحصل عليها، كل هذا له علاقة مباشرة بنوع معامل الثبات الذي يختاره الباحث، فطريقة التجزئة النصفية تقدم قيما مزيفة وغير دقيقة مع الاختبارات التي تقيس سمات متعددة الأبعاد، كما أن ثبات التجانس الداخلي وفق معادلة ألفا أو كيودر رتشردسون يتطلب كل منها معطيات مختلفة يتطلب من الباحث معرفتها والإشارة غليها عند التحقق من ثبات اختباره وفق إحدى هاتين الطريقتين.
ج- مصدر الخطأ :
من المعروف أن مختلف طرق التحقق من الثبات هي في الأصل طرق للتقليل من أخطاء القياس التي تعود إلى مصادر مختلفة، وعليه فإن اختيار طريقة دون أخرى تنطوي على تقدير من الباحث لمصادر الخطأ التي يتوقع أن لها تأثير على درجات إختباره في ظروف وخصوصية تختلف من دراسة إلى أخرى ومن عينة على أخرى، وهنا يمكن للباحث أن يعتمد على أكثر من طريقة لتقدير ثبات الاختبار، ولكن بشرط أن يقدم التبريرات العلمية والعملية التي جعلته يختار التحكم في مصدر معين للخطأ دون الأخر.
فلكي يساهم كل بند بجانب جديد من المعلومات، فإن إثراء المفهوم أو السمة موضوع القياس عملية متسقة تتخذ منحنى منتظما وغير عشوائي ولذلك تساهم في الرفع من التباين المنتظم أو المتسق الذي يفترض فيه أنه يعكس السمة المقاسة أو جوانب منها، والخطأ العشوائي يختلف عن الخطأ المنتظم لأنها لاترتبط بالمفهوم النظري للسمة أو المحتوى الدلالي للمفهوم وإنما ترتبط بمصادر خارجية تتعلق بظروف تطبيق الاختبار وهو مصدرالخطأ.
ء- تفسير معامل الثبات نظريا :
مما سبق تبين أن التحقق من ثبات الاختبار عملية معقدة ومركبة تتطلب من الباحث أن يقدر أبعاد مختلفة، بداية من الافترضات التي تقوم عليها كل طريقةمرورا بطبيعة السمة المقاسة ووصولا إلى مصادر الخطأ التي قدر الباحث ضرورة التحكم فيها، هذه المراحل التنظيرية بالدرجة الأولى تحتاج إلى تقديم الباحث لقيمة عددية تشير إلى مقدار ثبات الاختبار من خلال مختلف المعادلات
خلاصة النتائج:
من خلال هذه الدراسة والتي هدفت إلى معرفة الأساليب التي يستعملها الباحثون في عينة من دراسات الماجستير والدكتوراه من أجل إعادة التحقق من صدق وثبات اختباراتهم، أي الاختبارات التي يجدونها جاهزة وينقلونها كما هي بدون تعديل ويحاولون إعادة التحقق من صلاحيتها للتطبيق على عينة من الأفراد في البيئة الجزائرية التي يفترض أنها تختلف كلية عن البيئات التي طبقت فيها هذه الاختبارات.
وقد توصلت الدراسة إلى أن الباحثين قاموا بإعادة التحقق من الصدق والثبات بطرق غير مناسبة تماما لطبيعة السمات التي يقيسها ، كما أنهم لم يقدموا التبرير العلمي لاختيارهم أنواع معينة من الصدق والثبات دون الأنواع الأخرى، هذا الإخلال بالمنطق العلمي وتهميش الأبعاد والمقاربات الحديثة لكل من الصدق والثبات نتج عنه قبول هذه الاختبارات، والسبب أن هذا الإجراء تحول إلى عمل روتيني كمي أو تقني محض الهدف منه هو أن يقول الباحث أنه أعاد التحقق من الصدق والثبات ووجدهما على درجات مقبولة وبالتالي يمكن الثقة في النتائج المتوصل إليها، وهذه مفارقة علمية غير مقبولة وغير منطقية، فكيف أن كل الاختبارات بمختلف أنواعها كانت مستويات صدقها وثباتها مقبولة فهذا يعني أن كل الاختبارات النفسية هي اختبارات عابرة للثقافات بمعنى أنها لا تتأثر بالعامل الثقافي، وأم المفاهيم النفسية مثل القلق والدافعية والاغتراب والتفاؤل والتشاؤم والذكاء والابتكار و أساليب التفكير وغيرها من السمات لها المعنى نفسه في مختلف الثقافات وضمن مختلف العقائد.
ومنه نقول أن النظرة القاصرة لمفهومي الصدق والثبات والمبنية على البعد الكمي المحض هي التي جعلت الباحثين يصلون إلى قبول مستويات الصدق والثبات بالرغم من اختلاف البيئات، مما يدفعنا إلى القول بضرورة إعادة النظر في طريقة التحقق من الصدق والثبات واعتبارهما مفهومين مشبعين بالقيم الاجتماعية ولهما مألات وتفسيرات ترتبط بالثقافة التي طبق فيها الاختبار.
المراجع :
أكاديـمـيـا جلـــــوب
طريقك لمستقبل أكاديمى واعد
معلومات الاتصال
تواصل مع اكاديميا جلوب من خلال مواقع التواصل الاجتماعى او ارسل لنا بريد الالكترونى لتستقبل كل جديد
طرق الدفع
تابعنا على تويتر