Lakhasly

Online English Summarizer tool, free and accurate!

Summarize result (50%)

الفرق بين الملاحظات البنائية والتقويم التجميعي وتركز على تحديد نقاط الضعف في تعلم الطالب لمساعدته على تحسينها، في حين أن التقويم التجميعي يهدف إلى تقديم تقييم شامل للأداء الكلي بعد فترة معينة. الأول موجه لتحسين التعلم الفردي والتحديد الدقيق للنقاط التي تحتاج للتحسين، بينما الثاني يهدف إلى تقديم تقييم عام وشامل لأداء الطالب. مثال توضيحي: مادة (الرياضيات) الحساب الغرض من التقويم التجميعي هو تحديد قدرة وسرعة الطالب على ترجمة المسائل اللفظية إلى حلول كمية عند إجراء القسمة. وأيضًا تحديد مستوى الطلاب وتقديم تقرير لأولياء الأمور والهيئة الإدارية. أو عدم كفاية المفردات اللغوية. يمكن للمعلم الدمج بين التقويم التجميعي والتقويم البنائي في اختبار واحد، لذا فالتوقيت يلعب دورًا أيضًا حيث تجرى الاختبارات البنائية بشكل متكرر خلال فترات أقصر مقارنة بالتجميعية. فالتقويم البنائي يُستخدم لتحسين تعلم التلميذ بعد تعليم مهارة جديدة، فالاختبارات القصيرة التي تُعطى في نهاية الوحدات التعليمية القصيرة تميل لأن تكون بنائية بطبيعتها. ومن الفروق بين التقويم التجميعي والبنائي هو مستوى التعميم، حيث يقوم مبدأ تايلور بالتركيز على التوصيفات السلوكية المرغوبة (كما ورد ذكره في الفصل الثاني)، بينما جانيه ركز على التفاصيل الأولية للمقدرات. فالتقويم البنائي يلاحظ المتطلبات الأولية للعمل، خطوات عامة في بناء الاختبارات بالرغم من أن تفاصيل تكوين هذه الجداول تم شرحها في مواضع أخرى، القاعدة الرئيسية هي النظر إلى مجال المحتوى من منظور الموضوعات الكبيرة للمادة، مثال ذلك أنه في مادة العلوم يمكن استخدام الأبعاد المتجانسة في منهج العلوم البيولوجية، أو تقسيم المادة إلى أنظمة فسيولوجية ووظائف بيولوجية وعلم الحيوان. 2- بناء مفردات ومصطلحات للاختبار التي تتناسب مع الجدول الذي تم بناءه. 3- اختيار عينات مناسبة للاختبارات. سواء من المحتوى أو السلوكيات المعقدة. يتعين على المعلم تحديد الخلايا المهمة لعينته بناءً على أهدافه، سواء كانت عينة عشوائية لكل المفردات أو عينات تركز على أهداف محددة. هذا يساعد في وضع الطلاب في مستويات مناسبة أو منحهم شهادات بناءً على السلوكيات النهائية المطلوبة. 4-تدور حول تجميع المفردات في الاختبارات بناءً على خطة منظمة. يُفضل ترتيبها من السهل إلى الصعب. من المفيد أيضًا تجميع أنواع المفردات المختلفة مثل الاختيار من متعدد والمزاوجة وصواب أو خطأ حسب النوع لتسهيل إعطاء التعليمات للمعلم والتلميذ. 5- ضع خطة لإعطاء الدرجات بحيث تقدم معلومات مفيدة لأغراض الاختبار. يمكن جمع الدرجات الفردية للحصول على تقييم شامل لمهارات أو قدرات محددة. من أجل التغذية الراجعة، النظام يجب أن يسمح بمقارنة مخرجات مجموعات أو معالجات مختلفة ويعكس الفروق في القدرات والمعارف. التعليمات يجب أن تحدد الوقت المخصص للاختبار وأجزاءه، استخدامات الاختبار وبناءه: الاختبار التجميعي يمكن أن يخدم وظائف متنوعة، وأنه عند بناء وتصحيح الاختبارات بشكل صحيح، يجب تحديد الأهداف المقصودة قبل بناء الاختبار لضمان استفادة أكبر من النتائج. لا يمكن تطبيق مخرجات الاختبار بنفس الطريقة في جميع الاستخدامات والمجالات. - ومقارنة مخرجات مجموعات مختلفة.
وذلك من المدرسة الابتدائية إلى مرحلة ما بعد التخرج. الهدف هو تصنيف التلاميذ حسب مستوى تعلمهم مقارنة ببقية التلاميذ. لتحقيق انتشار فعّال، صعوبة المفردة تتعلق بنسبة الطلاب الذين يجيبون عليها بشكل صحيح، لتحقيق توزيع عادل، ولتعيين المستويات بشكل فعال، يجب تجريب كل اختبار على تلاميذ مماثلين قبل استخدامه. إذا كان ذلك غير عملي، يمكن أيضاً تجميع مفردات الاختبار ببطء لضمان توازنها في الصعوبة والتمييز. إن التربية الموجهة نحو التمكن تتطلب تغيير في الوقت ومنهجية التعليم لتحقيق هذا الهدف. في هذه الحالة، قد يشير ذلك إلى خلل في منهجية التعليم. مع تحسين التعليم، هذا هو الرأي الذي يتبناه التقويم البنائي. يجب الانتباه إلى بناء خطوات معينة مثل الخطوات 3، و5، كما هو موضح في جدول مواصفات العلوم البيولوجية للمرحلة الثانوية. من المهم تحسين المفردات وترتيبها من السهل إلى الصعب. ومع ذلك، لتوضيح النقطة بشكل أفضل، تم عرض مثال على معلم قرر أن يركز الامتحان التجميعي في نهاية المقرر على استخدام المهارات في فهم مشكلات العلوم وعرض العلاقات بين تراكيب المعرفة، مع التركيز على محاور رئيسية مثل التطور والتكامل الحيوي والبيئي. ولمنح الشهادات. الدرجات المتعددة تعطي معنى أكبر مقارنة بالدرجة الواحدة. والمعيار القائم على الآراء. بينما تعتمد المعايير المقدرة على توقعات الخبراء. المستويات القائمة على تحليل المهمة أو أفكار التمكن تركز على الأداءات المطلوبة لنجاح الطالب في مهام معينة. إجازة المهارات والقدرات أو المهارات الرياضية للإحصاء التربوي، أو مهارات معمل العلوم. في هذه المواقف، ويمكن أن تكون الأحكام الذاتية للخبراء بديلاً حتى تتوفر الأدلة التجريبية. أهمية استخدام الاختبارات التجميعية لتنبؤ نجاح الطلاب في المقررات اللاحقة. يؤكد على أن تصميم هذه الاختبارات يتطلب استشارة متخصصين تقنيين، لكن يجب على المدرس تحديد أهداف الامتحانات. يوضح النص أن الاختبارات التجميعية في نهاية المقرر يمكن أن تتنبأ بالنجاح في المقررات ذات الصلة، بشرط وجود دليل على العلاقة بين الأداء في الاختبار والمقرر اللاحق. لكن هناك عوامل عديدة غير معروفة تساهم في هذه العلاقة. نقطة البداية في تدريس مقرر لاحق أهمية الاختبارات التجميعية التي تُعطى في نهاية العام الدراسي في تحديد مستوى الطلاب لبداية تدريس المقرر التالي، التغذية المرتجعة للتلاميذ يجب أن تكون الاختبارات مبنية بشكل جيد لتوجيه التلميذ نحو تحسين نواحي النقص. من المهم أن تكون مفردات الاختبار دقيقة وتعكس جوانب متنوعة من المحتوى والسلوك. التغذية المرتجعة تكون أكثر فعالية عندما يتم استخدامها لتحسين عملية التعلم والتدريس بشكل مستمر. الهدف هو تقويم طرق مختلفة أو مواد أو أنواع مختلفة من التلاميذ. لتحقيق تفسيرات مفيدة، إذا كان الغرض هو مقارنة المخرجات، يمكن تقسيم الفصل إلى عينات متعددة وإجراء اختبارات منفصلة لكل منها، والتي تغطي خلايا السلوك والمحتوى كما هو مبين في الجدولين 4-1 و4-2. في الجدول 4-2، التسع مفردات الأولى تختبر معرفة المصطلحات المتعلقة بالتطور، بينما المفردات من 10 إلى 14 تختبر استرجاع الاتجاهات والتتابع في المحتوى المرتبط بالتباعد في الأنواع. باقي المفردات تختبر ثلاث خلايا أخرى. وذلك يعتمد على تركيز صانع الاختبار على سلوك أو محتوى معين. مما يوفر نوعًا من المراجعة ويعرف بالمفردات المرتكزة. هذا التداخل يسمح بمقارنة أداء المجموعات. فهذا يثير التساؤل عن مدى تمثيل هؤلاء المفحوصين للمجموعة بأكملها. بتقسيم الفصل إلى أربع فئات جزئية تحتوي كل منها على 11 مفردة، مما يغطي مجموعة واسعة من الأهداف. يمكن زيادة عدد المفردات إلى 40-60 مفردة حسب الحاجة، هذا يساعد في تحسين دقة التقييم وتغطية المحتوى بشكل أفضل. أن من مميزات أخذ العينات لغرض المقارنات هو الوضوح في التقييم، بدلاً من ذلك، مع مراعاة عدد المفردات وأوقات الاختبار المتعددة لتحقيق تغطية شاملة ودقيقة.
خطوات تنقيح الاختبارات:

  1. إعطاء الطلاب الاختبار بشكل فردي وتسجيل سلوكهم: يعد أداة فعّالة لتقييم تعلم الطلاب ويسمح بجمع بيانات مفصلة عن استجاباتهم، ويقدم وضوحًا حول فهمهم للتعليمات والأسئلة. يتم تطبيق هذا الأسلوب بشكل ميداني في مستويات صفية متعددة لتحديد نقاط القوة والضعف في تعلم الطلاب، 2. عرض مفردات الاختبار وجدول المواصفات على محكم كفء وعلى متخصص أخر في المجال والطلب منه وضع الجزئية من الجدول التي يربطها بكل مفردة، إن كلا من صانع الاختبار والمحكم يجدوا ان نظام الكروت من العوامل المساعدة وتساعد أيضا في وضع بنك مفردات لبناء اختبارات جديدة. ويعتبر المتوسط ضرورياً للإجراءات الموصوفة التي تعنى بالانحراف المعياري والثبات وتعتبر أيضا مقاييس النزعة المركزية ذات فائدة في مقارنة أداء مجموعتين مختلفتين في نفس الاختبار. الوسيط: هو القيمة المتوسطة للدرجات في اختبار معين بعد ترتيبها تصاعدياً (من الأصغر إلى الأكبر). 4. احسب الانحراف المعياري لدرجات الاختبار: ويعد هذا المقياس ذو فائدة مع المتوسط في إجراءات الحصول على قيمة للثبات، والانحراف المعياري هو مقياس يُظهر مدى تشتت أو انتشار درجات الطلاب حول المتوسط الحسابي. فهذا يعني أن معظم درجات الطلاب قريبة من المتوسط. وإذا كان مرتفعاً، فهذا يعني أن هناك اختلافاً كبيراً بين درجات الطلاب. 5. احسب مقياس الصعوبة لكل مفردة: هو مقياس يُعبّر عن نسبة الطلاب الذين أجابوا على البند بشكل صحيح. يتم تقسيم عدد الطلاب الذين أجابوا بشكل صحيح على العدد الكلي للطلاب الذين حاولوا الإجابة على البند. ويعتبر معرفة مستوى صعوبة كل بند مفيدًا في تحسين جودة الاختبار. البنود التي تكون سهلة أو صعبة للغاية قد لا تكون مفيدة لأنها لا تساعد في تحفيز الطلاب بشكل كافٍ، مع الحفاظ على الهدف التعليمي للبند. 6. حدد قوة التمييز لكل مفردة: معامل التمييز في أبسط مستوياته يتضمن الحصول على معامل الصعوبة لكل من المجموعتين من التلاميذ: اللذين أدوا بطريقة جيدة في الاختبار وبطريقة رديئة، وإذا لتميز المفردة بطريقة فعلية فيمكن حذفها، أما ثبات الأداء عبر الزمن، صيغة "كوردر ريتشاردسون" هي إحدى الطرق المستخدمة لحساب معامل الثبات (الصدق الداخلي) للاختبارات التي تتكون من أسئلة ثنائية الإجابة (صح أو خطأ، تُستخدم هذه الصيغة لتقدير مدى اتساق الأسئلة في قياس نفس الخاصية أو المفهوم. الخصائص الفنية للاختبارات: وفيما يلي جدول يوضح أنواع الصدق والفروقات بينها. نوع الصدق الوصف أمثلة تفصيلية الشروط اللازمة لتحقيق هذا النوع من الصدق الأدوات صدق المحتوى اختبار رياضيات يحتوي على أسئلة تتعلق بمفاهيم دروس الرياضيات الحالية يعتبر الاختبار صالحاً إذا وافق المحكمون على أن معظم الأسئلة تتعلق بمحتوى المقرر الدراسي بنسبة اتفاق عالية 75% أو أكثر. محكمون ذو كفاءة جدول المواصفات يهتم بالتأكد من أن مكونات الاختبار تقيس سمة أو مفهوم معين بشكل مترابط، مقارنة أداء التلاميذ في أنواع مختلفة من الأسئلة التي تقيس نفس القدرة، لتقييم قدرتهم على تطبيق المعرفة في مواقف جديدة. تحليل العناصر الإحصائي الصدق التنبؤي يشير إلى قدرة الاختبار على التنبؤ بأداء الطالب في اختبارات لاحقة أو مواقف مشابهة. أن تكون العناصر مرتبطة ارتباط وثيق بالأهداف التعليمية الفعلية للموضوع الدراسي. معامل الارتباط الصدق المتلازم يقيس توافق نتائج اختبار مع نتائج اختبار آخر يقيس نفس السلوك أو القدرة، اختبار جديد للذكاء يتم مقارنته مع اختبار "بينيه" التقليدي يمكن أيضاً استخدامه لمقارنة قدرة الطلاب على الكتابة باستخدام مهارات تصحيح النصوص مقارنة بمهارات الكتابة المباشرة للتأكد من إذا أظهر التلاميذ ترتيباً مماثلاً في كلا الاختبارين، فإن الصدق المتلازم يتحقق معامل الارتباط هناك معيارين عامان يمكن استخدامهما لاختيار العينة المناسبة من الأسئلة التي تتيح تقييم القدرات المعطاة للطلاب، وهما: هذه الجداول تساعد في تنظيم أنواع الأسئلة وموضوعاتها، السؤال الجوهري في هذا المعيار: كيف نحدد الأوزان النسبية لمختلف مجالات المادة الدراسية؟ التقدير الشخصي: يعتمد بعض المدرسين على حكمهم الشخصي لتحديد أهمية كل مجال، بناءً على ما يعتقدون أنه أكثر فائدة أو أهمية للطلاب، أو ما تركز عليه المراجع بدلالة عدد الصفحات المكرسة للموضوع أو ماذا قالت سلطة أخرى. والاستناد إلى حكم سلطة محلية معينة مثل: رئيس القسم أو مشرف أو لجنة تنظيم المنهج. الترابطات المنطقية: يركز البعض على الروابط بين مختلف مجالات المادة، فالمجالات التي ترتبط بشكل وثيق بمواضيع أخرى تعتبر أكثر أهمية، وهم أيضاً يهاجمون مشكلة إعطاء القيمة لمجالات المحتوى. التحليل العلمي: يلجأ بعض المدرسين إلى تحليل الأبحاث والدراسات العلمية لتحديد المفاهيم الأكثر شيوعاً والأكثر أهمية في المجال. 2. التساوي بين المهام المتضمنة: إذا علم المدرس بأن بعض المصطلحات والرموز المستخدمة في مادته تستخدم في مجال آخر، فإنه يتفادى عمل عينات من كليهما إذا كان محدداً بعدد من المفردات التي يمكن استخدامها. • لا تعني بالضرورة الأعداد المتساوية للمفردات أنّ كل جزء يسهم بنفس الوزن للدرجة الكلية. • إذا كان هناك تفاوت كبير في أداء الطلاب في جزء معين من الاختبار، فإن هذا التفاوت سينعكس بشكل واضح في النتيجة النهائية. • لا يمكن الجزم بشكل كامل بمدى ملائمة الأوزان النسبية المحددة قبل الاختبار إلا بعد رؤية نتائج الطلاب الفعلية. • القيمة المعطاة لمركبات أي اختبار تعكس أوزان هذه المركبات في الدرجة الكلية في حال وجود شرطين هما: تباين متساو في إجابات المفحوصين، وهذا نادر الحدوث في أي اختبار. الخاصية الفنية الثانية للاختبارات الثبات: إذا تم تطبيق نفس الاختبار على مجموعة من الطلاب مرتين (مرة في الصباح ومرة في المساء)، وإذا لم تكن نقول بأن النتائج لم تكن متسقة. في المثال الأول: نفس الاختبار يُعطى مرتين خلال فترة زمنية قصيرة جداً يعكس اتساقاً في إجراءات عملية الامتحان أو الأداة، مما يعكس على استجاباتهم، وطريقة منح الدرجات كجزء من إجراءات الامتحان قد تسبب في تباين النتائج لنفس الاستجابات عند التقييم. مما يجعلها أقل عرضة للتباين، ولتحسين الإتساق في منح الدرجات، ينصح باستخدام مفتاح تصحيح موحد، في المثال الثالث: استقرار السمة أو القدرة في التلاميذ: يعكس هذا المثال الفارق الزمني الكبير نسبياً قبل إجراء الاختبار الثاني بنفس العينة من المفردات أو مفردات مختلفة؛ فإذا كنا نتعامل مع اهتمامات التلاميذ لأغراض النجاح المهني، فإننا نتوقع الاستقرار عبر الزمن، وإذا كنا نتعامل مع القدرة الكتابية خلال فترة التعليم، ويجب أن يؤخذ الثبات في الاعتبار عند استخدام الاختبارات في منح الشهادة أو في التنبؤ بالنجاح. العلاقة بين الصدق والثبات: • الصدق يعتمد جزئياً على الثبات، بحيث يستطيع الفرد بناء اختبار غير صادق، • عند وجود اتفاق عام بين محكمين مناسبين على أن فئة معينة من المفردات تقيس القدرة على تفسير البيانات، وعليه يبنى صدق المحتوى، • إن الثبات يحد من الصدق؛ بعض الاقتراحات لتحسين ثبات اختبار ما:
  2. إن زيادة الاتفاق بين المصححين أو مصحح واحد في مناسبات مختلفة سوف يحسن من الثبات، الموضوعية في تصحيح الاختبارات ليست مقتصرة فقط على التقويم التجميعي، بل تمتد لتشمل أيضاً الاختبارات التشخيصية والتقويم البنائي، الموضوعية هنا لا تتعلق فقط بجودة التصحيح، بل تؤثر كذلك على ثبات وصدق النتائج. وعلى الرغم من إعداد الاختبارات بناءً على جدول المواصفات لتحقيق أهداف محددة، فإن عدم تطبيق الموضوعية في التصحيح قد يؤثر سلباً على صدق المحتوى، إذ قد يؤدي التحيز في التقييم إلى إعطاء درجات غير متساوية لنفس السلوك للطلاب المختلفين، مما يضعف كل من الثبات والصدق في نتائج الاختبار. ليتحقق من دقة العبارات حتى عند وجود ترابط قوي بين المفردات والمواصفات. في حال عدم الاتفاق على مفردة معينة، قد يكون هناك حاجة إلى تعديل الصياغة لضمان دقة المحتوى المستهدف، ومن المؤكد أن مفتاح الإجابة للاختبارات الاختيارية ضروري، بحيث لا يكون هناك اختلاف في الدرجات إلا إذا كان نتيجة خطأ في تطبيق المفتاح، مثل التكميل أو كتابة مقالة،


Original text

التقويم التجميعي
الفرق بين الملاحظات البنائية والتقويم التجميعي
الملاحظات البنائية تهدف إلى تحسين عملية التعلم المستمرة من خلال تسليط الضوء على النقاط التي لم يتمكن المتعلم من إتقانها بعد، وتركز على تحديد نقاط الضعف في تعلم الطالب لمساعدته على تحسينها، في حين أن التقويم التجميعي يهدف إلى تقديم تقييم شامل للأداء الكلي بعد فترة معينة. تقييم شامل لأداء الطالب في نهاية فترة معينة أو في نهاية مقرر معين. بعبارة أخرى، الأول موجه لتحسين التعلم الفردي والتحديد الدقيق للنقاط التي تحتاج للتحسين، بينما الثاني يهدف إلى تقديم تقييم عام وشامل لأداء الطالب.
مثال توضيحي: مادة (الرياضيات) الحساب الغرض من التقويم التجميعي هو تحديد قدرة وسرعة الطالب على ترجمة المسائل اللفظية إلى حلول كمية عند إجراء القسمة. وأيضًا تحديد مستوى الطلاب وتقديم تقرير لأولياء الأمور والهيئة الإدارية.
بينما يقوم التقويم البنائي في هذا المثال بالتركيز على معرفة الأسباب في القصور في ترجمة المسائل اللفظية هل ترجع في عدم قدرته على صياغة القوانين، أو عدم كفاية المفردات اللغوية.
يمكن للمعلم الدمج بين التقويم التجميعي والتقويم البنائي في اختبار واحد، لكن هناك مخاطرة حيث يمكن أن يؤدي هذا إلى اختبارات أطول وأكثر تعقيدًا، لذا فالتوقيت يلعب دورًا أيضًا حيث تجرى الاختبارات البنائية بشكل متكرر خلال فترات أقصر مقارنة بالتجميعية.
فالتقويم البنائي يُستخدم لتحسين تعلم التلميذ بعد تعليم مهارة جديدة، في حين تستخدم الاختبارات التجميعية لتقييم شامل عادة في نهاية المقرر أو عدة مرات خلال تدريسه، فالاختبارات القصيرة التي تُعطى في نهاية الوحدات التعليمية القصيرة تميل لأن تكون بنائية بطبيعتها.
ومن الفروق بين التقويم التجميعي والبنائي هو مستوى التعميم، حيث يقوم مبدأ تايلور بالتركيز على التوصيفات السلوكية المرغوبة (كما ورد ذكره في الفصل الثاني)، بينما جانيه ركز على التفاصيل الأولية للمقدرات.
إذا الفرق الأساسي هو مدى التعميم وقابلية الانتقال، فالتقويم البنائي يلاحظ المتطلبات الأولية للعمل، بينما التجميعي يركز على القدرة العريضة مثل القدرة على رسم وتفسير المنحنيات في الجبر.
خطوات عامة في بناء الاختبارات
1- قم بإنشاء أو تعديل جدول للمواصفات الخاصة بمادة ومستوى تعليمي محددين. بالرغم من أن تفاصيل تكوين هذه الجداول تم شرحها في مواضع أخرى، ولكن من المهم للمدرسين الاطلاع على بعض المصادر والقواعد المفيدة. القاعدة الرئيسية هي النظر إلى مجال المحتوى من منظور الموضوعات الكبيرة للمادة، مثال ذلك أنه في مادة العلوم يمكن استخدام الأبعاد المتجانسة في منهج العلوم البيولوجية، أو تقسيم المادة إلى أنظمة فسيولوجية ووظائف بيولوجية وعلم الحيوان.
2- بناء مفردات ومصطلحات للاختبار التي تتناسب مع الجدول الذي تم بناءه.
3- اختيار عينات مناسبة للاختبارات. يتم اقتراح أخذ عينات عبر جدول المواصفات بأكمله، سواء من المحتوى أو السلوكيات المعقدة. يتعين على المعلم تحديد الخلايا المهمة لعينته بناءً على أهدافه، سواء كانت عينة عشوائية لكل المفردات أو عينات تركز على أهداف محددة. هذا يساعد في وضع الطلاب في مستويات مناسبة أو منحهم شهادات بناءً على السلوكيات النهائية المطلوبة.
4-تدور حول تجميع المفردات في الاختبارات بناءً على خطة منظمة. يمكن أن تُجمع المفردات في مجموعات تمثل أنواعاً من السلوك أو حسب المحتوى. عند تجميعها، يُفضل ترتيبها من السهل إلى الصعب. من المفيد أيضًا تجميع أنواع المفردات المختلفة مثل الاختيار من متعدد والمزاوجة وصواب أو خطأ حسب النوع لتسهيل إعطاء التعليمات للمعلم والتلميذ.
5- ضع خطة لإعطاء الدرجات بحيث تقدم معلومات مفيدة لأغراض الاختبار. يمكن جمع الدرجات الفردية للحصول على تقييم شامل لمهارات أو قدرات محددة. نظام إعطاء الدرجات يمكن أن يساعد في التنبؤ بالأداء المستقبلي للطلاب، ويجب أن يعكس الفروق في القدرات والمهارات والمعارف. من أجل التغذية الراجعة، يجب إبلاغ الطلاب بمهاراتهم وقدراتهم العملية. النظام يجب أن يسمح بمقارنة مخرجات مجموعات أو معالجات مختلفة ويعكس الفروق في القدرات والمعارف.
6- ضع تعليمات للمفحوصين تشمل القواعد الأساسية للاختبار، مثل ما إذا كان يجب عليهم محاولة جميع المفردات أو فقط التي يعرفونها، وكيفية التعامل مع مفردات المزاوجة، وإذا كان عليهم اختيار أفضل إجابة أو الإجابة الصحيحة. التعليمات يجب أن تحدد الوقت المخصص للاختبار وأجزاءه، وما إذا كان سيتم تقييمهم بناءً على المضمون فقط أو أيضًا على صحة الهجاء، وقواعد اللغة، والأسلوب.
استخدامات الاختبار وبناءه:
الاختبار التجميعي يمكن أن يخدم وظائف متنوعة، وأنه عند بناء وتصحيح الاختبارات بشكل صحيح، يمكن استخدام نتائجها بطرق متعددة. يجب تحديد الأهداف المقصودة قبل بناء الاختبار لضمان استفادة أكبر من النتائج. لا يمكن تطبيق مخرجات الاختبار بنفس الطريقة في جميع الاستخدامات والمجالات. من بين الاستخدامات الشائعة لنتائج الاختبارات:



  • تعيين المستويات.

  • إصدار الشهادات.

  • التنبؤ بالنجاح.

  • تحديد نقطة البداية.

  • تقديم التغذية المرتدة.

  • ومقارنة مخرجات مجموعات مختلفة.

    تعيين المستويات
    الاستخدام الأكثر شيوعًا للاختبار التجميعي هو تعيين المستويات بناءً على الحروف أو الدرجات، وذلك من المدرسة الابتدائية إلى مرحلة ما بعد التخرج. الهدف هو تصنيف التلاميذ حسب مستوى تعلمهم مقارنة ببقية التلاميذ. لتحقيق انتشار فعّال، يتم اختيار مفردات الاختبار بناءً على صعوبتها وقدرتها على التمييز. صعوبة المفردة تتعلق بنسبة الطلاب الذين يجيبون عليها بشكل صحيح، أما القدرة على التمييز فتقارن نسبة إجابات الطلاب الأقوى بالطلاب الأضعف. لتحقيق توزيع عادل، يجب أن تكون مفردات الاختبار قادرة على التفريق بين مستويات الطلاب بشكل إيجابي.
    ولتعيين المستويات بشكل فعال، يجب تجريب كل اختبار على تلاميذ مماثلين قبل استخدامه. إذا كان ذلك غير عملي، يمكن تقدير صعوبة المفردات تقريبياً بناءً على خبرة المعلم. يمكن أيضاً تجميع مفردات الاختبار ببطء لضمان توازنها في الصعوبة والتمييز. يمكن استخدام تقديرات الخبراء لبناء الاختبارات ومن ثم تحليل النتائج لتحديد المفردات المناسبة. يهدف هذا إلى ضمان انتشار عادل للدرجات، مع قبول بعض النفقات في فقدان المفردات غير المناسبة.
    إن التربية الموجهة نحو التمكن تتطلب تغيير في الوقت ومنهجية التعليم لتحقيق هذا الهدف. في هذه الحالة، تصبح المحكات التقليدية غير ذات معنى، ويتم التركيز على اختيار السلوكيات والمحتوى من جدول المواصفات لتقييم النتائج. إذا لم يجتز عدد كبير من الطلاب بعض المفردات، قد يشير ذلك إلى خلل في منهجية التعليم. مع تحسين التعليم، يتوقع أن يجتاز عدد أكبر من الطلاب المفردات بنجاح. هذا هو الرأي الذي يتبناه التقويم البنائي. المناقشة تهدف إلى تنبيه المعلمين لأهمية إعادة النظر في استخدام نتائج الاختبارات لتعيين المستويات بناءً على أسس مختلفة عن تلك التقليدية.
    عند تحديد المستويات، يجب الانتباه إلى بناء خطوات معينة مثل الخطوات 3، 4، و5، كما هو موضح في جدول مواصفات العلوم البيولوجية للمرحلة الثانوية. يمكن للمعلم تطبيق الاختبار في نهاية المقرر لأخذ عينات من جميع المحاور الرئيسية للمحتوى. من المهم تحسين المفردات وترتيبها من السهل إلى الصعب. تفسير الدرجات يجب أن يكون مرجعًا عامًا للقدرة في المقرر ككل. ومع ذلك، يمكن أن يكون لمبدأ التعويض في وضع الدرجات تأثير سلبي على فائدة الدرجات في التغذية الراجعة أو التشخيص.
    لتوضيح النقطة بشكل أفضل، تم عرض مثال على معلم قرر أن يركز الامتحان التجميعي في نهاية المقرر على استخدام المهارات في فهم مشكلات العلوم وعرض العلاقات بين تراكيب المعرفة، مع التركيز على محاور رئيسية مثل التطور والتكامل الحيوي والبيئي. يتم أخذ عينات من هذه المجالات للحصول على مجموعات فرعية من المفردات، ويخطط لأخذ 12 إلى 15 مفردة من كل مجموعة فرعية لضمان ثبات الدرجات. يمكن استخدام تصميم مماثل للاختبارات التجميعية خلال المقرر. يفضل أخذ عينات من العناصر الفرعية لمراتب السلوك وتطبيق المعارف على مواقف جديدة. يجب أن يكون تصميم الاختبار وخطة وضع الدرجات شاملاً لضمان استخدام النتائج بشكل فعال لأغراض التغذية الراجعة، والبداية في تعليم تال، ولمنح الشهادات. الدرجات المتعددة تعطي معنى أكبر مقارنة بالدرجة الواحدة.
    المستويات
    أهمية تبني مستويات محددة لتعيين الدرجات ومنح الشهادات. هناك ثلاثة أنواع من المستويات: المعيار القائم على الملاحظة والاختبار، المعايير المقدرة، والمعيار القائم على الآراء. المستويات المعيارية تعتمد على نتائج اختبارات منشورة، بينما تعتمد المعايير المقدرة على توقعات الخبراء. يمكن للمعلمين إنشاء معايير مقدرة بناءً على خبرتهم، وعرضها على زملائهم لتعزيز الثقة في النتائج. المستويات القائمة على تحليل المهمة أو أفكار التمكن تركز على الأداءات المطلوبة لنجاح الطالب في مهام معينة. هذا يساعد في تحديد المهارات اللازمة للنجاح ومنح الشهادات بشكل أكثر دقة.
    إجازة المهارات والقدرات
    هناك مواقف يكون فيها الغرض الرئيسي من الاختبارات البنائية هو التأكد من أن الطالب قد اكتسب مهارات ومعلومات وقدرات معينة بشكل كامل. هذه المواقف شائعة في التدريب الفني في المدارس الثانوية أو الكليات الصغرى. الفكرة الأساسية هي التأكيد على قدرة الطالب على التعامل مع مواد دراسية معينة مثل القراءة للدراسات الاجتماعية، أو المهارات الرياضية للإحصاء التربوي، أو مهارات معمل العلوم.
    في هذه المواقف، يكون التركيز على مستوى السلوك بمحتوى محدد، ويجب اختيار مفردات الاختبار بناءً على جدول مواصفات محدد. يجب أن يتم تعيين مستوى أداء محدد يتجاوز الطالب ليتمكن من أداء العمل المطلوب. يتم استخدام الأدلة المستندة إلى الملاحظة والتجريب لضمان الثقة في النتائج، ويمكن أن تكون الأحكام الذاتية للخبراء بديلاً حتى تتوفر الأدلة التجريبية.
    أهمية استخدام الاختبارات التجميعية لتنبؤ نجاح الطلاب في المقررات اللاحقة. يؤكد على أن تصميم هذه الاختبارات يتطلب استشارة متخصصين تقنيين، لكن يجب على المدرس تحديد أهداف الامتحانات. يوضح النص أن الاختبارات التجميعية في نهاية المقرر يمكن أن تتنبأ بالنجاح في المقررات ذات الصلة، بشرط وجود دليل على العلاقة بين الأداء في الاختبار والمقرر اللاحق. يشير إلى أن الطلاب الذين يحققون درجات عالية في الاختبارات التجميعية يميلون لتحقيق درجات عالية في مجالات أخرى أيضًا، لكن هناك عوامل عديدة غير معروفة تساهم في هذه العلاقة. ينبغي استخدام نتائج الاختبارات التجميعية بحذر لتنبؤ الأداء المستقبلي وتجنب الاعتماد الكامل على اختبار واحد فقط لتحقيق أهداف متعددة.
    نقطة البداية في تدريس مقرر لاحق
    أهمية الاختبارات التجميعية التي تُعطى في نهاية العام الدراسي في تحديد مستوى الطلاب لبداية تدريس المقرر التالي، خاصة في المدرسة الابتدائية. يشير إلى أن استخدام هذه الاختبارات يشبه التقويم البنائي في موقف تعليمي مستمر، ويمثل بعض الاستراتيجيات المقترحة في التسكين والتقويم التشخيصي. يوضح أيضًا أن درجة واحدة في اختبار الحساب للصف الثالث قد لا تكون مفيدة لبداية تدريس المحتوى، لذا يجب أن تشمل الاختبارات عدة درجات تمثل خلايا السلوك والمحتوى المهمة. المعلم يحتاج إلى فهم بنود الدرجات بشكل كامل لتحديد نقطة البداية في تدريس المقرر التالي.
    التغذية المرتجعة للتلاميذ
    أن التغذية المرتجعة للتلاميذ هي جزء أساسي من التقويم البنائي، ويمكن للتقويم التجميعي أن يقدم نفس الفائدة. يجب أن تكون الاختبارات مبنية بشكل جيد لتوجيه التلميذ نحو تحسين نواحي النقص. إذا كانت النتائج غير مفيدة للتلميذ، فإنها لا تساعد في تحسين أدائه. من المهم أن تكون مفردات الاختبار دقيقة وتعكس جوانب متنوعة من المحتوى والسلوك. التغذية المرتجعة تكون أكثر فعالية عندما يتم استخدامها لتحسين عملية التعلم والتدريس بشكل مستمر. فالدرجات المتعددة، خاصة على بنود السلوك المرتبطة بالخلايا المختبرة، تكون مفيدة للتلميذ إذا كانت مبنية على عدد كاف من المفردات لضمان الثبات.
    مقارنة مخرجات مجموعات مختلفة
    إن استخدام المقاييس التجميعية لمقارنة مخرجات مجموعات مختلفة، وليس لتقييم تعلم الأفراد. الهدف هو تقويم طرق مختلفة أو مواد أو أنواع مختلفة من التلاميذ. لتحقيق تفسيرات مفيدة، يجب معرفة السلوك الابتدائي للتلاميذ من حيث القدرة والدافعية. إذا كان الغرض هو مقارنة المخرجات، يجب إعطاء جميع التلاميذ نفس الأسئلة لضمان التقييم المتكافئ. يمكن تقسيم الفصل إلى عينات متعددة وإجراء اختبارات منفصلة لكل منها، مع زيادة عدد المفردات لتحقيق أهداف الاختبار. جدول المواصفات يمكن أن يساعد في عمل عينات متنوعة من المهام أو المفردات لتحقيق تقييم دقيق.
    بافتراض تم وضع بطارية من المفردات مأخوذة من بنك مفردات كبير، والتي تغطي خلايا السلوك والمحتوى كما هو مبين في الجدولين 4-1 و4-2. في الجدول 4-2، تم ترتيب المفردات بالتتابع ووضع أرقام لها.
    توزيع المفردات من بنك الأسئلة لتغطية خلايا السلوك والمحتوى. التسع مفردات الأولى تختبر معرفة المصطلحات المتعلقة بالتطور، بينما المفردات من 10 إلى 14 تختبر استرجاع الاتجاهات والتتابع في المحتوى المرتبط بالتباعد في الأنواع. باقي المفردات تختبر ثلاث خلايا أخرى. المفردات مرقمة لتسهيل تعيينها للفئات الجزئية الأربعة في جدول 4-3. يمكن أن يكون عدد المفردات في الخلايا المختلفة غير متساوٍ، وذلك يعتمد على تركيز صانع الاختبار على سلوك أو محتوى معين.
    يقترح جدول 4-3 كيفية توزيع المفردات الأربعة والثلاثين على أربع فئات جزئية، مع تخصيص رقم جديد لكل مفردة في الفئة. تظهر بعض المفردات في جميع الفئات الأربع أو في اثنتين منها، مما يوفر نوعًا من المراجعة ويعرف بالمفردات المرتكزة. هذا التداخل يسمح بمقارنة أداء المجموعات. إذا كان أداء عينتين من التلاميذ مختلفًا في المفردات المرتكزة، فهذا يثير التساؤل عن مدى تمثيل هؤلاء المفحوصين للمجموعة بأكملها.
    بتقسيم الفصل إلى أربع فئات جزئية تحتوي كل منها على 11 مفردة، يمكن الحصول على معلومات من 34 مفردة، مما يغطي مجموعة واسعة من الأهداف. يمكن زيادة عدد المفردات إلى 40-60 مفردة حسب الحاجة، ولا يشترط تقسيم الفصل إلى أربع فئات جزئية فقط. في الفصول الكبيرة جدًا، يمكن تقسيمها إلى خمس أو ست مجموعات، بينما في الفصول الصغيرة من الأفضل تقسيمها إلى فئتين فقط. هذا يساعد في تحسين دقة التقييم وتغطية المحتوى بشكل أفضل.
    أن من مميزات أخذ العينات لغرض المقارنات هو الوضوح في التقييم، حيث لا يُلزَم المدرس بإجراء اختبار نهائي يتضمن خمسين مفردة بسبب القيود الزمنية أو متطلبات أخرى. بدلاً من ذلك، يمكن الحصول على معلومات مفصلة من المجموعات الجزئية للتلاميذ، مع مراعاة عدد المفردات وأوقات الاختبار المتعددة لتحقيق تغطية شاملة ودقيقة.

    خطوات تنقيح الاختبارات:



  1. إعطاء الطلاب الاختبار بشكل فردي وتسجيل سلوكهم: يعد أداة فعّالة لتقييم تعلم الطلاب ويسمح بجمع بيانات مفصلة عن استجاباتهم، ويقدم وضوحًا حول فهمهم للتعليمات والأسئلة. يتم تطبيق هذا الأسلوب بشكل ميداني في مستويات صفية متعددة لتحديد نقاط القوة والضعف في تعلم الطلاب، ويوفر تغذية راجعة تساعد على تحسين أساليب التقييم. كما يساهم في تحليل العلاقات بين الفقرات المختلفة في الاختبار، مما يساعد المعلمين على إجراء تعديلات في الاختبارات وتوجيه العملية التعليمية بما يتناسب مع احتياجات الطلاب التعليمية.

  2. عرض مفردات الاختبار وجدول المواصفات على محكم كفء وعلى متخصص أخر في المجال والطلب منه وضع الجزئية من الجدول التي يربطها بكل مفردة، أحيانا ممكن أن يخطئ المحكم في ربط بعض المفردات وبالرغم من هذا إذا نوقشت نقاط عدم الاتفاق فإن الصورة النهائية للاختبار سوف تتحسن. إن كلا من صانع الاختبار والمحكم يجدوا ان نظام الكروت من العوامل المساعدة وتساعد أيضا في وضع بنك مفردات لبناء اختبارات جديدة.

  3. حساب المتوسط والوسيط لدرجات اختبار المجموعة التجريبية: يمكن استخدام الوسيط في إيجاد معامل التمييز، ويعتبر المتوسط ضرورياً للإجراءات الموصوفة التي تعنى بالانحراف المعياري والثبات وتعتبر أيضا مقاييس النزعة المركزية ذات فائدة في مقارنة أداء مجموعتين مختلفتين في نفس الاختبار.
    الوسيط: هو القيمة المتوسطة للدرجات في اختبار معين بعد ترتيبها تصاعدياً (من الأصغر إلى الأكبر). يُستخدم الوسيط لوصف الموقع المركزي للدرجات في الاختبار، خاصة عندما تحتوي الدرجات على قيم متطرفة قد تؤثر على المتوسط الحسابي.
    المتوسط الحسابي: هو أحد مقاييس النزعة المركزية، ويُستخدم لمعرفة المعدل أو القيمة المتوسطة لمجموعة من البيانات. يتم حساب المتوسط من خلال جمع كل القيم ثم قسمة الناتج على عدد القيم.

  4. احسب الانحراف المعياري لدرجات الاختبار: ويعد هذا المقياس ذو فائدة مع المتوسط في إجراءات الحصول على قيمة للثبات، والانحراف المعياري هو مقياس يُظهر مدى تشتت أو انتشار درجات الطلاب حول المتوسط الحسابي. إذا كان الانحراف المعياري منخفضاً، فهذا يعني أن معظم درجات الطلاب قريبة من المتوسط. وإذا كان مرتفعاً، فهذا يعني أن هناك اختلافاً كبيراً بين درجات الطلاب.

  5. احسب مقياس الصعوبة لكل مفردة: هو مقياس يُعبّر عن نسبة الطلاب الذين أجابوا على البند بشكل صحيح. لحساب هذا المقياس، يتم تقسيم عدد الطلاب الذين أجابوا بشكل صحيح على العدد الكلي للطلاب الذين حاولوا الإجابة على البند. ويعتبر معرفة مستوى صعوبة كل بند مفيدًا في تحسين جودة الاختبار. البنود التي تكون سهلة أو صعبة للغاية قد لا تكون مفيدة لأنها لا تساعد في تحفيز الطلاب بشكل كافٍ، ويمكن تعديل درجة الصعوبة عن طريق تغيير خيارات الإجابة في أسئلة الاختيار من متعدد أو تحسين صياغة السؤال، مع الحفاظ على الهدف التعليمي للبند.

  6. حدد قوة التمييز لكل مفردة: معامل التمييز في أبسط مستوياته يتضمن الحصول على معامل الصعوبة لكل من المجموعتين من التلاميذ: اللذين أدوا بطريقة جيدة في الاختبار وبطريقة رديئة، وإذا لتميز المفردة بطريقة فعلية فيمكن حذفها، والأفضل تعديل لمفردة حتى تميز كما تريدها أن تكون كذلك.

  7. النظر في ثبات نتائج الاختبار: يوجد العديد من أنواع الثبات وصيغ حسابه، لكننا هنا نركز على نوع معين، وهو ثبات الاتساق عبر عينات المفردات. هذا النوع مهم في اختبارات التحصيل الدراسي، حيث يهدف إلى التأكد من أن العينة المختارة من المفردات تمثل باقي المجموعة بشكل جيد. هناك صيغ بسيطة لحساب هذا النوع من الثبات، وخاصة إذا توفرت معلومات عن صعوبة المفردات. أما ثبات الأداء عبر الزمن، فهو ذو أهمية أقل في هذا السياق.
    صيغة "كوردر ريتشاردسون" هي إحدى الطرق المستخدمة لحساب معامل الثبات (الصدق الداخلي) للاختبارات التي تتكون من أسئلة ثنائية الإجابة (صح أو خطأ، نعم أو لا). تُستخدم هذه الصيغة لتقدير مدى اتساق الأسئلة في قياس نفس الخاصية أو المفهوم.
    الخصائص الفنية للاختبارات:
    الخاصية الفنية الأولى للاختبارات هي الصدق: وهو مدى قدرة الاختبار على قياس ما صُمم لقياسه فعلاً، أي مدى ملاءمة الاختبار لأغراضه المحددة وصحة تفسير النتائج الناتجة عنه، وفيما يلي جدول يوضح أنواع الصدق والفروقات بينها.


نوع الصدق
الوصف
أمثلة تفصيلية
الشروط اللازمة لتحقيق هذا النوع من الصدق
الأدوات


صدق المحتوى
مدى تطابق مفردات الاختبار مع المحتوى التعليمي الذي تم إعداد الاختبار من أجله.
اختبار رياضيات يحتوي على أسئلة تتعلق بمفاهيم دروس الرياضيات الحالية
يعتبر الاختبار صالحاً إذا وافق المحكمون على أن معظم الأسئلة تتعلق بمحتوى المقرر الدراسي بنسبة اتفاق عالية 75% أو أكثر.
محكمون ذو كفاءة


جدول المواصفات


الصدق التركيبي
يهتم بالتأكد من أن مكونات الاختبار تقيس سمة أو مفهوم معين بشكل مترابط، ويستخدم عادة في اختبارات الذكاء أو القدرات.
مقارنة أداء التلاميذ في أنواع مختلفة من الأسئلة التي تقيس نفس القدرة، مثل الاختيارات المتعددة والأسئلة المقالية في اختبار واحد؛ لتقييم قدرتهم على تطبيق المعرفة في مواقف جديدة.
يتم التحقق من الصدق التركيبي عن طريق تحليل الارتباطات بين أنواع المفردات المستخدمة
تحليل العناصر الإحصائي


الصدق التنبؤي
يشير إلى قدرة الاختبار على التنبؤ بأداء الطالب في اختبارات لاحقة أو مواقف مشابهة.
اختبار تجميعي يهدف للتنبؤ بنجاح الطلاب في اختبارات لاحقة أو مراحل دراسية أخرى.
يعتبر الاختبار ذا صدق تنبؤي بحسب مدى فائدته في التنبؤ بنقطة البداية المناسبة.
أن تكون العناصر مرتبطة ارتباط وثيق بالأهداف التعليمية الفعلية للموضوع الدراسي.
معامل الارتباط


الصدق المتلازم
يقيس توافق نتائج اختبار مع نتائج اختبار آخر يقيس نفس السلوك أو القدرة، ويستخدم لإثبات توافق اختبار جديد مع اختبار موثوق
اختبار جديد للذكاء يتم مقارنته مع اختبار "بينيه" التقليدي
يمكن أيضاً استخدامه لمقارنة قدرة الطلاب على الكتابة باستخدام مهارات تصحيح النصوص مقارنة بمهارات الكتابة المباشرة للتأكد من
أن الاختبار يقدم قياساً موثوقاً للقدرات.
إذا أظهر التلاميذ ترتيباً مماثلاً في كلا الاختبارين، فإن الصدق المتلازم يتحقق
معامل الارتباط


هناك معيارين عامان يمكن استخدامهما لاختيار العينة المناسبة من الأسئلة التي تتيح تقييم القدرات المعطاة للطلاب، وهما:



  1. موضوع القيمة في عملية الاختبار باستخدام جدول المواصفات: يمكن للمعلم من استخدام جدول المواصفات لتحديد هذه القيمة لكل مجال أو جزء من المادة، هذه الجداول تساعد في تنظيم أنواع الأسئلة وموضوعاتها، حتى إذا لم يعطِ المدرس انتباهاً كافياً للقيم فإنه يعطي قيمة للمجالات المتنوعة من المادة.
    السؤال الجوهري في هذا المعيار: كيف نحدد الأوزان النسبية لمختلف مجالات المادة الدراسية؟
    التقدير الشخصي: يعتمد بعض المدرسين على حكمهم الشخصي لتحديد أهمية كل مجال، بناءً على ما يعتقدون أنه أكثر فائدة أو أهمية للطلاب، أو ما تركز عليه المراجع بدلالة عدد الصفحات المكرسة للموضوع أو ماذا قالت سلطة أخرى.
    التوجيهات الرسمية: يفضل بعض المدرسين إتباع توجيهات القسم أو المدرسة، والاستناد إلى حكم سلطة محلية معينة مثل: رئيس القسم أو مشرف أو لجنة تنظيم المنهج.
    الترابطات المنطقية: يركز البعض على الروابط بين مختلف مجالات المادة، فالمجالات التي ترتبط بشكل وثيق بمواضيع أخرى تعتبر أكثر أهمية، وتعتمد هذه المجموعة على رؤيتهم الخاصة بتحديد ذلك، وهم أيضاً يهاجمون مشكلة إعطاء القيمة لمجالات المحتوى.
    التحليل العلمي: يلجأ بعض المدرسين إلى تحليل الأبحاث والدراسات العلمية لتحديد المفاهيم الأكثر شيوعاً والأكثر أهمية في المجال.

  2. التساوي بين المهام المتضمنة: إذا علم المدرس بأن بعض المصطلحات والرموز المستخدمة في مادته تستخدم في مجال آخر، فإنه يتفادى عمل عينات من كليهما إذا كان محدداً بعدد من المفردات التي يمكن استخدامها.


ونستنتج من أمثلة هذا المعيار:
• لا تعني بالضرورة الأعداد المتساوية للمفردات أنّ كل جزء يسهم بنفس الوزن للدرجة الكلية.
• إذا كان هناك تفاوت كبير في أداء الطلاب في جزء معين من الاختبار، فإن هذا التفاوت سينعكس بشكل واضح في النتيجة النهائية.
• لا يمكن الجزم بشكل كامل بمدى ملائمة الأوزان النسبية المحددة قبل الاختبار إلا بعد رؤية نتائج الطلاب الفعلية.
• لا تضمن الأعداد النسبية للمفردات في الأجزاء المتنوعة أوزاناً نسبية مناسبة وسوف يحدث الانتشار في الدرجات.
• المفردات التي ترتبط غالباً ارتباطا عالياً سوف تضيف وزناً للدرجة الكلية أكثر مما تقترح تلك المفردات
• القيمة المعطاة لمركبات أي اختبار تعكس أوزان هذه المركبات في الدرجة الكلية في حال وجود شرطين هما: تباين متساو في إجابات المفحوصين، والعلاقة بين المركبات متماثلة. وهذا نادر الحدوث في أي اختبار.
الخاصية الفنية الثانية للاختبارات الثبات:
الثبات في الاختبار: هو خاصية تشير إلى مدى الإتساق في نتائج الطلاب عند تكرار تطبيق الاختبار بعد فترة زمنية محددة، ويعد الثبات عنصراً جزئياً من الصدق، إذا تم تطبيق نفس الاختبار على مجموعة من الطلاب مرتين (مرة في الصباح ومرة في المساء)، يجب أن تكون نتائج الاختبار متقاربة ليتم اعتبار الاختبار ثابتاً، وإذا لم تكن نقول بأن النتائج لم تكن متسقة.
أنواع الثبات الثلاثة في الأمثلة:
في المثال الأول: نفس الاختبار يُعطى مرتين خلال فترة زمنية قصيرة جداً يعكس اتساقاً في إجراءات عملية الامتحان أو الأداة، قد يؤدي غموض صياغة الأسئلة إلى اختلاف تفسير الطلاب للتعليمات، مما يعكس على استجاباتهم، وطريقة منح الدرجات كجزء من إجراءات الامتحان قد تسبب في تباين النتائج لنفس الاستجابات عند التقييم. وهذا يميل إلى الصحة وهذا التباين يظهر بشكل أكبر في الأسئلة المفتوحة التي تعتمد على تقدير المصحح، مقارنة بأسئلة الاختيار من متعدد التي تصحح باستخدام مفتاح إجابة موحد، مما يجعلها أقل عرضة للتباين، ولتحسين الإتساق في منح الدرجات، ينصح باستخدام مفتاح تصحيح موحد، وضمان توافق أكبر بين المصححين أو في تقييمات المصحح نفسه على وقتين مختلفين.
في المثال الثاني: يقترح وجود عينتين من الأسئلة تغطيان نفس الموضوع وتعطي بفارق زمني بسيط أو حتى بدون فارق زمني، لتحقيق ثبات أفضل في نتائج الاختبارات أي إنقاص عدم الاتساق في النتائج، ينصح بزيادة عدد الأسئلة في كلّ موضوع يتم اختباره، حيث إن المزيد من الأسئلة يتيح تقييماً أكثر دقة ويقلل من تأثير التباين العشوائي.
في المثال الثالث: استقرار السمة أو القدرة في التلاميذ: يعكس هذا المثال الفارق الزمني الكبير نسبياً قبل إجراء الاختبار الثاني بنفس العينة من المفردات أو مفردات مختلفة؛ فإذا كنا نتعامل مع اهتمامات التلاميذ لأغراض النجاح المهني، فإننا نتوقع الاستقرار عبر الزمن، وإذا كنا نتعامل مع القدرة الكتابية خلال فترة التعليم، فإننا لا نتوقع استقراراً عالياً، ويجب أن يؤخذ الثبات في الاعتبار عند استخدام الاختبارات في منح الشهادة أو في التنبؤ بالنجاح.


العلاقة بين الصدق والثبات:
• الصدق يعتمد جزئياً على الثبات، والعكس ليس صحيحاً، بحيث يستطيع الفرد بناء اختبار غير صادق، ولكن ثباته مرتفع.
• عند وجود اتفاق عام بين محكمين مناسبين على أن فئة معينة من المفردات تقيس القدرة على تفسير البيانات، وعليه يبنى صدق المحتوى، لا يمكن لصانع الاختبار أن يعتبر هذا الاختبار صادقاً إذا اكتشف أن ثباته منخفض.
• إن الثبات يحد من الصدق؛ فالمقياس الذي يعطي نتائج غير متسقة لا يمكن أن يعطي نتائج صادقة.
بعض الاقتراحات لتحسين ثبات اختبار ما:



  1. إن توضيح أي شيء غامض في المفردات والتوجيهات سوف يحسن بصفة عامة الثبات والصدق.

  2. إن زيادة الاتفاق بين المصححين أو مصحح واحد في مناسبات مختلفة سوف يحسن من الثبات، ولكن ما لم يجرَ بأسلوب رشيد وعناية فائقة فيمكن أن يقلل من الصدق.

  3. إن إضافة مفردات أكثر متشابهة الصدق في المحتوى لاختبار أو أجزاء اختبار سوف تزيد من ثبات الدرجات الناتجة طالما أنه قد أعطى الانتباه لنوعية المفردات ولإعطاء الدرجات.

  4. إن تحسين قوة التمييز للمفردات، مع تساوي الأشياء الأخرى، سوف يزيد من الثبات، وعند تعميق التمييز يجب أن يكون الفرد حريصاً على عدم وضع بدائل غير مرتبطة بمضمون المحتوى؛ خشية أن ينخفض الصدق.


الخاصية الفنية الثالثة للاختبارات: الموضوعية في إعطاء الدرجات (التصحيح).
الموضوعية في تصحيح الاختبارات ليست مقتصرة فقط على التقويم التجميعي، بل تمتد لتشمل أيضاً الاختبارات التشخيصية والتقويم البنائي، حيث تتيح هذه الأنواع فرصاً لتعديل النتائج باستخدام اختبارات لاحقة. الموضوعية هنا لا تتعلق فقط بجودة التصحيح، بل تؤثر كذلك على ثبات وصدق النتائج. وعلى الرغم من إعداد الاختبارات بناءً على جدول المواصفات لتحقيق أهداف محددة، فإن عدم تطبيق الموضوعية في التصحيح قد يؤثر سلباً على صدق المحتوى، إذ قد يؤدي التحيز في التقييم إلى إعطاء درجات غير متساوية لنفس السلوك للطلاب المختلفين، مما يضعف كل من الثبات والصدق في نتائج الاختبار.
إن وجود ارتباط وثيق بين المفردات ومصفوفة المواصفات لا يكفي لضمان صدق نتائج الاختبار؛ إذ يجب التوافق على مفتاح الاستجابات. يُشدد على أهمية مشاركة محكم خبير في هذه العملية، ليتحقق من دقة العبارات حتى عند وجود ترابط قوي بين المفردات والمواصفات. المسألة تتجاوز مجرد عدد الآراء إلى مناقشة منطقية لاختيار البديل الأنسب الذي يعبر عن السلوك المقصود.
في حال عدم الاتفاق على مفردة معينة، قد يكون هناك حاجة إلى تعديل الصياغة لضمان دقة المحتوى المستهدف، مع تجنب التعديلات الكبيرة التي قد تؤثر على صدق الاختبار. ومن المؤكد أن مفتاح الإجابة للاختبارات الاختيارية ضروري، بحيث لا يكون هناك اختلاف في الدرجات إلا إذا كان نتيجة خطأ في تطبيق المفتاح، مما قد يقلل الثبات والصدق
كما يوضح النص الفرق بين اختبارات "الإمداد" التي تتطلب من الطالب تقديم إجابة مفتوحة، مثل التكميل أو كتابة مقالة، واختبارات "الاختيار" التي تُعتبر موضوعية لحياد تصحيحها. ينتقد النص الاستخدام التقليدي للمصطلحين "موضوعية" و"مقالية"، ويشدد على ضرورة تصحيح بعض استجابات اختبارات الإمداد بشكل موضوعي، مثلما في اختبارات الاختيار، من خلال تقييم الإجابة الأفضل.
فكرة الخطأ في التصحيح الموضوعي:



  1. عندما تتفق مجموعة من المدرسين على أن إجابة واحدة فقط هي التي سوف تقبل، فلا يزال هناك خطر بأن المفردة ستظل غير صادقة وذلك بواسطة تفكير التلميذ في طريق آخر لسرد الفكرة بطريقة سليمة.

  2. تصحيح الاستجابات المتطابقة لتلاميذ مختلفين بطريقة مختلفة لأن المعلومات الإضافية صادقة تماماً فإن التصحيح المختلف (عدم الموضوعية) يخفض الثبات والصدق للاختبار.
    هناك مصدرين رئيسيين للتحيز هما:
    الأول: يمكن أن يتأثر المصحح عند انتقاله من ورقة إلى أخرى بالأخطاء غير المتصلة بالموضوع في الاستجابة، مثل أخطاء القواعد فيمكن أن يعطيها المصحح درجة أقل مما يعطيها لورقة تحتوي على نفس النتائج، ولكن مكتوبة بأسلوب مناسب ومقبول، وطريقة تصويب هذا النوع من التحيز هو تصحيح المفردة مستقلة عن القواعد أو الهجاء أو أسلوب الخط.
    الثاني: المعلومات التي لدى المصحح عما فعله التلميذ في المفردات السابقة في اختبار ما إذا كانت هناك فقرة تحتوي على عدة إجابات صحيحة، قد يميل المصحح إلى إعطاء درجات أقل لبعض الإجابات التي تبدو أقل دقة، رغم أنها تحتوي على معلومات صحيحة قد يتأثر المصحح بجودة إجابات الطالب في الفقرات السابقة، ويقوم بتقييم الفقرات اللاحقة بناءً على انطباعه السابق، وليس بناءً على الإجابة الفعلية، ومن الممكن أن الطالب قد يكون لديه فكرة صحيحة، ولكنه لا يعبر عنها بشكل جيد في إجابته، مما يجعل المصحح يواجه صعوبة في إعطاء الدرجة المناسبة.


يمكن التغلب على هذا النوع من التحيز باستخدام الإجراءات التالية:



  1. أحذف الاسم من ورقة الإجابة، ربما يقطعها إلى جزئين، بعد ترقيم جزئي ورقة الإجابة بنفس الرقم.

  2. أخلط أوراق الإجابة للمجموعة كلها قبل البدء في تصحيح أي منها. وحيث أنها لا تحمل أي أسماء.

  3. إذا كان هناك عدة مفردات صحح مفردة واحدة فقط في جميع الأوراق ثم أعد خلط أوراق الإجابة بحيث لا يكونوا بنفس الترتيب ثم ابدأ في تصحيح المفردة التالية في جميع الأوراق.

  4. ضع الدرجة على كل مفردة في ورقة منفصلة أو في ورقة الإجابة بطريقة لا يمكن رؤيتها عند تصحيح المفردة التالية.


اعد صياغة النص بطريقة احترافية


Summarize English and Arabic text online

Summarize text automatically

Summarize English and Arabic text using the statistical algorithm and sorting sentences based on its importance

Download Summary

You can download the summary result with one of any available formats such as PDF,DOCX and TXT

Permanent URL

ٌYou can share the summary link easily, we keep the summary on the website for future reference,except for private summaries.

Other Features

We are working on adding new features to make summarization more easy and accurate


Latest summaries

لعل التقويم الت...

لعل التقويم التربوي يعد وضروريا للإدارة والقيادات التربوية، فهو عملية مقصودة مهما ومطلوبة يقوم من خل...

تاريخ وفلسفة ال...

تاريخ وفلسفة المالية مدخل نظري في تطور الفكر المالي ووظائف المالية العمومية مقدمة لا يمكن فهم قانون ...

استوطن البشرُ ا...

استوطن البشرُ المغربَ منذ العصر الحجري القديم، أيْ من قبل 500-700 ألف سنة، وقد بدأ اهتمام البشر بالز...

فرمان الامتياز ...

فرمان الامتياز الأول ([3]) : صدر فرمان الامتياز الأول الذى منح فرديناند ديلسبس حق إنشاء شركة لشق قن...

لهذه المنظومة. ...

لهذه المنظومة. ويغدو من الضروري أولاً تبيان ماهية التراث الثقافي من المنظور التشريعي الوطني، وذلك من...

*Hou Shuren is ...

*Hou Shuren is the emperor's heir. He is just and respectable. Rumors say that he does not trust eas...

أنه انفصل عن عص...

أنه انفصل عن عصره، فقد مضى يزاوج بين الماضي والحاضر، يتلقى الماضي وبحباه، ويتلقى الحاضر ويحياه. الم...

تم حساب المتوسط...

تم حساب المتوسط الحسابي والانحراف المعياري للدرجة الكلية للبُعد الأول من أداة الدراسة، والمتعلق بتفع...

الأسس التي تقوم...

الأسس التي تقوم عليها الطريقة: جاءت الطرائق المثلى نتيجة اختبار طويل وتجريب علمي وملاحظات كثيرة وتأم...

ﺔ ﺗُﻌﺪ اﻷﺳﺮة أﺳ...

ﺔ ﺗُﻌﺪ اﻷﺳﺮة أﺳﺎس اﻟﻤﺠﺘﻤﻊ، وھﻲ اﻟﻤﺆﺳﺴﺔ اﻟﺘﻲ ﺗﻘﻮم ﻋﻠﻰ اﻟﻤﻮدة واﻟﺮﺣﻤﺔ واﻟﺘﻌﺎون ﺑﯿﻦ اﻟﺰوﺟﯿﻦ، وﻟﺬﻟﻚ أوﻟﺖ...

دورالقيادة الإد...

دورالقيادة الإدارية في تحسين الأداء الوظيفي: يجب على المنشأة أو الوزارة أو الهيئة أو أي كان مسماها ...

- نظرًا لأهمية ...

- نظرًا لأهمية أصول الفقه في فهم الأدلة، فإن النقطة المركزية في كثير من الاتجاهات الفكرية الحديثة هي...