پیمائش  مثال کے طور پر ، اگر فرض کیا جائے تو اس میں پانچویں جماعت کی ریاضی کی پیمائش کی جانی چاہئے نا کہ پڑھنے کی اہلیت۔  ایک ٹیسٹ ٹیسٹ ، کام کی کارکردگی ، تشخیص کے لئے کلاس روم / اسکول میں سلوک کے بارے میں ماہرین کے ذریعہ ، سوالات کی ایک سیریز کے تحریری جوابات کی شکل لے سکتا ہے ، جیسے پنسل ٹیسٹ ، یا فیصلے۔  فارم کے تحریری امتحان کے نتائج بھی مجموعی فیصلوں پر ، متعدد پیچیدہ سلسلہ میں ، جن سے سلوک میں اختلافات کو واضح کرنا ہوتا ہے۔  .1..1..1 ٹیسٹ کی درستگی اور ٹیسٹ کی توثیق پیپ. قطع نظر اس سے کہ کوئی ٹیسٹ لیتا ہے ، اس کا سب سے اہم پہلو یہ ہے کہ نتائج ہم کیسے ہیں اور جس طرح سے نتائج مجموعی طور پر انفرادی افراد اور معاشرے کو متاثر کرتے ہیں۔  اسکولوں یا پروگراموں میں یا تعلیمی تشخیص کے ل admission داخل ہونے والے ٹیسٹوں سے نہ صرف انفرادیہ متاثر ہوتی ہے بلکہ یہ جانچنے والے مواد کو بھی اہمیت دیتی ہے۔  ایک ایسی صورت حال میں جو بالکل مناسب ہو کسی صورت میں مفید ہو یا کسی اور صورت میں ناکافی ہو۔  مثال کے طور پر ، ایک ایسی ٹی جو تعلیمی تشخیص میں استعمال کے ل sufficient کافی ہوسکتی ہے وہ ہائی اسکول سے گریجویشن کا تعین کرنے میں مکمل طور پر ناکافی استعمال ہوسکتا ہے۔  ٹیسٹ کی توثیق ، ​​یا کسی ٹیسٹ کی توثیق کا مطلب واضح طور پر کسی ٹیسٹ کے استعمال کی توثیق کرنا ہے جیسے کسی خاص سیاق و سباق ، جیسے کالج کسی ٹیسٹ کی صداقت کا تعین کرنا قبول کرتا ہے ، اس کے لئے ضروری ہے کہ ٹیسٹ کے نتائج کا ترتیب میں ترتیب دیا جائے جس میں وہ استعمال کیا جاتا ہے۔  پچھلی مثال ، ہائی اسکول گریجویشن کی طرح ہی ٹیسٹ F تعلیمی تشخیص کو استعمال کرنے کے ل each ، ہر استعمال کو الگ الگ تصدیق کرنے کی ضرورت ہوگی ، حالانکہ ایک ہی امتحان دونوں مقاصد کے لئے استعمال کیا جاتا ہے۔  یا کسی کورس میں جگہ۔  لہذا ، 6.1.2. درستگی کی پیمائش کا مقصد: زیادہ تر ، لیکن سب نہیں ، ٹیسٹ مہارت ، قابلیت ، یا خصائص کی پیمائش کرنے کے لئے ڈیزائن کیے گئے ہیں جو کہ براہ راست مشاہدہ نہیں ہیں۔  مثال کے طور پر ، اسکولوسٹک اپٹٹیوڈ ٹیسٹ (اسکور) نے اسکور میں تنقیدی پڑھنے ، تحریری اور ریاضی کی صلاحیت پیدا کردی۔ امتحان میں جب کوئی امتحان دینے والا امتحان دیتا ہے تو وہ براہ راست پیمائش کی تنقیدی قابلیت نہیں ، جیسے ڈگری سنٹی گریڈ  کسی چیز کی حرارت کا براہ راست اقدام ہے ۔مطالعہ کرنے والے کے تیار کردہ تنقیدی پڑھنے کی اہلیت کی مقدار کو جانچ پڑتال کرنے والے کے ایس اے ٹی تنقیدی پڑھنے کے اسکور سے ہونا چاہئے۔ ٹیسٹ کے اسکور کو سلوک کے نمونے کے طور پر استعمال کرنے کے عمل کو نتیجہ اخذ کرنے کے ل a  طرز عمل کا ایک بڑا ڈومین سب سے زیادہ تعلیمی "نفسیاتی ٹیسٹ" کی خصوصیت ہے۔ ذمہ دار ٹیسٹ ڈویلپرز اور پبلشرز کو لازمی طور پر یہ ثابت کرنا چاہئے کہ کسی امتحان کے ذریعہ ماپا سلوک کے نمونے کو کسی امتحان دہندگان کی انجام دہی کی انجام دہی کی اہلیت کے بارے میں درست انفارمیشن کے لئے استعمال کرنا ممکن ہے۔  دلچسپی کا بڑا ڈومین۔ 1206.1.3 درستگی کے مقابلے میں قابل اعتماد ڈی قابل بھروسہ ہوسکتا ہے لیکن وہ درست نہیں ہوسکتا ہے ۔اگر ٹیسٹ کے اسکور کو اے سی بنانے کے لئے استعمال کیا جائے۔  معائنہ کرنے والے کی اہلیت کے بارے میں عمدہ تصادم ، وہ دونوں قابل اعتماد اور درست ہونا چاہئے۔  اعتماد قابل اعتبار کے لئے ضروری ہے اور کسی خاص خصلت یا ckill کو مستقل طور پر پیمائش کرنے کے لئے ٹیسٹ کی اہلیت سے مراد ہے۔  آسان لفظوں میں ہم کہہ سکتے ہیں کہ ایک ہی امتحان میں ایک ہی طلباء کے زیر انتظام ٹیسٹ ایک ہی اسکور حاصل کرسکتا ہے۔  تاہم ، ٹیسٹ انتہائی قابل اعتماد ہوسکتے ہیں اور پھر بھی کسی خاص مقصد کے لئے موزوں نہیں ہیں۔  اگر ترمامیٹر کی مثال پر غور کریں اگر کوئی منظم غلطی ہو اور اس کی پیمائش پانچ ڈگری اونچی ہو۔  جب بار بار پڑھنے کو انہی شرائط کے تحت لیا گیا ہو تو ترمامیٹر مستقل (قابل اعتماد) پیمائش کرے گا ، لیکن درجہ حرارت کے بارے میں اشارہ ناقص ہے۔  اس مشابہت سے یہ بات واضح ہوجاتی ہے کہ ٹیسٹ کی وشوسنییتا کا تعین ایک اہم پہلا مرحلہ ہے ، لیکن ٹیسٹ کی صداقت کے تعین میں یہ ایک اہم اقدام نہیں ہے۔  تشخیص ٹولز کی درستگی کی یقین دہانی کرنے کے مختلف طریقے ہیں۔  سیکشن 6.4 میں کچھ اہم طریقوں جیسے ، مشمولات ، تعمیرات ، پیش گوئی اور معیار کی توثیق پر تبادلہ خیال کیا گیا ہے۔  .2.२ درستگی کی پیمائش کے طریقے جائزیت جانچ کے اسکور کے کسی خاص استعمال کی مناسبات ہیں ، جانچ کی توثیق پھر اسکورز کے مطلوبہ استعمال کو جواز پیش کرنے کے لئے شواہد اکٹھا کرنے کا عمل ہے۔  توثیق کے ثبوت اکٹھا کرنے کے ل types ، بہت سارے اقسام کے جواز کے طریقے ہیں جو تشخیص کے اوزار کی افادیت فراہم کرتے ہیں۔  ان میں سے کچھ ذیل میں درج ہیں۔  6.2.1 مشمولیت کی درستگی کا ثبوت فیصلہ کن عمل ہے اور یہ رسمی یا غیر رسمی ہوسکتا ہے۔  باضابطہ عمل میں منظم طریقہ کار ہوتا ہے جو فیصلے پر پہنچتا ہے۔  اہم اجزاء سلوک کے مقاصد کی نشاندہی اور تفصیلات کے حامل کام کی تعمیر ہیں۔  مواد کے درست ہونے کے ثبوت میں ڈگری شامل ہوتی ہے جس کے ساتھ ٹیسٹ کا کونٹرنٹ تعمیر کے ساتھ وابستہ مواد کے ڈومین سے مماثل ہوتا ہے۔  مثال کے طور پر ، دو عددوں کو شامل کرنے کی صلاحیت کے امتحان میں ، اعداد کے ایک ٹور کو شامل کرنا چاہئے جس میں صرف ایک ہندسے والے اعداد ، یا صرف ایین نمبروں والے مواد کے ڈومین کی اچھی کوریج نہیں ہوگی۔  عمومی وابستہ مواد میں عام طور پر سبجیکٹ میٹر آئین (ایس ایم ای) ٹیسٹ کی وضاحتوں کے خلاف ٹیسٹ آئٹمز کا جائزہ لینا شامل ہے۔  یہ ایک غیر اعداد و شمار کی قسم ہے جس میں درستگی شامل ہوتی ہے۔ "اس کے بعد اس کا باقاعدہ امتحان شامل ہوتا ہے۔ اس بات کا تعین کرنے کے لئے کہ آیا اس میں ڈومی کی پیمائش کرنے کے نمایندے نمونے کا احاطہ کیا گیا ہے" (ایناستسی اور اربینہ ، 1997)۔  مثال کے طور پر ، کیا ذہانت کے تمام شعبوں پر محیط IQ سوالنامہ ہو آئٹمز جن پر سائنسی ادب میں بحث ہوئی ہے؟  کسی ٹیسٹ میں مشمولات کی جواز ہوتی ہے جس میں محتاط انتخاب کیا جاتا ہے کہ کون سے آئٹمز کو شامل کیا جائے (اناستسی اور اربینہ ، 1997)۔  اشیا کا انتخاب اس لئے کیا جاتا ہے کہ وہ ٹیسٹ کی تصریح پر عمل کریں جو مضمون ڈومین کی مکمل جانچ پڑتال کے ذریعے تیار کیا گیا ہے۔  فاکس کرافٹ وغیرہ۔  (2004 ، صفحہ 49) نوٹ کریں 'ماہرین کے پینل کا استعمال کرکے جانچ کی خصوصیات اور آئٹمز کے انتخاب کا جائزہ لینے کے لئے ٹیسٹ کی مشمولیت کو بہتر بنایا جاسکتا ہے۔  121 اعتبار کی اس شکل کا استعمال اسی جانچ پر آئٹمز میں نتائج کی مستقل مزاجی کے بارے میں کیا جاتا ہے۔  بنیادی طور پر ، آپ ٹیسٹ کی اشیاء کا موازنہ کر رہے ہیں جو ٹیسٹوں کی داخلی مستقل مزاجی کا تعین کرنے کے لئے اسی ساخت کی پیمائش کرتے ہیں۔  جب آپ کسی ایسے سوال کو دیکھتے ہو جو دوسرے ٹیسٹ سوال سے بالکل مشابہت محسوس ہوتا ہے تو ، اس سے یہ اشارہ ہوسکتا ہے کہ دونوں سوالات وشوسنییتا کا اندازہ کرنے کے لئے استعمال ہورہے ہیں۔  چونکہ دونوں سوالات ایک جیسے ہیں اور ایک ہی چیز کی پیمائش کے لئے ڈیزائن کیے گئے ہیں ، لہذا ٹیسٹ لینے والے کو دونوں سوالوں کا ایک ہی جواب دینا چاہئے ، جس سے یہ ظاہر ہوتا ہے کہ ٹیسٹ میں داخلی مستقل مزاجی ہے۔  جب ہم دو مختلف مواقع پر ایک ہی نمونے کے لئے ایک ہی ٹیسٹ کا انتظام کرتے ہیں تو ہم ٹیسٹ ریسٹسٹ قابل اعتماد کا تخمینہ لگاتے ہیں۔  اس نقطہ نظر سے یہ فرض ہوتا ہے کہ دونوں مواقع کے مابین تعمیرات میں کوئی خاص تبدیلی نہیں آئی ہے۔  اقدامات کے درمیان اجازت دی گئی وقت کی مقدار انتہائی ضروری ہے۔  ہم جانتے ہیں کہ اگر ہم ایک ہی چیز کو دو بار پیمانہ کریں کہ دونوں مشاہدات کے درمیان باہمی تعلق اس بات پر منحصر ہوگا کہ دونوں پیمائش کے مواقع کے مابین کتنا وقت گزرتا ہے۔  وقت کا فرق جتنا کم ہو ، اتنا ہی زیادہ ارتباط؛  وقت کا فرق جتنا لمبا ہوگا ، آپسی ارتباط کم ہوگا۔  اس کی وجہ یہ ہے کہ وقت کے ساتھ ساتھ دونوں مشاہدات کا آپس میں وابستہ ہوتا ہے - وقت کے ساتھ ساتھ ہمیں عوامل ملتے ہیں جو غلطی کا باعث بنتے ہیں۔  چونکہ یہ باہمی ربط قابل اعتبار ہونے کا تجربہ ہے ، لہذا آپ وقفے کے لحاظ سے کافی مختلف تخمینے حاصل کرسکتے ہیں۔  سرگرمی 5.2: چھٹی جماعت کے طالب علموں کے لئے انگریزی کا امتحان تیار کریں ، اس کو دو بار تلاش کریں