Методы в естествознании таблица. Методология естествознания. Надежность и точность измерения

Тест это объективное и стандартизированное измерение, поддающееся количественной оценке, статистической обработке и сравнительному анализу. Тест служит оценке знаний испытуемого и должен отвечать ряду принципов:

1. Применение серии одинаковых испытаний к большому количеству испытуемых.

2. Статистическая обработка результатов.

3. выделение эталонов оценки.

В данный момент тестовые задания широко используются в целях изучения и запоминания учебных материалов в образовательных учреждениях нашей страны. Одна из важных задач тестирования - быстрая и надежная оценка знаний человека. Теория педагогических тестов рассматривается как часть педагогической квалиметрии. Исследовалось состояние контроля знаний учащихся школ с применением тестовых измерителей и выявлялись основные проблемы при использовании тестов: качество и валидность содержания тестовых заданий, надежность результатов тестирования, недостатки обработки результатов по классической теории тестов, отсутствие использования современной теории обработки тестовых материалов с применением вычислительной техники. Высокая погрешность измерения тестовых результатов не позволяет говорить о высокой надежности результатов измерения.

Достоинства и недостатки тестирования.

Одним из недостатков тестового метода контроля знаний студентов является то, что создание тестов, их унификация и анализ - это большая кропотливая работа. Чтобы довести тест до полной готовности к применению необходимо несколько лет собирать статистические данные, хотя бы с потоком студентов 100-120 человек. Возможно возникновение и других трудностей. Довольно часто встречается значительный субъективизм в формировании содержания самих тестов, в отборе и формулировке тестовых вопросов, многое также зависит от конкретной тестовой системы, от того, сколько времени отводится на контроль знаний, от структуры включенных в тестовое задание вопросов и т.д.

Но не смотря на указанные недостатки тестирования, как метода педагогического контроля, его положительные качества во многом говорят о целесообразности использования такой технологии в учебных заведениях.

К достоинствам следует отнести:

как было сказано, большая объективность и, как следствие, большее позитивное стимулирующее воздействие на познавательную деятельность студента, учащегося; исключается воздействие негативного влияния на результаты тестирования таких факторов как настроение, уровень квалификации и др. характеристики конкретного преподавателя;

ориентированность на современные технические средства на использование в среде компьютерных (автоматизированных) обучающих систем; универсальность, охват всех стадий процесса обучения. Отметим другие достоинства. Тестированный опрос многофункционален. Он позволяет быстрее понять, как дальше работать с данным студентом, а также помогает лектору скорректировать курс.

В итоге следует заметить, что использование с 1 курса тестирования студентов поможет объективно провести аттестацию вуза, которая проводится с целью установления соответствия содержания, уровня и качества подготовки выпускников требованиям государственных образовательных стандартов.

Систематическое проведение контрольных мероприятий с помощью составленных на высшем уровне инструментов контроля позволяет ВУЗам формировать высококлассных специалистов в различных областях знаний, готовых применять накопленный багаж знаний в любую минуту.

Именно в таких специалистах и в настоящее время, и в будущем нуждается наша страна, чтобы с их помощью провести быстрое оздоровление экономики.

Ряд исследователей отмечает, что понятийный аппарат теории педагогических измерений еще полностью не сформирован. В частности не существует общепризнанного определения теста. Каждый исследователь отражает в определении теста свое видение проблемы педагогического тестирования.

Существует много определений ТЕСТА, довольно заметно отличающихся друг от друга. Приведем некоторые из них.

Согласно словарю ЕГЭ, ТЕСТ - это измерительная процедура, включающая инструкцию и набор заданий, прошедшая широкую апробацию и стандартизацию.

Рубинштейн С.Л. дал следующее определение: ТЕСТ - это испытание, которое ставит своей целью градуирование, определение рангового места личности в группе или коллек­тиве, установление её уровня.

Это определение сформулировано только с точки зрения достижения цели, не оговаривая, как эта цель достигается, а главное, не определяет тест как измерительный инструмент.

К.Ингенкамп - ТЕСТИРОВАНИЕ - это метод педагогической диагностики, с помощью которого выборка поведения, репрезентирующая предпосылки или результаты учебного процесса, должна максимально отвечать принципам сопоставимости, объективности, надежности и валидности измерений, должна пройти обработку и интерпретацию и быть готовой к использованию в педагогической практике.

В определении К.Ингенкампа рассматривается метод, а не средство педагогической диагностики и никак не характеризуются задания теста.

А.Н.Майоров приводит следующее определение теста, разработанное в 1997-1998 гг. группой авторов при разработке понятийного аппарата тестологии:

ТЕСТ – это инструмент, состоящий из квалиметрически выверенной системы тестовых заданий, стандартизованной процедуры проведения и заранее спроектированной технологии обработки и анализа результатов, предназначенный для измерения качества и свойств личности, изменение которых возможно в процессе систематического обучения.

В.С.Аванесов определяет ПЕДАГОГИЧЕСКИЙ ТЕСТ как систему параллельных заданий равномерно возрастающей трудности, специфической формы, позволяющую качественно и эффективно измерить уровень и оценить структуру подготовленности учащихся.

В одной из последних работ В.С.Аванесов (2005) несколько смягчил формулировку:

ПЕДАГОГИЧЕСКИЙ ТЕСТ определяется как система параллельных заданий возрастающей трудности, специфической формы, которая позволяет качественно и эффективно измерить уровень и структуру подготовленности испытуемых.

Сравнение обоих определений показывает, что произошло исключение требования равномерности возрастания трудности заданий. Обусловлено это тем, что обеспечить возрастание трудности заданий достаточно легко. Чтобы достичь этого составитель тестовых заданий ориентируется на различную сложность элементов предметной области. Для каждого элемента составляются задания и затем эмпирически проверяются, что действительно получены задания различной трудности. В самом тесте задания располагаются в порядке возрастания трудности.



Требование же равномерности возрастания трудности задания чрезвычайно сложно реализовать на практике. Хотя такой тест обеспечил бы линейную шкалу трудностей, что снизило бы ошибку измерения.

Исключение требования равномерности возрастания трудности задания заметно упрощает создание теста. Отметим, однако, что в этом случае, шкала трудностей получается нелинейной, с неравномерным покрытием заданного диапазона трудности заданий теста. Это, естественно, снижает точность педагогического теста как измерительного инструмента.

Определение Аванесова

Для лучшего понимания этого определения полезно дать краткое истолкование его основных терминов.

Система означает, что в тесте собраны такие задания, которые обладают системообразующими свойствами. Здесь, в первую очередь, надо выделить общую принадлежность заданий к одной и той же системе знаний, т.е. к одной учебной дисциплине, их связь и упорядоченность. Для итоговой аттестации выпускников школ нужно разрабатывать интегративные задания, содержание которых охватывает систему знаний.

Специфическая форма тестовых заданий отличается тем, что задания теста представляют собой не вопросы и не задачи, а задания, сформулированные в форме высказываний, истинных или ложных, в зависимости от ответов. Традиционные вопросы, напротив, истинными или ложными не бывают, а ответы на них нередко настолько неопределенны и многословны, что для выявления их правильности требуются заметные, в суммарном исчислении, затраты интеллектуальной энергии преподавателей. В этом смысле традиционные вопросы и ответы нетехнологичны, и потому их лучше не включать в тест.

Определенное содержание означает использование в тесте только такого контрольного материала, который соответствует содержанию учебной дисциплины; остальное в педагогический тест не включается ни под каким предлогом. Например, проверка уровня интеллектуального развития является предметом психологического тестирования. Содержание теста существует, сохраняется и передается в одной из четырех основных форм заданий. Вне тестовых форм ни тест, ни его содержание не существуют.

Теоретически оправданным критерием упорядочения содержания так называемого гомогенного теста является критерий трудности заданий. Внеучебное содержание (например, проверка уровня интеллектуального развития) в педагогический тест не включается. Это предмет психологического измерения.

Возрастающую трудность заданий можно образно сравнить с барьерами на беговой дорожке стадиона, где каждый последующий выше предыдущего. Пробежать дистанцию и успешно преодолеть все барьеры сможет только тот, кто лучше подготовлен. Поскольку в педагогическом тесте задания упорядочиваются по принципу возрастающей трудности, одни испытуемые "заваливаются" уже на самом легком, первом задании, другие - на последующих заданиях. Ученик среднего уровня подготовленности могут ответить правильно только на половину заданий теста и, наконец, только самые знающие в состоянии дать правильный ответ на задания самого высокого уровня трудности, расположенные в конце теста.

Трудность задания может определяться двояко: а) умозрительно, на основе предполагаемого числа и характера умственных операций, необходимых для успешного выполнения заданий, и б) после эмпирического опробывания заданий, с подсчетом доли неправильных ответов. В классической теории тестов многие годы рассматривались только эмпирические показатели трудности. В новых вариантах психологических и педагогических теорий тестов больше внимание стало уделяться характеру умственной деятельности учащихся в процессе выполнения тестовых заданий различных форм (1).

К этому можно добавить еще один критерий - это критерий логической определенности тестового задания. Его можно сформулировать следующими словами: задание является определенным, если на него можно ответить утвердительно или отрицательно, и если существует эффективный процесс для нахождения такого ответа.

Ответ на задание педагогического теста представляет собой краткое суждение, связанное по содержанию и по форме с содержанием задания. Каждому заданию ставятся в соответствие ответы правильные и неправильные. Критерии правильности заранее определяются авторами теста. Вероятность правильного ответа на любое задание зависит от соотношения уровня знаний испытуемого и уровня трудности задания. При наличии сопоставимых шкал, эту вероятность выражают значением от нуля до единицы. Оценка ответов по степени их правильности проводится довольно редко, но при необходимости создаются задания с такими ответами, которые правильны в различной степени. Инструкция для испытуемых в таких случаях может быть такой: "Обведите кружком номер (нажимайте на клавишу с номером) наиболее правильного ответа!"

Посредством тестирования чаще других признаков проверяются знания, умения, навыки и представления. С точки зрения педагогических измерений полезно ввести два основных показателя качества знаний - уровень и структура знаний. Они оценивается посредством регистрации оценок, как за знание, так и за незнание всех требуемых компонентов проверяемого материала. Для объективизации этого процесса все компоненты должны быть одинаковы. Одинаковыми являются и правила выставления оценок испытуемым. Эти условия открывают дорогу для объективного сравнения индивидуальных структур знания и не знания.

Уровень знаний выявляются при анализе ответов каждого ученика на все задания теста. Чем больше правильных ответов, тем выше индивидуальный тестовый балл испытуемых. Обычно этот тестовый балл ассоциируется с понятием "уровень знаний" и проходит процедуру уточнения на основе той или иной модели педагогического измерения. Один и тот же уровень знаний может быть получен за счет ответов на различные задания. Например, в тесте из тридцати заданий ученик получил десять баллов. Эти баллы, скорее всего, получены за счет правильных ответов на первые десять, сравнительно легких заданий. Присущую для такого случая последовательность единиц, а затем нулей можно назвать правильным профилем знаний ученика.

Если тестовый балл ниже требуемого уровня (измеряемого критерия), то проявленные при этом знания, умения, навыки и представления указывают на докритериальный уровень подготовленности испытуемого.

В истории науки и искусств известно немало случаев, когда имевшийся в соответствующие времена критериальный уровень требований к знаниям (или мастерству) мешал общественному признанию отдельных талантов. Поэтому признание нередко приходило только по мере изменения критериев оценки. Чаще всего после смерти авторов многих бессмертных произведений в сфере науки, музыки, живописи и др. Яркий пример такого рода - изменение критериев оценки творчества Ван Гога, творчества многих художников-импрессионистов, формалистов и др. Известны и такие, например, факты. Будущий лауреат Нобелевской премии Альберт Эйнштейн летом 1895 года не смог сдать экзамены в Цюрихский политехникум, а всемирно известный пианист С. Рихтер дважды отчислялся из консерватории за общую неуспеваемость.

Структура знаний оценивается на основе последовательности правильных и неправильных ответов на задания возрастающей трудности. Формой представления индивидуальной структуры знания и незнания является профиль знаний испытуемого, представляемый последовательностью единиц и нулей, получаемых каждым студентом.

Профиль знаний представляет собой упорядоченный набор оценок (вектор-строку) в матрице тестовых результатов. Если испытуемый отвечает правильно на первые, сравнительно легкие задания, можно говорить о правильной структуре знаний. Профиль называется правильным, если в строке баллов у испытуемого все нули следуют за всеми единицами.

Если же обнаруживается противоположная картина, (испытуемый правильно отвечает на трудные задания и неправильно - на легкие), то это противоречит логике теста и потому такая структура знаний может быть названа инвертированной. Она встречается редко, и чаще всего, из-за нарушения требования располагать задания по мере возрастающей трудности. При условии, что тест сделан правильно, каждый профиль свидетельствует о структуре знаний.

Каждое учебное заведение должно стремиться, в первую очередь, к формированию правильных индивидуальных структур знаний, в которых не было бы пробелов (разрывов в знаниях), и на этой основе повышать уровень подготовки.

Человек не может хорошо учиться, если разрывы для него между известным и неизвестным слишком велики. Уровень знаний в значительной степени зависит от личных усилий и способностей учащихся. В то время как структура знаний зависит от правильной организации учебного процесса, от индивидуализации обучения, от мастерства педагога, от объективности контроля. В общем, от всего того, чего обычно у нас не хватает.

В результате анализа приведенных определений теста мы склоняемся к выводу, что приемлемым может оказаться следующее определение:

ПЕДАГОГИЧЕСКИЙ ТЕСТ - это система тестовых заданий различной трудности, которая позволяет качественно и эффективно измерить уровень и структуру подготовленности испытуемых.

Это достаточно лаконичное и полное определение основано на определении В.С.Аванесова с некоторыми изменениями. Рассмотрим эти отличия.

1. Вместо слова «задание» использован термин «тестовое задание». Это позволило исключить требование «специфической формы», поскольку оно содержится в понятии «задание в тестовой форме» и, следовательно, в понятии «тестовое задание».

2. Исключено требование «параллельности» заданий. Это требование введено В.С.Аванесовым для повышения «живучести» теста, с тем, чтобы обеспечить возможность многократного использования теста, за счет варьирования в нем параллельных заданий. С этой точки зрения это вполне обоснованное требование. Однако, если мы определяем тест как таковой, отвлекаясь от привлекательной для практики его применения свойства «непотопляемости», то требование параллельности можно исключить.

3. Требование «возрастающей трудности» заменено требованием «различной трудности». Дело в том, что если мы располагаем тестовыми заданиями различной, известной трудности, то, формируя тест, легко можем расположить их в любом порядке, в частности, в порядке возрастания трудности.

Некоторые авторы предлагают размещать задания в порядке уменьшения трудности, аргументируя это оптимальным распределением умственного напряжения тестируемых во времени. К концу тестирования, когда испытуемые утомлены, целесообразно предъявлять им более легкие задания.

Иногда предлагается дать возможность выбора задания самими испытуемыми, которые будут соизмерять свои возможности с теми усилиями, которые им понадобятся при прохождении теста. Это позволит им показать наилучший результат.

При компьютерном тестировании зачастую используется случайный порядок предъявления заданий, при этом сам тест формируется «на лету». Тестовые задания автоматически извлекаются из банка заданий в соответствии с той или иной процедурой, заданной разработчиком теста. Если порядок предъявления одинаков для всех испытуемых, то, находясь в одном компьютерном классе, за соседними компьютерами, они могли бы подглядывать за ответами других испытуемых. При случайном порядке предъявления заданий уменьшается вероятность подобного нарушения процедуры тестирования.

Страница 19 из 25

Определение педагогического теста

Педагогический тест – система заданий специфической формы, определенного содержания, возрастающей трудности – система, создаваемая с целью объективно оценить структуру и качественно измерить уровень подготовленности учащихся. Тест – по прямому значению английского слова test – любая проба, любое испытание. В таком понимании термин «тест» применяется в технике, биологии, медицине и химии. Тест в психолого-педагогических исследованиях – нормированные по времени выполнения и трудности наборы заданий, используемые для сравнительного изучения групповых и индивидуальных особенностей.

Широкое распространение тесты нашли в прикладной психологии. Именно в этой области были разработаны методические критерии по конструированию, применению, проверке и обработке тестов. Эти критерии с некоторыми уточнениями должны признаваться обязательными и для тестов педагогических. Тест выступает в качестве измерительного инструмента, поэтому он должен удовлетворять строгим и ясным методическим требованиям. Случайно подобранный набор заданий тестом назвать нельзя.

Тесты не могут рассматриваться как универсальный и всеобъемлющий инструмент изучения уровня воспитанности. Ибо каждое задание теста и весь тест, поскольку он составлен из однородных заданий, направлены на выявление ограниченного комплекса качеств личности, и чем меньше признаков входит в комплекс, тем яснее возможная интерпретация результатов и тем лучше тест выполняет свою функцию. Лучше всего, если задание выявляет всего один признак, одно качество (свойство) личности. Задание, направленное на его обнаружение сразу и без возможностей последующего вычленения группы признаков, затрудняет интерпретацию. Успех или неуспех испытуемого не получает единственной и однозначной оценки, так как может зависеть от разных признаков. Педагог, не имея такой оценки, не сможет прийти к заключению о причинах, обусловивших конечный результат, и вряд ли сформулирует четкие выводы и проведет коррекцию мер воспитательного воздействия.

Метод тестирования имеет определенные границы применения. Есть такие характеристики воспитанности школьника, которые настолько сложны и многоплановы, что тестовые методики для их выявления не могут быть применены. Пока еще не найден тестовый эквивалент того, что можно было бы назвать общей подготовленностью или воспитанностью ученика. Многие учителя и методисты придают немаловажное значение этой характеристике. Тесты обладают лишь возможностью представлять отдельные составляющие этого сложного целого.

Приходится считаться и с тем, что характеристики, не имеющие ясного содержания, вообще не могут стать объектом тестирования. В частности, неясностью содержания отличается и характеристика общего развития и воспитанности. Учитель, конечно, может заранее оговорить, что эта характеристика, согласно его взгляду, состоит из таких-то и таких-то простых и поддающихся измерениям индивидуальных особенностей. В этом случае задача, которую он ставит перед собой, поддается решению. Вопрос только в том, удастся ли ему обосновать свой взгляд на эту характеристику.

Рассмотрим связь личностных тестов с другими количественными методами. Было бы ошибкой считать тестами все без исключения количественные методы, применяемые в исследованиях проблем воспитания. Сущность метода оценочных классификаций заключается в том, что отдельные лица («оценщики», «судьи»), хорошо знакомые с данным объектом, оценивают его по определенным стандартным критериям, шкалам и т.д. Путем соответствующей статистической обработки индивидуальные оценки трансформируются в совокупный количественный показатель. Однако лица, являющиеся объектами оценочных классификаций, не только не подвергаются какому-либо стандартизованному испытанию, но во многих случаях даже не ставятся в известность о производимом оценивании. Представления, исходя из которых оценщики выносят свои суждения, формируются у них на протяжении длительного общения или наблюдений в повседневной жизни.

Как и все другие методы педагогического контроля, тест имеет определенные достоинства и недостатки. При правильном и умелом использовании он может дать педагогу много важной информации, которую не получить никаким другим способом. Достоинством теста является то, что все сформулированные в нем задания, будучи предварительно глубоко обдуманы и экспериментально проверены, раскрывают в своей совокупности в максимально короткие сроки интересующие исследователя признаки ученика. Другим, еще более важным достоинством теста является его объективность. Известно, что учитель невольно вносит некоторую долю субъективизма в оценки качеств учащихся – в данном случае в оценки и самих учащихся. Этот оттенок субъективизма нередко оправдывается тем, что учитель, накопивший большой запас наблюдений о каждом ученике, не может отделаться от того, что некоторые особенности поведения, по его глубокому убеждению, возникли незакономерно, оказались плодом неблагоприятного сочетания случайностей.

Исследователь, впервые приступающий к использованию тестов в своей работе, должен решить такие наиболее существенные задачи, как: 1) разработка самого теста; 2) достижение его удовлетворительной надежности; 3) получение удовлетворительной валидности теста.

Научно обоснованный тест – это метод, соответствующий установленным стандартам надежности и валидности. В требованиях проверки теста на надежность и валидность реализуется важная идея методологического характера, что к истинному знанию ведет лишь истинный метод. Таким образом, качество педагогической информации оказывается зависимым от качества используемого для этого инструментария.

Тест не может считаться завершенным, если он не получил удовлетворительной оценки по надежности. Понятие надежности в тестологии имеет два смысла. С одной стороны, имеется в виду надежность теста как определенного инструмента. С другой стороны, говоря о надежности, мы имеем в виду относительную неизменность того предмета, который мы измеряем. При оценке надежности теста исходят из того, что тест тем надежнее, чем он более однороден.

Валидность – степень соответствия теста своему назначению. При установлении надежности все необходимое и достаточное исследователь находит в самом тесте: он сопоставляет одну часть заданий (с четными номерами) с другой (с нечетными номерами). Но для установления валидности этого мало. Валидность может быть выведена только при сопоставлении результатов по тесту с каким-то критерием, с какой-то оценкой, находящейся вне теста; ее обычно называют внешним критерием.



Оглавление
Педагогическая диагностика в воспитательном процессе.
ДИДАКТИЧЕСКИЙ ПЛАН
Понятие педагогической диагностики
Исторические аспекты формирования диагностики как специфического вида познания
Личность как предмет педагогической диагностики
Развитие личности в разные возрастные периоды
Принципы деятельности педагога в процессе педагогической диагностики
Диагностическая деятельность педагога
Научное познание и диагностика
Психодиагностика и педагогическая диагностика
Сущность и функции педагогической диагностики

В настоящее время отмечается методологически слабая обеспеченность тестирования. Она во многом определяется недостаточной разработанностью категорийно-понятийного аппарата педагогического тестирования. Постоянно смешиваются такие ключевые понятия, как "тест" и "тестовое задание", не конкретизирована терминология видов тестов и тестовых заданий. Кроме того, большинство педагогов-практиков не имеют представления о таких важных элементах обеспечения качества экспериментальной работы, как репрезентативность выборки, надежность, валидность.

Зарубежные психологи называют науку по теории тестов психометрикой (Psychometrika). а педагоги - педагогическим измерением (Educational measurement). Поскольку общего названия на русском языке пока нет. то мы будем придерживаться устоявшегося названия данной науки - тестология , которое используется в педагогическом, психологическом или социологическом контексте. Само название "тестология" определяется как наука о тестах.

Педагогическая тестология является прикладной методической теорией научной педагогики, которая призвана заниматься вопросами разработки тестов для объективного контроля подготовленности учащихся.

Ключевыми понятиями тестологии являются педагогическое задание, тест, содержание и форма заданий, надежность и валидность результатов измерения. Кроме того, в тестологии используются такие понятия статистической науки, как выборочная и генеральная совокупность, корреляция и др.

Исходным понятием тестологии является понятие "педагогическое задание". Педагогическое задание - средство интеллектуального развития, образования и обучения, способствующее активизаций учения, повышению подготовленности учащихся, а также повышению эффективности педагогического труда . Задания могут формулироваться как в тестовой, так и в нетестовой форме.

Еще одним важным понятием является понятие теста. В настоящее время существует несколько десятков определения понятия "тест". Для обыденного сознания тест означает перевод с английского test - проба, испытание, метод. Смысл этого слова охватывает любой метод проверки, даже субъективный.

Часто мы встречаемся с упрощенным пониманием данного термина как системы заданий с выбором правильного ответа из представленных вариантов. Положение усугубляется многочисленными примерами "тестов" в газетно-журнальной периодике, многочисленными книжными публикациями под одноименным названием. Часто под такими развлекательными и даже педагогическими заданиями оказываются не тесты, а нечто, только внешне похожее на них. Между тем различия в понимании сущности тестов следует искать в самом отношении к тестам

С.Л. Рубинштейн в 1938 г. дал следующее определение теста: "Тест - это испытание, которое ставит своей целью градирование, определение рангового места личности в группе или коллективе, установление ее уровня. Тест направлен на личность, он должен служить средством диагноза и прогноза" . Его современник, один из основоположников советской психотехники С.Г. Геллерштойн писал: "Тест - это испытательный эксперимент, носящий характер определенного задания, которое стимулирует определенную форму активности и выполнение которого, поддаваясь количественной и качественной оценке, служит симптомом совершенствования определенных функций" .

Под термином "тест" в советской психолого-педагогической литературе до 1980-х гг. имелось в виду задание с четким и однозначным вариантом правильного ответа, ориентированным на определенные нормативы.

В целом сегодня научное мышление под термином "тест" понимает но только метод тестирования, но и научно-педагогическую систему. B.C. Аванесов рассматривает тест как единство метода, результата, полученного определенным методом, и интерпретации результатов.

Традиционный тест представляет собой стандартизированный метод диагностики и уровня структуры подготовленности школьников. В таком тесте все испытуемые отвечают на одни и то же задания, в одинаковое время, в одинаковых условиях и с одинаковыми правилами оценивания ответов. Цель применения данных тестов - установить отношение порядка между испытуемыми по уровню проявляемых при тестировании знаний И на этой основе определить место каждого на заданном множество тестируемых испытуемых.

Далеко не однозначен и термин "дидактический тест": как синонимы используются термины "педагогические", "учительские", "преподавательские тесты", "тесты достижений", "тесты исполнения", "тесты контроля знаний", "тесты умений и навыков", "учебные тесты", "контрольные тесты".

При этом разные авторы вкладывают свое (не всегда четко определенное) понимание в эти термины. Например, у Ч. Куписевича "преподавательский тест - это не стандартизированные тесты, которые "могут быть составлены лицами, исследующими результаты учебы, достигнутые на проведенных ими учебных занятиях" .

С.М. Вишнякова в словаре профессионального образования дает следующее определение теста. Тест, во-первых, стандартное задание, соответствующее определенным требованиям (однозначности, краткости и простоты). выполнение которого позволяет оценить некоторые психофизиологические характеристики испытуемого (умственное развитие, способности.

полевые качества), а также уровень его знаний, умений и навыков. Во-вторых. тест является объективным методом контроля качества знаний учащегося, инструментом, позволяющим выявить факт усвоения. В-третьих, cостоит из контрольного задания и эталона - образца последовательного и правильного выполнения задания. Задание выдается испытуемому, а эталон используется преподавателем или заложен в техническое средство для сравнения с ответом испытуемого и выведения оценки. Следует отметить, что этот метод требует:

  • - объемного и дорогостоящего методического обеспечения (набора тестов по каждой цели обучения) и высокой квалификации разработчиков тестов;
  • - вопросник для конкретных социологических исследований;
  • - информационную задачу с известным решением, предназначенную для проверки правильности работы вычислительной машины .

А Н. Майоров рассматривает тест как инструмент, состоящий из квалиметрически выверенной системы тестовых заданий, стандартизированной процедуры проведения и заранее спроектированной технологии обработки и анализа результатов, предназначенный для измерения качеств и свойств личности, изменение которых возможно в процессе систематического обучения .

B.C. Аванесов определяет педагогический тест как систему параллельных заданий возрастающей трудности, специфической формы, которая позволяет качественно и эффективно измерять уровень и структуру подготовленности испытуемых .

При этом под системой понимается, что в тесте собраны такие задания. которые обладают системообразующими свойствами. Это, в свою очередь. означает общую принадлежность заданий к одной и той же системе знаний, а также их связь и упорядоченность. Еще одним необходимым атрибутом настоящего теста является расположение заданий по мере возрастания трудности - от самого легкого до самого трудного. Иначе говоря, главным формальным системообразующим признаком теста является различие заданий по степени их трудности.

Показатель трудности теста и тестовых заданий является содержательным и формальным одновременно. Содержательным показателем - потому что в хорошем тесте трудность может зависеть только от содержания и от уровня подготовленности самих испытуемых, в то время как в плохом тесте на результаты начинают заметно влиять форма заданий (особенно если она не адекватна содержанию), плохая организация тестирования, если имеются возможности списывания, утечки информации.

Формальная составляющая сторона показателя трудности возникает при рассмотрении тестирования как процесса противоборства каждого испытуемого с каждым предлагаемым ему заданием. Получаемый при этом исход полезно рассматривать как результат такого противоборства

Специфическая форма тестовых заданий говорит о том. что задания теста представляют собой и не задачи, а задания, сформулированные в форме высказываний, истинных или ложных. Такие задания носят название "тестовые задания" или "задания в тестовой форме" в зависимости от употребляемого контекста. Традиционные вопросы, напротив. истинными или ложными не бывают, а ответы на них часто бывают многословны, они не поддаются сравнению с жестким эталоном. В этом смысле традиционные вопросы и ответы менее нетехнологичны, чем задания в тестовой форме или тестовые задания.

Нельзя не согласиться с B.C. Аванесовым, который указывает на то, что не всякое содержание поддается представлению в форме тестового задания. Затруднительным представляется выражение доказательств, обширных вычислений, многословных описаний в тестовой форме.

Определенное содержание означает, что при тестировании проверяется не весь программный материал, а лишь та часть учебной программы, которая входит в содержание проверяемых знаний учащихся. Остальное в педагогический тест не включается. При этом некоторые элементы проверяемых знаний используются только в текущем контроле, другие - в рубежном контроле, например, в конце учебной четверти. И, наконец, в итоговом контроле используются задания, правильные ответы на которые требуют знания многих, а иногда и всех тем, изученных в течение учебного года. Особое внимание следует уделять комплексности и сбалансированности содержания теста . Согласно этому положению тест, разработанный для итогового контроля знаний, не должен строиться на материале одной темы, даже самой основной. Тест необходимо конструировать, исходя, из сбалансированности всех тем курса. В то же время необходимо добиваться комплексного включения в тест как вопросов теории, так и методов научной и практической деятельности, умения эффективно решать основные профессиональные задания.

Согласно принципу научной достоверности в тест включается только то содержание учебной дисциплины, которое является объективно истинным и обладает аргументацией. Не следует включать спорные вопросы, то есть вопросы, имеющие неоднозначное решение. Кроме того, в педагогический тест, предназначенный для контроля. диагностики обученности и обучаемости, недопустимо включать вопросы, которые выясняют оценки, мотивацию, мнения.

По своей длине тесты могут быть короткими (10-20 заданий), средними (40-60 заданий) и длинными (до 500 заданий). Оптимальное количество заданий определяется целями контроля, но практика показывает, что это примерно 40-60 заданий. Количество заданий в тесте принято называть длиной теста. К настоящему времени сложилась практика организации различных видов тестирования, требующих соответственно разных тестов. Таким образом. кроме приведенных подходов, тесты можно классифицировать по целому ряду оснований.

1. Прежде всего по процедуре создания могут быть выделены стандартизированные и нестандартизированные тесты.

Стандартизируются процедура и условия проведения тестирования, способы обработки и интерпретации результатов, которые должны привести к созданию равных условий для испытуемых и минимизировать случайные ошибки и погрешности как на этапе проведения, так и на этапе обработки результатов и интерпретации данных

В образовании можно выделить ряд задач, которые могут быть решены нестандартизированными тестами. Однако для целей мониторинга необходимо использовать только стандартизированный тестовый инструмент.

  • 2. По степени однородности задач выделяют гомогенные и гетерогенные тесты.
  • 3. По средствам предъявления выделяют бланковые тесты (""бумага и карандаш").

Эти тесты в свою очередь можно разделить на два вида:

  • 1) с использованием тестовых тетрадей, в которых находятся тестовые задания и в которых испытуемый фиксирует результаты;
  • 2) с использованием бланков, в которых испытуемые отмечают или вписывают правильные ответы (фиксируют ответы). Бланки предъявляются отдельно от заданий:

предметные, в которых необходимо манипулировать материальными объектами, результативность выполнения этих тестов зависит от скорости и правильности выполнения заданий;

аппаратурные - тесты с использованием устройств для изучения особенностей внимания, восприятия, памяти и мышления;

практические, появившиеся относительно недавно. Эти тесты сходны с известными у нас лабораторными работами (по химии, физике, биологии и пр.). однако снабженные соответствующими инструкциями и имеющие тестовое оснащение;

компьютерные тесты .

  • 4. По направленности развития и формирования человеческих качеств:
    • - тесты интеллекта, выявляющие особенности последнего;
    • - тесты общих умственных способностей, умственного развития;
    • - тесты специальных способностей в различных областях деятельности;
    • - тесты обученности, успеваемости, академических достижений;
    • - тесты для определения отдельных качеств (черт) личности , личностные тесты (иногда называемые тестами темперамента), с помощью которых изучаются особенности личности испытуемого (память, мышление, характер, эмоции и др.);
    • - тесты для определения уровня воспитанности (сформирован- мости общечеловеческих, социально-нравственных, обще интеллектуальных, общекультурных и других качеств);
    • - тесты достижений.

Правильно составленные тесты учебных достижений (обученности) должны удовлетворять определенным требованиям. Желательно сделать их:

  • - краткосрочными, чтобы не требовались большие затраты времени;
  • - однозначными, не допускающими произвольного толкования тестового задания;
  • - правильными, исключающими возможность формулирования многозначных ответов;
  • - краткими, требующими сжатых ответов;
  • - информационными, т.е. такими, которые обеспечивают возможность соотнесения количественной оценки за выполнение теста с порядковой или даже интервальной шкалами измерений; удобными, т.е. пригодными для быстрой математической обработки результатов;
  • - стандартными, пригодными для широкого практического использования - измерения уровня обученности возможно более широких групп учеников, овладевающих одинаковым объемом знаний на одном и том же уровне обучения.

Применение тестов будет наиболее эффективным и обеспечит надежные выводы лишь при условии правильного сочетания всех выделенных групп тестов. Поэтому тестовые испытания всегда имеют комплексный характер: выводы одних дополняются и корректируются другими.

При подготовке материалов для тестового контроля необходимо придерживаться следующих основных правил.

  • 1) Нельзя включать ответы, неправильность которых на момент тестирования не может быть обоснована учащимися.
  • 2) Неправильные ответы должны конструироваться на основе типичных ошибок и должны быть правдоподобными.
  • 3) Правильные ответы среди всех предлагаемых должны размещаться в случайном порядке.
  • 4) Вопросы не должны повторять формулировок учебника.
  • 5) Ответы на одни вопросы не должны быть подсказками для ответов на Другие.
  • 6) Вопросы не должны содержать "ловушек" .
  • 5. По характеру действий.

Вербальные (связанные с необходимостью произведения умственных действий - словесно-логические тесты, вопросники на проверку знаний, установление закономерностей и пр.). Данные тесты требуют сформированности навыков и наличия определенных знаний. Поэтому именно те дети, которые хорошо успевают в школе, как правило, набирают большее количество баллов при прохождении этих тестов.

Невербальные (практические), связанные с практическим манипулированием предметами - карточками, блоками, деталями. Невербальные тесты, по мнению многих английских педагогов, меньше зависят от школьной успеваемости, домашних условий воспитания, социального положения. При выполнении этих тестов учащийся должен анализировать, сравнивать, делать выводы на основе наборов картинок, диаграмм, предметов, фигур и т.д. С заданиями невербальных тестов нередко лучше справляются учащиеся с высоким уровнем интеллекта из семей с низким социальным статусом, отличающиеся плохим поведением, частыми нарушениями дисциплины и т.д. .

6. По ведущей ориентации.

Тесты скорости, содержащие простые задачи, время решения которых ограничено настолько, что ни один испытуемый не успевает решить все задачи в заданное время.

Тесты мощности или результативности, включающие трудные задачи. время решения которых либо вовсе не ограничено, либо мягко лимитировано. Оценке подлежит успешность и способ решения задачи. Примером такого рода тестовых заданий могут быть задания для письменных итоговых экзаменов за курс школы.

Смешанные тесты, которые объединяют в себе черты двух вышеперечисленных. В таких тестах представлены задачи различного уровня сложности. от самых простых до очень сложных. Время испытания в данном случае ограничено, но достаточное для решения предлагаемых задач большинством обследуемых. Оценкой в данном случае служат как скорость выполнения заданий (количество выполненных заданий), так и правильность решения.

Эти тесты наиболее часто применяются на практике, и именно к ним относится большинство тестов учебных достижений, которые можно использовать для нужд мониторинга.

7. По характеру объективности.

Объективные тесты - тесты, объективность оценки результатов которых обусловливается тем обстоятельством, что в процессе обработки результатов тестирования не предусматривается использование их субъективных толкований тестирующим, к этой группе тестов относятся тесты школьных достижений.

Проективные тесты - совокупность методик, разработанных в рамках проективного подхода в психологии и характеризующихся неопределенностью. неоднозначностью используемых в ходе тестирования стимулов. Соответственно, такой подход допускает большое разнообразие ответов и их интерпретацию.

8. По степени ориентированности.

Широко ориентированные, позволяющие оценить эффективность процесса обучения по степени реализации одной из его основных целей, то есть степени освоения учащимися системы знаний, умений и навыков в ходе учебного процесса.

Узко ориентированные, направленные на выявление достижений учащихся в процессе освоения отдельных предметов, отдельных тем и т.д..

  • 9. По целям использования выделяются следующие группы тестов:
    • - знаний или поведения студента в начале обучения (определяющий тест) :
    • - прогресса, достигнутого в процессе обучения (формирующий тест) :
    • - трудностей обучения и их источников во время процесса обучения (диагностический тест) :
    • - основных достижений в конце обучения (суммирующий тест).

Предварительный определяющий тест предназначен для оценки начальных способностей, обычно является несложным и охватывает очень небольшой диапазон знаний. Он может затрагивать минимум базовых знаний по теме обучения или другой ограниченный набор требуемых знаний.

Формирующий тест, используемый для контроля за прогрессом обучения, затрагивает ограниченный сегмент обучения, например, раздел или главу, и с его помощью делается попытка оценить все важные результаты данного сегмента. Акцент делается на оценке степени владения материалом изучаемых задач и обеспечения обратной связи со студентом по корректировке отдельных ошибок.

Диагностический тест содержит относительно большое число вопросов, имеющих отношение к конкретной тестируемой области. В связи с тем, что целью теста является определение трудностей обучения, внимание фокусируется на ответах учащихся на конкретный вопрос или группу вопросов, и общий балл имеет второстепенное значение. Этот тест обычно больше фокусируется на распространенных ошибках, которые делают учащиеся, чем на попытке широкого отбора ожидаемых результатов обучения.

Суммирующий тест разрабатывается для оценки широкого диапазона результатов обучения, ожидаемого в конце учебного процесса. Сложность и представительность выборки являются важными аспектами данного теста в связи с тем. что результаты используются для простановки баллов и определения степени достижения задач курса обучения. Для того чтобы адекватно отобрать все ожидаемые результаты обучения, суммирующий тест обычно содержит вопросы, которые представляют более высокий уровень сложности, чем другие виды тестов.

10. По широте использования.

Для использования учителем.

Для использования группой учителей или администрацией образовательно по учреждения.

Для целей отбора и формирования групп.