Контрольная работа по информатике измерение информации: Контрольная работа по информатике на тему “Измерение информации”

Контрольная работа по теме “Измерение информации”

Панафидина Л.М. МБОУ «СОШ №17» г. Новомосковск

Контрольная работа

по теме «Единицы измерения количества информации»

7 класс

I вариант

1. Перевести в биты:

А) 128 байт;

Б) 1,5 Кбайт;

В) 0,5 Байт;

Г) 0,2 Кбайт.

2. Перевести в байты:

А) 256 бит;

Б) 0,5 Мбайт;

В) 12 бит;

Г) 1,25 Кбайт.

3. Сравнить:

А) 24 байта и ;

Б) 0,5 Кбайт и 212 бит;

В) 128 Кбайт и 27 Мбайт;

Г) и 213 бит.

4. Решить задачу:

Сколько символов содержит сообщение, записанное с помощью 256 символьного алфавита, если его объём составил 1/16 часть мегабайта?

II вариант

1. Перевести в биты:

А) 45 байт;

Б) 0,5 Кбайт;

В) 80 байт;

Г) 0,001 Мбайт.

2. Перевести в байты:

А) 128 бит;

Б) 0,5 Мбайт;

В) 88 бит;

Г) 1,5 Кбайт.

3. Сравнить:

А) 64 байта и ;

Б) 1 Кбайт и 223 бит;

В) 25 Мбайт и 128 Кбайт;

Г) и 64 бит.

4. Решить задачу:

В сообщении, записанном с помощью 64 символьного алфавита, содержится 2048 символов. Найдите информационный объем этого сообщения. (ответ выразить в Кбайтах).

III вариант

1. Перевести в биты:

А) 16 байт;

Б) 0,5 Кбайт;

В) 1,5 Байт;

Г) 0,1 Кбайт.

2. Перевести в байты:

А) 1024 бит;

Б) Мбайт;

В) 24 бит;

Г) 1,05 Кбайт.

3. Сравнить:

А) 32 бит и ;

Б) 1 Кбайт и 210 бит;

В) 256 Кбайт и 28 Мбайт;

Г) и 128 бит.

4. Решить задачу:

Сколько символов содержит сообщение, записанное с помощью 16 символьного алфавита, если его объём составил 1/128 часть мегабайта?

IV вариант

1. Перевести в биты:

А) 64 байт;

Б) 0,02 Кбайт;

В) 1,05 байт;

Г) 1 Кбайт.

2. Перевести в байты:

А) 12 бит;

Б) Мбайт;

В) 240 бит;

Г) 1,2 Кбайт.

3. Сравнить:

А) 16 бит и ;

Б) 1 Кбайт и 215 бит;

В) 256 Кбайт и 210 Мбайт;

Г) и 64 бит.

4. Решить задачу:

В сообщении, записанном с помощью 256символьного алфавита, содержится 4096 символов. Найдите информационный объем этого сообщения. (ответ выразить в Кбайтах).

ОТВЕТЫ:

Номер задания:

I

вариант

II

вариант

III

вариант

IV

вариант

1

А) 1024

Б) 12288

В) 4

Г) 1638,4

А) 360

Б) 4096

В) 640

Г) 8388,608

А) 128

Б) 4096

В) 12

Г) 819,2

А) 512

Б) 163,84

В) 8,4

Г) 8196

2

А) 32

Б) 524288

В) 1,5

Г) 1280

А) 16

Б) 524288

В) 11

Г) 1536

А) 128

Б) 4096

В) 3

Г) 1075,2

А) 1,5

Б) 2048

В) 30

Г) 1228,8

3

А)

Б) =

В)

Г)

А)

Б)

В)

Г) =

А) =

Б)

В)

Г)

А)

Б)

В)

Г) =

4

65 536 символов

1,5 Кбайт

16 384 символов

4 Кбайта.

КОНТРОЛЬНАЯ РАБОТА ПО ПРЕДМЕТУ «ИНФОРМАТИКА и ИКТ» 7 класс по теме «ЕДИНИЦЫ ИЗМЕРЕНИЯ ИНФОРМАЦИИ»


Всероссийский дистанционный конкурс для учителей физики и информатики

«Контрольная работа в формате теста»


МБОУ «О(С)ОШ»

Всероссийский дистанционный конкурс для учителей физики и информатики

«Контрольная работа в формате теста»

Лобанов Алексей Александрович

05.11.2020

ПОЯСНИТЕЛЬНАЯ ЗАПИСКА К КОНТРОЛЬНОЙ РАБОТЕ ПО ТЕМЕ

«Информация и информационные процессы»

Автор:

Лобанов Алексей Александрович, учитель информатики МБОУ «О(С)ОШ» г. Ангарск

Класс

7 класс

Предмет

информатика

Продолжительность выполнения теста

30 – 40 минут

Структура и содержание заданий

Задания разработаны в соответствии с требованиями ФГОС ООО к системе оценки достижений планируемых результатов освоения основной образовательной программы по УМК Л.Л. Босовой учебной дисциплины «Информатика и ИКТ».

Число заданий в работе

9

Уровни сложности

В работе представлены задания разного уровня сложности: базового (8 заданий) и повышенного (1 задание).

Задания базового уровня включены в первую часть работы (заданий с выбором ответа). Это простые задания, проверяющие усвоение наиболее важных понятий темы.

Задания повышенного уровня направлены на проверку умения использовать полученные знания в рамках курса информатики по данной теме.

Цель работы

Проверка сформированности знаниевых компетенций по теме «Единицы измерения информации» и универсальных учебных действий у учащихся.

Планируемый результат

Знание единиц измерения информации и свободное оперирование ими.

Оценивать количественные параметры информационных объектов и процессов.

Умения

Определять информационный вес символа произвольного алфавита

Определить информационный объём сообщения, состоящего из некоторого количества символов алфавита

Соотносить результаты измерения количества информации, выраженные в разных единицах.

Сформированность УУД

Регулятивные

составление плана и последовательности деятельности; контролировать правильность и полноту выполнения изученных способов действий

Познавательные

построение логической цепи рассуждений

Личностные

навыки концентрации внимания

Требования к уровню подготовки учащихся по теме за курс 7 класса

Система оценивания работы

За правильный ответ на задания ставится 1 балл, за неверный ответ или его отсутствие – 0 баллов.

За правильный ответ задания повышенного уровня -2 балла

Критерии выставления оценок:

Оценка

Оценка «5»

Оценка «4»

Оценка «3»

Оценка «2»

Кол-во баллов

9-10

7-8

5-6

менее 5

Эталоны ответов

Номер задания

1 вариант

2 вариант

1

1Б2Б3В4Г

1Б2Б3В4Г

2

1Б2А3Г4В

1Б2А3Г4В

3

БАГВ

ГВБА

4

3

3

5

3

3

6

В

Б

7

25

24

8

24

16

9*

5

4

КОНТРОЛЬНАЯ РАБОТА ПО ПРЕДМЕТУ «ИНФОРМАТИКА и ИКТ» 7 класс

по теме «ЕДИНИЦЫ ИЗМЕРЕНИЯ ИНФОРМАЦИИ»

ИНСТРУКЦИЯ

На тестировании не разрешается: Общаться друг с другом. Вставать с места без разрешения учителя. Передавать что-либо друг другу.

После получения теста вы должны их подписать (фамилию и имя, класс)

Работать вы должны самостоятельно. Вопросы, связанные с содержанием заданий, задавать не следует.

Внимательно читайте инструкцию и каждое задание. Отвечайте на вопрос только после того, как вы его поняли.

Выполняйте задания в том порядке, в котором они даны. Если какое-то задание вызывает у вас затруднение, пропустите его. К пропущенным заданиям можно будет вернуться, если у вас останется время.

Не забывайте записывать ответы в бланк ответов и все решения в специально оставленные места в тесте. Без решения и оформления данные задания не будут засчитаны.

При ошибочной записи ответа на задание необходимо зачеркнуть неправильный ответ и, отступив в той же строчке указать новый вариант ответа.

Фамилия, Имя учащегося

Класс

ВАРИАНТ №1

Установите соответствие: где N- мощность алфавита, i-информационный вес символа алфавита.

1. N=4

А) i=2

2. i=3

Б) N=8

3. N=32

В) i=5

4. i=6

Г) N=64

Установите соответствие:

1. 88 бит

А) 1 Мбайт

2. 1024 Кбайт

Б) 11 байт

3. 3 байта

В) 0,5 Кбайт

4. 512 байт

Г) 24 бита

3. Отсортируйте в порядке возрастания величины: А) 1 байт; Б) 7 бит; В) 1025 байт; г) 1 Кбайт

4. Получено сообщение ВАПРАПСАПМАПЮТ, в котором использованы все символы алфавита, определите информационный вес символа в полученном сообщении.

Дано:

Формула(ы)

Решение

-?

Ответ:

Информационное сообщение объёмом 1 Кбайт состоит из 8192 символов. Каков информационный вес символа этого сообщения и сколько символов содержит алфавит, с помощью которого записано сообщение. В ответ запишите сумму полученных ответов.

Дано:

Формула(ы)

Решение

-?

Ответ:

6. Найдите наибольшую величину среди предложенных: А) 88 бит, Б)1 Мбайт; В) 1025 Кбайт; Г) 11 байт.

7. Заполните пропуски 4Мбайт =___ Кбайт =___________ байт = ___________ бит. В ответ запишите степень полученного числа с основанием два.

8. Получено сообщение ТОАМИШЫН, в котором использованы все символы данного алфавита, определите информационный объём полученного сообщения.

Дано:

Формула(ы)

Решение

-?

Ответ:

9*. Решите предложенное уравнение 16х битов=128Кбайт

БЛАНК ОТВЕТОВ

Номер задания

ОТВЕТ

Вес задания

Отметка о правильности выполнения

1

1 балл

2

1 балл

3

1 балл

4

1 балл

5

1 балл

6

1 балл

7

1 балл

8

1 балла

9

2 балла

ИТОГО БАЛЛОВ

баллов

Оценка за работу

КОНТРОЛЬНАЯ РАБОТА ПО ПРЕДМЕТУ «ИНФОРМАТИКА и ИКТ» 7 класс

по теме «ЕДИНИЦЫ ИЗМЕРЕНИЯ ИНФОРМАЦИИ»

ИНСТРУКЦИЯ

контрольная работа информатика
DOCX / 366. 78 Кб

На тестировании не разрешается: Общаться друг с другом. Вставать с места без разрешения учителя. Передавать что-либо друг другу.

После получения теста вы должны их подписать (фамилию и имя, класс)

Работать вы должны самостоятельно. Вопросы, связанные с содержанием заданий, задавать не следует.

Внимательно читайте инструкцию и каждое задание. Отвечайте на вопрос только после того, как вы его поняли.

Выполняйте задания в том порядке, в котором они даны. Если какое-то задание вызывает у вас затруднение, пропустите его. К пропущенным заданиям можно будет вернуться, если у вас останется время.

Не забывайте записывать ответы в бланк ответов и все решения в специально оставленные места в тесте. Без решения и оформления данные задания не будут засчитаны.

При ошибочной записи ответа на задание необходимо зачеркнуть неправильный ответ и, отступив в той же строчке указать новый вариант ответа.

Фамилия, Имя учащегося

Класс

ВАРИАНТ №2

Установите соответствие: где N- мощность алфавита, i-информационный вес символа алфавита.

1. N=2

А) i=1

2. i=4

Б) N=16

3. N=64

В) i=6

4. i=7

Г) N=128

Установите соответствие:

1. 96 бит

А) 2 Мбайт

2. 2048 Кбайт

Б) 12 байт

3. 4 байта

В) 0,25 Кбайт

4. 256 байт

Г) 32 бита

3. Отсортируйте в порядке убывания величины: А) 1 байт; Б) 9 бит; В) 1023 байт; г) 1 Кбайт

4. Получено сообщение ЯАХРАХСАХМАХЮТ, в котором использованы все символы алфавита, определите информационный вес символа в полученном сообщении.

Дано:

Формула(ы)

Решение

-?

Ответ:

5. Информационное сообщение объёмом 128 Кбайт состоит из 1024 символов. Каков информационный вес символа этого сообщения и сколько символов содержит алфавит, с помощью которого записано сообщение. В ответ запишите сумму полученных ответов.

Дано:

Формула(ы)

Решение

-?

Ответ:

6. Найдите наибольшую величину среди предложенных: А) 88888 бит, Б) 1025 Кбайт; В) 1Мбайт; Г) 1111 байт.

7. Заполните пропуски 2Мбайт =___ Кбайт =___________ байт = ___________ бит. В ответ запишите степень полученного числа с основанием два.

8. Получено сообщение ПУЕРПУЕР, в котором использованы все символы данного алфавита, определите информационный объём полученного сообщения.

Дано:

Формула(ы)

Решение

-?

Ответ:

9*. Решите предложенное уравнение 16х битов=8Кбайт

БЛАНК ОТВЕТОВ

Номер задания

ОТВЕТ

Вес задания

Отметка о правильности выполнения

1

1 балл

2

1 балл

3

1 балл

4

1 балл

5

1 балл

6

1 балл

7

1 балл

8

1 балла

9

2 балла

ИТОГО БАЛЛОВ

баллов

Оценка за работу

Лобанов А. А. учитель информатики МБОУ «О(С)ОШ» г. Ангарск Страница 8

Опубликовано в группе «УРОК.РФ: группа для участников конкурсов»

Измерение надежности — CS Education Research

Надежность инструментов оценки ничем не отличается от надежности других инструментов, используемых в науке и даже в информатике. Например, давайте возьмем еще один инструмент, который мы довольно часто используем, решая, что надеть каждый день, — термометр. Когда термометр разрабатывается, а затем производится, мы, как потребители, хотим, чтобы термометр точно измерял температуру каждый день. В вычислениях, когда мы вводим URL-адрес в нашем браузере, мы хотим, чтобы браузер возвращал правильный сайт для этого конкретного URL-адреса. В обоих случаях мы хотим, чтобы наш инструмент (или инструмент) был надежным.

Для инструментов оценки надежность является мерой согласованности и стабильности результатов участников. Он отвечает на вопрос: «Дает ли этот инструмент воспроизводимые результаты?» Если вы учитель, вы знаете, что создание теста для оценки знаний учащихся о циклах while или условных операторах может занять много времени. Вы хотите, чтобы тест или викторина измеряли одни и те же знания для каждого учащегося, который их проходит.

Мы можем измерять надежность приборов несколькими способами. Результаты одного или нескольких измерений свидетельствуют о надежности прибора.

1. Надежность внутренней согласованности (надежность по элементам)

Надежность внутренней согласованности отражает согласованность результатов прибора или теста. Это помогает гарантировать, что различные элементы, измеряющие разные конструкции, дают согласованные оценки по этим элементам. Например, предположим, что вы создаете тест с множественным выбором, и три вопроса предназначены для измерения одной конструкции — циклов while. Если бы ваш тест имел 100% надежность внутренней согласованности и если учащийся понимает циклы while, то все три ответа были бы правильными. Если бы они не понимали циклы while, то все три ответа были бы неверными.

Если у вас есть набор из 6 пунктов шкалы Лайкерта, предназначенных для измерения самоэффективности студентов, которые впервые изучают программирование, и все пункты были отмечены положительно («Я уверен, что смогу научиться программированию» вместо «Я не уверен, что смогу научиться программированию»), то учащиеся не ответили бы «Полностью согласен» по трем вопросам и «Совершенно не согласен» по трем остальным. Тест на внутреннюю согласованность, такой как α Кронбаха (греческая буква альфа), указывает на то, что три вопроса «Совершенно не согласен» должны быть удалены из инструмента.

Существует несколько способов проверки внутренней согласованности. α Кронбаха является наиболее популярным. Обычно считается, что значение 0,80 или выше указывает на то, что измеряемый конструкт обладает хорошей внутренней надежностью, хотя следует отметить, что по мере увеличения количества пунктов в шкале может быть возможно получить относительно высокий α Кронбаха даже с относительно низким уровнем корреляции между элементами.

2. Межэкспертная надежность (Надежность между исследователями)

Надежность между оценщиками оценивает, в какой степени разные оценщики дают согласованные результаты одних и тех же данных или явлений, которые оцениваются. С точки зрения тестов или викторин в классе, если у вас есть два оценщика, помогающие вам оценивать серию тестов, и ответы были открытыми, вам нужно убедиться, что каждый оценщик дал примерно одинаковую оценку за одни и те же задачи. В качестве другого примера, для этого сайта двое из нас рассмотрели и оценили каждый реферат в первоначальных десяти целевых журналах за 2012–2017 годы, чтобы определить, какие из них подходят для добавления в наш набор сводных данных по статьям. Мы оценили каждую, чтобы решить, соответствует ли она нашим заранее определенным критериям. Затем мы сравнили результаты нашего рейтинга и обнаружили, что последовательно оцениваем эти рефераты.4,8% времени, поэтому наш показатель надежности между экспертами составил 94,8% (что указывает на очень высокую согласованность). Если бы мы были на 100%, мы бы каждый раз точно измеряли их одинаково.

Инструменты оценки ничем не отличаются. Всякий раз, когда два или более исследователей оценивают ответы участников на открытые вопросы, например, будь то качественное исследование или открытые вопросы в рамках количественного исследования, исследователи должны быть обучены тому, как интерпретировать результаты. результаты (или закодировать их). Это можно сделать различными способами, включая отслеживание рейтинга каждого элемента, когда два или более исследователей всегда оценивают одни и те же элементы, а затем усредняют баллы, калибруют методы рейтинга, когда все исследователи оценивают одни и те же результаты пяти участников, а затем обсуждение того, как или почему их оценки были другими, и еще несколько.

Несмотря на то, что эта форма надежности часто проявляется в научных исследованиях, она реже встречается в описании инструмента, поскольку высокая межэкспертная надежность является скорее мерой того, насколько хорошо было проведено исследование, чем насколько хорошо была разработана рубрика или набор открытых вопросов (хотя есть некоторая взаимосвязь).

3. Надежность повторных испытаний (надежность во времени)

Надежность при повторном тестировании является наиболее простой и простой для понимания формой тестирования надежности. Это означает, что при наличии одного и того же вопросника через разные промежутки времени, возможно, с разницей в две недели, участники ответят на вопросы одинаково. Затем результаты первого распространения опроса и второго можно сопоставить, чтобы определить его стабильность во времени. Например, если вы измеряли отношение учащихся средней школы к компьютерам, вы могли бы провести опрос 1 ноября, а затем провести такой же опрос тем же учащимся 14 ноября (в той же среде и в тех же условиях). Надежность повторных испытаний будет измеряться с использованием коэффициента корреляции, такого как r Пирсона. Если r Пирсона составляет 0,70 или выше, а p-значение (критерий значимости) меньше 0,05, то говорят, что надежность повторного тестирования демонстрирует свидетельство надежности.

4.
Надежность параллельных форм и надежность разделенных половин

Когда вы разрабатываете инструмент или тест, какие вопросы лучше всего задавать? Мера надежности параллельных форм может помочь определить лучшие вопросы, когда разные вопросы, предназначенные для измерения одной и той же концепции, помещаются в два разных инструмента или теста. То есть вы одновременно запускаете два одинаковых теста, но используете разные вопросы из одной и той же батареи, предназначенной для измерения одной и той же конструкции. Затем вы оцениваете различия между результатами, чтобы определить, какие из них обеспечивают более высокую надежность, которая может быть определена по тому, какой из них дает самый высокий балл Кронбаха α для наборов вопросов, разработанных для измерения одной и той же конструкции.

Надежность разделенных пополам очень похожа. В этом случае тест, возможно, больший по набору вопросов, делится на две части. Два теста даются двум разным группам участников. Затем результаты каждой половины сравниваются друг с другом. Затем используется набор вопросов, которые дают наиболее последовательные результаты. Это измеряется посредством корреляции (r Пирсона или rho Спирмена) между двумя разными половинами инструмента. Полученные коэффициенты анализируются с использованием формулы Спирмена-Брауна для определения коэффициента надежности разделения пополам, который дает совокупную меру надежности.

Выберите здесь, чтобы перейти на следующую страницу, чтобы узнать о действительности.

Цитировать эту страницу

Для цитирования этой страницы используйте:

Макгилл, Моника М. и Ксавье, Джеффри. 2019. Измерение надежности и валидности. Получено с https://csedresearch.org

Ссылки

Браун, JD (1996). Тестирование в языковых программах. Река Аппер-Сэдл, Нью-Джерси: Регенты Прентис-Холла.

Кресуэлл, Дж. (2008). Образовательные исследования: планирование, проведение и оценка количественных и качественных исследований. Река Аппер-Сэдл, Нью-Джерси, США: Pearson Education, Inc.

Кронбах, Л. Дж.; Мил, П.Е. (1955). «Конструирование валидности в психологических тестах». Психологический вестник. 52 (4): 281–302. дои: 10.1037/h0040957. PMID 13245896.

Ли, А.С., Хубона, Г.С. (2009). Научная основа для строгого исследования информационных систем. MIS Quarterly, 33 (2), 237-262.

Полит, Д.Ф., Бек, К.Т. (2012). Исследования в области сестринского дела: сбор и оценка данных для сестринской практики, 9-е изд. Филадельфия, США: Wolters Klower Health, Lippincott Williams and Wilkins.

Трохим, В. (2006). Веб-центр методов социальных исследований. Доступно в Интернете по адресу https://www.socialresearchmethods.net

.

Измерение валидности — CS Education Research

Считается, что инструмент оценки или мера оценки, такая как тест или викторина, имеет свидетельство валидности , если мы можем сделать выводы о конкретной группе людей или конкретных целях по результатам. Это означает, что если конкретный тест на вычислительное мышление разработан, протестирован и утвержден для учащихся 7-го класса, это не означает автоматически, что он также будет действителен для старшеклассников. Без дополнительного тестирования на валидность для старшеклассников мы не сможем совершить этот прыжок. Конкретная подгруппа населения, используемая для валидации инструмента, также может быть важна — например, инструмент, измеряющий мотивацию к изучению компьютерных наук среди учащихся 7-х классов, которые в основном белые, может быть недействителен для использования с учащимися 7-х классов, которые в основном являются африканцами. американский.

То же самое относится и к конкретным целям из результатов. Если инструмент разработан, протестирован и измерен на достоверность с учащимися 7-го класса для измерения самоэффективности в отношении обучения программированию, доказательства валидности могут отличаться, если той же группе учащихся был предоставлен инструмент для измерения самоэффективности. в отношении изучения науки. Могут быть корреляции, но без дальнейшего изучения инструмента нельзя сделать твердого автоматического предположения о доказательствах достоверности в другом предмете (науке).

Лицевая валидность и валидность критериев являются наиболее часто используемыми формами проверки валидности в инструментах оценки для образования. Но есть много вариантов для рассмотрения. Валидность немного более субъективна, чем надежность, и не существует единого чистого метода «доказательства» валидности — мы можем только собрать доказательства валидности. Вы можете получить более глубокие уровни доказательств, оценив их с помощью различных мер (описанных ниже), но вы можете сделать так много с ограниченными ресурсами. От исследователей обычно не ожидают, что они приложат все усилия, чтобы продемонстрировать доказательства достоверности, однако те исследователи, у которых больше времени и ресурсов, могут это сделать.

Лицевая достоверность (или доказательство, связанное с содержанием)

Внешняя валидность заключается просто в том, что на его поверхности (или внешнем виде) с точки зрения специалистов по контенту, являются ли пункты и вопросы в инструменте уместными? Инструмент, который «соответствует» фактической действительности, будет соответствовать каждому из следующих критериев, определенных экспертами, если в целом пункты инструмента таковы:

  • Представитель образца оцениваемого контента,
  • В формате, подходящем для использования прибора, и
  • Разработан специально для целевой аудитории.

Это означает, что если инструмент измеряет когнитивную нагрузку учащихся 4-го класса, изучающих вычислительное мышление с помощью такого инструмента, как Scratch, содержание представляет собой множество вопросов, предназначенных для измерения когнитивной нагрузки по целевым целям (например, присваивание переменных и математические выражения). Он также может иметь изображения блоков Scratch для контекстуализации вопросов на инструменте. Формулировка вопросов и уместность ответов (возможно, множественный выбор) будут разработаны на уровне 4-го класса.

Измерение подлинности лица может быть выполнено исследователями, создающими опрос. Однако, учитывая присущую экспертам предвзятость при оценке своей работы, это имеет большее значение, если инструмент оценивается другими экспертами, когда это возможно.

Другой метод оценки внешней достоверности инструмента включает в себя проведение интервью с людьми, похожими на тех, кого вы исследуете. Попросив этих людей просмотреть пункты вашего опроса или протокола интервью и ответить на них так, как если бы они участвовали, они могут дать представление о том, какие пункты имеют для них смысл, а какие плохо сформулированы или могут измерять что-то другое, чем то, что исследователь верил.

Связанная с критериями (или конкретная) валидность

Валидность, связанная с критерием, оценивает, в какой степени инструмент или конструкции в инструменте предсказывают переменную, обозначенную как критерий, или ее результат. Параллельная валидность и прогностическая валидность являются формами валидности критерия. Эта форма валидности связана с внешней валидностью, обсуждаемой в следующем разделе.

  • Predictive Validity (Прогнозная достоверность) — измеряет, насколько вероятно, что прибор измеряет переменную, которую можно использовать для прогнозирования будущей связанной переменной. Например, измерение интереса учащихся 11-х классов к карьере в области компьютерных наук может быть использовано для прогнозирования того, можно ли его использовать для определения того, будут ли эти учащиеся изучать информатику в качестве основной специальности в колледже.
  • Параллельная валидность — этот конкретный показатель валидности определяет, насколько хорошо инструмент измеряет существующие инструменты/тесты. В этом случае результаты использования инструмента можно сравнить с аналогичными инструментами в смежных областях или в той же области или с аналогичными инструментами, нацеленными на другие группы населения. Например, если вы измеряете отношение учащихся к компьютерам с помощью своего инструмента, вы можете параллельно или одновременно с этим использовать второй инструмент, который уже предназначен для измерения отношения учащихся к компьютерам. Если результаты измерения вашего инструмента статистически такие же или лучше, чем результаты другого инструмента, то ваш инструмент соответствует требованиям одновременной валидности.

Внутренняя и внешняя действительность

Внутренняя валидность – это степень, в которой результаты инструмента могут быть обобщены для одной и той же группы населения и контекста. С другой стороны, внешняя валидность — это степень, в которой результаты инструмента могут быть распространены на другие группы населения, другие области, другие ситуации и другие вмешательства. То есть можно ли результаты участников контролируемого эксперимента распространить на популяцию за пределами контролируемого эксперимента?

  • Валидность совокупности — определяет, в какой степени выборочная совокупность может быть экстраполирована на генеральную совокупность. Он предоставляет данные о том, как результаты исследования могут быть распространены на более широкую популяцию, что во многом связано с масштабом и выборкой. Чтобы установить этот тип достоверности, нужно тщательно подумать о более широкой популяции, в которой вы хотели бы обобщить результаты.
  • Экологическая валидность. Определяет, в какой степени тесты, проведенные в контролируемой среде, могут быть распространены на условия за их пределами, то есть на поведение, которое человек может испытать в мире.

В качестве примера валидности населения предположим, что вам интересно понять, как участие в учебной программе «Изучение компьютерных наук» (ECS) влияет на вероятность того, что учащиеся 9-го класса будут участвовать в будущих курсах CS в старшей школе. Для того, чтобы иметь возможность получить точную картину поведения учащегося 9-го класса в целом в конкретной школе, было бы предпочтительнее назначать учащихся для участия в курсе случайным образом, а не позволять им записываться добровольно. . Для того, чтобы иметь возможность обобщать результаты на более широкую популяцию 9учащимся 1-го класса в городе или штате, такой же эксперимент нужно будет провести (с использованием случайного распределения) в нескольких школах, в идеале также выбранных случайным образом.

Примером проблемы экологической валидности может быть разработка теста для оценки навыков вычислительного мышления у выпускников средних школ. Если вы разработали такой тест, вам, возможно, будет интересно узнать, как учащиеся впоследствии преуспеют в других связанных с компьютерами предприятиях в будущем (либо в карьере, либо в колледже). Установление экологической валидности потребует долгосрочного изучения группы выпускников средних школ, сдавших тест, и проверки их успеваемости в колледже и/или карьере в задачах и курсовых работах, связанных с компьютерными науками, чтобы определить, существует ли тесная взаимосвязь между их успеваемостью по экзамен и их «реальные» результаты в CS.

Конструктивная валидность

Конструктивная валидность — это степень, в которой инструмент оценки измеряет то, что он должен измерять (Brown, 1996; Cronbach and Meel, 1955; Polit and Beck, 2012). Принимаются во внимание корреляция, причина и следствие, а дизайн исследования оценивается на предмет того, насколько хорошо он моделирует и отражает реальные ситуации. В этом показателе достоверности измеряется качество инструмента и/или плана эксперимента (в целом).

  • Конвергентная валидность – измеряет степень, в которой конструкты, которые, как ожидается, будут коррелировать, действительно коррелируют.
  • Дискриминантная валидность — измеряет степень, в которой конструкции, которые не должны коррелировать, на самом деле не коррелируют.

Сочетание конвергентной и дискриминантной валидности используется для измерения конструктной валидности. Матрица мультипризнаков-мультиметодов (MTMM) представляет собой формальный метод измерения этих двух концепций валидности вместе, чтобы определить, в какой степени инструмент соответствует мерам конвергентной и дискриминантной валидности. Он использует несколько методов (например, наблюдение/полевые исследования, анкеты, журналы, викторины/тесты и т. д.) для измерения и триангуляции результатов одного и того же набора переменных путем демонстрации корреляций в матрице.

Понятия конвергентной и дискриминантной валидности важно учитывать при попытке установить конструктную валидность. Например, чтобы помочь установить конвергентную валидность набора вопросов, ориентированных на мотивацию к участию в изучении компьютерных наук, можно было бы ожидать достаточно высокой корреляции с набором вопросов, направленных на намерение продолжить изучение компьютерных наук и пройти другие курсы. Наоборот, размышляя о дивергентной валидности, можно попытаться сопоставить эту мотивацию для участия в CS с набором вопросов, который измеряет отстраненность в классе (если батарея мотивации действительно измеряет то, что задумано, она, вероятно, будет иметь обратную связь с отстраненностью).

Формирующая и суммативная валидность

Формативная валидность относится к эффективности инструмента для предоставления информации, которая может быть использована для улучшения переменных, влияющих на результаты исследования. То есть, если инструмент предназначен для измерения слабости в изучении условных утверждений таким образом, чтобы определить конкретные изменения, которые могут быть внесены в учебную программу, то можно сказать, что уровень формирующей валидности является адекватным.

Суммативная валидность (Lee & Hubona, 2009).) измеряет степень, в которой инструменты подходят для построения теории, или конечный результат процесса создания теории посредством результатов инструмента. Это можно проверить эмпирически с помощью логики «modus tollens».

Достоверность выборки

Чтобы не путать с валидностью генеральной совокупности, валидность выборки измеряет степень, в которой наиболее важные элементы выбираются с использованием определенного шаблона метода выборки. Шаблон должен соответствовать целям исследования, чтобы гарантировать, что переменные, которые необходимо измерить, действительно каким-то образом сформулированы в инструменте как вопросы. Например, при измерении стиля преподавания среди группы учителей информатики до начала работы оценка только знаний учителей до начала работы была бы недостаточной, если цель вашего исследования заключалась в том, чтобы измерить, насколько успешной будет группа учителей в преподавание концепций информатики учащимся средней школы. Вам также может понадобиться включить вопросы, связанные с педагогикой, оценкой и самоэффективностью.

Заключение Достоверность

Обоснованность заключения — это «степень обоснованности выводов, которые мы делаем о взаимосвязях в наших данных» (Trochim, 2006). Предположим, вы хотите измерить взаимосвязь между самоэффективностью учителя в программировании и способностью его учеников изучать программирование (академическая успеваемость). Связь может быть положительной, когда высокая самоэффективность и высокая успеваемость учащегося, или отрицательной, когда коррелируют низкая самоэффективность и высокая успеваемость учащегося, или она может быть более нейтральной, когда самоэффективность не имеет отношения к учащемуся. достижение. Степень, в которой выводы об отношениях могут быть сформулированы, называется валидностью заключения.

Существует ряд причин, по которым может быть трудно сделать эффективное заключение. Это может быть связано с тем, что ваши меры имеют низкий уровень надежности, из-за того, что взаимосвязь в целом слабая, или из-за того, что вы не собрали достаточно данных (или данных неправильного типа). Таким образом, важное соображение для достоверности заключения связано с хорошей статистической мощностью, хорошей надежностью и хорошей реализацией. Статистическая мощность должна быть на уровне 0,80 или выше, и следует заранее позаботиться об определении соответствующего размера выборки, размера эффекта и уровней альфа. Надежность можно повысить, тщательно сконструировав свой инструмент, увеличив в нем количество вопросов и уменьшив количество отвлекающих факторов во время измерения.

Цитировать эту страницу

Для цитирования этой страницы используйте:

Макгилл, Моника М. и Ксавье, Джеффри. 2019. Измерение надежности и валидности. Получено с https://csedresearch.org

Каталожные номера

Браун, JD (1996). Тестирование в языковых программах. Река Аппер-Сэдл, Нью-Джерси: Регенты Прентис-Холла.

Кресуэлл, Дж. (2008). Образовательные исследования: планирование, проведение и оценка количественных и качественных исследований. Река Аппер-Сэдл, Нью-Джерси, США: Pearson Education, Inc.

Оставить комментарий