Распределение манна уитни. Критерий U Манна — Уитни

Методы математической обработки в психологии

ГЛАВА I. ОСНОВНЫЕ ПОНЯТИЯ, ИСПОЛЬЗУЕМЫЕ В МАТЕМАТИЧЕСКОЙ ОБРАБОТКЕ ПСИХОЛОГИЧЕСКИХ ДАННЫХ

Возможности и ограничения параметрических и непараметрических критериев

ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ
1. Позволяют прямо оценить различия в средних, полученных в двух вы­борках (t - критерий Стьюдента). Позволяют оценить лишь средние тенден­ции, например, ответить на вопрос, чаще ли в выборке А встречаются более высо­кие, а в выборке Б - более низкие значе­ния признака (критерии Q, U, φ и др.).
2. Позволяют прямо оценить различия в дисперсиях (критерий Фишера). Позволяют оценить лишь различия в диа­пазонах вариативности признака (критерий φ).
3. Позволяют выявить тенденции изменения признака при переходе от условия к условию (дисперсионный однофакторный анализ), но лишь при условии нормального распреде­ления признака. Позволяют выявить тенденции изменения признака при переходе от условия к усло­вию при любом распределении признака (критерии тенденций L и S).
4. Позволяют оценить взаимодействие двух и более факторов в их влиянии на изменения признака (двухфакторный дисперсионный анализ). Эта возможность отсутствует.
5. Экспериментальные данные должны отвечать двум, а иногда трем, усло­виям: а) значения признака измерены по интервальной шкале; б) распределение признака является нормальным; в) в дисперсионном анализе должно соблюдаться требование равенства дисперсий в ячейках комплекса. Экспериментальные данные могут не от­вечать ни одному из этих условий: а) значения признака могут быть пред­ставлены в любой шкале, начиная от шка­лы наименований; б) распределение признака может быть любым и совпадение его с каким-либо теоретическим законом распределения необязательно и не нуждается в проверке; в) требование равенства дисперсий отсут­ствует.
6. Математические расчеты довольно сложны. Математические расчеты по большей час­ти просты и занимают мало времени (за исключением критериев χ 2 и λ).
7. Если условия, перечисленные в п.5, выполняются, параметрические кри­терии оказываются несколько более мощными, чем непараметрические. Если условия, перечисленные в п.5, не выполняются, непараметрические критерии оказываются более мощными, чем пара­метрические, так как они менее чувстви­тельны к «засорениям».

Классификация задач и методов их решения

Задачи Условия Методы
1.Выявление различий в уровне исследуемого признака а) 2 выборки испытуемых Q- критерий Розенбаума; U - критерий Манна-Уитни; φ* - критерий (угловое преобразование Фишера)
б) 3 и более выбо­рок испытуемых S - критерий тенденций Джонкира; Н - критерий Крускала-Уоллиса.
2. Оценка сдвига зна­чений исследуемого признака а) 2 замера на од­ной и той же вы­борке испытуемых Т - критерий Вилкоксона; G - критерий знаков; φ* - критерий (угловое преобразование Фишера).
б) 3 и более заме­ров на одной и той же выборке испы­туемых χ л 2 - критерий Фридмана; L - критерий тенденций Пейджа.
3. Выявление различий в распределении а) при сопоставлении эмпирического признака распределения с теоретическим χ 2 - критерий Пирсона; λ - критерий Колмогорова-Смирнова; m - биномиальный критерий.
б) при сопоставле­нии двух эмпириче­ских распределений χ 2 - критерий Пирсона; λ - критерий Колмогорова-Смирнова; φ* - критерий (угловое преобразование Фишера).
4.Выявление степени согласованности изменений а) двух признаков
б) двух иерархий или профилей r s - коэффициент ранговой корреляции Спирмена.
5. Анализ изменений признака под влия­нием контролируе­мых условий а) под влиянием одного фактора S- критерий тенденций Джонкира; L - критерий тенденций Пейджа; однофакторный дисперсионный анализ Фишера.
б) под влиянием двух факторов одновременно Двухфакторный дисперсионный анализ Фишера.

ГЛАВА II. ВЫЯВЛЕНИЕ РАЗЛИЧИЙ В УРОВНЕ ИССЛЕДУЕМОГО ПРИЗНАКА

Принятие решения о выборе метода математической об­работки

Если данные уже получены, то вам предлагается следующий ал­горитм определения задачи и метода.

АЛГОРИТМ 2

Принятие решения о задаче и методе обработки на стадии планирования исследования

1. Определите, какая модель вам кажется наиболее подходящей для доказательства ваших научных предположений.

2. Внимательно ознакомьтесь с описанием метода, примерами и задачами для самостоятельного решения, которые к нему прилагаются.

3. Если вы убедились, что это то, что вам нужно, вернитесь к разделу «Ограничения критерия» и решите, сможете ли вы собрать данные, которые будут отвечать этим ограничениям (большие объемы выборок, наличие не­скольких выборок, монотонно различающихся по какому-либо признаку, напри­мер, по возрасту и т.п.).

4. Проводите исследование, а затем обрабатывайте полученные данные по заранее! выбранному алгоритму, если вам удалось выполнить ограничения.

5. Если ограничения выполнить не удалось, обратитесь к алгоритму 1.


Алгоритм принятия решения о выборе критерия для сопоставлений


Q - критерий Розенбаума

Назначение критерия . Критерий используется для оценки различий между двумявы­борками по уровнюкакого-либо признака, количественно измеренного. В каждой из выборок должно быть не менее 11 испытуемых.

Пример.

У предполагаемых участников психологического эксперимента, моделирующего деятельность воздушного диспетчера, был измерен уро­вень вербального и невербального интеллекта с помощью методики Д. Векслера. Было обследовано 26 юношей в возрасте от 18 до 24 лет (средний возраст 20,5 лет). 14 из них были студентами физического факультета, а 12 - студентами психологического факультета Ленинград­ского университета. Можно ли утверждать, что одна из групп превосходит другую по уровню вербального интеллекта?

АЛГОРИТМ 3 Подсчет критерия Q Розенбаума 1. Проверить, выполняются ли ограничения: n 1 ,n 2 ≥11, n 1 ,n 2 ≈n 2. 2. Упорядочить значения отдельно в каждой выборке по степени воз­растания признака. Считать выборкой 1 ту выборку, значения в ко­торой предположительно выше, а выборкой 2 - ту, где значения предположительно ниже. 3. Определить самое высокое (максимальное) значение в выборке 2. 4. Подсчитать количество значений в выборке 1, которые выше макси­мального значения в выборке 2. Обозначить полученную величину как S 1 . 5. Определить самое низкое (минимальное) значение в выборке 1. 6. Подсчитать количество значений в выборке 2, которые ниже мини­мального значения выборки 1. Обозначить полученную величину как S 2 . 7. Подсчитать эмпирическое значение Q по формуле: Q=S 1 +S2 8. По Табл. I определить критические значения Q для данных n 1 и n 2 . Если Q эмп равно Q 0,05 или превышает его, уровень признака в выборке 1 превышает уровень признака в вы­борке 2. 9. При n 1 и n 2 >26сопоставить полученное эмпирическое значение с Q к p = 8 (р≤ 0,05) и Q к p = 10 (p≤ 0,01). Если Q эмп ≥ Q к p = 8, уровень признака в выборке 1 превышает уровень признака в вы­борке 2.

Таблица I. Критические значения критерия Q Розенбаума

n
p=0,05
7
p=0,01

U - критерий Манна-Уитни

Назначение критерия . Критерий предназначен для оценки различий между двумя вы­борками по уровню какого-либо признака, количественно измеренного. Он позволяет выявлять различия между малыми выборками, когда n 1 ,n 2 ≥ 3 или n 1 =2, n 2 ≥5, и является более мощным, чем критерий Ро­зенбаума.

Пример

Уровень вербального интеллекта в выборке студентов физического факультета выше чем студентов психологического факультета Ленинградского университета. Попытаемся установить теперь, воспроизводится ли этот резуль­тат при сопоставлении выборок по уровню невербального интеллекта. Можно ли утверждать, что одна из выборок превосходит другую по уровню невербального интеллекта?

Правила ранжирования

1. Меньшему значению начисляется меньший ранг. Наименьшему значению начисляется ранг 1. Наибольшему значению начисляется ранг, соответствующий количе­ству ранжируемых значений. Например, если n=7, то наибольшее значение получит ранг 7, за возможным исключением для тех слу­чаев, которые предусмотрены правилом 2.

2. В случае, если несколько значений равны, им начисляется ранг, представляющий собой среднее значение из тех рангов, которые они получили бы, если бы не были равны.

Допустим, следующие 2 значения равны 12 сек. Они должны были бы получить ранги 4 и 5, но, поскольку они равны, то получают средний ранг:

3. Общая сумма рангов должна совпадать с расчетной, которая опре­деляется по формуле:

где N - общее количество ранжируемых наблюдений (значений). Несовпадение реальной и расчетной сумм рангов будет свидетельст­вовать об ошибке, допущенной при начислении рангов или их сум­мировании. Прежде чем продолжить работу, необходимо найти ошибку и устранить ее.

АЛГОРИТМ 4

Подсчет критерия U Манна-Уитни.

1. Перенести все данные испытуемых на индивидуальные карточки.

2. Пометить карточки испытуемых выборки 1 одним цветом, скажем красным, а все карточки из выборки 2 - другим, например синим.

3. Разложить все карточки в единый ряд по степени нарастания при­знака, не считаясь с тем, к какой выборке они относятся, как если бы мы работали с одной большой выборкой.

4. Проранжировать значения на карточках, приписывая меньшему зна­чению меньший ранг. Всего рангов получится столько, сколько у нас (n 1 +п 2).

5. Вновь разложить карточки на две группы, ориентируясь на цветные обозначения: красные карточки в один ряд, синие - в другой.

7. Определить большую из двух ранговых сумм.

8. Определить значение U по формуле:

где n 1 - количество испытуемых в выборке 1;

n 2 - количество испытуемых в выборке 2;

Т х - большая из двух ранговых сумм;

n х - количество испытуемых в группе с большей суммой рангов.

9. Определить критические значения U по Табл. II. Если U эмп U к p _ 005 , различия достоверны. Чем меньше значения U, тем достоверность различий выше.


Таблица II. Критические значения критерия U Манна-Уитни

для уровней статистической значимости р≤0,05 и р≤0,01.

n1
n2 p=0,05
-
-
p=0,01
- -
- -
-
-
-
-
-
-

Таблица II. Продолжение

n 1
n 2 p=0,05
р=0,01

Таблица II. Продолжение

U-критерий является ранговым , поэтому он инвариантен по отношению к любому монотонному преобразованию шкалы измерения.

Другие названия: критерий Манна-Уитни-Уилкоксона (Mann-Whitney-Wilcoxon, MWW), критерий суммы рангов Уилкоксона (Wilcoxon rank-sum test) или критерий Уилкоксона-Манна-Уитни (Wilcoxon-Mann-Whitney test, WMW).

Примеры задач

Пример 1. Первая выборка - это пациенты, которых лечили препаратом А. Вторая выборка - пациенты, которых лечили препаратом Б. Значения в выборках - это некоторая характеристика эффективности лечения (уровень метаболита в крови, температура через три дня после начала лечения, срок выздоровления, число койко-дней, и т.д.) Требуется выяснить, имеется ли значимое различие эффективности препаратов А и Б, или различия являются чисто случайными и объясняются «естественной» дисперсией выбранной характеристики.

Пример 2. Первая выборка - это поля, обработанные агротехническим методом А. Вторая выборка - поля, обработанные агротехническим методом Б. Значения в выборках - это урожайность. Требуется выяснить, является ли один из методов эффективнее другого, или различия урожайности обусловлены случайными факторами.

Пример 3. Первая выборка - это дни, когда в супермаркете проходила промо-акция типа А (красные ценники со скидкой). Вторая выборка - дни промо-акции типа Б (каждая пятая пачка бесплатно). Значения в выборках - это показатель эффективности промо-акции (объём продаж, либо выручка в рублях). Требуется выяснить, какой из типов промо-акции более эффективен.

Описание критерия

Заданы две выборки .

Дополнительные предположения:

Иногда ошибочно считают, что U-критерий проверяет нулевую гипотезу равенства медиан в двух выборках. Существуют распределения, для которых гипотеза верна, но их медианы различны.

U-критерий можно применять для проверки гипотезы сдвига в качестве альтернативной , где - некоторая константа, отличная от нуля. При этой альтернативе U-критерий является состоятельным . Его целесообразно применять, если одним и тем же прибором проводятся две серии измерений двух значений некоторой физической величины. При этом функция распределения описывает погрешности измерения одного значения, а - другого. Однако во многих приложениях (в частности, эконометрических) нет особых оснований предполагать, что распределение второй выборки лишь сдвигается, но не меняется каким-либо иным образом.

U-критерий является непараметрическим аналогом критерия Стьюдента . Если выборки нормальные , то для проверки гипотезы сдвига предпочтительно применить более мощный критерий Стьюдента.

История

Данный метод выявления различий между выборками был предложен в 1945 году Френком Уилкоксоном. В 1947 году он был существенно переработан и расширен Манном и Уитни, по именам которых сегодня обычно и называется.

Литература

  1. Mann H. B., Whitney D. R. On a test of whether one of two random variables is stochastically larger than the other. // Annals of Mathematical Statistics. - 1947, №18. - Pp. 50-60.
  2. Wilcoxon F. Individual Comparisons by Ranking Methods. // Biometrics Bulletin 1. 1945. - Pp. 80–83.
  3. Орлов А. И. Эконометрика. - М.: Экзамен, 2003. - 576 с. (§4.5 Какие гипотезы можно проверять с помощью двухвыборочного критерия Вилкоксона?)
  4. Кобзарь А. И. Прикладная математическая статистика. - М.: Физматлит, 2006. - 816 с.

Контрольная работа

Методика «Домик»

Методика «Домик» (Н. И. Гуткина) представляет собой задание на срисовывание картинки с изображением дома, отдельные детали которого состоят из элементов прописных букв. Методика рассчитана на детей в возрасте 5-10 лет и может использоваться для определения готовности ребёнка к школе.

Цель исследования : определить способность ребёнка к копированию сложного образца.

Задание позволяет выявить умение ребёнка ориентироваться по образцу, точно его копировать, определить особенности развития непроизвольного внимания, пространственного восприятия, сенсомоторной координации и мелкой моторики рук.

Материалы : образец рисунка, лист бумаги, карандаш.

Ход исследования

Перед выполнением задания ребёнку даётся инструкция: «Перед тобой лежит лист бумаги и карандаш. Нарисуй на этом листе точно такую же картинку, как здесь (перед малышом кладётся лист с изображением дома). Не спеши, будь внимателен, постарайся, чтобы твой рисунок был точно таким же, как на образце. Если ты что-то нарисуешь не так, не стирай резинкой (проследить, чтобы у ребёнка не было резинки). Нужно поверх неправильного рисунка или возле него нарисовать правильно. Тебе понятно задание? Тогда приступай к работе».

По ходу выполнения задания необходимо зафиксировать:

1. Какой рукой рисует ребёнок (правой или левой).

2. Как он работает с образцом: как часто смотрит на него, проводит ли над рисунком-образцом линии, повторяющие контуры картинки, сравнивает ли нарисованное с образцом или рисует по памяти.

3. Быстро или медленно проводит линии.

4. Отвлекается ли во время работы.

5. Высказывания и вопросы во время рисования.

6. Сверяет ли после окончания работы свой рисунок с образцом.

Когда ребёнок сообщает об окончании работы, ему предлагается проверить, всё ли у него правильно. Если он увидит неточности в своём рисунке, то может их исправить, но это должно быть зафиксировано экспериментатором.

Обработка и анализ результатов

Обработка экспериментального материала проводится методом подсчёта баллов, которые начисляются за ошибки. Ошибки бывают такими.

1. Отсутствие любой детали картины (4 балла). На рисунке может отсутствовать забор (одна или две половины), дым, труба, крыша, штриховка на крыше, окно, линия, изображающая основу дома.

2. Увеличение отдельных деталей рисунка более чем в два раза при относительно правильном сохранении размера всего рисунка (3 балла за каждую увеличенную деталь).

3. Неправильно изображён элемент рисунка (3 балла). Неправильно могут быть изображены кольца дыма, забор, штриховка на крыше, окно, труба. Причём если неправильно нарисованы палочки, из которых состоит правая (левая) часть забора, то 2 балла начисляется не за каждую неправильную палочку, а за всю правую (левую) часть забора в целом. То же касается и колец дыма, выходящих из трубы, и штриховки на крыше дома: 2 балла начисляется не за каждое неправильное кольцо, а за весь неправильно скопированный дым; не за каждую неправильную линию в штриховке, а за всю штриховку крыши в целом.

Правая и левая части забора оцениваются отдельно: так, если неправильно срисована правая часть, а левая скопирована без ошибок (или наоборот), то ребёнок получает за нарисованный забор 2 балла; если же допущены ошибки и в правой, и в левой части, то 4 балла (за каждую часть по 2 балла). Если часть правого (левого) бока забора скопированы правильно, а часть неправильно, то за этот бок забора начисляется 1 балл; то же касается и колец дыма, и штриховки на крыше: если только одна часть колец дыма срисована правильно, то дым оценивается в 1 балл; если только одна часть штриховки на крыше воспроизведена правильно, то вся штриховка оценивается в 1 балл. Неправильно воспроизведенное количество элементов в детали рисунка не считается ошибкой, то есть не важно, сколько будет палочек на заборе, колец дыма или линий в штриховке крыши.

4. Неправильное расположение деталей в пространстве рисунка (1 балл). К ошибкам этого вида относятся: расположение забора не на общей с основой дома линии, а выше её, дом как будто висит в воздухе или ниже линии основы дома; смещение трубы к левому краю крыши; существенное смещение окна в любую сторону от центра; расположение дыма более чем на 30° отклонения от горизонтальной линии; основа крыши по размеру соответствует основе дома, а не превышает её (на образце крыша нависает над домом).

5. Отклонение прямых линий более чем на 30° от заданного направления (1 балл): вертикальных и горизонтальных линий, из которых состоит дом и крыша; палочек забора; изменение угла наклона боковых линий крыши (расположение их под прямым или тупым углом к основе крыши вместо острого); отклонение линии основы забора более чем на 30° от горизонтальной линии.

6. Разрывы между линиями в тех местах, где они должны быть соединены (1 балл за каждый разрыв). В том случае если линии штриховки на крыше не доходят до линии крыши, 1 балл ставится за всю штриховку в целом, а не за каждую неправильную линию штриховки.

7. Линии налезают друг на друга (1 балл за каждое налезание). В случае если линии штриховки на крыше залезают за линии крыши, 1 балл ставится за всю штриховку в целом, а не за каждую неправильную линию штриховки.

Хорошее выполнение рисунка оценивается в «0» баллов. Таким образом, чем хуже выполнено задание, тем выше суммарная оценка. Однако при интерпретации результатов эксперимента необходимо учитывать возраст ребёнка. Пятилетние дети почти не получают оценки «0» из-за недостаточной зрелости мозговых структур, отвечающих за сенсомоторную координацию.

При анализе детского рисунка необходимо обратить внимание на характер линий: очень жирные или «косматые» линии могут свидетельствовать о состоянии тревожности ребёнка. Но вывод о тревожности ни в коем случае нельзя делать лишь на основании этого рисунка. Подозрения необходимо проверить специальными методиками по определению тревожности.

Дети с зпр

Результаты в баллах

Дети в норме

результаты

Представим полученные данные в виде Гистограммы 1.

Гистограмма 1. Результаты, полученные по методике «Домик»

Постройте мне пожалуйста гистограму вот такую. Дети с задержкой психического развития имеют выше среднего (около 10%) и) средний уровень развития (около 30% и ниже среднего (60%)

В среднем дети с нормальным развитием имеют высокий уровень развития (около 60%), средний уровень развития (около 20%) и выше среднего 20%. Вы и тут тоже неправильно подписали мне преподаватель перечеркнул и сказал нечитаемо. вы должны были подписать 10 % выше среднего а не низкое как в 1-м красном столбце. Во 2 красном столбце подписать средний уровень развития (около 30%) а не низкий и в третьем красном ниже среднего 60. И вот по такой гистограмме вы должны построить измененную гистограмму. Я провела коррекционную работу и количество детей изменилось якобы: с низким уровнем ниже среднего большинство из них стало приближаться к среднему 60% детей, 40 % приближаться к высокому это дети со средним значением были. Т. Е. нужно построить экспериментальную группу и зпр: со средним 60 % и 40 высокое.

И мне нужно составить таблицу по критерию мани уитни нужно изменить данные опять таки чтобы ниже среднего уровень приближался к среднему и средний к высокому. Распишите пожалуйста таблицу количество испытуемых было 10 человек норма и 10 зпр. Просто мне не очень понятно как вы ранжировали как я понимаю вы подогнали результаты (об этом я вас просила) и проставили ранги а далее действовали по формуле… если не так то объясните. Грядёт защита курсовой. Расчёты будет проверять сам доцент кафедры психологии. Пожалуйста помогите..

Назначение U-критерия Манна-Уитни

Настоящий статистический метод был предложен Фрэнком Вилкоксоном (см. фото) в 1945 году. Однако в 1947 году метод был улучшен и расширен Х. Б. Манном и Д. Р. Уитни, посему U-критерий чаще называют их именами.

Критерий предназначен для оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного. Он позволяет выявлять различия между малыми выборками, когда n 1 ,n 2 ≥3 или n 1 =2, n 2 ≥5, и является более мощным, чем критерий Розенбаума.

Описание U-критерия Манна-Уитни

Существует несколько способов использования критерия и несколько вариантов таблиц критических значений, соответствующих этим способам (Гублер Е. В., 1978; Рунион Р., 1982; Захаров В. П., 1985; McCall R., 1970; Krauth J., 1988).

Этот метод определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами. Мы помним, что 1-м рядом (выборкой, группой) мы называем тот ряд значений, в котором значения, по предварительной оценке, выше, а 2-м рядом - тот, где они предположительно ниже.

Чем меньше область перекрещивающихся значений, тем более вероятно, что различия достоверны. Иногда эти различия называют различиями в расположении двух выборок (Welkowitz J. et al., 1982).

Эмпирическое значение критерия U отражает то, насколько велика зона совпадения между рядами. Поэтому чем меньше U эмп, тем более вероятно, что различия достоверны.

Гипотезы U - критерия Манна-Уитни

U -критерий Манна-Уитни используется для оценки различий между двумя малыми выборками (n 1 , n 2 ≥3 или n 1 =2, n 2 ≥5) по уровню количественно измеряемого признака.

Нулевая гипотеза H 0 ={уровень признака во второй выборке не ниже уровня признака в первой выборке}; альтернативная гипотеза - H 1 ={уровень признака во второй выборке ниже уровня признака в первой выборке}.

Рассмотрим алгоритм применения U-критерия Манна-Уитни:

1. Перенести все данные испытуемых на индивидуальные карточки, пометив карточки 1-й выборки одним цветом, а 2-й - другим.

2. Разложить все карточки в единый ряд по степени возрастания признака и проранжировать в таком порядке.

3. Вновь разложить карточки по цвету на две группы.

5. Определить большую из двух ранговых сумм .

6. Вычислить эмпирическое значение U :

, где - количество испытуемых в - выборке (i = 1, 2), - количество испытуемых в группе с большей суммой рангов.

7. Задать уровень значимости α и, используя специальную таблицу, определить критическое значение U кр (α) . Если , то H 0 на выбранном уровне значимости принимается.

Рассмотрим использование U критерия Манна-Уитни для нашего примера.

При ранжировании объединяем две выборки в одну. Ранги присваиваются в порядке возрастания значения измеряемой величины, т.е. наименьшему рангу соответствует наименьший балл. Заметим, что в случае совпадения баллов для нескольких испытуемых ранг такого балла следует считать, как среднее арифметическое тех позиций, которые занимают данные баллы при их расположении в порядке возрастания.

Используя предложенный принцип ранжирования, получим таблицу рангов. Заметим, что выбор среднего арифметического в качестве ранга применяется при любом ранжировании.

Чтобы использовать критерий Манна-Уитни, рассчитаем суммы рангов рассматриваемых выборок (см. таблицу).

Проведение исследования по методике дало следующие результаты:

Результаты расчета U-критерия Манна-Уитни по результатам исследования представлены в таблице 1 (ранжирование), на рисунке 1 (ось значимос ти):

Дети в норме

Ранг 1

Дети с ЗПР

Ранг 2

Суммы:

72.5

137.5

17,5 19

Сумма для первой выборки равна 72,5, для второй - 137,5. Обозначим наибольшую из этих сумм через T x (T x =137.5). Среди объёмов n 1 =10 и n 2 =10 выборок наибольший обозначим n x 17,5

Полученное эмпирическое значение U эмп (17,5) находится в зоне значимости, а, следовательно, наша гипотеза подтвердилась.

Критическое значение критерия находим по специальной таблице. Пусть уровень значимости равен 0.05.

Гипотеза H0 о незначительности различий между баллами двух выборок принимается, если < . В противном случае H0 отвергается и различие определяется как существенное.

Следовательно, различия в уровне можно считать существенными.

Схема использования критерия Манна-Уитни выглядит следующим образом


U-критерий Манна-Уитни используется для оценки различий между двумя малыми выборками (n1,n2≥3 или n1=2, n2≥5) по уровню колич

U -критерий Манна-Уитни используется для оценки различий между двумя малыми выборками(n 1 , n 2 ≥3 или n 1 =2, n 2 ≥5) по уровню количественно измеряемого признака. При этом первой выборкой принято считать ту, где значение признака больше.

Нулевая гипотеза H 0 ={уровень признака во второй выборке не ниже уровня признака в первой выборке}; альтернативная гипотеза – H 1 ={уровень признака во второй выборке ниже уровня признака в первой выборке}.

Рассмотрим алгоритм применения U-критерия Манна-Уитни:

1. Перенести все данные испытуемых на индивидуальные карточки, пометив карточки 1-й выборки одним цветом, а 2-й – другим.

2. Разложить все карточки в единый ряд по степени возрастания признака и проранжировать в таком порядке.

3. Вновь разложить карточки по цвету на две группы.

5. Определить большую из двух ранговых сумм .

6. Вычислить эмпирическое значение U :

, где - количество испытуемых в - выборке (i = 1, 2), - количество испытуемых в группе с большей суммой рангов.

7. Задать уровень значимости α и, используя специальную таблицу, определить критическое значение U кр (α) . Если , то H 0 на выбранном уровне значимости принимается.

Рассмотрим использование U критерия Манна-Уитни на примере.

Проведение срезовой контрольной работы по математике (алгебра и геометрия) в средней общеобразовательной школе дало следующие результаты по 10-балльной шкале для класса, обучающегося по программе «Развивающего обучения» (7 «Б»), и класса, обучающегося по традиционной системе (7 «А»):

Ученик \ Класс

7 «А» (баллы)

7 «Б» (баллы)

Определите, превосходят ли учащиеся 7 «Б» учащихся 7 «А» по уровню знаний по математике.

Сравнение результатов показывает, что баллы, полученный за контрольную работу, в 7 «Б» классе несколько выше, поэтому первой считаем выборку результатов 7 «Б» класса. Таким образом, нам требуется определить, можно ли считать имеющуюся разницу между баллами существенной. Если можно, то это будет означать, что класс, обучающийся по системе «развивающего обучения» имеет более качественные знания по математике. В противном случае, на выбранном уровне значимости различие окажется несущественным.

Для оценки различий между двумя малыми выборками (в данном примере их объёмы равны: n 1 =12, n 2 =11) используем критерий Манна-Уитни. Проранжируем представленную таблицу:

7 «Б» (баллы)

ранг

7 «А» (баллы)

ранг

22,5

22,5

20.5

20.5

16.5

16.5

16.5

16.5

11.5

16.5

11.5

16.5

11.5

11.5

Сумма:

1 68 .5

Сумма:

107.5

При ранжировании объединяем две выборки в одну. Ранги присваиваются в порядке возрастания значения измеряемой величины, т.е. наименьшему рангу соответствует наименьший балл. Заметим, что в случае совпадения баллов для нескольких учеников ранг такого балла следует считать, как среднее арифметическое тех позиций, которые занимают данные баллы при их расположении в порядке возрастания. Например, 4 балла получили 3 ученика (см. таблицу). Значит, первые 3 позиции в расположении займёт балл, равный 4. Поэтому ранг для 4 баллов – это среднее арифметическое для позиций 1, 2 и 3, или: . Аналогично рассуждаем при вычислении ранга для балла, равного 5. Такой балл получили двое учащихся. Значит, при распределении по возрастанию первые три позиции занимает балл, равный 4, а четвёртую и пятую позиции займёт балл, равный 5. Поэтому его ранг будет равен среднему арифметическому между числами 4 и 5, т.е. 4.5.

Используя предложенный принцип ранжирования, получим таблицу рангов. Заметим, что выбор среднего арифметического в качестве ранга применяется при любом ранжировании, в том числе необходимого и для вычисления других критериев достоверности или же коэффициента корреляции Спирмена.

Чтобы использовать критерий Манна-Уитни, рассчитаем суммы рангов рассматриваемых выборок (см. таблицу). Сумма для первой выборки равна 168,5, для второй – 107,5. Обозначим наибольшую из этих сумм через T x (T x =168.5). Среди объёмов n 1 и n 2 выборок наибольший обозначим n x . Этих данных достаточно, чтобы воспользоваться формулой расчёта эмпирического значения критерия:

T x =168,5, n x =12>11= n 2 . Тогда:

Критическое значение критерия находим по специальной таблице. Пусть уровень значимости равен 0.05.

Гипотеза H 0 о незначительности различий между баллами двух классов принимается, если u кр < u эмп . В противном случае H 0 отвергается и различие определяется как существенное.

Следовательно, различия в уровне знаний по математике среди учащихся можно считать несущественными.

Схема использования критерия Манна-Уитни выглядит следующим образом


Настоящий статистический метод был предложен Фрэнком Вилкоксоном (см. фото) в 1945 году. Однако в 1947 году метод был улучшен и расширен Х. Б. Манном и Д. Р. Уитни, посему U-критерий чаще называют их именами.

Критерий предназначен для оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного. Он позволяет выявлять различия между малыми выборками, когда n 1 ,n 2 ≥3 или n 1 =2, n 2 ≥5, и является более мощным, чем критерий Розенбаума.

Описание U-критерия Манна-Уитни

Существует несколько способов использования критерия и несколько вариантов таблиц критических значений, соответствующих этим способам (Гублер Е. В., 1978; Рунион Р., 1982; Захаров В. П., 1985; McCall R., 1970; Krauth J., 1988).

Этот метод определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами. Мы помним, что 1-м рядом (выборкой, группой) мы называем тот ряд значений, в котором значения, по предварительной оценке, выше, а 2-м рядом - тот, где они предположительно ниже.

Чем меньше область перекрещивающихся значений, тем более вероятно, что различия достоверны. Иногда эти различия называют различиями в расположении двух выборок (Welkowitz J. et al., 1982).

Эмпирическое значение критерия U отражает то, насколько велика зона совпадения между рядами. Поэтому чем меньше U эмп, тем более вероятно, что различия достоверны.

Гипотезы U - критерия Манна-Уитни

H 0 : Уровень признака в группе 2 не ниже уровня признака в группе 1.
H 1 : Уровень признака в группе 2 ниже уровня признака в группе 1.

Ограничения U-критерия Манна-Уитни

1. В каждой выборке должно быть не менее 3 наблюдений: n 1 ,n 2 ≥ З; допускается, чтобы в одной выборке было 2 наблюдения, но тогда во второй их должно быть не менее 5.

2. В каждой выборке должно быть не более 60 наблюдений; n 1 , n 2 ≤ 60.

Автоматический расчет U-критерия Манна-Уитни

Шаг 1

Введите в первую колонку («Выборка 1») данные первой выборки, а во вторую колонку («Выборка 2») данные второй выборки. Данные вводятся по одному числу на строку; без пробелов, пропусков и т.д. Вводятся только цифры. Дробные числа вводятся со знаком «.» (точка). После заполнения колонок нажмите на кнопку «Шаг 2», чтобы произвести автоматический расчет U-критерия Манна-Уитни.




Top