Что такое проверка гипотезы
Объяснение, прогнозирование и контроль. Индуктивные и дедуктивные методы. Рабочие определения. Независимые и зависимые переменные. Чувствительность измерений. Контингент и выборки. Вариативность
Определение причины
Изоляция и контроль переменных. Проспективные и ретроспективные исследования. Корреляция и причинная связь. Валидность Надежность
Обдумывание ошибок
Опыт — слишком дорогой учитель
Самопрограммирование
Оккультные верования и паранормальные явления
Мыслить как интуитивный ученый
Применение алгоритма
Краткий итог главы
Термины для запоминания
Предположим, что верно следующее утверждение: у вас сильная зависимость от героина и вам надо выбрать одну из двух программ лечения.
Программа 1. Эту программу предлагают бывшие наркоманы. Вас будет лечить избавившийся от героиновой зависимости человек одного с вами возраста. В брошюре об этой программе сказано, что среди тех, кто занимается по ней не менее одного года, уровень успешности лечения очень высок (80%). Одним из главных преимуществ этой программы является знание врача о том, что такое серьезное пристрастие к наркотикам, и возможность поделиться с вами опытом собственного выздоровления.
Программа 2. Врачи, которые предлагают эту программу, изучили психологические и биологические причины возникновения героиновой зависимости. По сравнению с программой 1 они обещают значительно более низкий уровень успешности лечения (30%), но эта цифра получена на основе данных обо всех, кто лечился по этой программе. Ваш врач сам никогда не употреблял героин, зато исследовал различные варианты лечения. Вам надо принять важное решение. Какую из программ вы выберете?
Что такое проверка гипотезы
Исследование — это интеллектуальный подход к нерешенной проблеме, и его функция заключается в том, чтобы найти истину.
Лиди (Leedy, 1981, р. 7)
Наше мышление во многом напоминает научный метод проверки гипотез. Гипотеза — это набор предположений о природе мироздания; обычно это предполо-
265
жения о связи между двумя или несколькими переменными. Чтобы понять окружающий нас мир, мы накапливаем наблюдения, формируем предположения (или гипотезы), а затем методом наблюдения проверяем, подтверждаются они или нет. Таким образом, проверка гипотез — это один из способов выяснения истины о мире. Когда ученые хотят понять сущность событий, которые изучает их область науки, они пользуются тем же методом формулирования гипотез и проведения систематических наблюдений, которые могли бы подтвердить или опровергнуть эти гипотезы. Поэтому такой способ мышления имеет много общего с экспериментальными методами, используемыми в науке.
Объяснение, прогнозирование и контроль
Все люди… обладают природной любознательностью.
Аристотель (цит. по: J. Bartlett, 1992, р. 77)
У человека существует глубинная потребность понимать происходящие вокруг события. Сколько раз вы задавали себе вопросы типа «Почему мои друзья развелись — ведь казалось, что они прекрасно подходят друг для друга?» или «Как нам понять, почему сын министра здравоохранения, главного врача страны, пристрастился к наркотикам?». Когда вы пытаетесь ответить на подобные вопросы, вы, как и все мы, часто действуете, как «интуитивный ученый». Подобно ученым, мы строим собственные теории, объясняющие причины общественных событий или природных явлений. Важно уметь объяснить, почему люди реагируют на события определенным образом (например, «Он расист». «Она устала на работе и раздражена»), предсказывать результаты своих действий (например, «Если я не буду заниматься, я провалюсь на экзамене». «Если я буду носить одежду от кутюрье, все будут думать, что я крутой»), и управлять некоторыми из происходящих вокруг нас событий (например, «Чтобы получить хорошую работу в области бизнеса, мне надо получше изучить бухгалтерию»).
Цель проверки гипотез заключается в том, чтобы точно предсказать события, происходящие в той части мира, с которой мы соприкасаемся (Holland, & Thagard, 1986). Чтобы выжить и действовать с максимальной эффективностью, мы должны уменьшить степень неопределенности в окружающей среде. Один из способов уменьшения неопределенности — это наблюдение за последовательностью событий с целью определения связей между ними, которые можно было бы использовать для прогнозирования. Например, ребенок может узнать, что всякий раз, когда он плачет, приходят взрослые; ваша собака может понять, что когда она встанет у кухонной двери, вы выпустите ее на улицу; подросток может выяснить, что родители сердятся, когда он поздно возвращается домой. Все эти связи важны для прогнозирования, поскольку они снижают степень неопределенности окружающей среды и позволяют нам в какой-то степени управлять своей жизнью. При определении этих связей мы пользуемся тем же процессом, с помощью которого врачи-исследователи открыли, что после применения химиотерапии у больных раком (266:) начинается ремиссия или что долгожительство связано с определенным образом жизни. Поскольку используется один и тот же процесс, некоторые из технических подходов, используемых в научных методах, применимы к практическому повседневному мышлению
Индуктивные и дедуктивные методы
Индуктивные рассуждения являются одним из главных аспектов когнитивного развития и играют важную роль как в развитии системы процессов логического мышления, так и в приобретении новой информации
Пеллегрино и Голдман (Pellegnno & Goldman, 1983, р 143)
Иногда индуктивные и дедуктивные методы проверки гипотез разграничивают (см. главу 4). При использовании индуктивного метода вы наблюдаете события, а затем строите гипотезу об этих событиях. Приведем простой пример: допустим, вы заметили, что ваш знакомый пенсионер Арман любит смотреть по телевизору соревнования по борьбе. Затем вы замечаете, что и Минни, и Сью Энн, тоже пенсионерки, любят смотреть такие соревнования. На основе этих наблюдений вы выдвигаете гипотезу о том, что пожилые люди любят смотреть соревнования по борьбе. Таким образом, вы переходите от наблюдений к гипотезе. Иногда индуктивный метод называют «переходом от частного к общему». Авторы прекрасной книги, которая называется «Индукция» (Holland et al., 1986), утверждают, что индуктивный процесс — это главный способ, с помощью которого мы постигаем природу мира. Они считают, что «исследовать индукцию — значит исследовать, как знание изменяется в процессе его использования» (р. 5).
При использовании дедуктивного метода вы начинаете с гипотезы, которую считаете верной, а затем проверяете ее с помощью систематических наблюдений. Вы можете сделать логическое предположение о том, что, поскольку борьбой занимаются довольно молодые люди, пожилым людям нравится смотреть соревнования по телевизору. После выдвижения этой гипотезы вы начнете выяснять у знакомых пенсионеров, любят ли они смотреть по телевизору борьбу Вы также захотите сравнить их с группой людей помоложе, чтобы выяснить, смотрят ли они такие программы реже, чем пожилые люди. Когда вы начинаете с гипотезы, а потом собираете данные, подтверждающие или опровергающие эту гипотезу, то вы пользуетесь дедуктивным методом. Очень важно искать также и данные, опровергающие гипотезу. Иногда дедуктивный метод называют «переходом от общего к частному».
Несмотря на то, что эти два типа мышления обычно различают между собой, оба они являются просто различными фазами метода проверки гипотез. Часто люди наблюдают события, формулируют гипотезы, снова наблюдают события, переформулируют гипотезы и продолжают накапливать наблюдения. Вопрос о том, что первично — наблюдения или гипотеза, — является спорным, поскольку наши гипотезы определяют выбор объекта наших наблюдений, а наши наблюдения определяют, какие нам придут в голову гипотезы. Это похоже на вечный вопрос о том, что было раньше — курица или яйцо? Каждый из процессов существенно зависит от друго-
267
го. Таким образом, наблюдения и выдвижение гипотез образуют замкнутый цикл, причем наблюдения изменяют гипотезу, а гипотеза изменяет объект наблюдения.
Если вы любите рассказы о Шерлоке Холмсе, то вы уже узнали этот процесс, который легендарный детектив превратил в высокое искусство. Он проницательно замечал приметы, указывавшие на потенциальных подозреваемых. Например, Шерлок Холмс мог вспомнить о том, что на брюках дворецкого было маленькое желтое пятно от горчицы, хотя хорошо известно, что горчицу не подают к гусю, который был в тот вечер на ужин. На основе этих наблюдений Холмс выдвигал гипотезу о том, что «дворецкий побывал на поле, где растет дикая горчица». Тогда великий сыщик проверял, соответствуют или противоречат этой гипотезе другие признаки. Он мог изучить ботинки дворецкого, чтобы выяснить, есть ли на них следы красной глины, из которой состоит почва вокруг горчичного поля. Выстроив длинную цепь гипотез и наблюдений, Шерлок Холмс заявлял: «Это сделал дворецкий». Когда его просили объяснить, как он пришел к такому заключению, он изрекал свою знаменитую фразу: «Элементарно, Ватсон!»
Многие из наших убеждений о мире были получены с помощью тех же индуктивных и дедуктивных методов, которыми пользовался великий Шерлок Холмс. Для формирования и проверки представлений мы применяем принципы индуктивных и дедуктивных рассуждений. Легендарный детектив Артура Конана Дойля неизменно приходил к правильным выводам. К сожалению, никогда не ошибаются только литературные герои. Давайте рассмотрим составляющие процесса проверки гипотез, чтобы выяснить, где могут возникнуть ошибки
Рабочие определения
Как научное, так и повседневное мышление требуют обоснованного фактами подтверждения представлений, то есть соответствия теории и практики.
Кун (Kuhn, 1993, р. 74)
Рабочее определение объясняет читателю, как распознать и оценить интересующее его понятие. Например, если вы считаете, что женщины, достигшие успеха в жизни, получают высокую зарплату, то вам придется дать определения понятий «достигший успеха» и «высокая зарплата», которые позволят вам выяснить, кто достиг успеха и кто получает высокую зарплату. Если вы уже прочитали третью главу, то понимаете, что необходимость рабочих определений вытекает из проблемы неоднозначности. Вам придется ввести какое-либо суждение, вроде «Люди, достигшие успеха, — это те, кто известен в своей профессиональной области и кого уважают окружающие». Вы обнаружите, что часто бывает довольно трудно сформулировать хорошее рабочее определение. Я могу вспомнить нескольких человек, которые вовсе не пользуются известностью, но достигли успеха по их собственному мнению и по мнению других людей. Если вы воспользуетесь приведенным рабочим определением, то придете к выводу, что домохозяйки, техники, учителя, медсестры и многие другие не могут «достигнуть успеха» по этому определению. Таким
268
образом, оно оказывается неудовлетворительным. Но все-таки, для примера, предположим, что мы будем относить людей к классам «достигших успеха» и «не достигших успеха» на основе такого рабочего определения.
Какое рабочее определение вы подберете для понятия «получать высокую зарплату»? Допустим, вы считаете, что «высокая зарплата» — это «минимум 1000 долларов в неделю». После того как эти понятия определены, вы можете начать выяснять, существует ли разница в оплате труда женщин, достигших и не достигших успеха. Рабочие определения имеют большое значение. Когда вы в очередной раз услышите, как люди говорят о «нашей безответственной молодежи», «мягкотелых либералах», «обливающихся кровью сердцах», «деревенщине», «реакционерах», «фашистах» или «феминистках», попросите их дать рабочие определения этих терминов. Может оказаться, что, после того как их попросят выражаться точнее, убедительность их доводов уменьшится.
Очень часто на рабочих определениях строится аргументация. Рассмотрим, например, дискуссию о том, является ли гомосексуализм психическим отклонением Ответ на этот вопрос зависит от рабочего определения. Что такое «психическое отклонение»? Кто будет решать, какое определение следует дать психическому отклонению? Обладает ли гомосексуализм характеристиками, соответствующими этому определению? Ожесточенные споры о том, является ли аборт убийством, можно превратить в гораздо более спокойное обсуждение адекватного определения убийства и опять-таки более важного вопроса о том, кто полномочен определять, что такое убийство. Таким образом, если с помощью критического мышления и не удастся прекратить яростные схватки по поводу таких проблем, как аборты, то хотя бы изменится их характер, поскольку люди смогут осознать, о чем они, собственно, спорят.
Когда вы пользуетесь рабочими определениями, вы избегаете двусмысленности и неопределенности. Попытайтесь для примера записать рабочие определения следующих терминов, любовь, предубеждение, мотивация, хорошие отметки, болезнь, спортивный, красивый и зрелость.
Независимые и зависимые переменные
Переменной называется любая измеримая характеристика, которая может иметь более одного значения. Примерами переменных являются пол (женский и мужской), рост, политическая принадлежность (республиканец, демократ, коммунист и т. п.), привычка пользоваться преимущественно одной рукой (правша, левша, одинаково владеющий обеими руками) и отношение к традиционным половым ролям (может изменяться в диапазоне от крайне отрицательного до крайне положительного). При проверке гипотез мы начинаем с выбора переменных, которые нас интересуют.
В сюжете, с которого начинается эта глава, вас просили определить, какая из двух программ лечения с большей вероятностью поможет вам отвыкнуть от героиновой зависимости. В этом примере две переменные — тип лечения, который является независимой переменной, т. е. вы можете его выбирать (программа 1 или программа 2), и излечение, которое является зависимой переменной, т. е. вы считаете, что эта переменная изменяется в зависимости от типа лечения вы либо а) излечитесь от наркомании, либо б) не излечитесь от наркомании. Вы хотите выбрать программу, которая по-
269
может вам излечиться. В терминологии проверки гипотез вы хотите знать, какое значение независимой переменной благоприятно повлияет на зависимую переменную.
Следующим этапом процесса проверки гипотез является введение рабочих определений переменных. Предположим, что мы решили определить «излечение» как воздержание от наркотиков в течение минимум двух лет, а «неизлечение» — как воздержание от наркотиков в течение периода менее двух лет, куда входит и случай, если вы будете продолжать постоянно употреблять наркотики. Важно критически обдумать рабочие определения ваших переменных. Если они сформулированы неудовлетворительно, то заключение, к которому вы придете в результате своего исследования, может быть неправильным.
Чувствительность измерений
При измерении какой-либо величины мы постоянно придаем ей числовые значения, чтобы получить ее количественную характеристику. Рост человека, который выше вас, обозначается большим числом дюймов, чем ваш рост. Иначе понятие роста потеряло бы смысл.
Когда мы мыслим, как ученые, и собираем информацию, чтобы понять устройство мира, нам необходимо учитывать способ измерения переменных. Предположим, вы считаете, что любовь напоминает лихорадку и что у влюбленных бывают симптомы, похожие на симптомы лихорадки. Чтобы выяснить, верно ли это, вы можете провести эксперимент, измерив температуру у влюбленных и сравнив результаты с температурой людей, которые не влюблены. Как вы будете измерять температуру? Предположим, вы решили пользоваться ленточным термометром, который регистрирует температуру, когда его помещают на лоб пациента. Далее предположим, что этот прибор измеряет температуру, округляя ее до целых градусов (например, 36°, 37°, 38° и т.д.). Если от любви температура тела действительно повышается, но только на полградуса, вы этого никогда не узнаете, пользуясь ленточным термометром. Такие термометры просто недостаточно чувствительны для того, чтобы зарегистрировать небольшие отклонения температуры тела. Вы придете к неправильному заключению о том, что любовь не приводит к повышению температуры тела, хотя на самом деле это может быть не так. Насколько мне известно, подобный эксперимент никогда не проводился, но он хорошо демонстрирует необходимость учета чувствительности измерений в этой и других ситуациях.
Контингент и выборки
Каждый день люди принимают огромное количество решений, касающихся жизни и деятельности других людей Эти решения неизбежно чреваты ошибками, которые возникают из-за невежества, личных предубеждений или стереотипов.
У. Грант Дальстром (Dahlstrom, 1993, р. 393)
Принимая решение о том, какую программу лечения от героиновой зависимости выбрать, или в каком колледже учиться, или на какую работу устроиться, вы
270
делаете ставку на будущее событие, которое неизбежно связано с неопределенностью. Принципы проверки гипотез применяются для уменьшения этой неопределенности. Мы не можем полностью устранить неопределенность, но мы можем воспользоваться принципами проверки гипотез, которые помогут нам сделать оптимальный выбор. В примере, с которого я начала эту главу, вам пришлось бы изучить и оценить информацию о степени успешности обеих программ. Затем вы воспользовались бы этой информацией для принятия решения.
Группа людей, о которой мы хотим получить данные, называется контингентом. Поскольку очевидно, что для выявления более успешной программы лечения мы не можем обследовать всех людей, страдающих от героиновой зависимости, нам придется обследовать подгруппу этого контингента. Такая подгруппа называется выборкой. В данном примере выборку составляют все люди, которые лечились по каждой из программ.
Репрезентативные и нерепрезентативные (тенденциозные) выборки
Мы хотим, чтобы выборка была репрезентативной для нашего контингента. Чтобы выборка была репрезентативной, входящие в нее наркоманы должны быть мужчинами и женщинами из всех социально-экономических слоев общества, иметь различные уровни интеллекта, проживать в городских и сельских районах и т.д. Репрезентативная выборка необходима для того, чтобы можно было обобщить полученные результаты и решить, какая из программ в целом успешнее. Обобщением называется распространение результатов, полученных на выборке, на весь контингент, т.е. мы подразумеваем, что при обследовании всего контингента получили бы аналогичные результаты.
Что происходит, если выборка не репрезентативна для контингента? Предположим, что одна из программ стоит очень дорого, а другая программа предназначена для бедных и субсидируется государством. Это примеры нерепрезентативных (тенденциозных) выборок. Поскольку они не репрезентативны, вы не можете пользоваться ими для того, чтобы делать выводы обо всем контингенте наркоманов, употребляющих героин
Самое большое фиаско во всей истории выборок произошло, по-видимому, в 1936 г., когда журнал «Литературный дайджест» разослал по домашним адресам более 10 миллионов бюллетеней, чтобы предсказать результаты выборов президента, которые должны были состояться в том же году (Kimble, 1978). На этой большой выборке были получены совершенно ясные результаты: следующим президентом будет Альф Лэндон. Что, вы не знаете такого президента? Я уверена, что не знаете, потому что президентом США в 1936 г был избран Франклин Делано Рузвельт. В чем же было дело? Проблема состояла в том, как были отобраны избиратели, вошедшие в выборку. Бюллетени рассылались подписчикам этого литературного журнала, людям, чьи адреса были в телефонной книге, и владельцам автомобилей. Напоминаю, что дело было в 1936 г., когда только состоятельные люди подписывались на журналы и имели телефоны или автомобили. В выборку не было включено большое число менее богатых избирателей, многие из которых голосовали за Руз-
271
вельта, а не за Лэндона. Поскольку выборка была нерепрезентативной, нельзя было обобщать результаты на весь контингент. Несмотря на то, что в выборку было включено большое количество избирателей, результаты оказались неправильными, поскольку она была нерепрезентативной.
Часто бывает нелегко заметить, какое глубокое влияние оказывают нерепрезентативные выборки на получаемую нами информацию. Например, пользуются большой популярностью (возможно, потому, что кто-то зарабатывает деньги на оплате телефонных разговоров) телефонные опросы, в которых респонденты сами звонят, чтобы ответить на заданный вопрос. Предположим, телефонный опрос показал, что 75% респондентов, позвонивших, чтобы выразить свое мнение о смертной казни, были против нее. Какие выводы можно сделать из этого? Абсолютно никаких! Опросы такого типа называются slops (selected listeners opinion polls), что означает «опрос мнений избранных слушателей», а также отражает их ценность (slops по-английски также означает «помои»). Только люди с крайними взглядами по какому-либо вопросу не пожалеют времени и денег на то, чтобы позвонить и выразить свое мнение. Хотя обычно перед этими опросами предупреждают, что «это не научные данные», комментатор затем переходит к изложению бессмысленных результатов, как будто они отражают общественное мнение.
Еще одной ловушкой при составлении выборки является возможность смешанного влияния факторов (confounding). Поскольку пациенты этих двух гипотетических программ лечения от героиновой наркомании отличаются между собой по нескольким признакам, — т. е. по первой программе консультации проводят ровесники, а наркоманы очень состоятельны, а по второй программе предлагается лечение другого типа, и пациенты очень бедны, — мы не можем определить, зависят ли различия в показателях выздоровления от типа лечения или от уровня доходов пациентов. Поскольку мы не можем разделить влияние типа лечения и уровня доходов пациентов, то по этим результатам нельзя судить о том, какой тип лечения успешнее.
Обычно ученые пользуются удобными (convenience) выборками. Они исследуют группу людей, которые легко доступны. Чаще всего участниками психологических экспериментов бывают студенты колледжей и крысы. Насколько широко можно обобщать результаты, полученные на этих выборках, зависит от того, какой вопрос вы исследуете. Если вы хотите понять, как работает человеческое зрение, студенты колледжа будут подходящими участниками, особенно если вас интересуют молодые и здоровые глаза. С другой стороны, если вы хотите разобраться в вопросе о стереотипизации половых ролей у взрослых, студенты колледжа не будут репрезентативной выборкой, поскольку по сравнению с другими взрослыми они менее склонны к стереотипизации. В этом случае вы можете обобщать результаты только на студентов колледжа.
Во время недавних выборов в Калифорнии велось много споров по вопросу о введении ваучерной системы для оплаты среднего образования. Как вам, возможно, известно, некоторые люди считают, что образование выиграло бы, если бы родители получали ваучеры на сумму, которую государство тратит на обучение ребенка в средней школе. Затем родители могли бы воспользоваться этим ваучером и выбрать любую школу, которую они считают наиболее подходящей для своего ребенка. Это сложная проблема, поскольку сторонники ваучеризации утверждают, (272:) что конкуренция приведет к повышению уровня всех школ, а противники доказывают, что богатые родители будут доплачивать и посылать своих детей в частные школы, в то время как бедные родители будут вынуждены отдавать ваучеры в более дешевые и слабые школы. Я не хочу обсуждать здесь вопрос о ваучерах, но приведу объявление, которое часто появлялось в печати в предвыборный период. Оно звучало примерно так:
Государственные школы Калифорнии плохо справляются с обучением наших детей. Знаете ли вы, что результаты старшеклассников из Калифорнии на вступительных экзаменах в колледж значительно ниже, чем результаты старшеклассников из штата Миссисипи?
Мышление авторов этого объявления можно подвергнуть критике по многим пунктам (включая и явную инсинуацию в адрес штата Миссисипи), но целью нашего обсуждения является только рассмотрение характера сравниваемых выборок. Вступительные экзамены в колледж сдают только те школьники, которые собираются учиться в колледже. В Калифорнии эти экзамены сдает гораздо большая часть старшеклассников, чем в Миссисипи. Хотя я не знаю точных фактических цифр, предположим, что в Калифорнии эти экзамены сдают 40% лучших выпускников средней школы, а в Миссисипи — только 10%. Теперь вы видите, почему можно ожидать, что выпускники из Миссисипи покажут лучшие результаты — из-за нерепрезентативности выборки. Существуют и другие причины, по которым можно ожидать, что эти результаты не связаны с качеством образования. В Калифорнии много недавно приехавших иммигрантов, потому многие учащиеся говорят по-английски не так хорошо, как те, для кого английский язык является родным. Из-за этого средний балл учащихся штата тоже может понизиться. Таким образом, опять дело в выборке, поскольку не проводится сравнение групп, которые отличаются лишь одной интересующей нас переменной (штат, в котором получено образование). Конечно, не исключено, что в Миссисипи школьники получают лучшее образование, чем в Калифорнии, но это не следует из приведенных данных.
Размер выборки
Получив наперсток фактов, мы делаем поспешные обобщения размером с целую лохань.
Гордон Олпорт (Allport, 1954, р. 8)
Количество испытуемых, включенных в выборку, называется размером выборки. Допустим, что по первой программе лечились 6 пациентов/испытуемых, а по второй программе — 10 пациентов/испытуемых. (Испытуемый — это человек, животное или организм, который участвует в эксперименте.) Обе эти выборки слишком малы, чтобы определить степень успешности лечения. При проведении экспериментов ученые часто используют большое количество испытуемых. Если по какой-то причине у них не окажется большого количества испытуемых, то, возможно, им придется осторожнее и консервативнее относиться к выводам, полученным с помощью своих исследований. Несмотря на то что обсуждение числа испытуемых, (273:) необходимых для проведения эксперимента, выходит за рамки этой книги, важно помнить, что для большинства повседневных целей мы не можем обобщать на весь контингент результаты наблюдений за реакциями небольшой группы людей.
Предположим, что с вами произошла следующая история. После нескольких месяцев колебаний вы, наконец, решили купить машину марки «Шевроле Камаро». Вы обнаружили, что эта машина имеет высокий рейтинг в двух журналах — в Consumer Reports («Отзывы потребителей») и Road and Track («Пути — дороги»). Цена «Камаро» укладывается в ваш бюджет, и вам нравится его обтекаемая форма и спортивный стиль. Выходя из дома, чтобы оформить сделку, вы встречаетесь с близкой подругой и сообщаете о своей предполагаемой покупке. «"Камаро?" — кричит она. — Брат моего мужа купил эту машину — это просто консервная банка. Она постоянно ломается на дороге. Ее так часто таскали на буксире, что пора заменять бампер». Что вы будете делать?
Большинству людей было бы трудно все-таки решиться на покупку, потому что они не обращают достаточного внимания на размеры выборки. Общенациональные журналы, вероятно, проверили много машин перед тем, как определили свой рейтинг. Брат мужа вашей подруги — это один испытуемый. Вам следует больше доверять результатам, полученным на больших выборках, по сравнению с результатами, полученными на маленьких (при условии, что «эксперименты» были одинаково корректными). Тем не менее, многие считают рекомендации единственного человека, особенно если это их знакомый, убедительнее информации, полученной на большой выборке.
Мы склонны игнорировать важность достаточно большого размера выборки, когда действуем как «интуитивные ученые». Именно поэтому рекомендации являются таким мощным средством убеждения людей, внушая им, что делать и во что верить. Но рекомендации основываются на опыте только одного человека, и часто этому человеку платят за то, чтобы он хвалил определенный товар. В моей коллекции есть реклама телефонных консультаций экстрасенса, где в качестве доказательства того, что советы экстрасенсов эффективно помогают решить целый ряд проблем, приводятся «реальные случаи». «Жительница города Лансинга в штате Мичиган вновь обрела интерес к жизни после одной беседы с экстрасенсом... А женщина из Питтсбурга (штат Пенсильвания) чувствует, что экстрасенс как будто заглянул прямо ей в душу» («Космополитен», январь, 1994). Чтобы эти комментарии звучали более правдоподобно и носили личный характер, авторы ссылаются на определенных людей, не называя их имен, но указывая название города и штата. Чем определеннее получаемая нами информация, тем больше вероятность, что мы поверим в ее истинность. Но дайте мне передохнуть!
Мне хотелось бы игнорировать информацию подобного типа, считая ее вздором, на который никто не купится, но мой опыт свидетельствует об обратном. Одна моя родственница истратила более 300 долларов на телефонные звонки экстрасенсам, когда ей нужно было принять важное решение, касавшееся лечения ее серьезно больного мужа. За эти деньги она получила советы, которые были в лучшем случае просто безвредными, а в худшем случае приводили к тому, что она пренебрегала рекомендациями больничных врачей. Позднее я узнала, что экстрасенсам запрещено предсказывать кому-либо смерть, поэтому они дали ей ложную надежду, из-за чего ей было еще тяжелее перенести смерть мужа. Я рассказываю эту истинную историю, коснув-
274
шуюся лично меня, потому что надеюсь, что она заставит вас задуматься о том, какие необходимы доказательства, чтобы заплатить сотни долларов за совет незнакомого и заинтересованного в ваших деньгах человека, у которого нет документов, подтверждающих его компетенцию в области психологии или науки.
Вариативность
Термин вариативность указывает на то, что не все люди одинаковы. Предположим, что вы знаете человека, который «дымил, как паровоз» и прожил до ста лет. Означает ли это, что гипотеза об отрицательном влиянии курения на здоровье неверна? Отнюдь нет. Влияние курения на здоровье определялось многими независимыми исследователями, которые работали с большим количеством испытуемых. Люди демонстрируют различные реакции, придерживаются разных мнений и имеют разные способности. При осмыслении результатов важно помнить о роли вариативности.
Несколько лет назад поднялось много шума вокруг применения лаэтрила (laetrile), т.е. экстракта абрикосовых косточек, для лечения рака. Несмотря на то, что официальная медицина Соединенных Штатов признала его бесполезность в борьбе против рака, многие люди продолжали верить, что с помощью лаэтрила можно излечиться. Предположим, что вы прочитали о человеке с диагнозом «рак», который затем принимал лаэтрил. Впоследствии этот счастливчик излечился от рака. Какие выводы вы сделаете? Захочется ли вам заключить, что, по крайней мере, в некоторых случаях лаэтрил может вылечить или помочь вылечить рак? Такое заключение необоснованно. Некоторые люди вылечиваются от рака, а другие — нет. Так же как люди различны по своим убеждениям и установкам, они по-разному реагируют на болезнь. Если размер выборки равен единице, мы не можем заключить, что лаэтрил внес свой вклад в выздоровление больного. Чтобы решить, полезен ли лаэтрил при лечении рака, необходимы широкомасштабные сравнительные исследования уровней выживания групп больных раком, которые лечились лаэтрилом, и групп больных, которые лечились другими способами. Когда государственные организации провели такие тесты, оказалось, что лаэтрил бесполезен. Легко понять, что отчаявшиеся больные раком поддаются заблуждению и верят в результаты, полученные на очень маленьком количестве людей.
Готовность людей поверить, что результаты, полученные всего на нескольких испытуемых, можно обобщать на весь контингент, называется законом малых чисел (Tversky & Kahneman, 1971). На самом деле мы можем быть более уверены, когда работаем с большими выборками, а не с маленькими (Kunda & Nisbett, 1986). При экспериментальном исследовании этого явления (Quattrone & Jones, 1980) студенты колледжа продемонстрировали веру в то, что если один из членов группы принимает определенное решение, то другие члены этой группы примут такое же решение. Этот результат был особенно стойким, когда студенты одного колледжа наблюдали за решениями студентов других колледжей. Таким образом, мы видим, что вера в закон малых чисел способствует сохранению предрассудков и стереотипов. Мы склонны верить, что действия одного члена группы являются показателем действий всей группы. Слышали ли вы, как кто-нибудь говорит: «Все ____ (вставьте (275:) сюда название группы, к которой принадлежите) похожи друг на друга»? Одна знакомая как-то сказала мне, что все ямайцы — жулики и воры. Она пришла к такому заключению после одного неприятного инцидента, который произошел у нее с жителем Ямайки. Такого рода утверждения являются проявлением закона малых чисел. Теперь вы можете понять, как закон малых чисел может объяснить происхождение многих предрассудков, таких, например, как расизм? Единственное запомнившееся событие с участием члена группы, с которой мы редко вступаем в контакт, может повлиять на наши представления о всех остальных членах этой группы. Как правило, перед тем как прийти к какому-либо заключению, необходимо накопить большое количество наблюдений о людях и событиях.
Существует одно исключение из общего принципа, которое состоит в том, что для достоверных обобщений результатов на весь контингент необходимы большие выборки. Это исключение имеет место тогда, когда контингент совершенно однороден. Если, например, каждый человек из интересующего нас контингента совершенно одинаково отвечает на любой вопрос (например, «Одобряете ли вы смертную казнь?») или одинаково реагирует на любое лечение (например, не имеет «сердечных приступов» при лечении простым аспирином), то размер выборки больше не играет роли. Конечно, люди не бывают одинаковыми. Вы, вероятно, считаете, что об этом можно было бы и не говорить, поскольку все и так знают, что все люди разные. К сожалению, исследования показали, что большинство из нас склонно к недооценке изменчивости групп, которые нам не знакомы.
Члены всех групп меньшинств часто рассказывают, что лидеры или члены других групп обращаются к ним и спрашивают: «Что афроамериканцы (или женщины, или латиноамериканцы, или азиаты, или члены любой из групп меньшинств) думают по этому вопросу?» При этом как будто подразумевается, что несколько членов группы меньшинства могут говорить от имени всей группы. Это проявление нашей веры в то, что группы, к которым мы не принадлежим, гораздо более гомогенны (однородны), чем наша.
Способность к точному прогнозированию частично зависит от умения точно оценивать степень вариативности. Важно иметь это в виду всякий раз, когда вы проверяете гипотезу — в строго научной обстановке или при неформальных попытках определить причинные связи в своем повседневном окружении.
Достарыңызбен бөлісу: |