Введение в методику демоскопии



бет12/18
Дата19.06.2016
өлшемі2.63 Mb.
#147558
1   ...   8   9   10   11   12   13   14   15   ...   18

VI. Обработка и анализ

Одномерная базовая таблица: быстро ли вы обычно засыпаете?

Одной из предпосылок современных исследований методом опроса является создание машин, которые в час сортируют около 60 000 перфокарт и могут при этом подсчитывать все отверстия в одной колонке1, а также изобретение специальных счетных сортировочных машин, которые за один прием обрабатывают 60 колонок и больше, за одну операцию выполняют программы счета, сортировки [и вычислений и автоматически записывают результаты.

Стало технически просто подготовить тома g сотнями таблиц по результатам опроса, но составление содержательных и четких таблиц осталось трудным делом. Эту работу человеческого ума нельзя передать машине.

Прежде чем приступить к составлению таблиц, необходимо составить себе представление о распределении величин в целом. Для этого один раз просчитывают комплект перфокарт и у каждой позиции в схеме кодирования указывают найденную величину в абсолютных цифрах и процентах. Одновременно проверяют статистическую представительность данных, чтобы еще перед началом дальнейших вычислений произвести возможную корректировку результатов путем взвешивания 2. О величине ошибок кодирования судят по соответствующим контрольным пробам: сколько людей моложе 20 лет отмечены на перфокартах как пенсионеры, сколько жителей Гамбурга отме чены как члены сельской общины,скольконекурящих охотнокурят сигареты маркиX?

После однократного просчета всего комплекта перфокарт мы уже можем составить первые таблицы. Возьмем, например, вопрос138:

Легко


Довольно хорошо С трудом ....

Простые одномерные таблицы этого типа с общим результатом образуют базу всякого отчета. Их ценность состоит в описании обстоятельств, они еще не содержат результатованализа.

Эту таблицу можно записать и так:

ВОПРОС: «Как выобычно засыпаете — легко или с трудом?»

Общий результат

Легко 56,2%

Довольно хорошо 20,7%

С трудом 23,1%

100%

Или так:


ВОПРОС:«Как Вы обычно засыпаете — легко или с трудом?»

Общий Кол-во

результат

Легко 56% 1134

Довольно хорошо 21% 418

С трудом 23% 466

Илитак:

ВОПРОС:«Как Вы обычнозасыпаете — Легкоили с трудом?»



Проекция на

39,5 млн. жителей ФРГ (включая Западный Берлин) в возрасте старше 18 лет*

Засыпают легко 22,2 млн.

Засыпают довольно хорошо 8,2 млн.

Засыпают с трудом 9,1 млн.

39,5 млн.

В последней таблице мы, как говорят, «проецировали» на все население ФРГ результаты, полученные для представительной выборки в 2018 человек. Расчет был произведен на основании 3 групп известной величины.

Из 2018 опрошенных 1134 ответили, что они засыпают легко; на основании этого был сделан вывод, что из из 39,5 млн. лиц в возрасте от 18 лет в ФРГ засыпают легко 22 200 000 человек.К процентам переходят прежде всего тогда, когда необходимо сравнить друг с другом два или несколько рядов чисел. В нижеследующем примере сравнивают количество муки различных сортов, проданной в двух областях:

количество четырех сортов муки, проданное в двух различных областях (в фунтах).

СортаОбласть IОбласть II

А 5,836 2,888

Б 1,7101,728

В 13,723 3,736

Г 7,4500,224

Всего продано (в фунтах) 28,719 8,576

Пересчет в процентах яснее показывает положение дела. Проценты помогают нам определить различия в пропорциях проданной муки:

Количество четырех сортов муки, проданное в двух различных областях (в процентах)

Область I Область II

Сорта


34%

20%


43%

3%

100%


20%

6%

48%



26%

А

Б

В



100%

Г Всего

Почему результатыопросов

в большинстве случаев выражены

впроцентах?

Почему чаще всего результаты опросов выражают в процентах? Ганс Цайзель объясняет это в своей книге «Say it with Figures»139, впервые опубликованной в 1947 году, следующим образом:

«Для чего обычно применяют проценты — известно: они дают возможность выявить относительную величину двух или более чисел. Это осуществляется двумя способами. Во-первых, выраженные в процентах числа можно легко умножать и делить (проценты — это, как правило, числа меньше ста); во-вторых, при этом одно из чисел, базовое, превращается в 100 — число, которое легко делится само и на которое легко делить другие числа. Благодаря этому нетрудно представить относительную величину различных чисел.

Отношения между двумя числами

Часто в исследованиях мы получаем количественные результаты, которые, если их рассматривать как таковые, не имеют смысла. Лишь если эти результаты сравнить друг с другом, они дают желаемую информацию.

Предположим, что во время предвыборной кампании к президентским выборам 1948 года мы провели опрос представительной выборочной совокупности из 15 000 избирателей в штате Нью-Йорк. Нас интересовали их намерения во время выборов. Мы установили, что 7650 опрошенных заявляют, что они выберут Трумэна, 7350 опрошенных говорят, что они проголосуют за Дьюи. Если мы хотим оценить перспективы Трумэна на выборах (то же самое можно сделать и с данными о Дьюи), то мы имеем для этого два числа:

а) 7650 — числоопрошенныхизбирателей,которые хотятголосовать за Трумэна;

б) 15 000 — величина всей выборки, которая была опрошена.

Число (а), взятое отдельно, не говорит вообще ни о чем. Число (б) не является результатом исследования, это более или менее произвольно взятое число. Однако отношение между обоими числами (а) и (б) дает нам некоторую информацию.

Оно означает, что 51 процент избирателей выразил желание избрать Трумэна. Ни одно из обоих чисел в отдельности не представляет интереса. Представляет интерес лишь отношение между обоими числами а/б.

При использовании процентов мы не можем забывать об их главной функции: они должны по возможности упростить выражение отношений между двумя или несколькими числами. Из этого следуют практические выводы относительно способов процентного выражения.

Одна из проблем, возникающих в этой связи,— это, например, вычисление десятичных долей процентов.

Как известно, проценты можно вычислять с любой степенью точности: 170, например, составляет37,778... процентаот450.

На первый взгляд может показаться, что процентное выражение тем лучше выполняет свою цель, чем точнее оно вычислено. Приведенный пример показывает, однако, что процентное выражение по мере уточнения теряет какую-то долю своей простоты. Если мы вычислим слишком много знаков после запятой, то это может привести к тому, что процентное выражение труднее будет прочесть, чем первоначальное абсолютное число. Десятичные знаки могут свести на нет важное преимущество процентов, и поэтому следует подумать, прежде чем вычислять десятичные знаки в процентах.

В эмпирических социальных исследованиях и в исследованиях сбыта и потребления проценты рассчитывают, как правило, с точностью максимум до одной десятой; один десятичный знак рассматривают, так сказать, как допустимый компромисс между простотой и точностью. Однако мы не должны забывать, что даже один десятичный знак затрудняет ясность таблицы.

Предположим, что Вы находите в таблице следующие три процентных числа:

Проценты 27,6 42,2 84,8

Всего (базовое число) (352) (306) (344)

Нет никакого сомнения в том, что было бы намного легче сравнивать эти три числа, если бы проценты были изображены без десятичных: 28—42—85. При таком распределении ошибка, получающаяся при округлении, является незначительной. Различия между числами выступают гораздо нагляднее, если проценты представлены без десятичных знаков. С другой стороны, практически нет никакой разницы, сравнивают ли 27,6 и 42,2 или 28 и 42.

Напротив, следующая таблица показывает случай, при котором имеет значение, отбрасывают ли десятичные знаки или нет:

Проценты 11,5 11,9 12,4

Всего (базовое число) (9,367) (10,072) (10,031)

В этой таблице оставлены десятичные знаки по двум причинам. Во-первых, чтобы не стереть различие между тремя столбцами (тогда все три числа превратились бы в 12%). Кроме того, при выборке с таким количеством случаев различие в десятые доли процента еще может быть значимым. При выборке в несколько сотен случаев такое же различие между 11,5; 11,9 и 12,4 процентами уже не было бы значимым и нельзя было бы с достаточной уверенностью делать вывод о действительном различии между группами. В математической статистике никогда не может считаться ошибочным точное вычисление процентов с десятичными знаками, однако десятичные знаки психологически могут ввести в заблуждение, так как они создают видимость большей точности, чем та, которую выражают числа в абсолютном выражении. Если проценты 11,5; 11,9 и 12,4 вычислены на основе 300 случаев, а не на основе 10 000 случаев, то намного лучше указать на незначительность таких различий и, отбросив десятичные знаки, округлить: 12,12,12. Если мы оставим десятичные знаки, то даже при небольшой выборке наивный читатель, увидев такую таблицу, может сказать: «Здесь видно небольшое постепенное развитие от 11,5 через 11,9 к 12,4». В действительности такое впечатление вообще не оправданно.

Десятичные знаки должны сохраняться в тех случаях, когда запланировано повторение исследования и результаты будут сравниваться. Мы не можем знать наперед, как велико или как мало

будет найденное различие *. Однако в принципе можно утверждать, что таблица при отбрасывании десятичных знаков всегда выигрывает в ясности и наглядности. Одновременно мы избегаем впечатления несуществующей точности, которая является точностью расчета процентов,а не точностью самого результата».



Абсолютные числа мешают и необходимы

По вопросу о том, следует ли в таблице наряду с процентами указывать абсолютные числа, Г. Цайзель пишет140:

«Каждая таблица, даже простая, выигрывает в наглядности, если опустить абсолютные числа. Благодаря этому таблица становится также привлекательной для неспециалиста, который всегда немного испытывает страх перед большим количеством чисел. Во всех случаях, когда можно обойтись без абсолютных чисел в таблицах, необходимо от них освобождаться. Однако, если по каким-либо причинам нужно сохранить проценты и абсолютные числа, не перегружая таблицу, есть элегантное решение: свести абсолютные числа в отдельную таблицу и расположить эту таблицу рядом, ниже или поместить в приложении».

Как справедливо замечает Г. Цайзель, при решении вопроса о том, включать или не включать в таблицу абсолютные числа, возникает конфликт между облегчением анализа и ясностью таблицы. Для удобства анализа хотелось бы все нужные числа иметь рядом друг с другом, однако ясность таблицы сильно ухудшается, если удваивается количество содержащихся в ней чисел. При простых общих результатах, которые мы рассмотрели, это еще не имеет значения. Другое дело, если таблица содержит четыре, шесть или более столбцов. Практическое решение конфликта между удобством и ясностью, если речь идет не об отдельных таблицах, а о целых отчетах по исследованиям, состоит в том, чтобы составить перечень всех встречающихся в отчете базисных групп в абсолютном выражении и так поместить его в отчете, чтобы им можно было легко пользоваться.

Абсолютное число случаев, на основании которого получены проценты, как правило, необходимо для оценки статистических отклонений в результатах или для проверки значимости различий между двумя найденными величинами.

Однако имеется много случаев, когда должны быть приняты во внимание абсолютные величины — внутри выборочной совокупности или в проекции на генеральную совокупность,— чтобы избежать неправильных выводов. Так, например, в одной из газет была помещена заметка о соотношении мужчин и женщин среди слушателей гессенской и баварской радиопередач, делающих объявления о найме на работу: «При сравнении с результатами по сфере действия гессенской радиопередачи можно утверждать, что доля женщин среди «слушателей за день» в Баварии значительно меньше, чем в Гессене— 61% против 68% в Гессене». После этого сообщения Баварская радиостанция потребовала исправлений или пояснений в абсолютных числах.

На основании этой заметки можно сделать вывод, что гессенскую радиопередачу слушает больше женщин. Посмотрим, однако, таблицу, дополненную числами в абсолютномвыражении:


Слушатели радиопередачо найме рабочей силывГессене

68%= 735 000 32%= 345 000



Слушатели радиопередач о найме рабочей силы в Баварии

Женщины 61% = 1430 000

Мужчины 39%= 920 000

100 % = 2 350 000 100 % = 1 080 000

При анализах сбыта и потребления, анализах объявлений о приглашении на работу, а также при анализах политических вопросов всегда приходится проверять, указано ли наряду с числом процентов абсолютное число случаев, на основе которых рассчитаны проценты, а также не производят ли большее и правильное впечатление результаты опроса в абсолютных числах.

Приятное, все упрощающее сглаживание различающихся абсолютных величин при пересчете в проценты, без сомнения, таит в себе опасность ошибок, когда абсолютные величины легко исчезают из поля зрения или вообще не сообщаются. Один иллюстрированный журнал опубликовал однажды пародию на такие сообщения под заголовком: «50 процентов немецких врачей, которые в прошлом году уехали в Индию, умерли в первые 12 месяцев работы». Через несколько строк читатель узнал, что за весь прошлый год в Индию уехало лишь два врача.

Не является ли вообще расчет процентов при числе случаев меньше 100 намеренным коварным обманом?

В принципе никто пе возражает против того, чтобы рассчитывать проценты для небольших групп — это облегчает сравнение различных групп менаду собой, увеличивая общий базис до 100; наоборот, в больших группах его снижают до 100. Однако в выборочных исследованиях проценты, которые вычисляются на малой статистической базе (менее 100 случаев), должны обозначаться в принципе особым образом вследствие приблизительности результатов, значительного диапазона ошибок. Например, в таблицах их можно брать в скобки как простые «показательные» величины.



Когда сложение процентов дает число больше 100

Из исследования «Социологические данные по вопросам здравоохранения» (глава «Домашние средства и медицинское суеверие»)141 заимствована следующая таблица, содержащая общий результат:

ВОПРОС: «Иногда достаточно воспользоваться каким-либо домашним средством, и можно не ходить к врачу. Здесь перечислены различные домашние средства. Сначала вопрос: «Какие из них Вы знаете, о каких Вы уже слышали?»

И «какие из них Вы считаете хорошими —я имею в виду: на какие можно в большинстве случаев положиться и быть уверенным, что они помогут?»

Взрослое население

(старте 17 лет) в

Гессене

Знают следующие домашние средства:



Чай из липового цвета как потогонное средство 74%

Мех кошки при ревматизме или ишиасе . . . 60%

Крапива или укусы муравьев при ревматизме 38%

Уксусный компресс при температуре.... 36%

Собачий жир от туберкулеза 22%

Носить в карманах каштаны от ревматизма

При кровотечении из носа приложить к за- 19%

тылку связку ключей 15%

Не знают ни одного из этих средств 17%

281%


Сумма процентов при сложении получается более 100, если на один вопрос можно одновременно дать несколько ответов (если по смыслу на вопрос возможен лишь один ответ, сумма процентов всегда составляет 100). Второй пример мы видим в схеме кодирования с указанным общим результатом вопроса: «Давайте подумаем о ближайшем будущем, я имею в виду наступающий год, исполнения какого желания Вы хотели бы больше всего?» Благодаря таким ответам, как: «Здоровье моей дочери, а также ника-

кого застоя в делах», сумма процентов по всем желаниям в личной сфере увеличилась не на 51%, а на 60%.

Часто наблюдаются отчаянные попытки устранить в таблицах эти «некрасивые» ошибки; при этом сумма всех ответов берется за 100 и служит в качестве базы процентного исчисления.

При такой процедуре последовательность и соотношения величин остаются очевидными, но числа теряют свою конкретную наглядность, так как они уже относятся не к людям (60 из 100 гессенцев слышали о том, что мех кошки помогает от ревматизма), а относятся к сумме ответов («Среди псех ответов 23 касаются меха кошки как средства от ревматизма»).

Это возражение существенно; ведь статистике необходимо искусство, чтобы быть понятой. Многие люди встречают сообщения из мира науки о признаках и переменных, как было сказано ранее, с невольным сопротивлением. Поэтому доступ к таким сведениям не следует и дальше осложнять статистическими операциями, которых можно избежать. Наоборот, необходимо при составлении таблиц искать средства, чтобы сделать их наглядными, понятными.

Другой способ получить таблицу о домашних средствах со 100%-ным итогом — каждую строку дополнить пока отсутствующими данными о том, сколько процентов опрошенных не знают этого домашнего средства. Это дополнение, правда, удваивает количество чисел в таблице. Получают следующую таблицу:

Взрослое население

земли Гессен (старше

18 лет)

Чай из липового цвета как потогонное —




74% 26%
знают как домашнее средство....не знают


100%

60% 40%

100%
Мех кошки при ревматизме или ишиасе —



знают как домашнее средство ....не знают

Такой способ составления таблиц демонстрирует комбинацию знаний — эту модель можно использовать для вопросов с тремя или четырьмя категориями ответов — и уменьшает наглядность. Это хорошая форма таблицы, если мы хотим знать что-либо о комбинациях. Если нас не интересуют комбинации, то не следует их отражать. В то время как из таблицы комбинаций можно самостоятельно рассчитать общий результат для отдельных категорий и таким образом получить как бы два различных вида информации, по простому общему результату нельзя определить частоту комбинаций. Таблицы комбинаций менее ясны, менее наглядны, и это в достаточной степени говорит против такого способа. Представительные исследования приносят, как правило, огромное количество данных. Их отбор следует проводить, исходя из цели исследования.Можно составить эту таблицу более экономно:

Взрослое население земли Гессен (старше 18 лет)


Знают в качестве домашнего средства

74% 60%
Средство не известно


26% = 100% 40% = 100%


Чай из липового цвета какпотогонное

Мех кошки при ревматизмеили ишиасе

И еще одна возможность для вопросов с небольшим количеством вариантов ответов (для целей демонстрации мы соответственно сокращаем наш вопрос о домашних средствах):

Анализируется засыпание

Первые шаги анализа результатов опроса состоят в том, чтобы одномерные таблицы, которые мы рассматривали до сих пор, дополнить разработанными двухмерными или многомерными таблицами. Другими словами, наряду с общим результатом отдельно вычисляют результаты различных подгрупп и сравнивают их между собой. Если эти группы характеризуются единственным признаком (например, различным возрастом), то мы получаем двухмерную таблицу. Ниже приводится двухмерная таблица с 12-ю позициями:

Знают домашние средства:

Чай из липового цвета как потогонное и мехкошки при ревматизме и ишиасе

Чай из липового цвета как потогонное знают,о мехе кошки при ревматизме или ишиасене слышали

Мех кошки при ревматизме или ишиасе знают,о чае из липового цвета как потогонномне слышали

Не знают ни чай из липового цвета как потогонное, ни мех кошки при ревматизме или ишиасе .,.,,.,,,,,.,,,.

Взрослое население

земли Гессен (старше

18 лет)


53%

21%


7%

19% 100%

Оказывает ли возраст человека влияние на то, как он засыпает легко или с трудом?

ВОПРОС: «Как Выобычнозасыпаете — легкоили струдом?»







18-29-летние

74% 15% 11%



30-44-летние

62% 21% 17%



45-59-летние

50% 23% 27%



6 0-летние и старше

33% 25% 42%



довольно хорошо ....с трудом

N ( = число: итог в абсолютном выражении) =

100% 570

100% 475

100% 557

100%, 416

Мы используем здесь возможность объяснить два распространенных термина: группировка, которая является базисной для процентов (в данном случае это возраст), обозначается как независимая переменная. Легкое или трудное засыпание в этом примере — зависимая переменная.

«Распределение» (обычное английское выражение «breakdown»), или — если говорить по аналогии с техническим процессом в машине — «сортировка» по возрастным группам и сравнение результатов, оказывается полезным. Кроме простого знания факта — сколько людей засыпают легко или с трудом,— можно определить взаимосвязь явлений и узнать, например, что возраст оказывает определенное влияние на засыпание. Далее приходит в голову, что легкое или трудное засыпание может зависеть также от окружающих условий — живет ли человек в тихой деревне или в шумном большом городе. Готовят новый «счетный шаблон» для работы на машине и получают результат: сколько карточек было найдено в различных группах.

Как обычно, в счетный шаблон заносят также проценты. Их можно включить в следующую таблицу:

ЛЕГКОЕ И ТРУДНОЕ ЗАСЫПАНИЕ В ГОРОДЕ И В ДЕРЕВНЕ

ВОПРОС: «Как Вы обычно засыпаете—легко или с трудом?»


Легко

Довольно хорошо

С трудом
Жители




Деревень

Маленьких и

Крупных

(менее 2000

средних городов

городов

жителей)

(2000—100 000

(100 000 и




жителей)

более жите-







лей)

57%

55%

58%

23%

20%

20%

20%

25%

22%

100%

100%

100%.

504

873

641

Для подтверждения нашего предположения, что жители крупных городов засыпают труднее, нет никаких оснований.

Далеемы хотели бы проверить, одинаково ли хорошо засыпают мужчиныиженщины. Полученыследующие результаты:


Легко

Довольно хорошо

С трудом

N =
Сравнение мужчин и женщин ВОПРОС: «Как Вы обычно засыпаете — легко или с трудом?»


Мужчины

Женщины

62%

52%

20%

21%

18%

27%

100%

100%

930

1088

На первый взгляд кажется очевидным вывод: женщины труднее засыпают, чем мужчины. Однако известно, что среди женщин больше старых людей: вследствие гибели на войне многих мужчин старше 30 лет, а также благодаря биологически обусловленной большей продолжительности жизни у женщин. А мы уже знаем, что старые люди труднее засыпают. Может быть, данные последней таблицы — женщины в среднем труднее засыпают, чем мужчины,— объясняются более высокой долей людей старшего возраста/ среди женщин?

Переход от двухмерной таблицы к трехмерной один из важнейших шагов

На вопросы такого рода можно получить ответ, если от двухмерных таблиц, в которых группы в сказуемом различаются только по одному признаку (возраст, или величина населенного пункта, или пол), перейдем к трехмерным таблицам, в которых группировки сказуемого определяются комбинацией двух признаков142.

ЛЕГКОЕ И ТРУДНОЕ ЗАСЫПАНИЕ МУЖЧИН И ЖЕНЩИН РАЗЛИЧНЫХ ВОЗРАСТНЫХ ГРУПП

ВОПРОС: «Как Вы обычно засыпаете —легко или с трудом?»



Мужчины Женщины




моло-







6 0 лет

моло-







6 0 лет




же

30-44

45-59

и

же

30-44

45-59

и




30 лет

лет

лет

старше

30 лет

лет

лет

старше

Легко

71%

63%

58%

50%

77%

62%

43%

21%

Доволь-

























но хорошо

17%

20%

21%

23%

14%

21%

25%

26%

С трудом

12%

17%

21%

27%

9%

17%

32%

53%




100%

100%

100%

100%

100%

100%

100%

100%

N =

288

215

250

177

282

260

307

239

В этой таблице, кроме независимой переменной (пол) и зависимой переменной (легкое или трудное засыпание), появился еще третий фактор, «контрольная переменная»— возраст.

Прежде всего в этой таблице мы находим подтверждение нашему первому предположению: возраст человека оказывает значительное влияние на то, легко или трудно люди засыпают — как мужчины, так и женщины. Теперь вернемся к вопросу, который мы только что поставили: действительно ли мужчины засыпают легче, чем женщины? Чтобы точно определить это, попробуем несколько изменить вид нашей трехмерной таблицы.

ЛЕГКОЕ И ТРУДНОЕ ЗАСЫПАНИЕ МУЖЧИН И ЖЕНЩИН РАЗЛИЧНОГО ВОЗРАСТА

ВОПРОС: «Как Вы обычно засыпаете — легко или с трудом?»



Моложе 30

лет

30-44

лет

45—59

лет

60 лет и старше




Муж-

Жен-

Муж-

Жен-

Муж-

Жен-

Муж-

Жен-




чины

щины

чины

щины

чины

щины

чины

щины

Легко

71%

77%

63%

62%

58%

43%

50%

! 21%

Доволь-

























но хо-

























рошо

17%

14%

20%

21%

21%

25%

23%

26%

С трудом

12%

9%

17%

17%

21%

32%

27%

53%

100% 100%100%100%100%100%100%100%N= 288282 215 260 250 307 177 239

Теперь мы видим: предположение, что мужчины засыпают легче, чем женщины, справедливо лишь в некоторой степени. Оно не подтверждается для мужчин и женщин моложе 45 лет. Оно верно для мужчин и женщин в возрасте от 45 до 59 лет, а для возраста 60 лет и старше эта тенденция выражена более четко, чем это позволяла предположить наша первая простая таблица.



«.Возраст константа-»

На техническом языке анализа фактор, скрытое влияние которого на результаты хотят исследовать, называют константой. В нашем примере легкого и трудного засыпания мы считаем, что в действительности женщины засыпают не труднее мужчин. Здесь речь идет, видимо, о скрытом влиянии на результаты более высокого среднего возраста женщин в целом. Чтобы добиться ясности, мы составили таблицу, в которой возраст в четырех группах был константой: мы сравнивали мужчин и женщин в возрасте моложе 30 лет и устранили таким образом искажающий фактор «более высокий средний возраст женщин». Затем мы проделали то же самое с другими возрастными группами: мы сравнивали мужчин и женщин в возрасте от 30 до 44 лет, от 45 до 59 лет, а также мужчин и женщин старше 60 лет. Причем в последней группе возраст мужчин и женщин, без сомнения, не был константой, так как средний возраст женщин в этой последней группе был выше среднеговозраста мужчин.

Пример сразу же показал, что дли анализа удобно составление такой таблицы с тремя факторами: либо мужчины и женщины принимаются за постоянную величину и меняются возрастные группы (первое расположение), либо, наоборот, возрастные группы считаются константой, а внутри их идет сравнение мужчин и женщин. В первом случае контрольной переменной был пол. Во втором случае мы выбрали в качестве контрольной переменной возраст. Хотя цифры в таблицах при том или ином «расположении» одни и те же, преобразование таблиц яснее выявляет влияние различных факторов.

Небольшой шаг от простого распределения (breakdown) к «перекрестным матрицам» (cross-tabulation)143 путем введения новой переменной, или, говоря другими словами, от двухмерной таблицы к трехмерной, является одним из важнейших приемов при анализе.



Ложная корреляция:144 ловушкадляпроводящегоанализ

Общие результаты, как уже было сказано, представляют интерес в качестве описания, но по ним еще нельзя сделать вывод о взаимосвязях. Их можно «интерпретировать», то есть предполагать, как следует понимать выявленные обстоятельства, но насколько эти предположения оправданы, этот вопрос остается открытым. Подготавливают иривычные распределения общего результата, например, при опросах населения — распределения по полу, возрастным группам, семейному положению, по профессиям, по Доходу, по образованию, вероисповеданию, величине семьи, иногда по партийной принадлежности, по величине города или поселка, по регионам (по землям). Этому предшествует, конечно, запись соответствующих данных в интервью с каждым опрашиваемым и перенос их на перфокарты. Составляются двухмерные таблицы, благодаря которым мы не только получаем более дифференцированное описание соотношений, но в результате сравнения результатов по различным группам начинаем также выявлять взаимосвязь явлений.

Анализ былбы относительно прост,если бы многие из этих таблиц не имели двух «ловушек»:


  1. Результаты в сравниваемых группах не отличаютсядруг от друга, например результаты для опрашиваемыхс начальным и средним школьным образованием: можноделать вывод, что школьное образование не влияет на мнение респондентов по данному вопросу. В действительностисовпадение результатов оказывается лишь кажущимся:школьное образование влияет на мнение, но это влияниеперекрывается противодействующим фактором, которыйодновременно связан со школьным образованием и с исследуемым вопросом и снимает эти различия. Ниже приводитсяпример.

  2. Результатысравниваемыхгруппотличаются другот друга, и на этом основании делают вывод о наличиивзаимосвязи. В действительности нет никакой взаимосвязи,имеет место ложная корреляция, вызванная другим фактором, который имеет фактическую тесную связь со статистическим признаком, по которому произведены группировки в таблице, и с мнением по исследуемому вопросу.

Выявление таких заблуждений является одним из существенных признаков квалифицированного анализа.

Средством выявления ложных корреляций служит введение дополнительного фактора, введение контрольной переменной, вследствие чего двухмерная таблица преобразуется в трехмерную. Благодаря такой процедуре в первом случае скрытое различие проявляется, а наблюдаемое во втором случае различие становится значительно слабее, исчезает или даже превращается в свою противоположность. Для иллюстрации первого вида ловушек рассмотрим двухмерную таблицу или, как говорят, «простую корреляцию»: отношение слушателей с различным уровнем школьного образованияк радиопередачам.

ОТНОШЕНИЕ СЛУШАТЕЛЕЙ С РАЗЛИЧНЫМ ШКОЛЬНЫМ ОБРАЗОВАНИЕМ К РАДИОПЕРЕДАЧАМ

ВОПРОС: «Нравится ли Вам в общем и целом радиостанция X или не нравится?»

Слушатели с на-


Слушатели со средним школьным образованием

7% 57% 16% 11%

9%


ным образованием (народная школа)

57% 15% 10% 10%

Очень нравится

Нравится


Не очень нравится

Совершенно не нравится

Трудно сказать


100% 290

100% 1000

Итак, оказывает ли влияние школьное образование на отношение к радиостанции X? После введения нового фактора — проживает ли респондент в границах или за пределами «района взимания налогов» радиостанцией X, возникает следующая трехмерная таблица или «двойная корреляция», которая показывает другую картину.

ОТНОШЕНИЕ СЛУШАТЕЛЕЙ С РАЗЛИЧНЫМ ШКОЛЬНЫМ

ОБРАЗОВАНИЕМ К ПЕРЕДАЧАМ X В ГРАНИЦАХ ИЛИ ЗА ПРЕДЕЛАМИ РАЙОНА ВЗИМАНИЯ ЭТОЙ РАДИОСТАНЦИЕЙ



НАЛОГОВ

ВОПРОС: «Нравится ли Вам в общем и целом радиостанция X или не нравится?»






Слушатели

в 1 рани-

Слушатели

[ за преде-




цах района

взимания

лами района взима-




налогов

ния налогов




с началь-

со средним

с началь-

со средним




ным

школьным

ным

школьным




школьным

образова-

школьным

образова-




образова-

нием

образова-

нием




нием




нием




Очень нравится,













нравится

65%

50%

65%

80%

Не очень нравится,













совсем не нравится

24%

40%

26%

12%

Трудно сказать

11%

10%

9%

8%




100%

100%

100%

100%

N =

600

150

400

140

«Двойная корреляция» школьного образования и района проживания слушателей показывает, что в границах района взимания налогов слушатели со средним школьным образованием значительно более критично оценивают свою «местную передачу», которую они слушают ежедневно, чем слушатели с начальным школьным образованием.

С другой стороны, мнение слушателей со средним школьным образованием, проживающих за пределами района взимания налогов, имеет особую ценность — ведь они, вероятно (здесь начинается интерпретация — доказательств нет), слушают передачу X не всегда и включают ее, потому что она их особенно интересует, потому что о ней сложилось определенное мнение. Оба обстоятельства взаимно компенсируют друг друга при объединенном подсчете результатов с распределением по школьному образованию; простая корреляция дает, таким образом, ложную картину.

является пол. Если нам удается найти эту скрытую переменную, этот «мешающий» фактор (в английском языке он называется «spurious factor», потому что он вызывает «spurious correlation»— ложную корреляцию), и с его помощью составить трехмерную таблицу, то дело сразу проясняется.

Сначала приводим доказательства, что от пола зависит привычка курить, а также членство в спортивном клубе:

ВОПРОС: «Вы курите?» *


Женщины 24% 76%

Мужчины 67% 33%

100% 587

100% 413

Курящие спортсмены

Рассмотрим противоположный случай — интересные результаты, которые в действительности являются всего лишь ложной корреляцией. Такие примеры, к сожалению, в избытке встречаются в материалах опросов и вообще в статистических данных. Возьмем, например, таблицу, которая показывает, что члены спортивных клубов курят чаще, чем нечлеиы145.

ВОПРОС: «Вы курите?»


Члены спортивного клуба

47% 53%


Лица, которые не являются членами спортивного клуба

Да, я курю

Нет, я не курю



41% 59%

100% 118

100% 882

Величина исходной совокупности: 1000 интервью в Западном Берлине, население в возрасте старше 16 лет.

В этом случае фактором, который связан как с курением, так и с членством в спортивном клубе, но который остается скрытым из-за обманчивого построения таблицы, * Репрезентативная выборка населения Западного Берлина в возрасте старше 16 лет.

ВОПРОС: «Являетесь ли Вы членом спортивного клуба?» **

Мужчины Женщины

Да, являюсь 20% 6%

Нет, не являюсь 80% 94%


100% 413

100% 587

** Репрезентативная выборка населения Западного Берлина в возрасте старше 16 лет.

Трехмерная таблица, в которой скомбинированы оба признака «член спортивного клуба» и «пол», помогает снять ложнуюкорреляцию:

ВОПРОС: «Выкурите?» Мужчины

Женщины

Члены НечленыЧлены Нечлены



- спортив-спортив- спортив- спортивного клуба ного клуба ного клуба ного клуба

22% 78%

58% 42%

24% 76%

ОУ70 31%

100% 81

Да, я курю Нет, я не курю

100% 332

100% 550

100% 37

Таким образом, члены спортивного клуба курят не больше, а меньше, чем лица, которые не являются членами спортивных клубов. Но даже в этой таблице картина не вполне ясна из-за влияния скрытого фактора, особенноотноси тельно женщин. Этот фактор — возраст. С одной стороны, более молодые женщины чаще являются членами спортивных клубов; с другой стороны, молодые женщины чаще курят. Чтобы действительно узнать, меньше ли курят женщины, являющиеся членами спортивных клубов, необходимо ввести в наш анализ новый статистический признак— возраст:

ВОПРОС: «Вы курите?»

Женщины


Старше 3 0 лет

Моложе 30 лет

Члены НечленыЧлены Нечлены спортив- спортив- спортив- спортивного клуба ного клуба ного клуба ного клуба

Да, я курю

Нет, я не курю

Но здесь, как это часто бывает в подобных случаях, начинаются трудности, так как число случаев в подгруппах становится слишком маленьким. Опрос включал 1000 интервью, из них 587— с женщинами. 102 женщины были моложе 30 лет. Из них в свою очередь 16 были членами спортивных клубов. Так, анализ, который проводится по этому методу, встречает препятствие при определенных условиях, однако можно применять математические методы для определения мешающих факторов146.

Поиски мешающегофактора.

Иной пример ложной корреляции нам уже встречался в другом разделе этой книги.. При изучении влияния интервьюера было установлено: когда женщин спрашивали о количестве употребляемой ими косметики, то результаты были выше — если в качестве интервьюеров выступали женщины, и ниже — если интервьюерами были мужчины. Анализ показал, что скрытой независимой переменной в этом случае была величина населенного пункта: в сельских местностях, где женщины употребляют меньше косметики, в качестве интервьюеров чаще выступали мужчины. Различия исчезали, как только ответы интервьюерам-женщинам, с одной стороны, и интервьюерам-мужчинам, с другой стороны, сравнивались с учетом величины населенного пункта, то есть когда фактор величины населенного пункта принимался за константу.

Возьмем еще один результат из репрезентативного опроса: женщины, которые пользуются губной помадой, больше интересуются политикой. Действительно, интересный результат. Поборов удивление, можно попытаться найти этому факту объяснения — например, может быть, эти женщины интересуются политикой, чтобы пленять собеседников-мужчин. В принципе нет таких результатов опросов, которые нельзя объяснить — даже те, которые вызваны сбоями в работе вычислительной техники. Это заставляет проверять все имеющиеся объяснения путем тщательного анализа материала, и лишь после проверки всего материала можно предложить возможное объяснение — причем не как особое достижение в исследовании, а с оговоркой, что связь между двумя известными величинами, полученными в результате опроса, осталась неизвестной и до соответствующейпроверкиостаетсяоднимизпредположений.

В примере о женщинах, которые пользуются губной помадой и очень интересуются политикой, речь идет опять о ложной корреляции. Мешающим фактором в этом случае является более высокий уровень школьного образования — это показывает следующая таблица (из репрезентативного опроса населения старше 16 лет, проведенного в ФРГ, включая Западный Берлин, в ноябре 1962 года. Выборочная совокупность: 2102 опрошенных. Алленсбахский архив, опрос № 1071):

НАСКОЛЬКО БОЛЬШЕ ИНТЕРЕС К ПОЛИТИКЕ УЖЕНЩИН, КОТОРЫЕ ПОЛЬЗУЮТСЯ ГУБНОЙ ПОМАДОЙ?

ВОПРОС: «Интересуетесьли Вы политикой?»

Женщины, которые пользуются губной помадой не пользуются

Да 15% 9%

Мало 47% 36%

Совсем нет 38% 55%

100% 100%

N= 181 376



ВОПРОС: «Насколько удовлетворяет Вас работа?»




чувствую-

чувствую-

чувствую-

чувствую-

чувствую-

чувствую-




щие себя

щие себя

щие себя

щие себя

щие себя

щие себя




очень пе-

несколько

в меру

очень

несколько

в меру за-




регружен-

перегру-

загружен-

перегру-

перегру-

гружен




ными

женными

ными*

женными

женными

ными *

Очень



















удов-



















летво-



















рен

72%

81%

83%

36%

58%

70%

Менее



















Удов-



















летво-



















рен

28%

19%

17%

64%

42%

30%




100%

100%

100%

100%

100%

100%

N =

162

528

227

50

391

354

Наряду с другими объяснениями, каждое из которых было в чем-то правильным, большинство исследователей предложило следующее: сотрудники, которые чувствовали себя уставшими, перегруженными, рассматривали это как свидетельство собственной значимости для предприятия, это подкрепляло их чувство собственного достоинства.

Ложную корреляцию — перегруженные работой сотрудники особенно довольны — можно снять следующим образом: руководящие кадры, как правило, более загружены, чем сотрудники с меньшей ответственностью. Но, несмотря на большую загрузку, руководящие кадры, как правило, более довольны своим положением, находят свою работу более интересной и в большей степени отождествляют себя с предприятием. Однако, если учесть различную степень ответственности, то оказывается, что и у руководящих работников удовлетворение от работы снижается, если онипостоянно перегружены.

Лазарсфельд дает следующую простую модель ложной корреляции (t обозначает контрольную переменную, например уровень школьного образования: наличиесреднего школьного образования, отсутствиесреднегошкольного образования.

«Объясняющая корреляция» помогает найти желающих застраховать свою жизнь

Гораздо чаще, чем исчезновение зависимости или даже ее превращение в собственную противоположность после выявления скрытогоопределяющегофактора,случается

Переломным возрастом для оформления страхования жизни является 30 лет. Подготовленный до начала анализа план обработки предусматривал далее распределение по признаку семейного положения. Вот результат:

СТРАХОВАНИЕ ЖИЗНИ У ЗАНЯТОГО НАСЕЛЕНИЯ В ЗАВИСИМОСТИ ОТ СЕМЕЙНОГО ПОЛОЖЕНИЯ

Холостые Женатые

Застраховали свою жизнь 15% 43%

N= 372 703

Не только возраст, но и семейное положение тесно связано с договором о страховании жизни; женатые работающие намного чаще страхуют свою жизнь, чем холостые.

Конечно, это просто могло зависеть от того, что женатые работающие старше, чем холостые. Точно так же, но только в обратном порядке можно было бы сказать: работающие старше 30 лет чаще страхуют свою жизнь, потому что они большей частью женаты.



Какой из двух влияющих факторов имеет большее влияние?

Чтобы выяснить это, принимаем фактор возраста за постоянную величину и вычисляем теперь еще раз наличие страхового договора в связи с семейным положением. Следовательно, мы проверяем двойную корреляцию и снова составляем трехмерную таблицу.

НАЛИЧИЕ ДОГОВОРА О СТРАХОВАНИИ ЖИЗНИ

У РАБОТАЮЩИХ РАЗЛИЧНОГО ВОЗРАСТАВ ЗАВИСИМОСТИ

ОТ СЕМЕЙНОГО ПОЛОЖЕНИЯ

Занятое население в возрасте:









18-19

лет

30 лет и

старше







холостые

женатые

холостые

женатые

Застраховали жизнь

N =


свою

15% 270

33% 100

25% 102

44% 603

После получения первого результата мы хотели дать Обществу страхования жизни совет обращаться с предложениями прежде всего к 30-летним. Теперь мы знаем, что это была бы ошибка: люди моложе 30 лет тоже готовы застраховать свою жизнь, если они завели семью. Женатые работающие в возрасте моложе 30 лет чаще страхуют свою жизнь (33 процента), чем работающие более старшего возраста, которые еще холосты (25 процентов). Наш совет страховому обществу: свои услуги предлагать прежде всего людям, которые только что поженились, и в качестве убедительного аргумента в первую очередь указывать обеспечение семьи. Связь между наличием договора о страховании жизни и возрастом остается, но только в значительно ослабленном виде. Двойная корреляция объяснила нам, почему работающие в возрасте 30 лет и старше чаще страхуют свою жизнь: потому что среди них больше женатых, а женатые хотят обеспечить свою семью.

Зависимость между возрастом и страхованием жизни не доказана как ложная, но наше описание положения вещей стало теперь точнее. Благодаря анализу с применением нескольких переменных (простейший пример многомерного анализа по-английски multivariate analysis) 25 наши знания стали более точными147.



Может ли зависимость выглядеть как реальная и все-таки быть ложной? Схема определения

Почему мы с уверенностью можем утверждать, что полученные выше результаты: сотрудники предприятия X, которые чувствуют себя перегруженными, более довольны своей работой; женщины, которые пользуются губной помадой, больше интересуются политикой — являются ложной корреляцией? В конце концов в высказываниях есть доля истины, и, вероятно, в других исследованиях они могли быть вновь подтверждены.

Мы говорим о ложной корреляции, если нет причинной зависимости.

Цайзель на основании результатов Лазарсфельда разработал для распознавания истинной и ложной корреляции символические формы изображения: симметричная фигура X -<— X -> X для ложной корреляции, асимметричная фигура Х-> X ->- X для истинной корреляции.

Получаем симметричное расположение: большая ответственность ведет, с одной стороны, к горячке, перегрузкам, с другой стороны — к удовлетворению работой. Другое представление причинной связи невозможно, так как зависимость необратима, и изображение: горячка, перегрузки (ведут к)-> большей ответственности — было бы, очевидно, бессмысленным. Если рассматривать факторы с точки зрения временной последовательности, то «большая ответственность»предшествует,«antecedent»148.

Истинную корреляцию между возрастом и страхованием жизни можно представить асимметрично: увеличение возраста (ведет к) ->~ женитьбе (по времени промежуточный фактор); (ведет к) -> страхованию жизни. С точки зрения последовательности во времени женитьбу следует рассматривать не как предшествующую, а как промежуточную (intervening) переменную.

Если мы захотим изобразить корреляцию между употреблением губной помады и интересом к политике (которая была снята введением контрольного фактора «школьное образование»), то в нашем анализе отсутствует еще один фактор.

Более высокий уровень школьного образования ведет, что весьма правдоподобно, к лучшим политическим знаниям и, следовательно, к большему интересу к политике — но как связать это с употреблением губной помады? Только учитывая фактор принадлежности к более высоким социальным слоям населения, который в начале 60-х годов в ФРГ вызывает то, что девушки или женщины из этих слоев, с одной стороны, чаще используют губную помаду, а с другой стороны, чаще получают среднее школьное образование.

В результате получаем:

Использование губной помадыпринадлежность к более высоким социальным слоямсреднее шк. Образ.лучш.полит.знания

Три позиции слева образуют симметричную форму, то есть указывают ложную корреляцию. Асимметричное изображение было бы невозможно, так как обратное воздействие немыслимо: употребление губной помады не может само по себе обусловить принадлежность к высшим социальным слоям населения. Три позиции справа на схеме образуют асимметричную фигуру, то есть являются истинной корреляцией. Связь между употреблением губной помады и лучшими политическими знаниями проходит, таким образом, через ложную и истинную корреляцию. Может быть, это с самого начала придает высказыванию некий абсурдный смысл, нечто похожее на «статистический» анекдот. Однако ложные корреляции, которые можно выявить при помощи одного-единственного фактора, часто выглядят, ксожалению, оченьправдоподобно149.

Третийслучай: условныекорреляции

Наряду с истинными корреляциями, указывающими на причинные связи, и с ложными корреляциями следует, как предлагает Лазарсфельд, различать условные корреляции (conditional correlations). Условная корреляция имеет место в том случае, если при введении контрольной переменной становится очевидным, что наблюдаемая вначале корреляция проявляется с различной степенью в зависимости от контрольного фактора. Это значит: корреляция проявляется в полной мере лишь при наличии еще одного фактора, она не просто обнаруживает себя, для этого необходимо, собственно говоря, совместное действие двух факторов (то есть: в случае наличия X действует Y, но лишь при условии, что действует также и Z).

Сначала, в первом варианте таблицы, видим обычную картину корреляции, когда один фактор — в данном случае пол — принимался за константу. При этом связь между возрастом и трудным или легким засыпанием подтвердилась. Интересная, наводящая на новые размышления картина условной корреляции отчетливо проступила лишь тогда, когда мы в следующей таблице те же данные расположили так, чтобы внутри каждой возрастной группы сравнить результаты для мужчин и женщин. При этом мы увидели, что не все женщины труднее засыпают, чем мужчины, что это зависит от возраста: до 45 лет нет различий, но с увеличением возраста все сильнее проявляется различие.

Как группировать материал для обработки?

В ходе нашей дискуссии вскользь уже было сказано, что при обработке материала не следует ограничиваться распределениями по демографическим признакам — пол, возраст, семейное положение, профессия, величина населенного пункта и т. д. Необходимо проводить обсчет всех данных исследования отдельно или комбинированно по каждому направлению, которое кажется вероятным, и при этом сравнивать их друг с годрум. В наших примерах мы встречали в качестве независимых переменных употребление или неупотребление губной помады, проживание радиослушателей в границах или за пределами районов взимания налогов с радиостанции, рассматривали пример с работниками, которые занимают ответственные посты и чувствуют себя перегруженными, уставшими и т. д. Именно отношения между социологическими и психологическими факторами особенно стоит изучать.

Демографические группы, группы потребителей, группы с различными традициями, различным жизненным опытом, группы с различными убеждениями в области политики, общественной жизни, культуры, религии, группы с различными интересами, с различным уровнем информированности, различной включенностью в исследуемую область, различным семейным положением, различной психологической структурой — это лишь некоторые примеры того, какого рода группировки можно создавать для сравнительного обсчета результатов исследования.

Муж экономный, жена экономная: анализ окружения и другие классификации, которые выходят за пределы отдельного индивида

Вовсе не обязательно ограничиваться группировками, которые относятся к личности или к информации, полученной от самого опрашиваемого. Можно также создавать классификации в зависимости от характеристики окружения, от информации, полученной из окружения индивида, или в зависимости от связей между опрашиваемым и его окружением (двухступенчатый анализ)150. Примеры: по результатам опроса отдельно мужей и жен были составлены группировки — опрошенные из семей, в которых мнения мужа и жены по социально-экономическим проблемам совпадают; опрошенные из семей, в которых жена имеет более широкие планы приобретений и покупок и т. д. (в американской специальной терминологии это называется «Contex-tural Analysis»)151.

Интересным основанием для создания группировок являются те или иные сведения, поведение в хорошую погоду, в плохую погоду. Другой параметр группировок — время: сведения по различным годам, в различные времена года, в различное время суток, перед и после события или воздействия. Можно группировать данные не о личности, а о коллективах: деревни в местностях с плодородной землей, с неплодородной землей, семьи с несколькими кормильцами, семьи с одним кормильцем, предприятия с больничной кассой, предприятия безбольничнойкассыи т. д.

Было бы бесполезно перечислять здесь все возможности классификаций при статистическом анализе152. От правильного выбора основания для группировок и от проницательности проводящего анализ главным образом зависит то, насколько полно и надежно будет исследована проблема и насколько глубоко будут выявлены неожиданные, но существенные зависимости. Но все-таки главное решает анкета. Вопросы, которые не были сформулированы, характеристики опрашиваемого, которые не были записаны интервьюером, совершенно не учитываются при анализе. С другой стороны, создание анкеты сопровождается постоянными размышлениями о том, какие вопросы должны быть обработаны в сопоставлении; какие психологические или социологические сведения об опрашиваемом необходимы, чтобы установить зависимости, понять его образ действия, намерения, мотивы; какие группы следует формировать позднее при анализе; какие индексы следует вычислить; какие вопросы можно использовать для шкалирования, какие категории ответов необходимы, чтобы применить регрессионный анализ, факторный анализ, анализ латентных структур153.

При чтении анкеты трудно предполагать о такого рода соображениях, видны лишь контуры исследовательского инструмента.

Перекрестная оценка:

сплошной контроль материалов опроса

Анализ начинается, как правило, с подсчетов, что ответили представители различных групп населения на те или иные вопросы анкеты. Но это только первый шаг. Производят «перекрестное табулирование»(подготавливают сравнительныетаблицы):

а) Ответов на вопросы анкеты и демографических признаков.Пример: влияет ли погода наВаше здоровье? —в зависимости от пола, возраста, величины населенного пункта,региона и т.д.

б) Демографических признаков с демографическими признаками. Пример: пол в зависимости от возраста, возраст в зависимости от населенного пункта,населенный пункт в зависимости от региона.

в) Ответы на вопросы анкеты с ответами на вопросы анкеты. Пример:чтоотвечают те,чьездоровье сильно зависит от погоды, на вопрос о легком и трудном засыпании?

г) Всех интересующих комбинаций между демографическими признаками и ответами на вопросы анкеты с другими признаками, другими ответами или комбинациями из них.

Корреляционные сортировки такого рода производят, например, в следующих целях:


  1. В целях описания, чтобы можно было в дополнение к общим результатам описать положение вещей по различнымгруппамнаселения.Пример: как думают молодые, какдумаютпожилыелюди?Сколько сельских хозяев слушают дневные передачи по радио? Перед социологом, который работаетс опросами, как перед географом или геологом, частостоят преимущественноописательные задачи154.

Чтобы проверять непротиворечивость (consistency),отсутствие противоречий:насколькопоследовательно или непоследовательно, ясно или сбивчиво выражены установка,способповедения? Пример: согласны ли те, кто высказывается за образование Соединенных Штатов Европы, на въезд рабочих из европейских стран в Западную Германию? Вопросы, ответы на которые позже должны быть сопоставлены для проверки устойчивости точки зрения, располагаются в интервью по возможности на боль том расстоянии или по крайней мере разделены буферными вопросами. В какой мере сторонники какой-либо партии поддерживают определенные политические мероприятия, которые эта партия провозгласила в своей программе? Сколько шоколада съели за последние восемь дней люди, которые, по их собственным словам, следят за своим весом, по сравнению с людьми, которые говорят, что они не заботятся о своем весе? Выяснение непоследовательных позиций респондентов — важная задача анализа. При этом может оказаться, что опрашиваемые, которые чувствуют себя одновременно принадлежащими к нескольким группам (референтные группы — reference groups), придерживающимся противоположных точек зрения, попадают в ситуацию конфликта (cross-pressure) и оказываются скованными в своих действиях155.

Интересный случай, когда частично анализируется устойчивость мнения или поведения в рамках одной группы и частично проверяется также надежность данных, имеет место при раздельном опросе респондентов об одних и тех же обстоятельствах, например рабочих предприятия и их жен156 или мужа и жены — о сбережениях и планируемых в семье приобретениях157.

3. При различного вида шкалировании, чтобы измерять степени различия, интенсивность. Примеры: насколько сильно выражена поддержка идеи демократи ческого государства со стороны различных групп населения? Насколько недоверчивы молодые и старые люди к своемуокружению?

4. Чтобы определить, в какой взаимосвязи с другими данными находится тот или иной результат опроса. Пример: имеется ли взаимосвязь между трудным засыпаниеми возрастом, полом, жилищными условиями, материальным положением, между трудным засыпанием и восприимчивостью к погоде,к шуму и болезням и склонностью к депрессиям? При этом проводящего анализ особенно интересует одинвид зависимости — причиннаязависимость. Мы вернемся к этому вопросу в одном из следующих разделов (с. 297).

Примеры зависимостей, которые мы использовали до сих пор для иллюстрации, дают, конечно, сильно упрощенную картину. Часто речь идет о выявлении не одной-единетвенной зависимости, а о целой системе зависимостей, комплексе, «шаблоне поведения» («pattern»). Обработка методом факторного анализа приобретает огромные размеры, чтобы найти общие корни большого числа отдельных зависимостей.

Особый вид зависимости пытаются установить в эмпирическом материале, выделяя при помощи вопросов-индикаторов и шкал интенсивности и устойчивости группы респондентов, чтобы сначала определить величину и структуру этих групп, а затем изучить их поведение, их взгляды. Пример: ряд вопросов-индикаторов позволяет выделить группы консервативно и прогрессивно настроенных домашних хозяек, а затем изучается их отношение к новому товару158.

5. Для контроля, являются ли найденные зависимости истинными (причинными), или ложными, корреляциями, или они отражают условные зависимости.Иллюстрации таких случаев уже приведены на предыдущих страницах. Чисто практический пример: проверка вывода о том, что студенты богатых американских колледжей часто достигают гораздобольшегоуспеха в жизни,вфинансовом отношении, чем другиестуденты(«The Language ofSocial Research», p.162). 6. Для проверки тезисов, гипотез. До сих пор мы показывали, как при помощи корреляционных расчетов находят взаимосвязи. Теперь обратная процедура: на основе научной теории или психологических исследований или просто опираясь на повседневные наблюдения, общие предположения, деловые соображения, сначала исследователь формирует тезис о существовании определенной взаимосвязи и подвергает это утверждение проверке159

С этой целью проводят исследование, которое дает возможность проверить путем корреляционных вычислений, действительно ли имеет место предполагаемая зависимость, или проверяют материал имеющегося исследования методом так называемого «вторичного анализа».

Чем больше для верификации результатов в исследованиях мотивов применяется согласование данных психологического изучения и репрезентативных опросов, тем чаще корреляционный анализ служит для проверки тезисов. На практике в ходе эмпирического исследования часто приходится отказываться от первоначальной гипотезы и заменять ее новыми, которые затем, насколько это возможно, проверяются на полученном материале.

В научных дискуссиях иногда отстаивается мнение, что эмпирическому исследованию, если оно должно удовлетворять научным критериям, всегда предшествует формулирование гипотез160. П. Кендалл и П. Ф. Лазарсфельд в «Problems of Survey Analysis»161 справедливо отмечают в этой связи: «Социальное исследование еще не шагнуло вперед настолько, чтобы при изучении проблемы выдвигать в достаточном количестве ясные, четкие гипотезы». Цеттер-берг говорит по этому же поводу: «Социологическое исследование обычно изображают так, будто сначала строится теория и затем она подвергается эмпирической проверке. Может быть, это действительно общий принцип прогресса в социологическом познании, однако не следует на этом основании предполагать, будто так осуществляется большинство проектов социологических исследований. В эмпирическом исследовании собранные данные часто используют для пересмотра уже существующей теории». «Лишь опыт, накопленный в результате проб и ошибок, покажет, какой путь изучения закономерностей легче — проверка теоретических гипотез или обобщение отдельных результатов. Это скорее вопрос целесообразности и трудоемкости работы, чем вопрос логики науки»162.

Примером проверки гипотез является исследование о мотивах приобретения телевизоров на юго-западе страны: на основании результатов подобных исследований в Америке и Англии сначала была сформулирована гипотеза о том, что сильным мотивом ириобретения телевизора являются соображения престижа. Проверка гипотезы в ходе статистически репрезентативного опроса (1957 г.) показала, у что соображения престижа не были мотивом покупки телевизора163. Напротив, решающее значение имело желание оставаться по вечерам дома, удержать супруга дома и, может быть, приглашать к себе домой гостей.

Мало обоснованным казалось предположение, что препараты из лецитина используют прежде всего люди, которые находятся в состоянии психологического или биологического кризиса. Результаты сравнения экспериментальных групп опровергли это предположение: потребителями лециитновых препаратов являются в первую очередь люди определенного типа, которые, обладая здоровой психикой, страдают из-за относительно частых изменений настроения (циклотимный тип, пикники, по классификации Кречме-ра)164. Люди этого типа употребляют лецитиновые препараты, очевидно, из побуждения преодолеть кратковременный упадок настроения165.

Пример гипотезы, которая основана на небольшом количестве наблюдений в верхнем социальном слое: люди с плохим зрением часто не носят очков, потому что они тщесла вны или потому, что Они боятся, что в очках ойй кажутся слишком старыми. Эти предположения опровергнуты простыми демографическими расчетами: оказалось, что люди, которые, несмотря на плохое зрение, не носят очков, это в первую очередь мужчины, а не женщины, причем представители более молодых возрастных групп (моложе 40 лет), а не представители возрастных групп старше 40 лет, которые заинтересованы в том, чтобы выглядеть моложе, наконец, что они преимущественно являются представителями слоя рабочих, а не представителями верхних социальных слоев.

Как показал анализ мотивов, простое население считает очки знаком принадлежности к интеллигенции и высоким социальным слоям. Причиной того, что молодые рабочие при плохом зрении не носят очки, в первую очередь является опасение подвергнуться насмешкам со стороны своих коллег и упрекам, что они хотят якобы выделиться166.

Из научно-теоретических соображений возник следующий тезис: предпочитает ли человек получать деньги наличными и хранить их дома или он заводит счет в банке — в значительной степени зависит от возможности образования неиспользуемой суммы денег. Как гласит классическое правило политической экономии, расходы на потребление в группах с более высоким доходом возрастают в меньшей пропорции и возможности накопления излишков тем больше, чем больше доход. Другими словами: использование банковских счетов чаще встречается с увеличением дохода.

Статистический корреляционный анализ выявил несостоятельность этой гипотезы: рабочие почти независимо от величины дохода получают зарплату наличными и хранят деньги дома, в то время как служащие и в еще большей степени чиновники в большинстве случаев переводят свою зарплату на банковский счет или несут ее в банк даже при низких доходах. Следовательно, не величина дохода решает вопрос о том, пользуется ли конкретный человек своими деньгами в наличности или при помощи банковских счетов: другие движущие причины социологического или психологического порядка играют определяющую роль в этом решении.



Пять ключевых понятий: непротиворечивость, надежность, достоверность, аккуратность,точность

Предшествующее изложение задач, решаемых при проведении операций подсчета, дает возможность рассмотреть различные понятия из области исследований методом опросов, например consistency — устойчивость, непротиворечивость. Родственными ключевыми понятиями в этой связи можно назвать принятые в Англии и США термины: reliability — надежность, особенно надежность инструмента исследования, возможность при каждом применении этого инструмента получать аналогичные результаты; validity — достоверность, совпадение с действительностью; precision — точность, аккуратность выполнения работы персоналом, участвующим в исследовании; accuracy — статистическая точность результата, величина статистического отклонения.

Для разъяснения этих понятий, очевидно, следует указать, каким образом можно улучшить названные здесь аспекты качества информации.


  1. Противоречивость, неустойчивость {inconsistency): этоотноситсяк характеристикеопрашиваемого(установка,поведение) и обусловлено не техникой сбора информацииили качествами интервьюера, а является фрагментомдействительности, который должен быть отчетливо выявленв исследовании.

  2. Недостаточная надежность {reliability):

а) Если это относится к ответам опрашиваемого, то обу-слоЕлено его социальным статусом и психологическимихарактеристиками,но может быть взначительной мереулучшено путем методического совершенствования анкеты.Противоречивость и ненадежность в ответах опрашиваемогоследует оценивать по-разному:противоречивость — этофрагмент действительности, ненадежность означает невысокую стабильность высказываний о действительности.

б) Если это относится к инструментарию, к методике,то это можно преодолеть в ходе проверки объективностивопросов или предлагаемых рисунков: имеют ли они однои то же значение при различных обстоятельствах для раз-ных[ категорий опрашиваемых?

3. Недостаточнаядостоверность {validity):причина заключается в самой анкете и не зависит от опрашиваемого или интервьюера. Достоверность тесно связана с предметом исследования. Щекотливые темы беседы ставят достоверность под угрозу. Повышение достоверности достигается путем совершенствования анкеты и тщательной отработкой ее проекта.


  1. Недостаточнаяточностьинструмента(precision):возможные ошибки связаны с техническим оформлениеманкеты, они могут быть допущены интервьюером или сотрудниками, которые кодируют и перфорируют ответы.Повышениеточности можетбыть достигнутопутемболее целесообразного оформления анкеты, более удачноговыбора интервьюеров и повышения дисциплинированностисотрудников приобработкематериала.

  2. Статистическая точность (accuracy):

зависит от величины и качества выборки и может быть повышена, например, за счет увеличения числа опрашиваемых.

«Солнце всходит потому, чтокузнечики стрекочут»

Э. Роупер, один из первых и известнейших американских специалистов в области социальных исследований, поучал иногда молодых сотрудников своего института: «Ага, вы думаете — солнце всходит потому, что кузнечики стрекочут?» Эта фраза возникла в связи с двумя фактами, которые в пылу анализа легко забываются: не каждая корреляция, которая встречается в материале, означает причинную зависимость, и если действительно имеет место причинная зависимость, то необходимо решить вопрос о ее направленности: что является причиной, а что следствием, может быть, речь идет о взаимном влиянии? Аналитик пытается «объяснить» каждую зависимость, которую он видит, потому что, только когда он нашел объяснение, он может



  • на основе полученных данных сформулировать правило;

  • опираясь на правило, делать предположения;

  • опираясь на правило, показать, что можно сделать,чтобы повлиять на выявленные обстоятельства.

Одним из важнейших инструментов для нахождения и объяснения зависимостей или для проверки реальности ожидаемых зависимостей является описанный в предшествующих разделах корреляционный анализ. Характерная модель, представленная в корреляции двух вопросов из опроса, проведенного в 1956 году, выглядит следующим образом167:

ВОПРОС АНКЕТЫ: «Представьте себе: один человек сегодня случайно кладет куда-то 20 марок и забывает о них; через 10 лет, то есть в 1966 году, он находит их снова. Как вы думаете: сможет ли он купить в 1966 г. на 20 марок столько же, сколько сейчас, больше или меньше?» (В СЛУЧАЕ ОТВЕТА «Не знаю» следует вопрос: «Что Вы можете предположить?») Результат:

На 20 марок в 1966 году

— можно будет купить меньше 55%

а именно: гораздоменьше 30%

немного меньше 16%

трудно сказать,насколькоменьше 9%



Достарыңызбен бөлісу:
1   ...   8   9   10   11   12   13   14   15   ...   18




©dereksiz.org 2024
әкімшілігінің қараңыз

    Басты бет