Программа сбора данных. Генеральная и выборочная совокупности. Репрезентативность данных.
В обобщенном виде программа сбора — это перечень учетных признаков наблюдения, которые позволяют достаточно полно характеризовать каждую единицу наблюдения и факторы изучаемых явлений. Конкретное воплощение этого перечня — набор вопросов, содержащихся в формуляре статистического наблюдения. Таким формуляром может быть анкета опроса, регистрационная карта наблюдения и т. п. Правильно разработанный формуляр статистического наблюдения является ключом всего исследования. В правильно составленном учетном документе есть все признаки, существенные для данного исследования. В нем не должно быть громоздких, малосодержательных, не информативных признаков, затрудняющих регистрацию и обработку материала и мало влияющих на конечные результаты исследования. Учетный документ должен предусматривать удобство работы регистратора, что уменьшает число ошибок регистрации. Удобство обработки на ЭВМ гарантирует малую вероятность ошибок ввода данных в компьютер, возможность углубленной и быстрой обработки данных. Для снижения числа ошибок и повышения скорости регистрации наблюдений используются специальные аппаратные средства автоматизации (автоматические регистраторы физиологических параметров, сканеры ввода анкетных данных и т. п.).
В целом, по способу наблюдения программой сбора могут предусматриваться следующие варианты получения исходных данных: непосредственное наблюдение (регистрация), выкопировка данных из отчетно-учетных документов, опрос.
Непосредственное наблюдение предполагает непосредственную регистрацию единиц наблюдения и их характеристик в натуре, либо измерение параметров с помощью технических средств (измерение жизненной емкости легких, форсированного выдоха, параметров кардиограмм и т. п.).
Выкопировка данных из отчетно-учетной документации предполагает использование в виде источника информации различных документов (история болезни, история развития ребенка, больничный лист). Этот способ получения информации требует предварительной экспертной оценки наличия документации в полном объеме, правильности заполнения и полноты записей в документах. При этом имеется в виду, что, несмотря на декларируемую полную регистрацию данных, информация из официальных источников (заболеваемость, численность и состав населения) нередко имеет серьезные дефекты, появление которых связано с недоброкачественной работой регистраторов, местными условиями, традициями, экономической ситуацией и т. п.
Опрос обеспечивает получение информации со слов опрашиваемого (респондента) методом интервью или заочным путем (почтовые, телефонные, прессовые опросы). Регистрация такой информации производится на специальные опросные листы или анкеты. Для качественного проведения опроса рекомендуется привлекать специалистов по разработке опросных листов. Выбор метода опроса диктуется организационными и финансовыми возможностями. При этом любому из существующих методов присущи определенные недостатки. Например: существенным недостатком телефонного опроса является неразвитость в ряде регионов телефонных сетей, серьезно затрудняющая формирование представительной выборки. Опросы первого встречного, интерактивные телевизионные опросы - методы, которые решают в основном журналистские задачи. К методам получения достоверной информации такие опросы отнесены быть не могут.
По времени наблюдение может быть текущим или единовременным.
-
Текущее (непрерывное) наблюдение предусматривает регистрацию данных по мере их возникновения за какой-либо промежуток времени. Данные при этом виде наблюдения накапливаются во времени. Например: данные о заболеваемости по обращаемости, инфекционной заболеваемости, смертности, регистрация актов гражданского состояния ЗАГСами за год и т. д. Отдельные результаты, полученные таким путем, можно суммировать (помесячную заболеваемость можно суммировать по кварталам, за год).
-
Единовременное (прерывное) наблюдение предусматривает регистрацию данных в один момент времени, или по состоянию на один момент времени, так называемый критический момент наблюдения. Таким образом, проводится сбор данных при переписях населения.
На определенный момент времени (на конец года) учитывается численность населения, численность медицинского персонала, количество учреждений медицинской помощи. Заболеваемость по данным профилактических осмотров (патологическая пораженность) так же регистрируется на определенный момент времени. Особенность данных полученных таким путем - их нельзя просто суммировать. Например: численность населения района в 2010 году составила 2,5 млн человек, в 2011 году - 2,6 млн человек. За суммарный период 2010-2011 годов можно рассчитать только среднегодовую численность населения. Если единовременное наблюдение регулярно повторяется (ежегодный учет численности населения, предприятий и т. п.), то такое наблюдение называется периодическим.
По охвату статистической совокупности исследование может быть сплошное или не сплошное. Эта методическая особенность сбора данных определяет весь дальнейший ход и методику статистического анализа.
При сплошном статистическом исследовании группа наблюдения формируется путем полного охвата всех единиц изучаемого явления. Множество всех единиц наблюдения, охватываемых таким сплошным наблюдением, называется генеральной совокупностью. На практике сплошное исследование проводится крайне редко, поскольку осуществить такое наблюдение организационно очень трудно или физически невозможно из-за больших размеров генеральной совокупности или из-за отсутствия определенных границ этой совокупности. В ряде ситуаций, даже если генеральная совокупность ограничена в своих размерах, исследование объекта приводит к его уничтожению (анализ качества промышленных партий вакцин, сывороток, медикаментов). В этой ситуации проведение сплошных исследований также невозможно. К тому же, сплошные исследования во много раз дороже несплошных. Существенный недостаток сплошных исследований - большие затраты времени на сбор данных, что приводит к затягиванию исследований на продолжительное время. Кроме того, формирование в ходе таких наблюдений больших массивов данных вызывает затруднения при обработке собранных материалов. Такие наблюдения используют, как правило, только для решения общегосударственных задач переписи населения, сбора информации об инфекционной заболеваемости и некоторых других задач.
К методам не сплошного наблюдения относятся монографический метод, метод основного массива и собственно выборочный метод.
Монографический метод применяется для подробного описания объекта, имеющего какие-либо яркие особенности.
Например: медико-социальное обследование национальностей Крайнего Севера или социально-гигиеническое описание промышленного центра. Выводы, которые получаются путем таких обследований, относятся либо только к конкретному объекту исследования, либо могут быть распространены на весьма ограниченную группу аналогичных объектов.
Метод основного массива предусматривает обследование контингентов, которые могут быть сосредоточены на конкретном объекте. Например: изучение госпитализированной заболеваемости в стационаре. Данные о структуре заболеваний, тяжести течения и их прогнозе, полученные в этом исследовании, могут иметь значение только для решения частных вопросов. Судить о распространенности патологии за пределами такого стационара по этим данным нельзя.
Собственно выборочное исследование охватывает выборочную совокупность или просто выборку из генеральной совокупности. Такое исследование имеет ряд весьма существенных преимуществ перед сплошным наблюдением. Во-первых, оно дает значительную экономию средств и требует существенно меньше времени, чем сплошное. Во-вторых, при выборочном исследовании может быть достигнута большая глубина и детальность изучения вопроса. В-третьих, при меньшем числе наблюдений уменьшаются вероятности систематических ошибок наблюдения, возникающих, когда объектам приписывают искаженные данные.
Конечной целью изучения выборочной совокупности всегда является получение информации о генеральной совокупности. Для этого выборочное исследование должно удовлетворять определенным условиям. Одно из главных условий - представительность выборки.
Каждое выборочное исследование несет с собой некоторую погрешность, вытекающую из самого факта выборочности, когда результаты, полученные на выборке, переносят на всю генеральную совокупность, т. е. по части судят о целом.
В этой связи следует отметить, что в настоящее время действует Федеральный закон, касающийся в связи с проведением опросов общественного мнения референдумов и т. п. ответственности за информацию, получаемую путем опросов. Этот закон гласит: «При публикации результатов опросов средства массовой информации обязаны указывать организацию, проводившую опрос, время его проведения, число опрошенных (выборку), метод сбора информации, точную формулировку вопроса, статистическую оценку возможной погрешности». В статистике подобного рода погрешность называется ошибкой репрезентативности (представительности).
Выделяют репрезентативность количественную и качественную (структурную). Количественная репрезентативность определяется числом наблюдений, гарантирующим получение статистически достоверных данных. В общем, здесь действует основной постулат закона больших чисел - «чем больше наблюдений - тем результаты достоверней» или «чем больше число наблюдений, тем больше значения характеристик выборки приближаются к соответствующим характеристикам генеральной совокупности».
Это обстоятельство существенно для случайных ошибок, которые имеют некоторые общие для данной совокупности свойства. Число положительных случайных ошибок почти всегда равно числу отрицательных. Чем больше проведено наблюдений, тем ближе к нулю разность между теми и другими случайными ошибками. Систематические ошибки наблюдения, которые могут возникать как при сборе, так и при сводке информации, искажают результат наблюдения в одном направлении. Они могут возникать, например, в результате желания опрашиваемых или исследователей представить все в лучшем свете, чем есть на самом деле. Ошибки такого рода не могут быть устранены увеличением объема выборки.
Величина ошибки репрезентативности зависит также и от изменчивости изучаемого признака. Если бы все единицы совокупности были одинаковы, то результаты, полученные на одной единице наблюдения, можно было бы распространить на все остальные. Однако реально всегда имеется какой-то разброс значений изучаемых признаков. И чем он больше, тем больше статистическая ошибка. Именно поэтому при анализе статистических данных необходимы характеристики изменчивости (разброса) значений, составляющих ряды распределений.
Качественная репрезентативность - обозначает структурное соответствие выборочной и генеральной совокупностей. Например: если в составе генеральной совокупности 50% - лица мужского пола, то и в выборочной группе их должно быть 50%.
В силу закона больших чисел выборка будет качественно репрезентативной только в том случае, если ее осуществить случайно. Проводить отбор случайно, значит обеспечить выполнение условия, что каждый объект выборки отбирается случайно из генеральной совокупности. При соблюдении этого условия можно определенно утверждать, что объекты выборки правильно представляют генеральную совокупность.
Случайность, гарантирующая качественную (структурную) репрезентативность статистических исследований, достигается выполнением ряда условий формирования выборочных групп (совокупностей):
-
Каждый член генеральной совокупности должен иметь равную вероятность попасть в выборку. Например: если отбор историй болезней проводить по заглавным буквам фамилий больных, то вероятность попасть в выборку для разных фамилий будет разная, т. к. частота встречаемости различных букв алфавита в началах фамилий разная.
-
Отбор единиц наблюдения из генеральной совокупности необходимо проводить независимо от изучаемого признака. Если отбор проводится целенаправленно, то и при этом необходимо соблюдать условия независимости распределения изучаемого признака.
-
Например, при изучении взаимосвязи курения и здоровья человека можно поступить двояко:
-
целенаправленно сформировать группы обследуемых в зависимости от их отношения к курению (не курят, курят мало, курят много и т. п.) В этом случае независимо должны формироваться показатели здоровья в этих группах;
-
целенаправленно сформировать группы здоровья. Например: здоровые, редко болеющие острыми заболеваниями, хронические больные и т. п. В этом случае независимо должны формироваться показатели отношения к курению в этих группах. Например: не курят, курят мало, много и т. п.
В первом случае доказательством связи курения и здоровья будут разные уровни показателей здоровья в различных по отношению к курению группах. Во втором - различная распространенность курения в различных группах здоровья.
-
Отбор должен проводиться из однородных групп. Например: показатели физического развития мужчин и женщин существенно отличаются друг от друга, поэтому для оценки физического развития необходимо брать либо однополые группы, либо группы с одинаковым соотношением полов.
Соблюдение условий, гарантирующих максимальную близость выборочной и генеральной совокупностей, обеспечивается специальными способами отбора. В зависимости от способа формирования различают следующие выборки:
-
Выборки, не требующие разделения генеральной совокупности на части (собственно случайная повторная или бесповторная выборка).
-
Выборки, требующие разбиения генеральной совокупности на части (механическая, типическая или типологическая выборки, когортная, парно-сопряженная выборки).
Собственно случайная выборка формируется случайным отбором - наудачу. В основе случайного отбора - перемешивание. Например: выбор шара в спортлото после перемешивания всех шаров, выбор выигрышных номеров лотереи, случайный выбор карточек больных для исследования и т. п. Иногда используют случайные числа, получаемые из таблиц случайных чисел или с помощью генераторов случайных чисел. Согласно этим числам из заранее пронумерованного массива генеральной совокупности выбираются единицы наблюдения с номерами, соответствующими выпавшим случайным числам.
При составлении случайной выборки после того, как объект отобран, и все необходимые данные о нем зарегистрированы, можно поступать двояко: объект можно вернуть или не вернуть в генеральную совокупность. В соответствии с этим выборку называют повторной (объект возвращается в генеральную совокупность) или бесповторной (объект не возвращается в генеральную совокупность). Отбор с возвращением (повторный отбор) гарантирует большую независимость выборки, однако этот вид отбора труден в организационном плане. Вместе с тем, разность погрешностей бесповторного и повторного отбора тем меньше, чем больше объем генеральной совокупности. В практике медико-биологических и гигиенических исследований, как правило, объем генеральной совокупности неизвестен или гипотетически достаточно велик. В предельном случае генеральная совокупность бесконечно велика. Например: при оценке профилактических свойств фармацевтического препарата исследователь, как правило, не знает точно числа людей, которые в объективной реальности могут его принимать. Поэтому в большинстве статистических исследований разница между повторной и бесповторной выборками практически отсутствует и априорно принимается условие, что выборка повторная.
Механическая выборка - выборка, когда из обследуемой совокупности единицы наблюдения отбираются механически. Например: отбор каждого пятого или каждого десятого рабочего по карточкам отдела кадров предприятия или по амбулаторным картам поликлиники МСЧ. При этом надо помнить, что обращаемость в поликлинику взрослого населения может зависеть от состояния здоровья (здоровые почти не обращаются). В результате чего, в поликлинике амбулаторные карты имеются, как правило, только на больных. Кроме того, большая часть амбулаторных карт может находиться на руках у пациентов.
Типическая, типологическая или районированная выборка предполагает разбивку генеральной совокупности на ряд качественно однородных групп. Например: при изучении заболеваемости студентов вуза для углубленного обследования на каждом курсе выбираются типичные по своему составу студенческие группы. Часто этот способ отбора комбинируется с другими способами. Например: территория города делится в зависимости от степени загрязнения на типичные районы, в этих районах путем случайного отбора формируются группы наблюдения.
Когортный отбор относится к целенаправленным отборам, при этом способе из генеральной совокупности отбираются лица, объединенные моментом появления какого-либо признака, играющего существенную роль в исследовании (год рождения, начало болезни и т. п.).
Достарыңызбен бөлісу: |