__________________________________________________________
А.И. Бахтин, Н.М. Низамутдинов, Н.М. Хасанова, Е.М. Нуриева
ФАКТОРНЫЙ АНАЛИЗ В ГЕОЛОГИИ
Учебное пособие к лабораторным занятиям
Казань
2007
Утверждено учебно-методической комиссией геологического факультета
Казанского государственного университета
Протокол № 2 от 5.02.2007 г.
Научный редактор
Доктор геолого-минералогических наук,
профессор Д.К. Нургалиев
А.И. Бахтин, Н.М. Низамутдинов, Н.М. Хасанова, Е.М. Нуриева
Б30 Факторный анализ в геологии: Учебное пособие. – Казань: Казанский государственный университет, 2007. – 32 с.
В пособии излагаются общие представления о факторном анализе, его цели, задачи, возможности. Рассматриваются методы факторного анализа. Разбирается процедура проведения факторного анализа двух геологических объектов и дается геологическая интерпретация наиболее значимых выявленных факторов. Рекомендуется студентам геологического факультета КГУ специальностей «Геология», «Геофизика», «Геология и геохимия горючих ископаемых», «Гидрогеология и инженерная геология».
Бахтин А.И., Низамутдинов Н.М., Хасанова Н.М., Нуриева Е.М., 2007
Казанский государственный университет, 2007
СОДЕРЖАНИЕ
Введение
1.Общие представления о факторном анализе
2. Метод главных компонент
3. Примеры факторного анализа
Заключение
Литература
Введение
Геологические объекты, как правило, являются очень сложными, многообразными, так как их формирование обычно обусловлено действием множества разнообразных факторов (причин). Поэтому для более полной характеристики геологических объектов их обычно характеризуют набором разнообразных признаков (параметров), а результаты измерений совокупности этих признаков представляют в виде многомерных случайных величин. При исследовании таких многопараметрических объектов всегда встает вопрос: нельзя ли отбросить часть параметров или заменить их меньшим числом каких-либо функций от них, сохранив при этом всю информацию? Методы факторного анализа позволяют это сделать. Факторный анализ является одним из разделов современной многомерной статистики и широко используется в различных областях исследовательской деятельности. Он глубоко проник и в геологию. В исследовании сложных геологических объектов факторный анализ позволяет глубже понять сущность геологического объекта, его генетические особенности, что является чрезвычайно важным при разработке стратегии поисков и разведки месторождений полезных ископаемых.
1. Общие представления о факторном анализе
Факторный анализ является одним из разделов многомерного статистического анализа. Он основан на многомерном нормальном распределении, то есть каждый из используемых признаков изучаемого объекта должен иметь нормальный закон распределения. Факторный анализ исследует внутреннюю структуру ковариационной и корреляционной матриц системы признаков изучаемого объекта.
Пусть в изучаемом геологическом объекте отобрано проб. В каждой из них измерены значения признаков и получены значения случайных многомерных нормально распределенных величин:
где
Ясно, что эти значения случайных многомерных величин обусловлены какими-то объективными причинами, которые будем называть факторами. Предполагается, что число этих факторов всегда меньше, чем число измеряемых параметров (признаков) изучаемого объекта. Эти факторы являются скрытыми, их нельзя непосредственно измерить и поэтому они представляются гипотетическими. Однако имеются методы их выявления, которые и составляют сущность факторного анализа.
В факторном анализе решаются следующие задачи:
-
Определить количество действующих факторов и указать их относительную интенсивность
-
Выявить признаковую структуру факторов, т.е. показать, какими признаками геологического объекта обусловлено действие того или иного фактора и в какой относительной мере
-
Выявить факторную структуру изучаемых признаков геологического объекта, т.е. показать долю влияния каждого из факторов на значение того или иного признака этого объекта
-
Воссоздать в факторном координатном пространстве облик изучаемого геологического объекта, используя вычисляемые значения факторов для каждого наблюдения исходной выборочной совокупности.
Пусть в каждой пробе из геологического объекта мы измерили четыре характеристики, которые обусловлены действием двух факторов и . Фактор действует на все четыре характеристики объекта, а фактор действует лишь на два признака и .
Рисунок 1
Значит значения признаков и определяются только фактором , а признаки и определяются совокупным действием фактором и . Но мы всего этого пока не знаем и перед нами стоит задача оценить интенсивность влияния факторов и на признаки и выделить в значениях те части, которые обусловлены действием каждого из факторов и в отдельности.
Для решения этой задачи предполагают, что линейно зависят от . Для нашего случая имеем
где
- коэффициенты, называемые факторными нагрузками.
Существует две модели факторного анализа:
1) метод главных компонент (МГК), в котором наблюдаемые значения каждого из признаков представляются в виде линейных комбинаций факторных нагрузок и факторов , где , причем
где - число факторов
2) модель собственного факторного анализа (ФА), когда наблюдаемые значения определяются не только факторами, но и действием локальных случайных причин
2. Метод главных компонент (МГК)
Метод будем рассматривать на указанном выше примере, когда геологический объект охарактеризован – пробами, в каждой из которых определено значение четырех признаков. В четырехмерном графическом пространстве с осями координат нашему объекту будет отвечать облако из – точек. Для упрощения понимания и для наглядности рассечем это четырехмерное пространство плоскостью, в которой находятся координатные оси, отвечающие признакам и . Тогда в сечении мы увидим облако точек которое в условиях взаимосвязи признаков и друг с другом представляет собой эллипс рассеяния. В факторном анализе исходные значения признаков выборочной совокупности центрируются и нормируются с помощью преобразования
где - исходное значение j-го признака в t-ой пробе;
-среднее значение j-ого признака;
–стандартное отклонение j-ого признака.
В этом случае центр этого эллипса рассеяния будет находиться в точке начала координат, как показано на рисунке 2.
Вследствие нормировки главная ось эллипса ориентируется к оси Х1 либо под углом 45 при , либо под углом 135 при . Форма этого эллипса (сжатость – вытянутость) будет определяться величиной коэффициента корреляции с , т.е. , Чем больше , тем более вытянут эллипс и при он превращается в прямую линию, а при - в круг. Проведем оси эллипса и . Ясно, что по мере увеличения происходит уменьшение степени разброса точек наблюдений вдоль одной оси эллипса (на рисунке – ось ) и увеличение разброса вдоль другой оси эллипса (на рисунке – ось ).
Рисунок 2
Если теперь перейдем от исходной координатной системы , к новой , , оси которой ориентированы вдоль осей эллипса рассеяния, то легко видеть, что в новой системе координат значения переменной вдоль оси будут иметь меньшую дисперсию, чем в исходной системе вдоль оси , а значения этой переменной вдоль оси , наоборот, будут иметь большую дисперсию, чем в исходной системе вдоль оси . Поэтому переменная несет в себе больше информации о выборке, чем . При этом чем сильнее связаны между собой признаки и , тем большим становится удельный вес одной из новых переменных, а именно той, которая ориентируется вдоль главной оси эллипса рассеяния. Следовательно, в случае многомерного пространства появляется возможность ранжирования переменных (признаков) по их дисперсии в соответствии с их вкладом (значимостью) в общую характеристику изучаемого геологического объекта, т.е. по уменьшению дисперсии значений признаков вдоль новых координатных осей .
Трудно представить, как выглядит в многомерном пространстве облако точек выборочной многомерной совокупности. По аналогии с рассмотренным выше двумерным случаем можно предполагать, что оно представляет собой эллипсоид с несколькими разновеликими ортогональными осями. Поэтому в условиях взаимозависимости признаков для более компактного представления информации переходят к новой ортогональной системе координат (ориентированной по главным осям этого эллипсоида), которой отвечают новые переменные ( и ), концентрирующие в себе основную информацию об исходной выборке (т.е. ее главные компоненты) и снижающие размерность исходного признакового пространства (). Эта процедура перехода к новой ортогональной системе координат () и составляет сущность метода главных компонент факторного анализа (МГК).
Указанный переход не затрагивает геометрической структуры взаимного расположения точек наблюдений. Характер их распределения сохраняется. Поэтому суммарная дисперсия остается прежней, т.е.
или в общем, виде (4)
Факторные нагрузки в уравнениях (1)-(3) представляют собой коэффициенты корреляции между исходными и новыми переменными . Выше отмечалось, что в факторном анализе очень важно оценить величину дисперсии признаков случайной многомерной величины в выборочной совокупности, характеризующей геологический объект.
Дисперсия случайных многомерных величин характеризуется ковариационной матрицей , где – номера признаков ( ). Элементы этой матрицы могут быть представлены как . Ясно, что при величина будет представлять дисперсию i-го (или j-го) признака, т.к. при этом . Поэтому .
При нормировке ковариационная матрица превращается в корреляционную матрицу , т.к. (т.е. дисперсии всех признаков становятся равными единице). Поэтому в факторном анализе вычисляется корреляционная матрица, содержащая линейные коэффициенты парной корреляции i–ого признака с j–тым признаком ( ).
По главной диагонали этой корреляционной матрицы располагаются единицы и по аналогии с ковариационной матрицей они представляют собой дисперсии используемых -признаков, но в отличие от последней, вследствие нормировки, эти дисперсии становятся равными 1. Суммарная дисперсия всей системы -признаков в выборочной совокупности объема равна сумме этих единиц, т.е. равна следу корреляционной матрицы .
В факторном анализе используется процедура преобразования корреляционной матрицы с помощью, которой все недиагональные члены корреляционной матрицы превращаются в нуль, а диагональные её члены изменяют свои значения. Превращение в нуль недиагональных членов означает, что признаки становятся независимыми друг от друга ( при ). Но и в этих условиях суммарная дисперсия всей системы -признаков в выборочной совокупности остается прежней. Однако её значение перераспределяется по -признакам неравномерно. Процедура нахождения значений этих дисперсий представляет собой нахождение собственных значений корреляционной матрицы для каждого из -признаков. Сумма этих собственных значений равна следу корреляционной матрицы, т.е. . Эти собственные значения и есть величины дисперсии признаков в условиях, если бы признаки были бы независимыми друг от друга.
В методе главных компонент сначала по исходным данным рассчитывается корреляционная матрица. Затем производят её ортогональное преобразование и посредством этого находят факторные нагрузки для всех -признаков и -факторов (матрицу факторных нагрузок), собственные значения и определяют веса факторов. Вес факторов или отражает долю в общей дисперсии вносимую данным фактором.
Факторные нагрузки изменяются от –1 до +1 и являются аналогом коэффициента корреляции. В матрице факторных нагрузок необходимо выделить значимые и незначимые нагрузки с помощью критерия Стьюдента .
Сумма квадратов нагрузок j-го фактора во всех -признаках равна собственному значению данного фактора. И это используется для характеристики признаковой структуры факторов, которую можно выражать в процентах и она помогает познать природу факторов , -вклад i-ой переменной в % в формировании (нагрузки i-ой переменной на j-ый фактор).
Сумма квадратов факторных нагрузок всех факторов во всех признаках равна суммарной дисперсии (т.е. следу или порядку корреляционной матрицы, или сумме её собственных значений) .
Сумма квадратов нагрузок i–ого признака на полный набор факторов равна дисперсии данного признака, т.е. единице, если исходные данные были нормированы: . Это используется для расшифровки факторной структуры каждого из признаков, т.е. чтобы показывать долю вклада каждого из факторов в формировании значений того или иного признака. Эту долю можно выражать в процентах .
В общем виде факторная структура i–го признака представляется в форме, в которую включаются лишь значимые нагрузки. Признаковая структура каждого из факторов в общем виде представляется как , в которую включаются лишь значимые нагрузки. Используя матрицу факторных нагрузок можно вычислить значения всех факторов для каждого наблюдения исходной выборочной совокупности по формуле:
,
где – значение j-ого фактора у t-ого наблюдения, -нормированное (и центрированное) значение i–ого признака у t-ого наблюдения исходной выборки; –факторная нагрузка, –собственное значение, отвечающее фактору j. Эти вычисленные значения широко используются для графического представления результатов факторного анализа.
3. Примеры факторного анализа
Пример 1.
В одном из районов развития гранитоидного магматизма было отобрано 70 проб из грейзенизированных гранитов. В пробах было определено содержание пяти компонент (признаков): SiO2, Na2O, K2O, Li, Be.
Результат анализа каждой пробы представляет собой случайную пятикомпонентную величину , где t - номер пробы; X1, X2, X3, X4, X5 – содержания компонентов SiO2, Na2O, K2O, Li, Be соответственно.
Необходимо произвести факторный анализ с целью выяснения геохимических и генетических особенностей объекта.
Решение
На первом шаге факторного анализа методом главных компонент по выборочной совокупности были вычислены: корреляционная матрица системы используемых признаков (табл.1), её собственные значения, факторные нагрузки и веса факторов (табл.2).
Достарыңызбен бөлісу: |