Цифровая обработка сигналов



Дата27.06.2016
өлшемі360.5 Kb.
#160480
түріРеферат




ЦИФРОВАЯ ОБРАБОТКА СИГНАЛОВ

Тема 14. АППРОКСИМАЦИЯ СИГНАЛОВ И ФУНКЦИЙ

На фабрике будущего будут заняты только двое служащих: человек и собака. Человек будет нужен для того, чтобы кормить собаку. Собака будет нужна для того, чтобы не позволять человеку прикасаться к оборудованию.

Уоррен Беннис, американский экономист.

Блестящий пример линейной экстраполяции по двум узловым точкам – прошлому и настоящему. Потребуется конкретизация – повышайте степень аппроксимации введением новых точек: что производит фабрика, есть ли на ней профсоюз, чем кормят собаку. Появление председателя профсоюза гарантировано.

Станислав Игумнов, Уральский геофизик.



Содержание

Введение.

1. Приближение сигналов рядами Тейлора.

2. Интерполяция и экстраполяция сигналов. Полиномиальная интерполяция. Кривые Безье.

3. Сплайновая интерполяция.

4. Спектральный метод интерполяции. Спектр дискретного сигнала. Интерполяционный ряд Котельникова-Шеннона.

5. Децимация и интерполяция цифровых сигналов. Децимация с целым шагом. Интерполяция с целым шагом. Преобразование частоты дискретизации с нецелым шагом.

6. Методика аппроксимации эмпирических данных. Мера приближения. Аппроксимирующая функция. Порядок модели. Оценка качества приближения.



ВВЕДЕНИЕ

Математика часто оперирует с математическими функциями решения дифференциальных уравнений и интегралов, которые не имеют аналитических выражений и представляются табличными числовыми значениями yi для дискретных значений независимых переменных xi вместо аналитических выражений в виде y=s(x). Это означает, что любому значению x из области определения поставлено в соответствии определенное числовое значение y. Аналогичными таблицами {yi, xi} могут представляться и экспериментальные данные, для которых неизвестна явная связь между y и x или эта связь только подлежит выяснению. Точки, в которых определены числовые значения функций или данных, называются узловыми.

Однако на практике могут понадобиться значения данных величин совсем в других точках, отличных от узловых, или с другим шагом дискретизации аргументов. Возникающая задача вычисления значений функции в промежутках между узами называется задачей интерполяции, за пределами семейства узловых точек вперед или назад по переменным – задачей экстраполяции или прогнозирования.

Даже при известных зависимостях y=s(x) формулы этих зависимостей, детально и точно описывающие определенные физические объекты и процессы, могут быть очень сложными и мало пригодными для практического использования как при математическом анализе физических данных, так и в прикладных задачах, особенно при расчетах ожидаемых результатов измерений и при математическом моделировании физических процессов. Кроме того, практическая регистрация физических данных выполняется, как правило, с определенной погрешностью или с определенным уровнем шумов, которые по своим значениям могут быть выше теоретической погрешности прогнозирования сигналов при расчетах по сложным, хотя и очень точным формулам. Не имеет смысла и проектирование систем обработки и анализа сигналов по высокоточным формулам, если повышение точности расчетов не дает эффекта в повышении точности обработки данных. Во всех этих условиях возникает задача аппроксимации. Аппроксимация, это представление сложных функций s(x) или дискретных выборок из этих функций s(xi) простыми и удобными для практического использования функциями аппроксимации f(x) таким образом, чтобы отклонение f(x) от s(x) в области ее задания было наименьшим по определенному критерию приближения.

Если приближение строиться на заданном множестве точек {xi}, то аппроксимация называется точечной. К ней относятся интерполирование, среднеквадратичное приближение и др. При построении приближения на непрерывном множестве точек, например на отрезке [a,b], аппроксимация называется непрерывной или интегральной.

Сглаживание статистических данных или аппроксимация данных с учетом их статистических параметров относится к задачам регрессии. Как правило, при регрессионном анализе усреднение данных производится методом наименьших квадратов (МНК).

Классические математические методы аппроксимации, интерполяции, экстраполяции и регрессии функций имеют многовековую историю. В рамках настоящего курса мы не будем углубляться в строгую математическую теорию этих операций. Все современные математические системы (Mathcad, Matlab, Maple и пр.) имеют в своем составе универсальный аппарат выполнения таких операций, дающий пользователю возможность реализации любых практических задач по обработке данных. В качестве основной математической системы для примеров будем использовать систему Mathcad.

14.1. Приближение сигналов рядами тейлора [39]

Разложение функций в ряд Тейлора явилось одним из первых методов приближения функций в окрестностях точек х0:

f(x)  f(x0) + (x-x0) + (x-x0)2 + … + (x-x0)n.

f(x)  f(x0) +(x-x0)i.

При разложении функции в окрестностях точки х0=0 ряд Тейлора принято называть рядом Маклорена.

Первый член ряда f(x0) представляет собой отсчет функции в точке х0 и грубое приближение к значениям функции в окрестностях этой точки. Остальные члены ряда детализируют значения функции в окрестностях точки х0 по информации в соседних точках и тем точнее приближают сумму ряда к значениям функции, чем больше членов суммы участвуют в приближении, с расширением интервала окрестностей точного приближения. Наглядно это можно видеть на примере двух функций, приведенном на рис. 14.1.1 (с усечением отображения членов рядов f2(x) и f4(x)).



Рис. 14.1.1. Примеры разложения функций в ряд Маклорена.

Приближение функций рядом Тейлора применяется, в основном, для непрерывных гладких функций в локальных интервалах задания. Для разрывных и периодически повторяющихся функций использовать его практически невозможно, равно как и для непрерывных не дифференцируемых функций. Операция дифференцирования тоже может быть далеко не простой, а получаемые ряды могут сходиться очень медленно.

14.2. интерполяция и экстраполяция сигналов [39, 55].

Полиномиальная интерполяция. Одним из основных типов точечной аппроксимации является интерполирование. Сущность его заключается в том, что функции yi = s(xi) сопоставляется интерполяционный многочлен

f(x) = а0 + а1х + а2х2 + … + anxn =ai·xi, (14.2.1)

принимающий в точках xi те же значения yi, что и функция f(x). Для выполнения полиномиальной интерполяции достаточно по выражению (14.2.1) составить систему линейных уравнений для n узловых точек и определить n значений коэффициентов ai.

При N точках функции yi максимальная степень интерполяционного многочлена n=N-1, и в этом случае говорят о глобальной интерполяции с прохождением f(x) через все значения точек yi. Однако в этом случае при большом количестве узлов получается очень высокая степень многочлена. Кроме того, экспериментальные табличные данные могут содержать ошибки измерений, а глобальная интерполяция повторит все допущенные при измерениях ошибки. Для исключения этого фактора стараются подобрать аппроксимирующий многочлен как можно меньшей степени (как правило, n=1, 2, 3), график которого проходит близко от узловых точек. На практике мерой отклонения многочлена f(x) от заданной функции на множестве точек (xi,yi) является величина  среднеквадратичного приближения 2 = i(f(xi)-yi)2, минимальное значение которой обеспечивается подбором коэффициентов ai.

Пример выполнения глобальной интерполяции приведен на рис.14.2.1. Равномерной дискретизации данных для интерполяции не требуется. Максимальная степень полинома на практике обычно устанавливается не более 8-10, а большие массивы данных интерполируются последовательными локальными частями.


Рис. 14.2.1. Интерполяция данных.


Линейная и квадратичная интерполяция являются самыми простыми способами обработки таблиц и выполняются по уравнениям:

f(x)лин = а0 + а1х. f(x)кв = а01х+а2х2.

При линейной интерполяции вычисления дополнительных точек выполняются по линейной зависимости. Графически это означает простое соединение узловых точек отрезками прямых. В системе Mathcad для этого используется функция linterp(X,Y,x), где X и Y – вектора узловых точек. Функция linterp(X,Y,x) возвращает значение функции при её линейной интерполяции по заданным аргументам х. При небольшом числе узловых точек (менее 10) линейная интерполяция оказывается довольно грубой. Для целей экстраполяции функция linterp не предназначена.

Для практического использования более удобны формулы аппроксимации, не требующие предварительного определения коэффициентов аппроксимирующих полиномов. К числу таких формул относится интерполяционных многочлен по Лагранжу /40/. При аппроксимации функции у(х) многочленом n-й степени Y(x):

Y(x) =  +  +…

…+ . (14.2.2)

Пример интерполяции по Лагранжу приведен на рис. 14.2.2.


Рис. 14.2.2. Интерполяция по Лагранжу.


Кривые Безье. Для задач аппроксимации широко применяются кривые Безье. Это связано с их удобством как для аналитического описания, так и для наглядного геометрического построения. При использовании кривых Безье в компьютерной графике пользователь может задавать форму кривой интерактивно, двигая опорные точки курсором на экране.

Метод построения кривых был предложен де Кастелье в 1959 году и основан на разбиении отрезков, соединяющих исходные точки в отношении t, а затем в рекурсивном повторении этого процесса для полученных отрезков:



(t) = (1-t)(t) + t(t), (14.2.3)

где нижний индекс - номер точки, верхний индекс - уровень разбиения. Уравнение кривой n-ого порядка задается уравнением: P(t) = (t).




Рис. 14.2.3.


Для примера построим кривую для трех опорных точек P0(t=0), P1 и P2(t=1) на интервале t=[0, 1] (рис. 14.2.3).

Для каждого t[0, 1] определим точку :



= (1-t)P0 + tP1, = (1-t)P1 + tP2,

= (1-t) + t=(1-t)2P0(t)+2t(1-t)P1(t)+t2P2(t),

и тем самым получим кривую второго порядка.




Рис. 14.2.3.


Аналогичным образом построение кривой Безье с четырьмя опорными точками будет определяться следующими выражениями:

=(1-t)P0+tP1, =(1-t)P1+tP2, =(1-t)P2+tP3,

=(1-t)+t=(1-t)2P0(t)+2t(1-t)P1(t)+t2P2(t), =(1-t)+t=(1-t)2P1(t)+2t(1-t)P2(t)+t2P3(t),

= (1-t) + t=(1-t)3P0(t)+3t(1-t)2P1(t)+ 3t2(1-t)P2(t)+t3P3(t).

Общая аналитическая запись для кривых Безье по N+1 опорной точке:

PN(t) = Pi , = ti (1-t)N-i,

= N!/(i! (N-i)!) – биномиальные коэффициенты.

Кривые Безье всегда проходят через начальную P0 и конечную PN точки. Если рассматривать опорные точки в противоположном порядке, то форма кривой не изменяется. Если опорные точки лежат на одной прямой, то кривая Безье вырождается в отрезок, соединяющий эти точки. Степень многочлена, представляющего кривую в аналитическом виде, на 1 меньше числа точек.


14.3. сплайновая интерполяция [39].

Сплайн - кусочный многочлен степени K с непрерывной производной степени K - 1 в точках соединения сегментов.

При сплайновой интерполяции обычно используются локальные полиномы не выше третьей степени. Так, например, кубические сплайны проходят через три смежные узловые точки (текущие опорные точки вычислений), при этом в граничных точках совпадают как значения полинома и функции, так и значения их первых и вторых производных. Коэффициенты полиномов, проходящих через три узловые точки, рассчитываются так, чтобы непрерывными были их первая и вторая производные. Линия, которую описывает сплайн-функция, напоминает по форме гибкую линейку, закреплённую в узловых точках. Это создает высокую плавность сплайнового полинома по сравнению с другими методами аппроксимации и наглядно видно на рис. 14.3.1. Полиномы более высоких порядков чрезмерно громоздки для практики.



Рис. 14.3.1. Сплайновая интерполяция и интерполяция по Лагранжу.

Сплайновая аппроксимация может применяться для достаточно быстро изменяющихся функций, не имеющих разрывов функции и ее производных. Основной недостаток сплайнов – отсутствие единого аналитического выражения для описания функции. Заметим также, что результаты экстраполяции функций, как это можно видеть на рис. 14.3.1, существенно зависят от метода аппроксимации, и, соответственно, к их достоверности нужно подходить достаточно осторожно.

Сплайновая интерполяция обычно применяется в составе математических пакетов по определенной технологии. Так, в системе Mathcad при выполнении сплайновой интерполяции по узловым точкам функции (векторам X и Y) сначала вычисляется вектор (обозначим его индексом S) вторых производных входной функции y(x) по одной из программ:

S:= cspline(X,Y) – возвращает вектор S вторых производных при приближении в опорных точках к кубическому полиному;

S:= pspline(X,Y) – возвращает вектор S при приближении в опорных точках к параболической кривой;

S:= lspline(X,Y) – возвращает вектор S при приближении в опорных точках к прямой.

По значениям вектора S функцией interp(S,X,Y,x) вычисляются значения аппроксимирующей функции по аргументам х.

На рис. 14.3.2 приведен пример кубической сплайновой интерполяции двумерных цифровых данных с одновременным повышением узловой сетки цифровых данных в 4 раза.

Рис. 14.3.2. Сплайн - интерполяция двумерных данных.



14.4. спектральный метод интерполяции [16, 39].

При дискретизации данных с равномерным шагом по аргументу наиболее точную интерполяцию финитных сигналов обеспечивает спектральный метод. При условии, естественно, что в спектре сигнала не содержится частотных составляющих, превышающих частоту Найквиста.



Спектр дискретного сигнала. Допустим, что для обработки задается произвольный аналоговый сигнал s(t), имеющий фурье-образ S(f). Равномерная дискретизация непрерывного сигнала s(t) с частотой F (шаг t = 1/F = ) с математических позиций означает умножение функции s(t) на гребневую (решетчатую) функцию Ш(t) = (t-kt):

s(t) = s(t) Ш(t) = s(t)(t-kt) =s(kt)(t-kt). (14.4.1)

С учетом известного преобразования Фурье гребневой функции Ш(t)  FШF(f) фурье-образ дискретной функции s(t):

SF(f) = S(f) ③ FШF(f). (14.4.2)

ШF(f) =(f-nF). (14.4.3)

Отсюда, для спектра дискретного сигнала имеем:

SF(f) = FS(f) ③(f-nF) = FS(f-nF). (14.4.4)

Спектр дискретного сигнала представляет собой непрерывную периодическую функцию с периодом F, совпадающую с функцией FS(f) непрерывного сигнала s(t) в пределах центрального периода от -fN до fN, где fN = 1/2t = F/2 - частота Найквиста. Частота дискретизации сигнала должна быть минимум в два раза выше максимальной частотной составляющей в спектре сигнала (F = 1/t  2fmax). Умножая функцию (14.4.2) на прямоугольную весовую функцию ПF(f), равную 1 в пределах главного частотного, получаем непрерывный спектр в бесконечных по частоте границах, равный спектру FS(f) в пределах главного частотного диапазона:

FS(f) = F[S(f) ③ ШF(f)] ПF(f). (14.4.5)

Обратное преобразование Фурье этого спектра, с учетом коэффициента F, должно восстанавливать непрерывный сигнал, равный исходному аналоговому сигналу s(t).

На рис. 14.4.1 приведен пример интерполяции и экстраполяции равномерных по аргументу дискретных данных в сравнении с сплайн-методом и методом по Лагранжу. Исходная аналоговая кривая дискретизирована корректно (fmax < 1/2t) и восстановленная по дискретным данным кривая fS(z) полностью ее повторяет. Близкие результаты к исходному сигналу дает также и сплайн-интерполяция, но доверять сплайн-экстраполяции, особенно по концевой части интервала задания данного сигнала, не приходится. Что касается интерполяции по Лагранжу, то можно видеть существенную погрешность интерполяции на концевых частях интервала сигнала и полную непригодность для задачи экстраполяции.

Рис. 14.4.1. Спектральный метод интерполяции и экстраполяции.

Вычисление спектра, учитывая информационную равноценность динамического и спектрального представления сигналов, может производиться в дискретном варианте с использованием быстрого преобразования Фурье.

При нарушении корректности дискретизации данных погрешности интерполяции возрастают практически во всех методах интерполяции. Это можно видеть на рис. 14.4.2, который полностью повторяет рис. 14.4.1 с изменением значения только одного, пятого отсчета (уменьшение с 7.84 до 2), что вызывает подъем высоких частот в спектре данных.



Рис. 14.4.2.

Следует учитывать, что при интерполяции данных, представляющих собой вырезки из сигнальных функций с определенной постоянной составляющей (сигнал не выходит на нулевые значения на концевых участках интервала задания), а равно и любых данных со скачками функций, при спектральном преобразовании на интерполированном сигнале в окрестностях обрезания данных и скачков возникает явление Гиббса. Это можно видеть сравнением рисунков 14.4.1 и 14.4.3. Данные на рис. 14.4.1 в рисунке 14.4.3 подняты на 20 единиц постоянной составляющей.

Рис. 14.4.3.

Для исключения этого эффекта можно рекомендовать перед интерполяцией производить определение линейного тренда данных по концевым значениям отсчетов и вычитать его из данных, с последующим восстановлением после интерполяции.

Интерполяционный ряд Котельникова-Шеннона. Произведем обратное преобразование обеих частей равенства (14.4.5). Умножение непрерывного и бесконечного спектра на П-импульс в пределах главного диапазона отобразится в динамической области сверткой двух функций:

Fs(t) = Fs(t) ③ sinc(Ft).

s(t) = sinc(Ft) ③s(kt)(t-kt),

Отсюда, с учетом равенства (t-kt) ③ sinc(Ft) = sinc[F(t-kt)], получаем:

s(t) =s(kt) sinc[F(t-kt)]. (14.4.6)

Эта формула носит название интерполяционного ряда Котельникова-Шеннона и, по существу, является разложением сигнала по системе ортогональных функций sinc(F(t-kt)) = sinc((t/t – k)). С другой стороны, эта формула представляет собой свертку дискретной функции данных s(kt) с непрерывной функцией интегрального синуса. Для больших массивов дискретных данных точность восстановления сигнала обычно ограничивается интервалом задания функции интегрального синуса, по которому устанавливается интервал суммирования.

Из совокупности приведенных формул следует, что если для частоты дискретизации сигнала справедливо неравенство F  2fmax, где fmax - наибольшая частота в спектре произвольной непрерывной функции s(t), то функция s(t) может представляться в виде числовой последовательности дискретных значений s(kt), k = 0,1,2,..., и однозначно по этой последовательности восстанавливаться, в пределе - без потери точности. В этом и состоит сущность теоремы отсчетов Котельникова-Шеннона.

На рис. 14.4.4 приведен пример интерполяции входных данных, повторяющих данные рис. 14.4.1. Результаты интерполяции, как и следовало ожидать, абсолютно идентичны. Аналогичным образом влияют на результаты усечение и скачки функций (явление Гиббса).



Рис. 14.4.4. Интерполяция по Котельникову-Шеннону.



14.5. ДЕЦИМАЦИЯ И ИНТЕРПОЛЯЦИЯ ЦИФРОВЫХ СИГНАЛОВ [43]

Применительно к цифровым сигналам децимация – уменьшение частоты дискретизации данных с сохранением в новом сигнале всей полезной информации. Интерполяция обратна децимации – увеличение частоты дискретизации без изменения информации. Цифровая децимация и интерполяция широко используется в современных системах обработки данных для сжатия и восстановления данных, для уменьшения объемов памяти хранения данных, для увеличения скорости передачи данных, и т.п.

Простой, но мало производительный подход – восстановить сигнал в аналоговой форме (ЦАП) и заново оцифровать его (АЦП) с новой частотой дискретизации. Цифровые методы позволяют выполнить эту операцию в более эффективной форме.

Децимация с целым шагом. Кратная компрессия частоты дискретизации снижает частоту дискретизации входного сигнала x(k) с fd до fd/M путем отбрасывания М-1 отсчетов в каждой последовательной серии из М-отсчетов, т.е. из М-отсчетов оставляется только 1:

y(m) =x(k) (k-mM), m = 0, 1, 2, … , K/M. (14.5.1)

Естественно, что частота Найквиста fN входного сигнала x(k) компрессора для выходного сигнала y(k) также уменьшается в М раз и становится равной fN' = fN/M для выходного сигнала. Для полного сохранения после компрессии полезной информации, содержащейся в сигнале x(k), максимальная частота полезной информации во входном сигнале не должна превышать значения fmax  fN/2M. В противном случае децимация будет некорректной и в новом главном частотном диапазоне выходного сигнала произойдет искажение спектра полезной информации за счет сложения со спектрами боковых диапазонов. Пример корректной децимации сигнала с М=2 и спектры входного и децимированного сигнала приведены на рис. 14.5.1.

Рис. 14.5.1.

Входные сигналы кроме полезной информации могут содержать статистические шумы и помехи, распределенные по всему частотному диапазону. При децимации шумы и помехи в частотном диапазоне от fN/M до fN входного сигнала зеркально отражаются от fN' нового главного частотного диапазона и их суммирование со спектром нового главного диапазона и полезного сигнала может приводить к увеличению уровня шумов и искажению информации. Для исключения этого эффекта перед конверсией сигнала необходимо выполнять его низкочастотную фильтрацию со срезом на частоте fN/2M.

Рис. 14.5.2.

На рис. 14.5.2 приведен спектр Z2n сигнала zk с рисунка 14.5.1 (спектр Zn), в который для наглядности эффекта зеркального отражения условно введен только высокочастотный шум на интервале fs - fN, и соответствующий данному спектру сигнал z2k. При децимации сигнала z2 с М=2 сначала была выполнена его низкочастотная фильтрация с частотой среза fs, что полностью сняло модельный шум, и при восстановлении сигнала (интерполяции) получен сигнал y1k, полностью соответствующий сигналу zk. При выполнении децимации без предварительной фильтрации восстанавливается сигнал y2k, который по своей форме отличается как от сигнала y1k = zk, так и от входного сигнала z2k.

Интерполяция с целым шагом. Экспандер частоты дискретизации увеличивает частоту дискретизации входного сигнала xk с fd до Lfd путем введения (L-1) нулевых отсчетов после каждого отсчета входного сигнала. При этом форма спектра выходного сигнала yk остается без изменения, но частотная шкала спектра сжимается в L раз и в границы главного диапазона спектра входного сигнала ±fN заходят боковые диапазоны спектра выходного сигнала (зеркальные частоты). Это наглядно можно видеть на рис. 14.5.3 сравнением спектров Xn для входного сигнала xk, и Yn для экспандированного сигнала xk с L=2. Следовательно, фактическая частота Найквиста выходного сигнала становится равной fN/L. Для исключения зеркальных частот и распределения энергии отсчетов xk по L выходным интервалам экспандированный сигнал пропускается через фильтр нижних частот со срезом на частоте fN/L и с коэффициентом L для компенсации распределения энергии отсчетов по интервалам L. Результат операции можно видеть на сигнале yk по сравнению с исходным сигналом zk (рис. 14.5.1), децимацией которого с М=2 был получен сигнал xk.

Рис. 14.5.3.



Преобразование частоты дискретизации с нецелым шагом на практике обычно выполняют представлением нецелого множителя максимально близким приближением рациональными числами вида L/M, Это позволяет выполнять преобразование частоты дискретизации последовательными операциями сначала интерполяции с шагом L, сохраняющей все частотные составляющие сигнала, и затем децимации с шагом М, при которой часть высокочастотных составляющих и шумов будет подавлена низкочастотной фильтрацией. Поскольку при этом низкочастотные фильтры экспандирования и децимации следуют друг за другом и работают на одной частоте дискретизации, то вместо двух фильтров можно применять один, имеющий минимальную частоту среза с коэффициентом усиления, равным L.

При программной обработке больших пакетов данных децимация и интерполяция может выполняться в спектральной области с использованием БПФ.



14.6. методика аппроксимации эмпирических данных [41].

Эмпирические данные, как правило, задаются числовыми рядами значений двух величин: независимой (хk) и зависимой (уk) , каждая из которых кроме определенной регулярной составляющей может содержать и случайные составляющие самой различной природы, обусловленные как статистической природой изучаемых процессов, так и внешними факторами процессов измерений и преобразования данных (шумы, помехи, ошибки измерений). Независимая переменная xk обычно полагается детерминированной, а ее случайная составляющая "переносится" на зависимую переменную yk. Полагается также, что значения случайной составляющей зависимой переменной распределены по некоторому вероятностному закону (например – нормальному).

При выполнении аппроксимации данных предполагается существование определенной детерминированной связи y(x) между регулярными составляющими этих двух числовых рядов на статистически значимом уровне, достаточном для ее выявления на уровне случайных составляющих. Задача выявления такой закономерности относится к числу неопределенных и неоднозначных, результат которой зависит от трех основных субъективных факторов:


  • выбора меры близости зависимой переменной к искомой функции и метода построения приближения (параметров математической модели);

  • выбора подходящего класса функции аппроксимации (степенной, тригонометрической и пр.), отвечающего физической природе моделируемого процесса;

  • метода оптимизации порядка модельной функции или числа членов ряда аппроксимирующего выражения.

Отсюда следует, что оптимальная аппроксимация может быть обеспечена только достаточно гибкими интерактивными алгоритмами на основе многоэтапных итерационных процессов с возможностью коррекции на каждом этапе.

Мера приближения. Наиболее распространен критерий наилучшего приближения в виде минимума степенной разности между переменной yk и аппроксимирующей функцией (xk):

[yk - (xk)]S  min, (14.6.1)

где S > 0 - положительное число.



Квадратичная мера реализуется при S = 2 в методе наименьших квадратов (МНК) и обеспечивает максимальное правдоподобие функции приближения при нормальном распределении случайной составляющей зависимой переменной yk. Несмещенной оценкой меры приближения в МНК является дисперсия остатков:

D = {[yk - (xk)]2}/(k-m), (14.6.2)

где m – количество параметров в функции приближения, (k-m) – число степеней свободы. Однако эмпирические данные могут содержать выбросы и грубые ошибки, которые вызывают смещения вычисляемых параметров. Их влияние обычно исключается цензурированием данных: вычислением гистограммы разностей yk-(xk) после определения первого приближения функции аппроксимации и исключением "хвостовых" элементов гистограммы (до 2.5% от количества данных, или резко выделяющихся элементов данных на основании оценок вероятностей с использованием r- или t- распределений).

Мера наименьших модулей (метод Лагранжа) реализуется при S = 1 и применяется при распределениях случайных составляющих зависимой переменной по законам, близким к закону Лапласа (двустороннее экспоненциальное распределение). Такая мера соответствует площади между графиками эмпирических данных и функции аппроксимации, и, по сравнению с квадратической, является более устойчивой, в том числе при наличии случайных составляющих с большими амплитудами (длинные "хвосты" разностных гистограмм). Оценки по модулю получили название "робастных" (robust – устойчивый).

Свойства квадратичной меры и меры наименьших модулей в определенной степени сочетаются при S = 3/2.



Минимаксная мера (мера Чебышева – минимизация максимального расхождения функции аппроксимации с данными) обеспечивает наилучшее приближение при равномерном распределении значений случайной составляющей, но не является устойчивой при наличии больших расхождений данных с функцией аппроксимации.

Аппроксимирующая функция, в принципе, может быть математической функцией любого типа, линейной комбинацией различных функций или функциональным рядом из степенных, тригонометрических и любых других функций. В основу ее построения желательно закладывать теоретические предположения о сущности изучаемого явления, хотя бы по таким свойствам, как область определения переменных и производных, асимптоты, минимумы и максимумы.

При полном отсутствии априорной информации о распределении случайной составляющей данных, на начальном этапе обычно используется квадратичная мера приближения, при этом существенное значение имеет количество задаваемых параметров функции аппроксимации, особенно при малом количестве данных. Как следует из (14.6.2), при прочих равных условиях целесообразно использовать функции с минимальным количеством задаваемых параметров, что обеспечивает большее число степеней свободы и меньшие значения дисперсии остатков.

Наибольшее распространение в практике аппроксимации при отсутствии теоретических аспектов изучаемых явлений получили функциональные ряды, для которых определяющее значение имеет порядок аппроксимирующей функции (модели).

Порядок модели ограничивает число членов функционального ряда аппроксимирующей функции определенным оптимальным количеством членов ряда, которое обеспечивает обоснованное расхождение с фактическими данными и минимизирующее отклонение от искомой регулярной составляющей данных.

Очевидно, что для функциональных рядов порядок модели (степень ряда для степенных рядов) определяет значение меры приближения. При повышении порядка модели минимум функции (14.6.1) стремится к нулю. Однако это означает, что при повышении порядка модели в функцию аппроксимации входит не только регулярная составляющая данных, но все большая и большая доля случайных составляющих, в пределе до полного соответствия функции k исходным данным yk. Но повышение степени приближения к исходным данным при наличии в них случайных составляющих с какого-то определенного момента (порядка модели) не только не будет приближать функцию аппроксимации к регулярным составляющим данных, а наоборот – увеличивать расхождение. С этой точки зрения термин "меры приближения" (14.6.1) было бы целесообразнее заменить термином "мера аппроксимации" данных, а под мерой приближения понимать значение меры аппроксимации, при которой обеспечивается максимальная степень приближения функции аппроксимации к регулярной составляющей данных (минимум дисперсии разности функций аппроксимации и регулярной составляющей).

При разделении данных на значения регулярных составляющих sk и случайных k, для квадратичной меры можно записать:

[yk-(xk)]2 =[sk+k-(xk)]2 =[sk-(xk)]2 +2[sk-(xk)]k +k2.

При нулевом значении математического ожидания случайных величин k значение второй суммы стремится к нулю, при этом для оптимальной аппроксимирующей функции:



[sk-(xk)]2  min, (14.6.3)

[yk-(xk)]2k2. (14.6.4)

В пределе, при идеальной аппроксимации, выражение (14.6.3) стремится к нулю, а выражение (14.6.4) эквивалентно соотношению дисперсий:

{[yk - (xk)]2}/(k-m) k2/k. (14.6.5)

Отсюда следует, что при прочих равных условиях наилучшим является приближение, у которого мера приближения близка к дисперсии шума. Для "белых" шумов оценку их дисперсии в экспериментальных данных можно выполнять в спектральной области, если частота Найквиста данных минимум в 2 раза выше предельных частот регулярной составляющей.

При отсутствии информации о дисперсии шумов оптимальный порядок модели может определяться методом последовательных уточнений с последовательным нарастанием порядка модели и сравнением по критерию Фишера значимости различия дисперсии остатков каждого нового порядка с предыдущим. При увеличении порядка модели (начиная с 1-го) значимость различия дисперсий сначала является довольно высокой, постепенно уменьшается, и в области оптимальных порядков становится малозначимой. Это объясняется тем, что в этой области при небольших уменьшениях значения числителя выражения (14.6.2) одновременно, за счет увеличения порядка, сокращается число степеней свободы. После прохождения оптимальной зоны значения дисперсий остатков снова начинают увеличиваться с увеличением значимости различий.

Рис. 14.6.1.

Оптимальный порядок модели при нормальном распределении шума может устанавливаться и непосредственно по минимуму дисперсии остатков. Это можно наглядно видеть на примере, приведенном на рис. 14.6.1.

Одномерная полиномиальная аппроксимация данных в векторе Y полиномом с произвольной степенью n и с произвольными координатами отсчетов в векторе Х в Mathcad выполняется функциями:



  • regress(X,Y,n) – вычисляет вектор S для функции interp(…), в составе которого находятся коэффициенты ci полинома n-й степени;

  • interp(S,X,Y,x) – возвращает значения функции аппроксимации по координатам х.

Функция interp(…) реализует вычисления по формуле:

f(x) = c0 + c1·x1 + c2·x2 + … + cn·xnci·xi.

Значения коэффициентов ci могут быть извлечены из вектора S функцией


  • submatrix(S, 3, length(S), 0, 0).

Оценка качества приближения. Для оценки качества математической модели эмпирической зависимости используется коэффициент детерминации (Adjusted R2):

Adjusted R2 = D/Dy = 1 – Do/Dy,

где: D - дисперсия функции приближения, Dy – дисперсия данных, Do – дисперсия остатков. Чем выше качество аппроксимации, тем ближе к 1 значение коэффициента детерминации.
литература

16. Макс Ж. Методы и техника обработки сигналов при физических измерениях: В 2-х томах. - М.: Мир, 1983.

39. Дьяконов В.П. Вейвлеты. От теории к практике. – М.: СОЛОН-Р, 2002. – 448 с.

40. Корн Г., Корн Е. Справочник по математике для научных работников и инженеров. – М.: Наука, 1984.

41. Овечкина Е.В. (НТИ УГТУ-УПИ), Поршнев С.В. (УГТУ-УПИ). Разработка методов оптимальной аппроксимации эмпирических зависимостей. (Статья в электронном журнале).

43. Айфичер Э., Джервис Б. Цифровая обработка сигналов. Практический подход. / М., "Вильямс", 2004, 992 с.

55. Иванов Д.В. и др. Алгоритмические основы растровой графики. – Интернет университет информационных технологий. – http://www.intuit.ru/goto/course/rastrgraph

Cайт автора Лекции Практикум

О замеченных опечатках, ошибках и предложениях по дополнению: davpro@yandex.ru.



Copyright ©2008-2010 Davydov А.V.



Достарыңызбен бөлісу:




©dereksiz.org 2024
әкімшілігінің қараңыз

    Басты бет