Существует много возможностей улучшения производительности OpenGL. К тому же разные подходы к оптимизации приводят к разным эффектам при аппаратной и программной визуализации. Например, интерполяция цветов может быть очень дорогой операцией без аппаратной поддержки, а при аппаратной визуализации почти не дает задержек.
После каждой из следующих методик следуют квадратные скобки, в которых указан один из символов, обозначающих значимость данной методики для конкретной системы
-
[А] – предпочтительно для систем с аппаратной поддержкой OpenGL
-
[П] – предпочтительно для программных реализаций
-
[все] – вероятно предпочтительно для всех реализаций
8.2.1.Передача данных в OpenGL
В данном разделе рассмотрим способы минимизации времени на передачу данных о примитивах в OpenGL
Используйте связанные примитивы.
Связанные примитивы, такие как GL_LINES, GL_LINE_LOOP, GL_TRIANGLE_STRIP, GL_TRIANGLE_FAN, и GL_QUAD_STRIP требуют для определения меньше вершин, чем отдельные линия или многоугольник. Это уменьшает количество данных, передаваемых OpenGL [все]
Используйте массивы вершин.
На большинстве архитектур замена множественных вызовов glVertex/glColor/glNormal на механизм массивов вершин может быть очень выигрышной. [все]
Используйте индексированные примитивы.
В некоторых случаях даже при использовании связанных примитивов GL_TRIANGLE_STRIP (GL_QUAD_STRIP) вершины дублируются.
Чтобы не передавать в OpenGL дубли, увеличивая нагрузку на шину, используйте команду glDrawElements() (см. раздел 2.5.) [все]
Задавайте необходимые массивы одной командой.
Вместо использования команд
glVertexPointer/glColorPointer/glNormalPointer лучше пользоваться одной командой
void glInterleavedArrays ( Glint format,
Glsizei stride,
void * ptr);
так, если имеется структура
typedef struct tag_VERTEX_DATA
{
float color[4];
float normal[3];
float vertex[3];
}VERTEX_DATA;
VERTEX_DATA * pData;
то параметры можно передать с помощью следующей команды
glInterleavedArrays (GL_C4F_N3F_V3F, 0, pData);
что означает, что первые четыре float относятся к цвету, затем три float к нормали, и последние три float задают координаты вершины. Более подробное описание команды смотрите в спецификации OpenGL. [все]
Храните данные о вершинах в памяти последовательно.
Последовательное расположение данных в памяти улучшает скорость обмена между основной памятью и графической подсистемой. [А]
Используйте векторные версии glVertex, glColor, glNormal и glTexCoord.
Функции glVertex*(), glColor*() и т.д., которые в качестве аргументов принимают указатели (например, glVertex3fv(v)) могут работать значительно быстрее, чем их соответствующие версии glVertex3f(x,y,z) [все]
Уменьшайте сложность примитивов.
Во многих случаях будьте внимательны, чтобы не разбивать большие плоскости на части сильнее, чем необходимо. Поэкспериментируйте, например, с примитивами GLU для определения наилучшего соотношения качества и производительности. Текстурированные объекты, например, могут быть качественно отображены с небольшой сложностью геометрии. [все]
Используйте дисплейные списки.
Используйте дисплейные списки для наиболее часто выводимых объектов. Дисплейные списки могут храниться в памяти графической подсистемы и, следовательно, исключать частые перемещения данных из основной памяти. [А]
Не указывайте ненужные атрибуты вершин
Если освещение выключено, не вызывайте glNormal. Если не используются текстуры, не вызывайте glTexCoord, и т.д. [все]
Минимизируйте количество лишнего кода между glBegin/glEnd
Для максимальной производительности на high-end системах важно, чтобы информация о вершинах была передана графической подсистеме максимально быстро. Избегайте лишнего кода между glBegin/glEnd.
Пример неудачного решения:
glBegin(GL_TRIANGLE_STRIP);
for (i=0; i < n; i++)
{
if (lighting)
{
glNormal3fv(norm[i]);
}
glVertex3fv(vert[i]);
}
glEnd();
Эта конструкция плоха тем, что мы проверяем переменную lighting перед каждой вершиной. Этого можно избежать, за счет частичного дублирования кода:
if (lighting)
{
glBegin(GL_TRIANGLE_STRIP);
for (i=0; i < n ;i++)
{
glNormal3fv(norm[i]);
glVertex3fv(vert[i]);
}
glEnd();
}
else
{
glBegin(GL_TRIANGLE_STRIP);
for (i=0; i < n ;i++)
{
glVertex3fv(vert[i]);
}
glEnd();
}
8.2.2.Преобразования
Преобразования включают в себя трансформации вершин от координат, указанных в glVertex*(), к оконным координатам, отсечение, освещение и т.д.
Освещение
-
Избегайте использования локальных источников света, т.е. координаты источника должны быть в форме (x,y,z,0) [П]
-
Избегайте использования точечных источников света. [все]
-
Избегайте использования двухстороннего освещения (two-sided lighting). [все]
-
Избегайте использования отрицательные коэффициентов в параметрах материала и цвета. [П]
-
Избегайте использования локальной модели освещения .[все]
-
Избегайте частой смены параметра материала GL_SHININESS [П]
-
Некоторые реализации OpenGL оптимизированы для случая одного источника света [А, П]
-
Рассмотрите возможность заранее просчитать освещение. Можно получить эффект освещения, задавая цвета вершин вместо нормалей. [все]
Отключайте нормализацию векторов нормалей, когда это не необходимо.
Команда glEnable/Disable(GL_NORMALIZE) управляет нормализацией векторов нормалей перед использованием. Если вы не используете команду glScale, то нормализацию можно отключить без посторонних эффектов. По умолчанию эта опция выключена. [все]
Используйте связанные примитивы.
Связанные примитивы, такие как GL_LINES, GL_LINE_LOOP, GL_TRIANGLE_STRIP, GL_TRIANGLE_FAN, и GL_QUAD_STRIP уменьшают нагрузку на конвейер OpenGL, а также уменьшают количество данных, передаваемых графической подсистеме.
8.2.3.Растеризация
Растеризация часто является узким местом программных реализаций OpenGL.
Отключайте интерполяцию цветов, когда в этом нет необходимости
Интерполяция цветов включена по умолчанию. Плоское затенение не требует интерполяции четырех компонент цвета и, как правило, быстрее на программных реализациях OpenGL. Аппаратные реализации обычно выполняют оба вида затенения с одинаковой скоростью. Для отключения используйте команду glShadeModel(GL_FLAT) [П]
Отключайте тест на глубину, когда в этом нет необходимости.
Фоновые объекты, например, могут быть нарисованы без теста на глубину, если они визуализируется первыми [все]
Используйте отсечение обратных граней полигонов
Замкнутые объекты могут быть нарисованы с установленным режимом отсечения обратных граней glEnable(GL_CULL_FACE) Иногда это позволяет отбросить до половины многоугольников, не растеризуя их.[все]
Избегайте лишних операций с пикселями
Маскирование, альфа-смешивание и другие попиксельные операции могут занимать существенное время на этапе растеризации. Отключайте все операции, которые вы не используете. [все]
Уменьшайте размер окна или разрешение экрана
Простой способ уменьшить время растеризации – уменьшить число пикселей, которые будут нарисованы. Если меньшие размеры окна или меньшее разрешение экрана приемлемы, то это хороший путь для увеличения скорости растеризации. [все]
8.2.4.Текстурирование
Наложение текстур является дорогой операцией, как в программных, так и в аппаратных реализациях.
Используйте эффективные форматы хранения изображений
Формат GL_UNSIGNED_BYTE обычно наиболее всего подходит для передачи текстуры в OpenGL. [все]
Объединяйте текстуры в текстурные объекты или дисплейные списки.
Это особенно важно, если вы используете несколько текстур и позволяет графической подсистеме эффективно управлять размещением текстур в видеопамяти. [все]
Не используйте текстуры большого размера
Небольшие текстуры быстрее обрабатываются и занимают меньше памяти, что позволят хранить сразу несколько текстур в памяти графической подсистемы [all]
Комбинируйте небольшие текстуры в одну
Если вы используете несколько маленьких текстур, можно объединить их в одну большего размера и изменить текстурные координаты для работы нужной подтекстурой. Это позволяет уменьшить число переключений текстур.
Анимированные текстуры
Если вы хотите использовать анимированные текстуры, не используйте команду glTexImage2D чтобы обновлять образ текстуры. Вместо этого используйте glTexSubImage2D или glTexCopyTexSubImage2D.
8.2.5.Очистка буферов
Очистка буферов цвета, глубины, маски и буфера-накопителя может требовать много времени, особенно в программных реализациях OpenGL. В этом разделе описаны некоторые приемы, которые могут помочь оптимизировать эту операцию.
Используйте команду glClear с осторожностью [все]
Очищайте все нужные буферы с помощью одной команды glClear.
Неверно:
glClear(GL_COLOR_BUFFER_BIT);
if (stenciling) /* очистить буфер маски? */
{
glClear(GL_STENCIL_BUFFER_BIT);
}
Верно:
if (stenciling) /* очистить буфер маски? */
{
glClear(GL_COLOR_BUFFER_BIT |
STENCIL_BUFFER_BIT);
}
else
{
glClear(GL_COLOR_BUFFER_BIT);
}
Отключайте размывание (dithering)
Отключайте размывание перед очисткой буфера. Обычно различие между очистками с включенным размыванием и без него незаметно. [П]
Используйте ножницы (scissors) для очистки меньшей области
Если вы не хотите очищать весь буфер, используйте glScissor() для ограничения очистки по заданной области [все].
Не очищайте буфер цвета полностью
Если ваша сцена занимает только часть окна, нет необходимости очищать весь буфер цвета. [П]
Избегайте команды glClearDepth(d), где d!=1.0
Некоторые программные реализации оптимизированы для очистки буфера с глубиной 1.0. [П]
8.2.6.Разное
Проверяйте ошибки GL во время написания программ. [все]
Вызывайте команду glGetError() для проверки, не произошла ли ошибки во время вызова одной из функций OpenGL. Как правило, ошибки возникают из-за неверных параметров команд OpenGL или неверной последовательности команд. Для финальных версий кода отключайте эти проверки, так как они могут существенно замедлить работу. Для проверки можно использовать, например, такой макрос:
#include
#define CHECK_GL \
assert(glGetError() != GL_NO_ERROR);
Использовать его можно так:
glBegin(GL_TRIANGLES);
glVertex3f(1,1,1);
glEnd();
CHECK_GL
Используйте glColorMaterial вместо glMaterial
Если в сцене материалы объектов различаются лишь одним параметром, команда glColorMaterial может быть быстрее, чем glMaterial [все]
Минимизируйте число изменений состояния OpenGL
Команды, изменяющие состояние OpenGL (glEnable/glDisable/glBindTexture и другие), вызывают повторные внутренние проверки целостности, создание дополнительных структур данных и т.д., что может приводить к задержкам [все]
Избегайте использования команды glPolygonMode
Если вам необходимо рисовать много незакрашенных многоугольников, используйте glBegin с GL_POINTS, GL_LINES, GL_LINE_LOOP или GL_LINE_STRIP вместо изменения режима рисования примитивов, так как это может быть намного быстрее [все]
Конечно, эти рекомендации охватывают лишь малую часть возможностей по оптимизации OpenGL-приложений. Тем не менее, при их правильном использовании можно достичь существенного ускорения работы ваших программ.
Достарыңызбен бөлісу: |