Лекция Общие методы распараллеливания кода




НазваниеЛекция Общие методы распараллеливания кода
Дата конвертации19.02.2013
Размер445 b.
ТипЛекция


Теория компиляторов Часть II

  • Лекция 3. Общие методы распараллеливания кода


Общая схема распараллеливания программы

  • Необходимо преобразовать линейный список инструкций [w1,w2,…,wn] в список широких командных слов [VLIW1,VLIW2,…,VLIWm].



1. Управляющий граф программы

  • Вершины–источники - 2, 5 и 10.

  • Стоки-вершины 5 и 9.



Этапы

  • 1. Формирование модели макроуровня. Объект – исходный поток инструкций.

  • 1.1. Расстановка меток.

  • 1.2. Построение управляющего графа.

  • 1.3. Планирование трасс.

  • 1.4. Преобразование трасс.

  • 1.5. Формирование линейных участков.

  • 2. Формирование модели микроуровня. Объект – линейные участки.

  • 2.1. Построение графа зависимости по данным (ГЗД).

  • 2.2. Преобразование ГЗД к ярусно-параллельной форме.

  • 2.3. Построение графа конфликтов

  • 2.3. Распределение регистров.



Структура ПК



Расстановка меток

  • Для каждой тетрады определяются ее атрибуты, относящие тетраду к типу «развилка», «сток», «плохая инструкция».

    • «Плохая инструкция» (операции ввода-вывода, вызовы подпрограмм, операции синхронизации и т.п.)
    • Если тетрада - операция условного перехода, то это – «развилка».
    • Если адрес (номер) тетрады используется где-либо в качестве адреса перехода, то это – «сток».
  • Тетрада может иметь несколько подобных атрибутов (быть и «развилкой», и «стоком»).



Построение управляющего графа

  • УГ содержит описание линейных блоков программы

  • УГ - орграф, вершины которого - линейные участки программы, а дуги указывают пути передачи управления.

  • УГ имеет единственную входную и единственную выходную вершину. Каждая вершина имеет не более двух потомков.



Планирование трасс

  • «Хорошие» линейные участки - длинные

  • «Плохие» линейные участки: короткие или содержащие «плохие» операции.

  • "Плохие" инструкции:

    • вызовы внешних подпрограмм;
    • возвраты из подпрограмм;
    • операции ввода-вывода;
    • операции синхронизации по времени;
    • переходы по вычисляемым адресам (т.к. адрес перехода неизвестен заранее, то оптимизировать нельзя);
    • операции с данными, находящимися по вычисляемым адресам (невозможно проследить зависимости по данным на этапе трансляции).


Эвристики

  • Предсказание на основе истории ветвлений. Сбор статистики об исходах операций ветвления и построение на ее основе строится предположение о результате выполнения текущей операции.

  • Предсказание на основе пробных прогонов программы. Для этого производится имитация выполнения программы на одном или нескольких наборах данных. Собирается статистика. Недостаток очевиден: метод работает лишь при определенных обстоятельствах и исходных данных.

  • Использование эвристик выбора доминирующей ветви.

    • Избегание «плохих» инструкций.
    • Условия с указателями. Обычно справедливы условия
      • PtrNULL
      • Ptr1Ptr2
      • if((ptr=malloc(…))!=NULL) …
      • for(p=p0;p!=NULL;p=p–>next) …
    • Эвристика исполнения циклов. Если при ветвлении одна из ветвей содержит цикл, то обычно именно она и будет доминировать. По статистике исполнение циклов занимает до 90% времени выполнения программы в целом.
    • Эвристика направления ветвления. Возврат назад более вероятен (высока вероятность неявного цикла с постусловием).
    • Предсказание по коду операции:
      • при сравнении чисел с плавающей точкой более вероятно неравенство;
      • отрицательные числа менее вероятны.


Пример

  • В первую очередь, избегаем плохих инструкций (4). Если бы (4) была хорошей командой, то мы от (2) перешли на (3), т.к. чаще всего при выполнении сравнения числа не равны друг другу. После (7) идем на (6), т.к. вероятнее движение по циклу.



Преобразование трасс

  • Метод дублирования остатка



Линейные участки

  • ЛУ - последовательность инструкций, у которой имеется вход и два выхода.

  • ЛУ заканчивается тогда, когда осуществляется переход или ставится метка.

  • ЛУ – это основной объект оптимизации.

  • Чем длиннее ЛУ, тем больше возможностей для параллельных вычислений.

  • ЛУ  ГЗД  ЯПФ  распределение регистров  {VLIW}.



Граф зависимости по данным

  • Пусть имеется участок программы – список инструкций A=(a1,a2,…,an)

  • Каждая инструкция ai представлена в тетрадной форме ai=(OPi, Ii(1), Ii(2), Ri)

  • ГЗД участка A - граф (A,V) с вершинами aiA и дугами (ai, aj)  V

  • V={(ai, aj): i



Пример ГЗД

  • S = p*(p–a)*((p–b)*(p–c))

  • 1. (-, p, a, T1)

  • 2. (-, p, b, T2)

  • 3. (-, p, c, T3)

  • 4. (*, T2, T3, T4)

  • 5. (*, p, T1, T5)

  • 6. (*, T5, T4, T6)



Ярусно-параллельная форма

  • 1. Построение дерева

  • Для преобразования ГЗД к дереву (лесу бинарных деревьев) используется дублирование переменных. Дублирование производится для вершин

  • deg–(aiA)>1

  • В результате вершина дублируется deg–(ai)–1 раз

  • Пример. S = p*(p–a)*((p–b)*(p–c))



Ярусно-параллельная форма

  • Пример. a=(b+c)*(c+d)*(b+d)



Построение ЯПФ

  • ЯПФ – эта форма разметки дерева. В ЯПФ каждой вершине графа приписывается некое число – ранг (номер яруса). Вершины, имеющие один ранг (находящиеся на одном ярусе) могут исполняться одновременно.

  • Пусть ГЗД оперирует двумя видами тетрад (вершин) – полными тетрадами вида

  • T4=(OP, A1, A2, R)

  • и неполными (вырожденными) тетрадами вида

  • T3=(OP, A, ,R)

      • (+,A,B,C) -- C:=A+B
      • (*,A,B,C) -- C:=A*B
      • (:=,A, , C) -- C:=A
  • Представление графа ЯПФ

  • Граф ЯПФ – множество вершин-структур



Алгоритм построения ЯПФ

  • Вход: поток тетрад {T}

  • Выход: граф G в ярусно-параллельной форме

  • Очистить список вершин графа G

  • Цикл по всем тетрадам T

  • Выбрать очередную тетраду T.

  • Если тип тетрады T соответствует T4 (T=(OP, A1, A2, R)), то

  • -- Анализируем аргумент A1. Если ГЗД нет элемента с именем A1, то -- добавляем новый элемент g1 в G g1.name := A1; g1.rank:= 0; g1.left := NULL; g1.right := NULL. добавить элемент g1 в G иначе запомнить элемент g1 (g1.name=A1)

  • -- Анализируем аргумент A2. Если ГЗД нет элемента с именем A2, то -- добавляем новый элемент g2 в G g2.name := A2; g2.rank:= 0; g2.left := NULL; g2.right := NULL. добавить элемент g2 в G иначе запомнить элемент g2 (g2.name=A2)

  • -- Анализируем аргумент R.

  • Найти элемент g3 с максимальным рангом, использующий R в качестве аргумента A1 или A2.

  • Найти элемент g4 максимального ранга с именем R.

  • Выбираем максимальный из рангов среди найденных элементов gi: rmax = max(g1.rank, g2.rank, g3.rank, g4.rank) (при этом если какой-либо из элементов gi не был найден в G, то считаем его ранг равным нулю)

  • Помещаем элемент R на ярус со значением rmax+1.

  • КонецЕсли

  • Если тип тетрады T соответствует T3=(OP, A,, R), то

  • -- Далее все аналогично, только вместо двух анализируется один аргумент – операнд A. КонецЕсли

  • КонецЦикла



Пример

  • (+,a,b,c) -- c:=a+b

  • (+,a,b,c) -- c:=a+b

  • (+,a,b,b) -- b:=a+b

  • (+,d,e,f) -- f:=d+e

  • (:=,b,,a) -- a:=b

  • (:=,b,,f) -- f:=b

  • (:=,h,,g) -- g:=h



Распределение регистров

  • 11 регистров



Оптимальная загрузка регистров

  • Регистров обычно не хватает

  • Сведем задачу распределения регистров к задаче раскраски графа:

    • Создать граф, вершинами которого являются данные, а дуги определяют пересечение времен жизни (одновременность использования данных).
    • Раскрасить граф – приписать каждой вершине графа свой цвет – используемый регистр.
    • Количество цветов (красок) – это и есть количество регистров.
  • Прежде следует определиться с тем, какие команды (вершины) вообще могут конфликтовать друг с другом из-за регистров.



Граф конфликтов

  • Граф конфликтов – это неориентированный граф, вершинами которого являются используемые переменные (данные), а ребра соединяют вершины с пересекающимися временами жизни. Строить граф конфликтов мы будем, опираясь на ЯПФ.

  • Одновременно "живут" (сосуществуют) те вершины, которые находятся на одном ярусе. Кроме того:

    • сохраняются связи, полученные в ЯПФ
    • учитываются связи с вершинами предыдущего ярусами.
  • Определяется связь со всеми вершинами, которые находятся выше и имеют потомков ниже или на том же уровне, что и текущая:

  • Для вершины ak строится связь (ak, ai) с вершиной ai такой, что:

  • L(ai)



Пример

  • a:=b+c;

  • k:=a*d

  • e:=b+f

  • m:=b*g



Построение графа конфликтов

  • Далее - раскраска графа

  • Использованы краски с именами 0-4. Итого - 5 цветов (регистров)



Раскраска графа

  • Гипотеза о четырех красках:

  • Хроматическое число любого планарного графа не превосходит 4

  • Но: наш граф не обязан быть планарным



Раскраска

  • Нахождение оптимальной раскраски – это NP–полная задача. Поэтому чаще всего реализуют алгоритмы поиска субоптимального решения.

  • Последовательная раскраска

  • Пусть дано упорядоченное множество вершин графа v1,…,vn.

  • вершине v1 приписываем цвет c1;

  • если подграф H(v1,…,vi–1), порожденный вершинами v1,…,vi–1 k'–раскрашен, ki–1, то вершина vi получает цвет cm, где mk+1, т.е. цвет с наименьшим номером, не встречающимся на смежных с vi вершинах.

  • Число цветов k при этом заранее не фиксируется. Этот алгоритм дает точную k–раскраску только для полных k–дольных графов.

  • k–дольным называется граф, множество вершин которого можно разбить на k непересекающихся подмножеств X1,…,Xk так, что никакие 2 вершины из подмножества Xi, i=1,..,n, не смежны.

  • k–дольный граф называется полным k–дольным, если каждая вершина из множества Xi смежна с каждой вершиной из Xj, ij.



Стратегии последовательных раскрасок

  • 1. НП–стратегия («Наибольшие–Первыми»). Упорядочить вершины v1,…,vn по убыванию их степеней связности, т.е. сначала раскрашиваются вершины с максимальными степенями.

  • В данном случае упорядочивание может выглядеть так: {2,1,3,4,5,6}. Поэтому раскраску начнем с вершины V1=2.

  • 2. ПН–стратегия («Последними–Наименьшие»)

  • для n=|V| в качестве vn выбирается вершина минимальной степени в G;

  • для i=n–1,n–2,…,2,1 в качестве vi выбирается вершина минимальной степени в подграфе H(V\{vn,…,vi+1}).

  • Выберем вершину минимальной связности: V6=6. Далее рассматриваем граф, где нет 6-й вершины. В этом графе V5=5. Далее в оставшемся графе определим V4=4, затем V3=1, V2=2 и V1=3. Итого: {3,2,1,4,5,6}



Итоговая последовательность

  • 1. Формирование модели макроуровня. Объект – исходный поток инструкций.

  • 1.1. Расстановка меток.

  • 1.2. Построение управляющего графа.

  • 1.3. Планирование трасс. Эвристики.

  • 1.4. Преобразование трасс.

  • 1.5. Формирование линейных участков.

  • 2. Формирование модели микроуровня. Объект – линейные участки.

  • 2.1. Построение графа зависимости по данным (ГЗД).

  • 2.2. Преобразование ГЗД к ярусно-параллельной форме.

  • 2.3. Построение графа конфликтов

  • 2.3. Распределение регистров.



Добавить документ в свой блог или на сайт

Похожие:

Лекция Общие методы распараллеливания кода iconЛекция №9, часть 2
Анализ производительности последовательного кода. Основы vtune™ Performance Analyzer лекция №9, часть 2

Лекция Общие методы распараллеливания кода iconОбщие методы и средства снижения выбросов Общие методы и средства снижения выбросов
Общая структура мероприятий по предотвращению выбросов в окружающую среду на опасных предприятиях

Лекция Общие методы распараллеливания кода iconЛекция Предмет, задачи и методы региональной науки Лекция Предмет, задачи и методы региональной науки План Значение и место региональных исследований в Советский период
Лекция Предмет, задачи и методы региональной науки Лекция Предмет, задачи и методы региональной науки

Лекция Общие методы распараллеливания кода iconЛекция 1 Общие методы определения кинематических и динамических характеристик механизмов, машин и систем машин Строение механизмов
Общие методы определения кинематических и динамических характеристик механизмов, машин и систем машин

Лекция Общие методы распараллеливания кода iconМетоды лингвистического анализа методы лингвистического анализа
Понимание текста зависит не только от степени сложности творческого кода, но и от личности читателя, его языковой и филологической...

Лекция Общие методы распараллеливания кода iconИсследовательская работа на тему: Галитоз Содержание: Введение Общие сведения о галитозе Методы установления наличия галитоза Методы диагностики галитоза и прибор для галитоза

Лекция Общие методы распараллеливания кода iconЛекция №15 «Методы прогнозирования» профессор Соколов Н. А
Основы построения телекоммуникационных систем и сетей Лекция №15 «Методы прогнозирования» профессор Соколов Н. А

Лекция Общие методы распараллеливания кода iconТеория графов
Лекция № Основные законы линейных электрических цепей постоянного тока Лекция № Методы расчета токов

Лекция Общие методы распараллеливания кода iconЛекция №6 «Методы исследования инфокоммуникаций» профессор Соколов Н. А
Теория построения инфокоммуникационных систем и сетей Лекция №6 «Методы исследования инфокоммуникаций» профессор Соколов Н. А

Лекция Общие методы распараллеливания кода iconЛекция № Введение Лекция № Введение Лекция № Основные законы линейных электрических цепей постоянного тока Лекция № Методы расчета токов
Лекция № Основные законы линейных электрических цепей постоянного тока Лекция № Методы расчета токов

Разместите кнопку на своём сайте:
rpp.nashaucheba.ru


База данных защищена авторским правом ©rpp.nashaucheba.ru 2012
обратиться к администрации
rpp.nashaucheba.ru
Главная страница