|
| ||||||||||||
| ||||||||||||
|
2005 г.
Усовершенствованный алгоритм распространения констант с использованием GSA-представленияТруды Института Системного Программирования РАН, 2004 г. В данной статье представлены усовершенствования метода распространения констант, использующего GSA-представление (Gated Single Assignment), позволяющие алгоритму находить большее количество констант, чем исходный алгоритм. ВведениеРаспространение констант – хорошо известная проблема глобального анализа потока данных. Цель распространения констант состоит в обнаружении величин, которые являются постоянными при любом возможном пути выполнения программы, и в распространении этих величин так далеко по тексту программы, как только это возможно. Выражения, чьи операнды являются константами, могут быть вычислены на этапе компиляции. Поэтому использование алгоритмов распространения констант позволяет компилятору выдавать более компактный и быстрый код. Хотя в общем случае проблема распространения констант является неразрешимой, существует множество проявлений этой проблемы, для которых существуют эффективные алгоритмы. Технологии распространения констант позволяют решить следующие задачи:
Алгоритм распространения констант, использующий GSA-представлениеАлгоритм распространения констант, описанный в [8] использует SSA-представление (Static Single Assignment) программы. В SSA-форму программа трансформируется таким образом, что только одно присваивание может достигнуть точки использования. Так как программы имеют ветвления и точки объединения нескольких путей, то в точках объединения необходимо добавить специальную форму присваивания, названную φ-функцией. φ-функция имеет форму V ← φ(R, S, …), где V, R, S, … – переменные. Количество операндов такой функции равняется количеству предшественников данного узла. Эти предшественники перечисляются в некотором определенном порядке и j-й операнд φ-функции ассоциируется с j‑м предшественником узла. Если путь выполнения программы лежит через j‑го предка узла, то переменная V получает значение, связанное с j‑м аргументом. Каждое исполнение φ-функции использует только один из аргументов, но который именно – зависит от того, из которого узла получил управление данный узел. В работе [8] алгоритмы распространения констант разделены на те, которые находят простые и условные константы. Алгоритм Sparse Conditional Constant Propagation находит все простые, а также некоторые условные константы. Время работы такого алгоритма пропорционально размеру SSA-графа и каждое SSA-ребро обрабатывается максимум два раза. Когда необходимо классифицировать переменную в точке слияния, мы используем функцию meet для аргументов ее φ-функции. Но если в процессе своего выполнения программа всегда идет только по одной ветке было бы лучше использовать то значение переменной, которое порождается именно в ней. В методе, описанном в предыдущем разделе, если значение предиката будет постоянным, то выполняемое ребро будет добавлено к рабочему списку. Поэтому в точке слияния выражения будут вычисляться с использованием информации о входящих выполняемых ребрах, что может приводить к неоднократному вычислению одних и тех же выражений. В методе, использующем GSA, если символ использует значение из точки слияния, то вычисляется значение предиката и определяется путь из которого берется значение. При использовании φ-функции мы не можем определить по какому пути шло выполнение программы. Но если снабдить φ-функцию предикатом, то, если его значение является константой, можно выбрать нужный аргумент φ-функции, а если нет, то самое лучшее, что можно получить с помощью данного метода – это взять функцию meet от φ-аргументов. Чтобы выполнить данную задачу необходимо расширить SSA-представление до GSA (gated single assignment), введенное в работе [3], которое позволяет вычислять условные выражения, базирующие на предикатах. В данном представлении φ-функции заменяются на μ- и γ-функции. Большая часть φ-функций, расположенных в заголовках циклов переименовываются в μ-функции, тогда как остальные – преобразуются в γ-функции. γ-функция имеет вид: v = γ(P, v1, v2), что означает, что v принимает значение v1, если P=true и v2, если P=false. В такой форме γ-функция представляет собой конструкцию if-then-else, но она может быть расширена для работы с более сложными условными конструкциями. Алгоритм для преобразования φ-функций в μ- и γ-функции представлен в работе [6]. В данном алгоритме используется представление программы в виде базовых блоков, состоящих из кортежей. Базовые блоки и кортежи внутри них связаны между собой и вместе образуют граф потока данных. Кортежи имеют следующие атрибуты: op, left, right, ssa_link, lattice, где op – код операции, left и right – два операнда. ssa_link – связь, порождаемая алгоритмом преобразования программы в SSA-форму. Поля left, right, ssa_link представляют собой указатели на соответствующие кортежи. Каждая операция (кортеж) также имеет ассоциированное значение – lattice, принадлежащее множеству значений из решетки и представляющее собой результат выполнения операции, который может быть получен на этапе компиляции.
Исходный алгоритм∀ t ∈ tuples lattice(t) = T unvisited(t) = true Недостатки и предлагаемые измененияВ работе [7] показано, что арифметические и логические выражения, включающие γ-функции, можно преобразовывать в несколько вложенных γ‑функций и арифметических выражений, что позволяет получать константные выражения даже в тех случаях, когда аргументы исходного арифметического или логического выражения не являются константами. Это видно по следующему примеру: if P then a1 = 2 b1 = 1 else a2 = 4 b2 = 2 endif a3 = γ(P, a1, a2) b3 = γ(P, b2, b3) if a3 > b3 then ... endif В данном случае переменные a3 и b3 будут всегда равны независимо от значения предиката P. Алгоритм, предложенный в [5] не сможет определить отношение значений переменных в данной ситуации. Предлагаемые изменения алгоритма привели бы предикат a3 > b3 к виду: γ(P, a1 > b1, a2 > b2) = γ(P, true, true) = true. Предлагаемые изменения алгоритма касаются обработки арифметических и логических выражений и состоят в следующем: E1, E2 – аргументы арифметического (логического) оператора
Новый алгоритм∀ t ∈ tuples lattice(t) = T unvisited(t) = true Функция join_common_predicate – объединяет две γ-функции с одинаковыми предикатами в одну join_common_predicate (tuple t) tuple new_t = new γ-function predicate(new_t) = predicate(left(t)) Функция join_gamma_with_operand – объединяет γ-функцию и операнд, который не является γ-функцией join_gamma_with_operand (tuple t)
tuple g, op
tuple g_left = new operation node, same as t
tuple g_right = new operation node, same as t
if type(left(t)) = γ-function then
g = left(t)
op = right(t)
left(g_left) = left(g)
left(g_right) = right(g)
right(g_left) = op
right(g_right) = op
else
op = left(t)
g = right(t)
left(g_left) = op
left(g_right) = op
right(g_left) = left(g)
right(g_right) = right(g)
endif
left(g) = g_left
right(g) = g_right
t = g
Время работы алгоритмаТ.к. в оригинальном алгоритме флаг unvisited для каждого узла не может измениться более одного раза, то это означает, что алгоритм посещает каждый узел единожды, поэтому время его работы может быть оценено как O(N), где N – количество узлов. Модифицированный алгоритм, как и исходный, посещает каждый узел представления программы единожды. В предельном (невозможном на практике) случае, однако, тип каждого узла может быть преобразован, поэтому время, необходимое для обработки одного узла может увеличиться. Тем не менее, время работы алгоритма также представляет собой величину порядка O(N). Таким образом, улучшенный алгоритм обладает большими возможностями по обнаружению констант, чем исходный лишь незначительно увеличивая время его работы (при том, что асимптотическая оценка времени работы остается той же). Для сравнения предикатов можно использовать сравнения указателей на них (т.е. предикаты эквивалентны, если они указывают на один и тот же оператор ветвления) или алгоритм классификации выражений, описанный в [2]. Первый вариант позволяет выполнить сравнения без значительных затрат времени. Второй – позволяет найти одинаковые предикаты, которые не принадлежат одному оператору ветвления, но требует дополнительных затрат времени на классификацию предикатов. Список использованной литературы
|
|
CITForum © 1997–2025