Skip to content

Commit 38b6553

Browse files
add post 'Common subexpression elimination (CSE)'
Signed-off-by: jonghoonpark <dev@jonghoonpark.com>
1 parent ab39535 commit 38b6553

File tree

1 file changed

+79
-0
lines changed

1 file changed

+79
-0
lines changed

_posts/2026-02-22-CSE.md

Lines changed: 79 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,79 @@
1+
---
2+
layout: "post"
3+
title: "Common subexpression elimination (CSE)"
4+
categories:
5+
- "개발"
6+
tags:
7+
- "Common subexpression elimination"
8+
- "CSE"
9+
- "컴파일러"
10+
- "최적화"
11+
date: "2026-02-22 00:30:00"
12+
toc: true
13+
---
14+
15+
## Common subexpression elimination (CSE)
16+
17+
**[Common subexpression elimination(CSE, 공통 부분식 제거)](https://en.wikipedia.org/wiki/Common_subexpression_elimination)**는 프로그램 내에서 동일한 값을 계산하는 중복된 표현식들을 찾아내고, 이를 단일 변수로 대체하여 중복 계산을 피하는 컴파일러 최적화 기술이다.
18+
19+
### 예시
20+
21+
다음과 같은 코드가 있을 때:
22+
23+
```c
24+
a = b * c + g;
25+
d = b * c * e;
26+
```
27+
28+
컴파일러는 이를 다음과 같이 변환할 수 있다.
29+
30+
```c
31+
tmp = b * c;
32+
a = tmp + g;
33+
d = tmp * e;
34+
```
35+
36+
이 변환은 $tmp$ 값을 저장하고 불러오는 비용이 $b \times c$를 한 번 더 계산하는 비용보다 적을 때 가치가 있다.
37+
38+
### 작동 원리
39+
40+
CSE를 수행할 수 있는지 여부는 **가용 표현식 분석(Available Expression Analysis)**이라는 데이터 흐름 분석 기법을 바탕으로 한다.
41+
42+
특정 지점 $p$에서 표현식 $b \times c$가 가용하다는 것은 다음 조건이 충족됨을 의미한다.
43+
44+
- 프로그램 시작부터 $p$에 이르는 모든 경로에서 $b \times c$가 이미 계산되었어야 한다.
45+
- 마지막 계산 이후 $p$에 도달하기 전까지 변수 $b$나 $c$의 값이 변경되지 않아야 한다.
46+
47+
최적화 도구는 단순히 산술 연산 비용뿐만 아니라, 어떤 값이 어느 레지스터에 보관되어 있는지 등의 다양한 요소를 고려하여 비용/이익 분석을 수행한다.
48+
49+
[Three-Address Code](https://jonghoonpark.com/2026/02/22/ssa) 로 변환을 해놓으면 컴파일러가 공통 부분식을 쉽게 찾아낼 수 있다.
50+
51+
### CSE의 종류
52+
53+
CSE를 크게 두 가지로 분류한다.
54+
55+
1. **지역 공통 부분식 제거 (Local CSE)**: 단일 기본 블록(Basic Block) 내에서만 작동한다. 가장 기본적인 최적화 단계에서 실행된다.
56+
57+
2. **전역 공통 부분식 제거 (Global CSE)**: 절차(Procedure) 전체를 대상으로 작동한다. 더 높은 성능 최적화가 필요할 때 실행된다.
58+
59+
두 방식 모두 데이터 흐름 분석을 통해 특정 지점에서 어떤 표현식을 사용할 수 있는지 파악하는 원리를 사용한다.
60+
61+
### 장점 및 특징
62+
63+
CSE는 매우 효과적이어서 현대 컴파일러에서 흔히 사용되는 최적화이다.
64+
65+
- **수동 vs 자동**: 간단한 경우 개발자가 직접 중복 코드를 정리할 수 있지만, 배열 인덱스 계산과 같이 컴파일러가 중간 코드를 생성하는 과정에서 발생하는 중복은 개발자가 직접 손대기 어렵다. 이때 CSE의 진가가 발휘된다.
66+
67+
- **언어적 요인**: C 언어의 매크로처럼 확장 후에 소스 코드상에서는 보이지 않던 중복 식이 대량으로 발생하는 경우에도 매우 유용하다.
68+
69+
### 주의사항 (레지스터 압박)
70+
71+
컴파일러는 결과값을 담아둘 임시 변수(Temporary)의 개수를 신중하게 결정해야 한다. 임시 변수가 너무 많아지면 **레지스터 압박(Register Pressure)**이 생겨 값이 메모리로 밀려나게(Spilling) 되며, 이 경우 차라리 다시 계산하는 것보다 속도가 느려질 수 있다. (계산량을 줄이려다 오히려 메모리 접근 때문에 더 느려질 수 있다.)
72+
73+
### 실제 컴파일러의 전략
74+
75+
현대 컴파일러는 보통 다음과 같은 흐름으로 작동한다.
76+
77+
1. **Local CSE**를 먼저 수행하여 각 기본 블록 안의 자질구레한 중복을 빠르게 제거한다.
78+
2. 이후 **Global CSE**를 수행하여 함수 전체를 관통하는 굵직한 중복을 찾아낸다.
79+
3. 최근에는 **[GVN(Global Value Numbering)](/2026/02/22/value-numbering)** 같은 더 강력한 기법이 Global CSE를 대신하거나 보완하기도 한다.

0 commit comments

Comments
 (0)