Skip to content

Commit ca86e10

Browse files
committed
access protocols
1 parent 5502149 commit ca86e10

File tree

1 file changed

+6
-2
lines changed

1 file changed

+6
-2
lines changed

_posts/2025-05-30-paper_review_delta_lake.md

Lines changed: 6 additions & 2 deletions
Original file line numberDiff line numberDiff line change
@@ -140,6 +140,10 @@ Delta Lake 개념
140140
- 결과 체크포인트 파케이 파일은 테이블 메타데이터 쿼리에 적합하다.
141141
- 클라이언트는 주어진 레코드 ID까지 체크포인트 생성을 시도한다. `03.parquet``03.json`의 체크포인트를 나타낸다.
142142
- 기본값으로 10개 트랜잭션마다 체크포인트를 생성한다.
143-
- LIST없이 마지막 체크포인트를 효율적으로 찾기 위해 체크포인트 writer는 `_delta_log/_last_cehckkpoint`파일을 쓴다.
143+
- LIST없이 마지막 체크포인트를 효율적으로 찾기 위해 체크포인트 writer는 `_delta_log/_last_checkpoint`파일을 쓴다.
144144

145-
## Access Protocol
145+
## Access Protocol
146+
- 접근 프로토콜은 serializable 트랜잭션을 객체 저장소의 연산만으로 가능하게끔 설계되었다. (객체 저장소는 eventually consistent임에도 불구)
147+
- 로그 레코드 객체(.json)은 클라이어트가 읽어야 할 루트 자료구조다.
148+
- eventually consistency 지연때문에 로그 레코드 객체가 보이지 않으면 보일때까지 기다렸다가 테이블 데이터를 읽는다.
149+
- 쓰기 트랜잭션에서 클라이언트는 하나의 writer만이 다음 로그 레코드를 생성하는 것을 보장할 수 있는 방법이 필요하다. 그리고 이것을 낙관적 동시성 제어를 구현하는데 사용한다.

0 commit comments

Comments
 (0)