트랜잭션 고립화 레벨(Transaction Isolation Level)

트랜잭션 고립화 레벨(Transaction Isolation Level)은 정규화, 인덱스, 트랜잭션 특징(ACID) 등 Database 면접 질문으로 자주 등장한다는 소리를 들었다. 따라서 이번 기회에 한번 공부 및 정리해보려고 한다.

우선 Isolaion Level이 무엇인지 알아보기 전에 Isolation Level이 왜 필요한지부터 알아보자.

Database에서 가장 중요한 것 중 하나는 데이터의 무결성을 보장해줘야 한다는 것이다.

만약, A가 DB에서 데이터를 사용하고 있다고 하자. 이때 B가 A가 사용하고 있는 데이터를 변경한다면 어떻게 될까? 데이터가 변경된다면 A는 원하는 데이터를 제대로 사용할 수 없다.

즉, 이런 상황을 방지하기 위해 데이터의 무결성을 보장해줘야 하는 것이다.

DB에서 수행되는 모든 작업은 트랜잭션이라고 한다.

트랜잭션은 무결성을 보장해주기 위해 ACID(Atomicity, Consistency, Isolation, Durability) 4가지 특성을 만족해야 한다.

트랜잭션의 ACID에 대해 궁금하다면 다음 글을 참고하길 바란다.

트랜잭션(Transaction)

이번에 배워볼 내용은 트랜잭션(Transaction)이다. 트랜잭션의 정의는 데이터베이스 시스템 또는 유사 시스템에서 하나의 논리적 기능을 정상적으로 수행하기 위한 작업의 기본단위이자 한꺼번에

sorjfkrh5078.tistory.com

즉, DB는 ACID 특징처럼 트랜잭션이 원자적이면서 독립적인 수행을 하도록 해줘야 하는데 이때 등장하는 개념이 Locking이다. 세마포어의 Lock을 생각하면 된다.

무조건 강한 Locking 기법을 사용한다면 그만큼 많은 트랜잭션이 대기해야 하기 때문에 DB 성능이 떨어지게 되고 반대로 응답성을 높이기 위해 약한 Locking 기법을 사용한다면 데이터가 도중에 변경되는 등 잘못된 처리가 발생할 수 있게 된다.

따라서 우리는 최대한 효율적인 Locking 기법을 적용해야 한다. 이와 관련된 Locking 방법이 고립화 단계(Isolation Level)이다.

Isolation Level는 대표적으로 4단계가 존재한다. 하나씩 살펴보도록 하자.

SQL Server가 Default로 사용하는 단계이다.
Select 문장이 수행되는 동안 해당 데이터에 Shared Lock이 걸린다.
Read Committed 의미 그대로 commit된 데이터만 접근이 가능하다.
Level 0 단계의 문제점을 개선하였지만 한 트랜잭션이 commit을 하기 전까지는 다른 트랜잭션은 접근할 수 없기 때문에 대기해야 하는 단점이 있다.

Level 2 단계에서 SELECT 문장이 사용하는 모든 데이터에 Shared Lock이 걸려 commit 전까지는 접근할 수 없었다. 하지만 그만큼 다른 트랜잭션은 대기해야 하는 단점이 있었다.
이러한 문제점을 개선하기 위해 Level 3 단계는 트랜잭션이 SELECT 문장이 조회한 데이터를 제외한 해당 Row의 범위에는 다른 트랜잭션이 insert가 가능하다.
제외한 범위에서 가능하기 때문에 당연히 트랜잭션이 최초 수행된 후 해당 범위 내에서는 조회한 데이터의 내용이 항상 동일함을 보장한다.

Transaction 1에서 SELECT 쿼리를 통해 "아무개"를 조회하였다.
Transaction 1이 종료되지 않았지만 Transaction 2에서 user 테이블에 "동네개발자"라는 새로운 데이터를 insert 하였다.
Transaction 2에서 "아무개"를 "개발자"로 업데이트하였다.
Transaction 2에서 변경된 작업을 commit 한다.
Transaction 1에서 SELECT 쿼리를 수행하면 insert는 반영되었지만 기존에 사용하였던 "아무개" 데이터는 update 쿼리가 반영되지 않은 상태로 "아무개"와 "동네개발자"가 조회된다.

Transaction 1에서 SELECT 쿼리를 통해 "아무개"를 조회하였다.
Transaction 1이 종료되지 않았지만 Transaction 2에서 user 테이블에 "동네개발자"라는 새로운 데이터를 insert 하였다.
Transaction 2에서 "아무개"를 "개발자"로 업데이트하였다.
Transaction 2에서 변경된 작업을 commit 한다.
Transaction 1에서 SELECT 쿼리를 수행하여도 update, insert가 수행되지 않은 상태인 "아무개"만 조회된다.

마지막으로 Level에 따라 다음과 같은 부작용(Sied Effect)이 존재한다.

A Transaction이 같은 질의를 계속해도 B Transaction이 commit하지 않았기 때문에 A는 계속 변경되기 전의 동일한 데이터만 읽어드리는 경우를 의미한다.
즉, 다른 Transaction에 의한 변경 사항을 볼 수 없다.
만약 보고 싶다면 Transaction을 새로 시작해야 한다.

다른 Transaction에 의한 변경 사항으로 인해 현재 사용 중인 Transaction의 Where 절의 조건에 맞는 새로운 행이 생길 수 있는 상황을 의미한다.
예를 들어 위의 Level 2의 REPEATABLE READ 예시를 보면 처음에는 "아무개", 1개의 데이터만 조회되었지만 이후에는 "아무개"와 "동네개발자", 2개의 데이터가 조회되었다.
이처럼 Where 절의 조건에 맞는 새로운 행이 생길 수 있는 경우를 말한다.

[ Reference ]

· https://goodgid.github.io/Transaction-Isolation-Level/

Libi의 블로그