본문 바로가기
Database

[Database] 트랜잭션과 격리 수준(Transaction And Isolation level)

by doodoom 2023. 1. 3.

0. 이 글을 쓰게 된 이유

평소에 db에 대한 지식이 부족하다는 생각을 해서 공부를 하던 도중 db의 기본 중의 기본인 트랜잭션 격리성 수준에 대해서 정리하고자 이 글을 쓰게 되었다.

1. 트랜잭션과 격리 수준이란?

1.1 트랜잭션의 ACID

트랜잭션은 ACID라 하는 원자성(Atomicity), 일관성(Consistency), 격리성(isolation), 지속성(Durability)를 보장해야한다.

  • 원자성 : 트랜잭션 내에서 실행한 작업들은 하나의 작업처럼 처리되어 모두 성공하거나 모두 실패해야 한다.
  • 일관성 : 모든 트랜잭션은 일관성 있는 데이터베이스 상태를 유지해야 한다. 예를 들어 데이터베이스에서 정한 무결성 제약 조건을 항상 만족해야한다.
  • 격리성 : 동시에 실행되는 트랜잭션들이 서로에게 영향을 미치지 않도록 격리한다. 예를 들어 동시에 같은 데이터를 수정하지 못하게 해야한다. 격리성은 동시성과 같은 성능 이슈로 인해 격리 수준을 선택할 수 있다.
  • 지속성 : 트랜잭션을 성공적을 끝내면 그 결과가 항상 기록되어야 한다. 중간에 시스템에 문제가 발생해도 데이터베이스 로그 등을 사용해서 성공한 트랜잭션 내용을 복구해야 한다.

1.2 격리성(isolation)의 문제점

트랜잭션은 기본적으로 원자성, 일관성, 지속성을 보장한다. 문제는 격리성인데 완벽한 격리성을 위해서는 모든 트랜잭션을 차례대로 실행해야 한다. 이렇게 되면 동시 처리 성능이 매우 나빠지므로 개발자가 그 격리 수준을 잘 선택하여 사용해야한다.

1.3 격리 수준(Isolation Level)

ANSI 표준은 트랜잭션의 격리 수준을 다음과 같이 4단계로 나누어 정의했다.

1.3.1 READ UNCOMMITED(커밋되지 않은 읽기)

커밋하지 않은 데이터도 읽을 수 있다. READ UNCOMMITED는 DIRTY READ를 허용한다.

  • DIRTY READ : 예를 들어 트랜잭션1이 데이터를 수정하고 있는데 아직 커밋하지 않은 상태이다. 이때 트랜잭션 2가 수정 중인 데이터를 조회할 수 있다. 이를 DIRTY READ라 한다. 트랜잭션 2가 DIRTY READ한 데이터를 사용하는데 트랜잭션 1을 롤백하면 데이터 정합성에 심각한 문제가 발생할 수 있다.

1.3.2 READ COMMITED(커밋된 읽기)

커밋한 데이터만 읽을 수 있다. 따라서 DIRTY READ가 발생하지 않는다. 하지만 NON-REPEATABLE READ는 발생할 수 있다.

  • NON-REPEATABLE READ : 예를 들어 트랜잭션 1이 회원 A를 조회했다. 그리고 트랜잭션 2가 회원 A를 수정하고 커밋했다. 그 후 트랜잭션 1이 다시 회원 A를 조회하게되면 트랜잭션 2가 수정한 데이터를 조회하게 된다. 즉, 트랜잭션 1은 처음에 회원 A를 조회한 데이터와 그 다음에 회원 A를 조회한 데이터가 달라지게 된다. 이처럼 같은 데이터를 반복해서 읽을 수 없는 상태를 NON-REPEATABLE READ라고 한다.

1.3.3 REPEATABLE READ(반복 가능한 읽기)

한 번 조회한 데이터를 반복해서 조회해도 같은 데이터가 조회된다. 즉, NON-REPEATABLE READ는 발생하지 않는다. 하지만 PHANTOM READ는 발생할 수 있다.

  • PHANTOM READ : 예를 들어 트랜잭션 1이 10살 이하의 회원을 조회했다. 그리고 트랜잭션 2가 5살 회원을 추가하고 커밋했다. 그 후 트랜잭션 1이 다시 10살 이하의 회원을 조회하면 최초 조회했을 때보다 하나가 추가된 상태로 조회된다. 이처럼 반복 조회 시 결과 집합이 달라지는 것을 PHANTOM READ라고한다.

NON-REPEATABLE READ과 PHANTOM READ는 언뜻 보기에 같아보일 수 있다. 하지만 NON-REPEATABLE READ는 데이터가 수정되는 것을 얘기하고 PHANTOM READ는 데이터가 추가 혹은 삭제되는 것을 얘기한다.

1.3.4 SERIALIZABLE(직렬화 가능)

가장 엄격한 트랜잭션 격리 수준이다. 여기서는 앞에서 말한 모든 문제들이 발생하지 않는다. 하지만 동시성 처리 성능이 급격히 떨어질 수 있다.

정리

애플리케이션 대부분은 동시성 처리가 중요하므로 데이터베이스들은 보통 READ COMMITED 격리 수준을 기본으로 사용한다. 일부 중요한 비즈니스 로직에 더 높은 격리 수준이 필요하면 데이터베이스 트랜잭션이 제공하는 잠금 기능을 사용하면 된다.