데이터 마트 구축을 위한 다차원 모델 설계(2/3)
2. 다차원 모델의 구성요소 및 종류
다차원 모델은 비즈니스 사용자에게 이해하기 쉬운 데이터를 제공하고 빠른 쿼리 성능을 보장하기 위한 데이터 모델이다. 즉, BI 설루션 또는 OLAP 툴을 통해 분석 데이터를 제공하기 위한 데이터 모델이다.
2.1 다차원 모델의 구성요소
다차원 모델의 구성요소는 디멘전(Dimension)와 팩트(Fact) 테이블로 구성된다.
디멘전 테이블은 비즈니스 프로세스 이벤트와 관련된 배경 설명을 담고 있으며 이벤트와 관련된 “누가, 언제, 어디서, 무엇을, 어떻게, 왜”를 설명한다. 차원, Lookup 또는 분석 관점이라고도 한다.
팩트 테이블은 비즈니스 프로세스 이벤트에서 발생하는 값을 말한다. 즉, 분석의 대상이 되는 수치 정보(Numeric data)이다. 팩트 테이블은 그레인(grain)이라 불리는 특정한 상세 수준으로 데이터가 저장된다. 사실, 관심항목, 메저(Measure) 또는 Metric 이라고도 한다.
일부 혹자는 팩트 테이블은 요약 데이터를 위한 것이다라는 오해가 존재하는데 팩트 테이블은 원천 테이블의 트랜잭션 레벨 즉, 상세 수준으로 데이터를 관리한다. 필요 시 요약 데이터를 관리한다.
다차원 모델은 정규화한 ER 모델에서 다수의 테이블 중 동일 레벨의 데이터는 하나의 팩트 테이블로 합쳐서 관리한다. 정규화 모델처럼 트랜잭션 단위의 상세 데이터 즉, ROW 데이터를 팩트 테이블에서 관리한다. 최하 레벨의 상세 데이터를 관리함으로써 변화나 특이 상황에 영향을 받지 않고 분석할 수 있는 환경을 제공할 수 있다.
다차원 모델은 데이터 모델을 단순화하고 가독성을 높여 사용자가 쉽게 직접 질의하여 원하는 분석 결과를 제공받을 수 있는 데이터 모델이다.
또한, 다차원 모델은 데이터 중복을 허용하는 비정규화 모델이다.
2.2 다차원 모델의 종류
다차원 모델은 스노우플레이크 스키마(Snowflake Schema) 또는 스타 스키마(Star Schema)로 구분한다.
기본적으로 다차원 모델의 적용은 OLAP 툴이 지원하는 스키마 형태로 적용한다. OLAP 툴이 두 개의 스키마 모두 지원한다면 장단점을 비교 후 선택하여 적용한다.
다차원 모델의 형태는 아래와 같다.
2.2.1 스노우플레이크 스키마
스노우플레이크 스키마는 디멘전 테이블이 정규화되어 있는 구조이다. 차원 요소마다 1개의 테이블로 구성한다. 디멘전 테이블에 차원 정보와 상위 테이블로 조인하기 위한 조인 키가 존재한다.
스노우플레이크 스키마는 디멘전 테이블의 유연성이 높다. 하나의 디멘전 내에 여러 개의 계층(Hierarchy)을 지원하고 차원 요소 간의 M:N 관계 표현이 가능하다.
2.2.2 스타 스키마
스타 스키마는 디멘전 테이블이 비정규화 되어 있는 구조이다. 디멘전마다 1개의 테이블로 구성한다. 스노우플레이크 스키마를 비정규화한 형태이다.
스타 스키마는 디멘전 테이블의 수가 상대적으로 적어 유지/관리가 용이하다.
▶ prev : 데이터 마트 구축을 위한 다차원 모델 설계(1/3)
▶ next : 데이터 마트 구축을 위한 다차원 모델 설계(3/3)
'다차원 모델링' 카테고리의 다른 글
데이터 마트 구축을 위한 다차원 모델 설계(3/3) (0) | 2024.04.21 |
---|---|
데이터 마트 구축을 위한 다차원 모델 설계(1/3) (0) | 2024.04.21 |