반응형

# SQLD 1과목 데이터 모델링의 이해 정리

## 발생 시점에 따른 엔터티 분류

  1. 기본 / 키 엔터티 (Fundamental Entity, Key Entity)
  2. 중심 엔터티 (Main Entity)
  3. 행위 엔터티 (Active Entity)

 

## 데이터 모델링

  • 정보시스템을 구축하기 위한 데이터 관점의 업무 분석 기법이다.
  • 현실 세계의 데이터에 대해 약속된 표기법에 의해 표현하는 과정이다.
  • 데이터베이스를 구축하기 위한 분석/설계의 과정이다.
  • (일정한 형식에 맞추어 표현하는 추상화의 의미를 가질 수 있다. 복잡한 현실을 제한된 언어, 표기법을 통해 이해하기 쉽게 하는 단순화 의미를 가질수 있다. 애매모호함을 배제 누구나 이해가 가능하도록 정확하게 현상을 기술하는 정확화의 의미를 가진다. 모델링은 단지 시스템 구현만을 위해 수행하는 타스크가 아니고 시스템 구현을 포함한 업무분석 및 업무형상화를 하는 목적이 있다.)

 

## 데이터 모델링이 필요한 이유

  • 업무 정보를 구성하는 기초가 되는 정보에 대해 일정한 표기법에 의해 표현
  • 분석된 모델을 갖고 데이터베이스를 생성하여 개발 및 데이터관리에 사용하기 위함
  • 데이터모델링 자체로서 업무의 흐름을 설명, 분석하는 부분에 의미

 

## 데이터 모델링의 유의점

  1. 중복 (Duplication)
  2. 비유연성 (Inflexibility) : 데이터 모델을 어떻게 설계했냐에 따라 사소한 업무변화에 데이터 모델이 수시로 변경되어 유지보수의 어려움을 가중시킬 수 있다. 데이터의 정의를 데이터 사용 프로세스와 분리 해서 데이터베이스에 중대한 변화를 일으킬 수 있는 가능성을 줄인다.
  3. 비일관성 (Inconsistency)

 

## 데이터 모델링 종류

  1. 개념적 데이터 모델링 : 추상화 수준이 높고, 자시중심적, 전사적 데이터 모델링, EA 수립시 많이 이용
  2. 논리적 데이터 모델링 : Key, 속성, 관계 등을 정확하게 표현, 재사용성 높음
  3. 물리적 데이터 모델링 : 실제로 데이터베이스에 이식할 수 있게, 물리적 성격을 고려한 것

 

## 데이터베이스의 스키마 구조

  1. 외부 스키마 (External Schema)
  2. 개념 스키마 (Conceptual Schema) : 통합한 조직 전체 관점의 통합적 표현
  3. 내부 스키마 (Internal Schema)

 

## ERD

  • 피터첸에 의해 E-R Model라는 표기법이 만들어졌다.
  • ERD 작성은 엔터티 도출 > 엔터티 배치 > 관계 설정 > 관계명 기술 > 관계 참여도 기술 > 관계의 필수여부 기술 순으로 진행

 

## 엔터티의 특징

  • 반드시 해당 업무에서 필요, 관리하고자 하는 정보이어야 함
  • 유일한 식별자에 의해 식별 가능해야 함 (유일한 식별자)
  • 영속적으로 존재하는 인스턴스의 집합이어야 함
  • 업무 프로세스에 의해 이용되어야 함
  • 반드시 속성이 있어야 함 (속성 없는 엔터티는 있을 수 없다.)
  • 다른 엔터티와 최소 한 개 이상의 관계가 있어야 함 (통계성, 코드성 엔터티의 경우 관계 생략 가능)

 

## 기본 엔터티 (키 엔터티)

  • 다른 엔터티로부터 주식별자를 상속받지 않고, 자신의 고유한 주식별자를 갖는다.
  • 사원, 부서, 고객, 상품, 자재 등이 대표적인 예

 

## 엔터티

  • 두개 이상의 인스턴스의 집합이어야 함
  • 두개 이상의 속성을 갖는다.

## 속성

  • 한 개 이상의 속성값을 갖는다.
  • 속성은 인스턴스에서 관리하고자 하는 의미상 더 이상 분리되지 않는 최소의 데이터 단위
  • 속성은 엔터티에 대한 자세하고 구체적인 정보를 나타냄
  • 하나의 엔터티는 두개 이상의 속성을 갖는다.
  • 속성도 집합이다.

 

## 엔터티 이름 부여 방법

  • 현업의 업무 용어를 사용, 업무상의 의미를 분명하게 함
  • 모든 엔터티에서 유일한 이름이 부여되어야 함
  • 생성되는 의미대로 자연스럽게 이름 부여되어야 함

 

## 속성의 특성에 따른 분류

  1. 기본 속성 : 원래 갖고 있어야 하는 속성
  2. 설계 속성
  3. 파생 속성 : 원래 속성 값을 계산해서 만든 속성

 

## 도메인

  • 각 속성이 가질 수 있는 값의 범위.
  • 엔터티 내 속성에 대한 데이터 타입, 제약사항을 지정한다.

 

## 속성 명칭 부여

  • 해당 업무에서 사용하는 이름을 부여
  • 서술식 속성명 사용 금지
  • 약어사용 가급적 제한
  • 유일성을 확보하는 것이 좋다.

 

## 데이터모델링의 관계

  • 관계는 존재에 의한 관계, 행위에 의한 관계로 구분될 수 있으나, ERD에서 관계를 연결할 때 존재와 행위를 구분하지 않고 단일화된 표기법 사용
  • UML에는 클래스다이어그램의 관계 중 연관관계, 의존관계가 존재, 실선과 점선의 표기법 서로 다르게 표기
  • 존재적 관계 사례 : 부서와 사원 엔터티 간의 소속 관계
  • 행위에 의한 관계 사례 : 주문과 배송 엔터티 간의 배송 근거 관계

 

## 관계 표기법

  1. 관계명 : 관계의 이름
  2. 관계차수 : 1:1, 1:M, M:N 등 관계의 기수성
  3. 관계 선택사양 : 필수관계, 선택관계

 

## 두 개의 엔터티 사이 정의한 관계를 체크하는 사항

  • 두 개의 엔터티 사이에 관심 있는 연관규칙이 존재하는가?
  • 두 개의 엔터티 사이에 정보의 조합이 발생되는가?
  • 업무기술서, 장표에 관계연결을 가능하게 하는 동사가 있는가?
  • 업무기술서, 장표에 관계연결에 대한 규칙이 서술되어 있는가?

 

## 관계 읽기

  • 기준(Source) 엔터티를 한 개(One) 또는 각(Each) 읽는다.
  • 대상(Target) 엔터티의 관계참여도(개수)를 읽는다.
  • 관계 선택사양과 관계명을 읽는다.

 

## 식별자의 종류

  • 엔터티 내에서 대표성을 갖느냐에 따라 : 주식별자, 보조식별자
  • 엔터티 내에서 스스로 생성되었는지에 따라 : 내부식별자, 외부식별자
  • 단일 속성으로 식별이 되는가에 따라 : 단일식별자, 복합식별자
  • 원래 업무적으로 의미있던 식별자 속성을 대체하여 일련번호와 같이 새롭게 만든 식별자 구분을 위해 : 본질식별자, 인조식별자

 

## 주식별자를 지정할 때 고려할 사항

  • 주식별자에 의해 엔터티 내 모든 인스턴스들이 유일하게 구분 되어야 한다.
  • 주식별자를 구성하는 속성의 수는 유일성을 만족하는 최소의 수가 되어야 한다.
  • 지정된 주식별자의 값은 자주 변하지 않는 것이어야 한다.
  • 주식별자가 지정되면 반드시 값이 들어와야 한다.

 

## 주식별자의 특성

  1. 유일성 : 모든 인스턴스를 유일하게 구분
  2. 최소성 : 주식별자를 구성하는 속성의 수는 유일성을 만족하는 최소의 수가 되어야 함
  3. 불변성 : 한 번 특정 엔터티에 지정되면 값이 변하지 않아야 함
  4. 존재성 : 주 식별자가 지정되면 반드시 데이터 값이 존재(Null 불가)

 

## 비식별자관계 선택 기준

  • 관계의 강약을 분석, 상호간 연관성이 약할 경우 고려
  • 자식 테이블에서 독립적인 Primary Key의 구조를 가지기 원할 때 고려
  • 모든 관계가 식별자 관계로 연결될 경우 WHERE 절에서 비교하는 항목이 증가되어 조인에 참여하는 테이블에 따라 SQL문장이 길어져 SQL문의 복잡성이 증가되는 것을 방지하기 위해 고려

 

## 비식별자 관계 연결을 고려해야 하는 경우

  • 부모엔터티에 참조값이 없어도 자식엔터티의 인스턴스가 생성될 수 있는 경우
  • 여러 개의 엔터티를 하나로 통합하면 각각의 엔터티가 갖고 있던 여러 개의 개별 관계가 통합되는 경우
  • 자식쪽 엔터티의 주식별자를 부모엔터티와는 별도로 생성하는 것이 더 유리하다고 판단하는 경우
  • 엔터티별로 데이터의 생명주기를 다르게 관리할 경우
반응형

+ Recent posts