[DB] DBMS 기초

CS/Data Base

[DB] DBMS 기초

hojak99 2017. 5. 18. 20:38

DBMS (DB Management System) :

- 데이터베이스를 관리하는 시스템

DB : 테이블들이 모여 이루는 데이터 단위

- 데이터를 저장하고 유지보수(수정, 삭제, 추가)하고 이를 검색하는 시스템

CRUD(Create, Retrieve, Update, Delete)

- 대량의 데이터를 처리하는 시스템

- 다양한 자료구조와 검색 구조를 사용해 빠른 검색 가능

- 대부분의 시스템은 검색 >> >> 업데이트의 빈도수가 많음

- 검색에 최적화

정렬 :

- 빠른 검색을 위해서 데이터는 반드시 정렬되어 있어야 한다.

- 정렬 되어 있지 않다면 평균적으로 전체 데이터의 절반 필요

(최선: 1, 최악: N, 평균: N/2)

- 정렬되어 있을 경우 데이터를 빠른 시간 안에 찾을 수 있음

(O(Nlog)-O(N제곱))

- 퀵 정렬 / 힙 정렬 계열이 주로 사용된다.

인덱스 :

인덱스 종류

- 이진검샘(Binary Search) :

최대 log2(N) 번 내에 검색 가능

- B-Tree 계열 :

최대 log3(N) 번 내에 검색 가능

상용 DBMS 에서 가장 일반적으로 많이 사용됨

데이터 추가, 수정 및 삭제할 때마다 정렬 / 인덱스 업데이트가 일어난다.

이진탐색 (Binary Search) :

- 데이터를 정렬 후 "test" 단어를 검색하는 경우

· 한가운데 값을 확인 -> "sample" -> 뒤쪽 절반

· 뒤쪽 중 한가운데 확인 -> "zeal" -> 앞쪽 절반

· 계속 반복해 "test" 단어가 나올 때까지 계속

예) 1,000 개의 데이터가 있을 경우에 10번만 찾으면 데이터를 찾는 것이 이론적으로 보장됨

2 N제곱 > 1000 인 값(N=10)

· 데이터가 추가 / 삭제/ 변경될 때마다 한가운데 / 왼쪽 가운데 / 오른쪽 가운데 값 등을 미리 계산해 놓음 (인덱스라고 통칭 함)

B-트리 (B-Tree) :

- 이진 탐색과 유사하지만 한 번에 비교를 2번 한다 (a, b : a < b)

작은 값 보다 작은 경우 (x < a)
큰 값과 작은 값 사이인 경우 (a < x < b)
큰 값보다 큰 경우 (x > b)

- B-트리 계열 > 이진 검색 계열

O(log3N) > (O(log2N)

데이터가 추가 / 삭제 / 변경될 때마다 a, b 값을 업데이트

DBMS 의 종류 :

- 계층 형 데이터베이스

- 네트워크 형 데이터베이스

- 관계형 데이터베이스 (RDBMS - Relational DBMS)

- 객체지향 데이터베이스

- 객체 관계형 데이터베이스 (ORDBMS)

- NoSQL (Not Only SQL)

RDBMS 란 :

- 관계형 데이터베이스 시스템

- 테이블 기반의 DBMS

테이블-컬럼 형태의 데이터 저장 방식
테이블과 테이블 간의 연관관계 (주로 외래키 형태)를 이용해 필요한 정보를 구하는 방식
모델링은 E-R(Entity Relationship) 모델을 사용
테이블을 엔티티(기본)와 릴레이션십(유도) 테이블로 구분하는 방식

- 데이터를 테이블 단위로 구분

하나의 테이블은 여러 개의 컬럼으로 구성된다

- 테이블끼리의 중복 정보는 최소화 시킴

동일한 데이터가 여러 군데 중복되어 존재하면 데이터의 수정 시 문제 발생 확률이 높아지기 때문
정규화(Normalize) -> 정규형

- 사용방식

여러 테이블을 합쳐 큰 테이블을 생성(Join)해서 필요한 정보를 찾아내는 방식

기본용어 :

- 스키마

DB, 테이블 정의 내역

- SQL 쿼리

관계형 DBMS 를 사용하는 전용 질의 언어
대소문자 가리지 않음

- 기본키 (Primary Key : PK)

테이블에서 하나의 레코드를 지정할 수 있는 하나 이상의 컬럼 집합
예) 주민등록번호, SSN(Social Security Number)

- 외래키 (Foreign Key : FK)

어떤 테이블의 기본 키가 다른 테이블의 컬럼에 들어 있을 경우

- 테이블 (Table)

정보들의 묶음 단위
예) 학교, 학생, 교수 ....

- 컬럼 (Column)

테이블을 구성하는 정보들
예) 학생 테이블 - 이름, 주소, 전화, 번호, 나이, 성별 ....

- 레코드 (Record)

테이블에 들어 있는 여러가지 인스턴스 하나하나를 지정
대학교의 학과 테이블
예) 경영학과, 미술학과, 수학과, 컴퓨터 공학과 ...
기본키(PK)로 구별 가능

- 도메인 값(Domain Value)

각 컬럼에서 나올 수 있는 후보 값
예) 학기 컬럼에서 나올 수 있는 후보 값은 1, 2학기가 있다.

저작자표시 비영리 변경금지

현재글[DB] DBMS 기초

한성보스몬스터,

Today :
Yesterday :

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

hojak99 의 블로그

[DB] DBMS 기초

'CS/Data Base'의 다른글

티스토리툴바

[DB] DBMS 기초

'CS/Data Base'의 다른글

관련글

티스토리툴바