컴퓨팅 기술/데이터베이스시스템

해싱(Hasing)의 개념 해시(Hash) 탐색키에 산술적인 연산을 통해 버킷 주소를 계산하는 해시 함수를 사용하여 데이터 배분 및 접근하는 기법 아래 이미지와 같다고 생각하시면 됩니다. 여기서 버킷(Bucket)이란 한 개 이상의 레코드를 저장할 수 있는 저장공간의 단위로, 일반적으로 디스크 블록의 크기와 일치한 크기를 지닌다. 해시의 구조 아래 이미지처럼 탐색키가 해시 함수를 거치면 어느 버킷에 저장되는지 정해지는 것 해시의 사용 그렇다면 어떻게 데이터를 꺼낼 수 있는가? 아래처럼 값을 입력하면 그에 상응하는 버킷을 알려줌 그렇다면 해시 함수의 역할은 자연스럽게, 여러 버킷에 균등하게 제공해야 한다, 만약 한 버킷에 모든 레코드를 저장하다면 해시의 성능이 확 떨어짐 => 실제 해시 인덱스에서는 완벽한..
인덱스의 이해 인덱스의 개념 인덱스(Index) : DBMS에서 요청된 레코드에 빠르게 접근할 수 있도록 지원하는 데이터와 부가적인 구조 인덱싱(Indexing) : 인덱스를 구성하고 생성하는 작업 => 인덱스의 탐색키를 이용하여 해당 레코드가 저장된 블럭에서 디스크 저장 장치 또는 메모리에서 파악하여 해당 블럭을 빠르게 적재할 수 있음 탐색키 : 파일에서 레코드를 찾는데 사용되는 컬럼이나 컬럼의 집합 인덱스 기반의 검색 과정 기존에는 디스크에서 메모리에 모든 컬럼을 올린다면 인덱스를 이용한다면 메모리에는 인덱스만을 올리고 필요할 때 추가 컬럼을 가져오는 방식을 이용 => 인덱스가 컬럼의 집합보다 크기가 작기 때문에 가능 인덱스의 종류 순서 인덱스 : 특정 값에 대해 정렬된 순서 구조 해시 인덱스 : 버..
데이터베이스의 데이터가 저장되는 공간은 무엇일까? 아래는 컴퓨터 내부의 저장 공간의 종류입니다, 내려갈 수록 저장 요량이 커지며, 올라올 수록 속도와 가격이 높아집니다.(행 기준) 명칭 특성 설명 레지스터 (Register) 휘발성 극히 소량의 데이터나 처리중인 중간 결과와도 같은 프로세스가 바로 사용할 수 있는 데이터를 담는 영역 캐시 (Chache Memory) 휘발성 고비용 저장장치로 빠른 접근 속도를 보장 메인 메모리 (Main Memory) 비휘발성 실제 프로그램과 데이터 적재 공간 자기 디스크 (Magnetic Disk) 플래시 메모리 (Flash Memory) 비휘발성 자기 디스크 : 데이터베이스 전체를 안정적으로 저장 플래시 메모리 : 메인 메모리와 유사하나 비휘발성, 전기적으로 데이터를 ..
데이터의 중복의 문제점 - 일관성 유지의 어려움 - 저장 공간의 낭비 갱신 이상 - 삽입 이상 : 레코드 추가 시 불필요한 컬럼의 값이 없이는 추가를 못함 - 삭제 이상 : 삭제시 의도치 않았던 데이터도 삭제되는 경우 - 수정 이상 : 중복 저장된 레코드를 수정 시 모두 안되어 DB의 일관성이 깨지는 경우 데이터베이스에서 나쁜 릴레이션의 예시 등급, 할인율에서 중복 데이터를 사용 => 할인율 변경 시나 등급 변경 시 일관성 유지가 어려움 데이터베이스에서 좋은 릴레이션의 예시 새로운 테이블 만듦으로써 할인율의 삽입, 삭제, 수정 등이 용이해짐 + 데이터가 많아질 경우 데이터의 사용 공간을 절약함 위에서 어느 릴레이션을 나눌지 정하는 요소가 바로 함수적 종속성이다 정의 1. 릴레이션 인스턴스를 분석하여 속성..
DSeung
'컴퓨팅 기술/데이터베이스시스템' 카테고리의 글 목록