DW

Data Warehouse 의 의미로 큰의미로 방대한 조직 내 분산 운영시 각각의 데이터 베이스 시스템을 통합 관리 합니다. 그렇기에 효율적인 의사 결정을 위한 기초를 제공하는 실무적인 활용방법으로써 사용됩니다.

데이터 웨어하우스는 하드웨어와 관리 소프트웨어,추출/변환/정렬 도구, 메타 데이터 등 최종 사용자로 하여금 활용 도구 등으로써 구성되어 있습니다.

데이터 웨어하우스의 성질

데이터 웨어하우스는 다음과 같은 특성을 가집니다.

  • 주제 지향적 (subjectoriented)

  • 통합적 (integrated)

  • 시계열적(timevarient)

  • 비휘발적(nonvolatile)

기술이 변화함에 따라 데이터를 저장하고 관리 분석하는 방법중 하나로 사용되는 개념인 DW는 대형 메인 프레임 등 기존의 플랫폼으로는 시간과 비용의 제약이 있었지만 병렬 서버의 등장과 자기 디스크 장치의 대용량화,저가격화로 인해서 가능하게 되었습니다. 병렬 서버를 사용해 여러 복수 프로세스로 처리 함으로써 높은 속도의 검색을 할 수 있기 때문입니다.

데이터 웨어하우스의 작동방식

조회 쿼리를 지속적으로 요청할 경우 정보시스템의 부하가 일어 날 수 있습니다.(운영,기간계 기스템 등) 그렇기에 운영하는 DB에서 DB서버에 무리 하지 않을때 따로 빼내서 분석만을 위한 DB에 저장을 하게 됩니다. 데이터 웨어하우스는 이러한 용도로 ㅈ사용됩니다.

  • 여러 소스의 데이터를 통합.

  • 과거 데이터를 분석.

  • 데이터 품질, 일관성 및 정확성 제공.

  • 트랜잭션 데이터베이스와 분석 처리를 분리해 두 시스템 모두의 성능을 향상.

데이터레이크에서 웨어하우스까지

데이터베이스나 레이크 에서 데이터를 연결하고 준비하면 웨어하우스로 이동한 후 보고를 수행합니다. 아래 아래 사진을 참고해 그림으로 보도록 하겠습니다.

또한 데이터 웨어하우스 에서 데이터를 연결하고 분석 후에 데이터를 공유하여 머신러닝 같은 기계 학습서비스와 함께 적용됩니다.

DW 와 DataMart

데이터 마트는 금융, 마케팅 영역 이나 특정 팀의 사업 요구를 만족시키기 위한 데이터 웨어 하우스 입니다. 규모는 데이터 웨어하우스에 비해서 더 작지만 집중적이며 사용자의 커뮤니티에 잘 맞는 데이터를 포함 시킬 수 있습니다. 데이터 마트는 데이터 웨어하우스에 속하는 소개념 이라고 볼 수 있습니다.

특징데이터 웨어하우스데이터 마트

범위

함께 통합된 중앙 집중식의 여러 주제 영역

분산된 특정 주제 영역

사용자

전사적

단일 커뮤니티 또는 부서

데이터 원본

여러 소스

단일 또는 몇 개의 소스,또는 데이터 웨어하우스에 이미 수집된 데이터의 일부

크기

대규모이며 수백 기가바이트에서 페타바이트에

이를 수 있음 소규모이며 대개 최대 수십 기가바이트에 이름

설계

하향식

상향식

데이터 세부 정보

완전한,상세 데이터

요약된 데이터를 포함할 수 있음

Last updated