Sinbum's blog
  • 인셉션 개발자
    • History
    • Editorial Board
    • 세미나
      • MS_빅데이터_분석_교육
      • Databricks_Musinsa_사례분석
      • Databricks_AMOREPACIFIC_사례분석
    • 개발자 꿀팁
  • 리눅스
    • 리눅스 기초
      • 기본명령어
      • 프록시서버
      • 온프레미스
      • systemd
      • 우분투 앱
      • vi 사용법
    • 도커
      • MSA 아키텍처
      • 도커 설명
      • 도커 설치
      • 도커 가이드
        • 컨테이너 만들기
        • 컨테이너 보관
        • 컨테이너 사용
        • 컨테이너 관리
        • 컨테이너 볼륨
        • 컨테이너 통신
        • 도커 연습
  • 언어
    • 자바
      • 자바(JAVA)는 무엇인가?
        • JVM 메모리
      • 자바 설치 가이드
      • 자바 언어 활용
        • 변수
        • static
        • 상수
        • 연산자
        • 제어문
        • 배열
        • CLI-자바사용
        • 클래스
        • 메소드
        • 값에의한 호출
        • GUI 프레임
        • 생성자
        • 오버로딩
        • 상속
        • 상속생성자
        • 접근제한자 와 가비지 컬렉션
        • 추상클래스 와 인터페이스
        • 다중구현
        • 예외처리
        • 컬렉션 프레임워크
        • 쓰레드
        • 네트워크
        • 다중 접속 서버 구현
      • 간단한 채팅 앱 개발하기
    • 파이썬
      • 파이썬(Python)은 무엇인가?
      • 파이썬 설치 가이드
      • 파이썬 언어 활용
        • 변수
        • 입력,출력
        • 타입선언
        • 자료구조
        • 주석처리
        • 문자열
        • 리스트
        • 반복문
        • 연산자
        • 조건문
        • 정규표현식
          • re 모듈
          • 메타문자1
          • 메타문자2
          • 그루핑
          • 전방탐색
          • 문자열 바꾸기
          • Greedy 와 Non-Greedy
      • 마치며...
  • 형상관리,CI/CD
    • 깃허브
      • 깃허브 협업 모델
      • 깃허브 설치 와 ssl
      • 깃허브를 잘쓰는 팁 모음
  • BigData
    • BigData 개념
      • OLTP,OLAP
      • ELT,ETL
      • DW
      • ObjectStorage
      • LambdaArc
      • OGG
    • Kafka
      • 환경설정 및 소스코드 다운로드
      • 아파치 카프카는?
        • 카프카의 시작
        • 카프카 특성
        • 빅데이터 아키텍처
      • 카프카 기초 개념
    • BuildApplications
      • Airflow
      • Grafana
    • PowerBi
      • DAX
        • REMOVEFILTERS
        • DAX_문법
        • DAX_함수
    • Azure
      • SynapseAnalytics
  • IOT
    • 아두이노
      • 설치 및 기초
      • 센서의 종류
      • led 출력하기
      • 시리얼 통신
      • 무선 통신
  • About
    • SINBUM
    • INTEREST
    • PROJECTS
      • 업무 프로젝트
      • 개인 프로젝트
        • 티스토리API를 사용한 블로그 앱
        • 노션 API와 블로그 연동 자동화 하기
        • 로지텍 마우스 수리
    • CONTACT
Powered by GitBook
On this page
  • 데이터 웨어하우스의 성질
  • 데이터 웨어하우스의 작동방식
  • 데이터레이크에서 웨어하우스까지
  • DW 와 DataMart
  1. BigData
  2. BigData 개념

DW

Data Warehouse 의 의미로 큰의미로 방대한 조직 내 분산 운영시 각각의 데이터 베이스 시스템을 통합 관리 합니다. 그렇기에 효율적인 의사 결정을 위한 기초를 제공하는 실무적인 활용방법으로써 사용됩니다.

데이터 웨어하우스는 하드웨어와 관리 소프트웨어,추출/변환/정렬 도구, 메타 데이터 등 최종 사용자로 하여금 활용 도구 등으로써 구성되어 있습니다.

데이터 웨어하우스의 성질

데이터 웨어하우스는 다음과 같은 특성을 가집니다.

  • 주제 지향적 (subjectoriented)

  • 통합적 (integrated)

  • 시계열적(timevarient)

  • 비휘발적(nonvolatile)

기술이 변화함에 따라 데이터를 저장하고 관리 분석하는 방법중 하나로 사용되는 개념인 DW는 대형 메인 프레임 등 기존의 플랫폼으로는 시간과 비용의 제약이 있었지만 병렬 서버의 등장과 자기 디스크 장치의 대용량화,저가격화로 인해서 가능하게 되었습니다. 병렬 서버를 사용해 여러 복수 프로세스로 처리 함으로써 높은 속도의 검색을 할 수 있기 때문입니다.

데이터 웨어하우스의 작동방식

조회 쿼리를 지속적으로 요청할 경우 정보시스템의 부하가 일어 날 수 있습니다.(운영,기간계 기스템 등) 그렇기에 운영하는 DB에서 DB서버에 무리 하지 않을때 따로 빼내서 분석만을 위한 DB에 저장을 하게 됩니다. 데이터 웨어하우스는 이러한 용도로 ㅈ사용됩니다.

  • 여러 소스의 데이터를 통합.

  • 과거 데이터를 분석.

  • 데이터 품질, 일관성 및 정확성 제공.

  • 트랜잭션 데이터베이스와 분석 처리를 분리해 두 시스템 모두의 성능을 향상.

데이터레이크에서 웨어하우스까지

데이터베이스나 레이크 에서 데이터를 연결하고 준비하면 웨어하우스로 이동한 후 보고를 수행합니다. 아래 아래 사진을 참고해 그림으로 보도록 하겠습니다.

또한 데이터 웨어하우스 에서 데이터를 연결하고 분석 후에 데이터를 공유하여 머신러닝 같은 기계 학습서비스와 함께 적용됩니다.

DW 와 DataMart

데이터 마트는 금융, 마케팅 영역 이나 특정 팀의 사업 요구를 만족시키기 위한 데이터 웨어 하우스 입니다. 규모는 데이터 웨어하우스에 비해서 더 작지만 집중적이며 사용자의 커뮤니티에 잘 맞는 데이터를 포함 시킬 수 있습니다. 데이터 마트는 데이터 웨어하우스에 속하는 소개념 이라고 볼 수 있습니다.

특징
데이터 웨어하우스
데이터 마트

범위

함께 통합된 중앙 집중식의 여러 주제 영역

분산된 특정 주제 영역

사용자

전사적

단일 커뮤니티 또는 부서

데이터 원본

여러 소스

단일 또는 몇 개의 소스,또는 데이터 웨어하우스에 이미 수집된 데이터의 일부

크기

대규모이며 수백 기가바이트에서 페타바이트에

이를 수 있음 소규모이며 대개 최대 수십 기가바이트에 이름

설계

하향식

상향식

데이터 세부 정보

완전한,상세 데이터

요약된 데이터를 포함할 수 있음

PreviousELT,ETLNextObjectStorage

Last updated 2 years ago

참고 이미지: DW in aws
참고 이미지: DW in aws

참고링크: aws