Sinbum's blog
  • 인셉션 개발자
    • History
    • Editorial Board
    • 세미나
      • MS_빅데이터_분석_교육
      • Databricks_Musinsa_사례분석
      • Databricks_AMOREPACIFIC_사례분석
    • 개발자 꿀팁
  • 리눅스
    • 리눅스 기초
      • 기본명령어
      • 프록시서버
      • 온프레미스
      • systemd
      • 우분투 앱
      • vi 사용법
    • 도커
      • MSA 아키텍처
      • 도커 설명
      • 도커 설치
      • 도커 가이드
        • 컨테이너 만들기
        • 컨테이너 보관
        • 컨테이너 사용
        • 컨테이너 관리
        • 컨테이너 볼륨
        • 컨테이너 통신
        • 도커 연습
  • 언어
    • 자바
      • 자바(JAVA)는 무엇인가?
        • JVM 메모리
      • 자바 설치 가이드
      • 자바 언어 활용
        • 변수
        • static
        • 상수
        • 연산자
        • 제어문
        • 배열
        • CLI-자바사용
        • 클래스
        • 메소드
        • 값에의한 호출
        • GUI 프레임
        • 생성자
        • 오버로딩
        • 상속
        • 상속생성자
        • 접근제한자 와 가비지 컬렉션
        • 추상클래스 와 인터페이스
        • 다중구현
        • 예외처리
        • 컬렉션 프레임워크
        • 쓰레드
        • 네트워크
        • 다중 접속 서버 구현
      • 간단한 채팅 앱 개발하기
    • 파이썬
      • 파이썬(Python)은 무엇인가?
      • 파이썬 설치 가이드
      • 파이썬 언어 활용
        • 변수
        • 입력,출력
        • 타입선언
        • 자료구조
        • 주석처리
        • 문자열
        • 리스트
        • 반복문
        • 연산자
        • 조건문
        • 정규표현식
          • re 모듈
          • 메타문자1
          • 메타문자2
          • 그루핑
          • 전방탐색
          • 문자열 바꾸기
          • Greedy 와 Non-Greedy
      • 마치며...
  • 형상관리,CI/CD
    • 깃허브
      • 깃허브 협업 모델
      • 깃허브 설치 와 ssl
      • 깃허브를 잘쓰는 팁 모음
  • BigData
    • BigData 개념
      • OLTP,OLAP
      • ELT,ETL
      • DW
      • ObjectStorage
      • LambdaArc
      • OGG
    • Kafka
      • 환경설정 및 소스코드 다운로드
      • 아파치 카프카는?
        • 카프카의 시작
        • 카프카 특성
        • 빅데이터 아키텍처
      • 카프카 기초 개념
    • BuildApplications
      • Airflow
      • Grafana
    • PowerBi
      • DAX
        • REMOVEFILTERS
        • DAX_문법
        • DAX_함수
    • Azure
      • SynapseAnalytics
  • IOT
    • 아두이노
      • 설치 및 기초
      • 센서의 종류
      • led 출력하기
      • 시리얼 통신
      • 무선 통신
  • About
    • SINBUM
    • INTEREST
    • PROJECTS
      • 업무 프로젝트
      • 개인 프로젝트
        • 티스토리API를 사용한 블로그 앱
        • 노션 API와 블로그 연동 자동화 하기
        • 로지텍 마우스 수리
    • CONTACT
Powered by GitBook
On this page
  • ETL
  • ELT
  1. BigData
  2. BigData 개념

ELT,ETL

PreviousOLTP,OLAPNextDW

Last updated 2 years ago


추출하고 변환하고 적재하는 과정으로써 데이터가 생기는 지점이나 원천 데이터로부터 데이터를 가져오고 그것을 재사용하기 위해 통일성(데이터프레임)을 갖춘 형태를 가지며 다시 적재하는 과정을 말합니다.

쉽게 표현하면 여러 데이터를 가지고 변환해서 이쁘게 담는 것이라고 생각하면 됩니다.

  • E: Extract

  • T: Transform

  • L: Load

ETL 과 ELT 사이에서는 사용 목적과 ‘key’ 차이에 있어서 아주 중요 하게 고려되어야 합니다.

ETL

ETL (Extract, Transform, Load)은 데이터 인테그레이션 기술로써 소스로부터 원천데이터를 변환 시켜 가져오도록합니다. ETL은 1970년대 부터 시작된 방식이며, 온프레미스 데이터 방식에서 아주 강력하게 사용 되었습니다. 그러나 온라인 시장에서의 흐름으로 클라우드 서비스가 제공되며 그흐름이 점차 바뀌고 있습니다.

ELT

ETL과는 다르게 변환과 적재 방식에서 차이가 있습니다. 어떤 원천 데이터 소스로부터 먼저 적재 하는 방식으로 써 쓰입니다. ELT는 새로운 개발 방식이며 온라인서비스의 시작으로 그 방법론이 변화되고 있습니다. 예를 들어 ELT의경우 모든 데이터를 추출하고 Snowflake, Amazon Redshift, Google BigQuery 등 클라우드 서비스 등에 적재를 시작합니다. 필요할때마다 연산처리와 함께 먼저 적재된 데이터를 가지고 변환 및 데이터를 그때그때 받아볼 수 있습니다. 현재는 많이 사용 되는 방식은 아니지만 점점 유명해지는 추세이며 클라우드 인프라에서 그방식이 사용 되어지고 있습니다.

ELT를 사용하는 경우 다음과 같을때가 훨씬 효용가치가 있습니다.

  • 방대한 양의 데이터를 보유한경우.

    • 현 시대에서는 방대한 양이 데이터가 증가되고 있습니다.

  • 가능한 한 빨리 데이터를 보관해야 하는경우.

    • 연산처리가 이루어지기 전에 데이터를 적재하여 미리 로드합니다.

  • 데이터를 처리 하는 자원이 부족한 경우.

    • ETL시 웨어하우스에 도착전 파이프라인에서 연산 및 데이터 변환 처리가 일어나야 합니다. 이때 자원사용량이 많을 수 있으므로 ELT 방식을 구축한다면 경제적으로 유연성을 가질 수 있습니다.

참고링크 : rivery.io/blog
참고링크 : rivery.io/blog
참고 이미지
참고 이미지