Cloud

DataBase

체원 2022. 5. 30. 14:55
클라우드와 데이터처리

⛅ 클라우드 현황

모든 분야의 기업에서 클라우드 채택 가속화 중 
문제 : 마이그레이션 ➡ 각 기업 워크로드의 60%는 여전히 온프레미스 


클라우드 개념과 용어

cloud

  • 가상화 ➡ 사용자 구성, 제공 업체 관리 및 유지 보수
  • 핵심 : 가상화, 분산컴퓨팅 기술력

Public/Private & Hybrid Cloud

Public Cloud

  • 공용
  • 개별 조직이 소유

 

 

Private Cloud

 

  • 사설
  • sw 서비스를 사용료를 내고 이용

 

 

Hybrid Cloud

 

  • Public + Private 결합 형태

CSP

  • Cloud Service Provider
  • ex) aws, gcp, azure, ncloud, kt-biz
  • CSP 사업자에 따라 Disk iop, 네트워크 제공 스펙, private network, 보안 수준이 다름

 

MSP

  • Managed Service Provider
  • 네트워크를 통해 여러 기업들에게 network, app, system, e-management 서비스 제공 사업자
  • 컨설팅과 시스템 구축은 물론 사후 서비스까지 클라우드와 관련된 모든 서비스를 제공

IaaS / PaaS / SaaS

IaaS

  • CPU core 수, memory 용량, disk 사이즈 등 필요한 만큼의 자원을 선택
  • On-demand 과금

 

Paas

  • 태동은 미들웨어와 유사
    • 미들웨어 없이 AP 개발 힘들듯이,
    • PaaS없이 클라우드 플랫폼 위에서 개발하는 일은 어려움
  • 개발 환경 구성, 확장성, 가용성, 보안 제공
  • 빠른 개발 환경 지원

 

 

SaaS

 

  • 다양한 목적의 SaaS app들이 클라우드 인프라 위에서 실행


💾 Database 개념

여러 사람에 의해 공유되어 사용될 목적으로 통합하여 관리되는 데이터의 집합

 

관계형 DB

 

DBMS

 데이터의 집합을 만들고, 저장 및 관리할 수 있는 기능들을 제공하는 응용 프로그램이다.

즉, 데이터의 관리에 특화된 프로그램이라고 생각하면 편하다

  • 종류 : 오라클, MySQL, MariaDB, PostgreSQL, SQLite, MongoDB ···

DBMS Architeture

 

AWS의 클라우드 DataBase

https://aws.amazon.com/ko/free/database


📌 빅데이터

 

빅데이터 3대 요소 (3V)

  • Volume
  • Variety
  • Velocity

빅데이터 프로젝트 도전과 좌절

 

  • 이용 목적이 명확하지 않은 데이터 수집은 무의미

개인화 추천 시스템과 같은 빅데이터 시장


전통적인 데이터 분석 시스템 (방법)

 

 

  • 많은 비용과 기간이 필요한 웨어하우스 보다는 부서별 마트를 먼저 구축
    • 운영 시스템 → 데이터 마트 → 사용자
    • 여러 데이터 마트간의 데이터 중복 등 문제 발생
  • 전사 용도의 데이터 웨어하우스 구축
    • 운영 시스템 → 웨어하우스 → 데이터 마트 → 사용자
  • RDBMS 기반
  • schema 미리 정의 (데이터 로딩 위함)
  • 정기적 리포트 생성, 간단한 Ad-hoc 분석
  • 대규모 비용 선투자

AWS를 활용한 빅데이터 분석 시스템

Soure ➡ Data lake ➡ DW / Mart
  • 관계형/비정형 데이터 모두 저장
  • DW와 Data Lake간 쉬운 데이터 이동
  • Cataloging을 통한 가시성, 데이터거버넌스
  • 인사이트 얻기 위한 다양한 분석 엔진 사용
  • 낮은 비용의 스토리지, 낮은 선투자 비용

AWS는 빅데이터 분석 시스템을 위한 모든 서비스를 제공

  • Data Lake(S3)
    • 특징 : Raw Date를 그대로 저장
    • Insight 미리 예측 불가능
    • 다양한 원시 데이터를 가공하여 분석하는 과정에서 발견되는 경향이 있음
    • 카탈로깅 필요
  • Data Warehouse (Redshift)
    • Columnar, MPP, Nvme SSD
  • BI (QuickSight)
    • Date Lake와 Data Warehouse 동시 연결성 제공, 통합적 분석 가능