AWS Summit Seoul 2024

AWS Summit Seoul 2024

1.Key Note

  • Gen Ai (생성형 Ai) 시대의 도래

2.카카오페이 손해보험 클라우드 DX

  • 원장 데이터베이스의 집중도를 줄이기 위한 시도
    • 원장: 거래를 계정별로 기록하는 장부
  • 메시징 기반의 Event Driven 비지니스 로직 처리
  • 비용절감을 위한 95%의 Graviton (ARM) CPU 노드 사용 (EKS)
  • 년 1회 실서버 재해복구 훈련 및 카오스 엔지니어링
  • 서버리스 기반 데이터 레이크 구성
  • 용어 설명
    • EDA(Exploratory Data Analysis)
    • Kafka: 실시간으로 기록 스트림을 게시, 구독, 저장 및 처리할 수 있는 분산형 데이터 스트리밍 플랫폼
    • Amazon ElastiCache: Redis와 호환되는 AWS의 인메모리 데이터스토어
    • Amazon Document DB: 완전관리형 기본 JSON 도큐먼트 데이터베이스 (Mongo DB 호환)
    • AWS Datalake: 데이터 저장과 분석용 솔루션 모음

3.LG화학 MES 클라우드 전환

  • 수많은 PoC를 통한 가설 검증
    • 예) 250 SPM
  • 모니터링 이상감지
  • AWS Outpost 사용으로 보안 이슈 해결
  • Outpost vs Region간 AMI 상호 Provisioning 가능
  • 랙타입 서버만 Outpost Full Service 가능
  • Outpost 도입시 사전 체크 시간이 제법 걸림 (한달 이상)
    • Network
    • 전원
    • 공조장치
    • BGP Protocol
  • 응용과 인프라의 협업이 중요
  • 용어 설명
    • AWS Outpost: 온프레미스 프라이빗 클라우드
    • FDC(Fault Detection Control): 결함관리
    • LMS(Line Management System): 생산라인 관리
    • PIS: Plant Information System
    • Contingency Plan: 위기상황 대처

4.하이퍼커넥트의 Graviton(ARM CPU) 도입

  • AWS의 RDS, Kube 등 Managed Service는 이미 모두 Graviton CPU를 사용하고 있음
  • 가성비를 위해 안 쓸 이유가 없음
    • 비용 20% 절감
    • 전력 소모량 60% 절감
  • 현재 Gravition 4세대 출시됨
  • AWS CUR 데이터를 다운로드 받아 서비스를 분석한 후 적용해야 함
  • 용어 설명

5.생성형 Ai를 엔터프라이즈에 적용하기 위한 방법론 (메가존)

  • Gen Ai의 거버넌스 관리가 중요함
  • 기업의 프로세스 자체가 자산임. 자동화와 별개
  • Gen Ai를 사용하려면 최소한의 품질수준을 지켜야 함
    • 관찰가능하고 관리가능한
  • Data Life Cycle이 충분히 긴 것이 학습대상이 되어야 함
    • 시간이 지나 Fact가 증명된 것
  • 용어 설명
    • Shadow IT:  IT 부서의 승인을 받지 않고 흔히 IT 부서가 이를 모르거나 감독하지 않는 상태에서 엔터프라이즈 네트워크에서 사용되는 모든 소프트웨어, 하드웨어 또는 IT 리소스
    • RAG(Retrieval augmented generation): LLM 검색 결과를 기반으로 답변 생성을 도와주는 개념 (검색 증강 생성)
    • LLM(Large language model, LLM): 또는 거대 언어 모델 은 수많은 파라미터(보통 수십억 웨이트 이상)를 보유한 인공 신경망으로 구성되는 언어 모델

6.케이뱅크의 클라우드 전환

  • 고객 진입 채널을 5:3:2 비율로 분산 (2가 클라우드)
  • CloudFormation으로 Scale Out 적용
  • 채널만 클라우드 적용함
  • 용어 설명
    • Direct Connect: 전용선
    • Transit Gateway: 네트워크간 연결
    • GWLB: 게이트웨이 로드밸런서
    • GSLB: Global Server Load Balancer
    • ALB: Application Load Balancer
    • NLB: Network Load Balancer
    • S3: 객체 스토리지
    • EC2: Elastic Compute Cloud
    • IPS(Intrusion Prevention System): 침입방지 시스템
    • Shield: DDos 방지
    • MCI: Multi Channel Interface
    • Sagemaker: Machine Learning Solution
    • EMR: Petabyte-scale data processing, interactive analytics, and machine learning using open-source frameworks such as Apache Spark, Apache Hive, and Presto
    • Glue: ETL (extract, transform, load — data integration)

Read more

[시리즈 2편] 실무로 배우는 메시지 큐 - RabbitMQ

[시리즈 2편] 실무로 배우는 메시지 큐 - RabbitMQ

들어가며 [시리즈1]에서는 프로세스 내부 메시지 큐를 다뤘습니다. 이번엔 네트워크 메시지 큐인 RabbitMQ를 다룹니다. RabbitMQ 공식 문서나 기술 블로그는 많지만, 실무에서 어떻게 사용하는지에 대한 글은 의외로 적습니다. "Producer가 뭐고 Consumer가 뭔지는 알겠는데, 그래서 실제로는 어떻게 쓰는데?" 이번 글에서는 우리 MES 시스템에서 RabbitMQ를 어떻게 활용하고 있는지 실제 코드와 함께 공유합니다. 우리

By Jeonggil
[시리즈 1편] 실무로 배우는 메시지 큐 - Windows Message Loop

[시리즈 1편] 실무로 배우는 메시지 큐 - Windows Message Loop

들어가며 이 글은 "실무로 배우는 메시지 큐" 시리즈의 첫 번째 글입니다. 실무에서 발견한 문제를 해결하는 과정에서, IME 입력 문제와 해결 과정을 공유합니다. 메시지 큐는 RabbitMQ, Kafka 같은 네트워크 레벨만 있는 게 아닙니다. 우리가 매일 쓰는 Windows 애플리케이션도 메시지 큐 기반으로 동작합니다. * 시리즈1 (이 글): 프로세스 내부의 메시지 큐 - Windows

By Jeonggil
[시리즈 2편] 그림으로 풀어낸 SaaS 알림 시스템

[시리즈 2편] 그림으로 풀어낸 SaaS 알림 시스템

이 글은 1편 - 그림으로 풀어낸 SaaS 알림 시스템의 후속편입니다. 들어가며 1편에서는 설비 연속 OFF 알림 기능의 핵심 로직과 어떤식으로 해결했는지 그림으로 알아봤습니다. 이번 글에서는 실무에서 마주한 진짜 고민들을 공유합니다: * 왜 3개의 새로운 테이블이 필요했나? * 어떻게 확장 가능한 구조를 만들었나? * SMS 14원짜리 알림이 왜 무서운가? * 운영 레벨로 나가기까지 무엇을 준비했나?

By Jeonggil
[시리즈 1편] 그림으로 풀어낸 SaaS 알림 시스템

[시리즈 1편] 그림으로 풀어낸 SaaS 알림 시스템

들어가며 제조업 IoT 플랫폼에서 N대 이상의 설비를 실시간으로 모니터링하고, 설비가 연속으로 꺼졌을 때 담당자에게 즉시 알림을 보내는 기능을 개발하게 되었습니다. 데이터는 실시간으로 쌓이지만, 설비이상을 체크하는 스케줄러 주기는 1분으로 설정하였습니다. 시스템 아키텍처 기존 인프라와 Push 기능은 이미 구축되어 있었습니다. 저는 중간에 들어가는 Alert Scheduler만 구현하면 되는 상황이었습니다. ┌──────────────────────────────────────────────────────────┐ │ 설비 IoT 센서 (실시간)

By Jeonggil