AWS Summit Seoul 2024

AWS Summit Seoul 2024

1.Key Note

  • Gen Ai (생성형 Ai) 시대의 도래

2.카카오페이 손해보험 클라우드 DX

  • 원장 데이터베이스의 집중도를 줄이기 위한 시도
    • 원장: 거래를 계정별로 기록하는 장부
  • 메시징 기반의 Event Driven 비지니스 로직 처리
  • 비용절감을 위한 95%의 Graviton (ARM) CPU 노드 사용 (EKS)
  • 년 1회 실서버 재해복구 훈련 및 카오스 엔지니어링
  • 서버리스 기반 데이터 레이크 구성
  • 용어 설명
    • EDA(Exploratory Data Analysis)
    • Kafka: 실시간으로 기록 스트림을 게시, 구독, 저장 및 처리할 수 있는 분산형 데이터 스트리밍 플랫폼
    • Amazon ElastiCache: Redis와 호환되는 AWS의 인메모리 데이터스토어
    • Amazon Document DB: 완전관리형 기본 JSON 도큐먼트 데이터베이스 (Mongo DB 호환)
    • AWS Datalake: 데이터 저장과 분석용 솔루션 모음

3.LG화학 MES 클라우드 전환

  • 수많은 PoC를 통한 가설 검증
    • 예) 250 SPM
  • 모니터링 이상감지
  • AWS Outpost 사용으로 보안 이슈 해결
  • Outpost vs Region간 AMI 상호 Provisioning 가능
  • 랙타입 서버만 Outpost Full Service 가능
  • Outpost 도입시 사전 체크 시간이 제법 걸림 (한달 이상)
    • Network
    • 전원
    • 공조장치
    • BGP Protocol
  • 응용과 인프라의 협업이 중요
  • 용어 설명
    • AWS Outpost: 온프레미스 프라이빗 클라우드
    • FDC(Fault Detection Control): 결함관리
    • LMS(Line Management System): 생산라인 관리
    • PIS: Plant Information System
    • Contingency Plan: 위기상황 대처

4.하이퍼커넥트의 Graviton(ARM CPU) 도입

  • AWS의 RDS, Kube 등 Managed Service는 이미 모두 Graviton CPU를 사용하고 있음
  • 가성비를 위해 안 쓸 이유가 없음
    • 비용 20% 절감
    • 전력 소모량 60% 절감
  • 현재 Gravition 4세대 출시됨
  • AWS CUR 데이터를 다운로드 받아 서비스를 분석한 후 적용해야 함
  • 용어 설명

5.생성형 Ai를 엔터프라이즈에 적용하기 위한 방법론 (메가존)

  • Gen Ai의 거버넌스 관리가 중요함
  • 기업의 프로세스 자체가 자산임. 자동화와 별개
  • Gen Ai를 사용하려면 최소한의 품질수준을 지켜야 함
    • 관찰가능하고 관리가능한
  • Data Life Cycle이 충분히 긴 것이 학습대상이 되어야 함
    • 시간이 지나 Fact가 증명된 것
  • 용어 설명
    • Shadow IT:  IT 부서의 승인을 받지 않고 흔히 IT 부서가 이를 모르거나 감독하지 않는 상태에서 엔터프라이즈 네트워크에서 사용되는 모든 소프트웨어, 하드웨어 또는 IT 리소스
    • RAG(Retrieval augmented generation): LLM 검색 결과를 기반으로 답변 생성을 도와주는 개념 (검색 증강 생성)
    • LLM(Large language model, LLM): 또는 거대 언어 모델 은 수많은 파라미터(보통 수십억 웨이트 이상)를 보유한 인공 신경망으로 구성되는 언어 모델

6.케이뱅크의 클라우드 전환

  • 고객 진입 채널을 5:3:2 비율로 분산 (2가 클라우드)
  • CloudFormation으로 Scale Out 적용
  • 채널만 클라우드 적용함
  • 용어 설명
    • Direct Connect: 전용선
    • Transit Gateway: 네트워크간 연결
    • GWLB: 게이트웨이 로드밸런서
    • GSLB: Global Server Load Balancer
    • ALB: Application Load Balancer
    • NLB: Network Load Balancer
    • S3: 객체 스토리지
    • EC2: Elastic Compute Cloud
    • IPS(Intrusion Prevention System): 침입방지 시스템
    • Shield: DDos 방지
    • MCI: Multi Channel Interface
    • Sagemaker: Machine Learning Solution
    • EMR: Petabyte-scale data processing, interactive analytics, and machine learning using open-source frameworks such as Apache Spark, Apache Hive, and Presto
    • Glue: ETL (extract, transform, load — data integration)

Read more

Lumen - AI Agent를 위한 지속 가능한 두뇌

Lumen - AI Agent를 위한 지속 가능한 두뇌

왜 만들었는가 AI 에이전트는 모든 대화를 기억상실증 상태에서 시작합니다. Claude Code, Cursor, Codex, Mastra 하네스, LangChain 파이프라인 — 이 도구들은 세상을 알지만 당신의 세상은 전혀 모릅니다. 당신이 읽은 200편의 논문, 당신이 출시하는 코드베이스, 지난 분기에 내린 아키텍처 결정, 새벽 2시에 그 버그를 잡아냈을 때 마침내 통했던 트래젝토리. 모든 세션이 같은 컨텍스트를

By Sardor Madaminov

200 OK, 텅 빈 body — Starlette Race Condition 장애 분석기

발생일: 2026-04-23 / 해결일: 2026-04-27 영향 범위: report-dev.machine365.ai 전체 API 들어가며 API가 200 OK를 반환하는데 body가 비어있다. 프론트엔드에는 아무것도 안 뜨고, Swagger UI(/docs)도 빈 화면. 그런데 로컬에서 돌리면 멀쩡하다. 배경은 이랬다. 미터링(Metering) 기능을 만들면서 API 호출 로그를 수집할 미들웨어를 작성했다. Spring Boot 백엔드에 먼저 적용하고, Python

By Jeonggil