[6일차] Apache Iceberg는 왜 차세대 테이블 포맷이 되었을까? | Iceberg 기초 완전 이해

🏗️ 데이터 레이크하우스 엔지니어링 20일 집중 과정 DAY 6 — Apache Iceberg 기초: 왜 Iceberg인가 이번 영상에서는 차세대 데이터 레이크 테이블 포맷인 “Apache Iceberg”의 핵심 구조를 이해합니다. ✔ Hive 테이블 방식의 한계 ✔ Partition Metadata 병목 문제 ✔ ACID 미지원 문제 ✔ Snapshot 기반 테이블 구조 ✔ Iceberg Metadata 계층 구조 ✔ Manifest / Snapshot / Metadata 동작 원리 ✔ Iceberg Catalog 종류 ✔ Spark + Iceberg 연동 ✔ Optimistic Concurrency Control 기존 Hadoop/Hive 기반 데이터 레이크는 대규모 환경에서 여러 구조적 한계를 가집니다. Apache Iceberg는 이 문제를 해결하기 위해 등장한 차세대 Open Table Format 입니다. 이번 강의에서는 Iceberg가 왜 중요한지, 그리고 내부 메타데이터 구조가 어떻게 동작하는지를 아키텍처 중심으로 설명합니다. 📌 이런 분들에게 추천합니다 데이터 엔지니어 Spark 개발자 플랫폼 엔지니어 MLOps 엔지니어 Lakehouse 구축 담당자 Hadoop/Hive 운영 경험자 🔥 이번 영상 핵심 내용 Hive Metastore 병목 구조 Snapshot Isolation 이해 ACID 기반 데이터 레이크 Iceberg Metadata Layer REST Catalog & Nessie 구조 Spark SQL 기반 Iceberg 실습 🧪 실습 내용 Spark + Iceberg REST Catalog 구성 MinIO 기반 Lakehouse 환경 구축 Bronze → Silver Iceberg 마이그레이션 Iceberg 테이블 생성 및 데이터 삽입 #ApacheIceberg #Iceberg #Spark #DataEngineering #Lakehouse #BigData #Hadoop #Hive #MLOps #데이터엔지니어 #AI인프라 #클라우드

도커가 바꾼 개발바닥
▶︎

도커가 바꾼 개발바닥

'컴퓨터'의 구조는 어떻게 되어있을까? CPU와 메모리! [안될과학 - 랩미팅 15화]
▶︎

'컴퓨터'의 구조는 어떻게 되어있을까? CPU와 메모리! [안될과학 - 랩미팅 15화]

LLM 설명 (요약버전)
▶︎

LLM 설명 (요약버전)

[7일차] Apache Iceberg 심화 | 파티셔닝 · Schema Evolution · Time Travel 완전 정복
▶︎

[7일차] Apache Iceberg 심화 | 파티셔닝 · Schema Evolution · Time Travel 완전 정복

Snowflake를 이용한 데이터 플랫폼 구축 성공 사례 - Bespin Global 장익철 본부장
▶︎

Snowflake를 이용한 데이터 플랫폼 구축 성공 사례 - Bespin Global 장익철 본부장

꼭 알아야 하는 네트워크 지식 50분 만에 기초 끝내기 특강 (ft. 강민철 저자님)
▶︎

꼭 알아야 하는 네트워크 지식 50분 만에 기초 끝내기 특강 (ft. 강민철 저자님)

Andrej Karpathy: From Vibe Coding to Agentic Engineering w/ Stephanie Zhan
▶︎

Andrej Karpathy: From Vibe Coding to Agentic Engineering w/ Stephanie Zhan

[12일차] Airflow DAG 설계 패턴 완전 정리 | Branch · XCom · Dynamic Task Mapping
▶︎

[12일차] Airflow DAG 설계 패턴 완전 정리 | Branch · XCom · Dynamic Task Mapping

AI 정신증: AI와 대화하다 망상에 빠진 사람들 - BBC News 코리아
▶︎

AI 정신증: AI와 대화하다 망상에 빠진 사람들 - BBC News 코리아

World Labs' Fei-Fei Li on Creating Large World Models
▶︎

World Labs' Fei-Fei Li on Creating Large World Models

[8일차] Apache Spark 완전 이해 | 아키텍처 · RDD · DataFrame 핵심 정리
▶︎

[8일차] Apache Spark 완전 이해 | 아키텍처 · RDD · DataFrame 핵심 정리

What is a Vector Database? Powering Semantic Search & AI Applications
▶︎

What is a Vector Database? Powering Semantic Search & AI Applications

[5일차] HashiCorp Vault 완전 이해 | 데이터 플랫폼 보안 아키텍처 구축
▶︎

[5일차] HashiCorp Vault 완전 이해 | 데이터 플랫폼 보안 아키텍처 구축

[최초공개] 양자역학, 한 편으로 이해할 수 있는 다큐! 세계는 확률인가, 법칙인가… 아인슈타인 vs 보어 - 양자 전쟁 I 사이언스 워 : 거인의 전쟁I KBS 260307 방송
▶︎

[최초공개] 양자역학, 한 편으로 이해할 수 있는 다큐! 세계는 확률인가, 법칙인가… 아인슈타인 vs 보어 - 양자 전쟁 I 사이언스 워 : 거인의 전쟁I KBS 260307 방송

Claude's skill, which can be used like an agent by 'taking it out' whenever needed (Dr. Kang Su-jin)
▶︎

Claude's skill, which can be used like an agent by 'taking it out' whenever needed (Dr. Kang Su-jin)

“칩도 안 만드는데 왜?” 전 세계 반도체 기업이 LG를 찾는 진짜 이유
▶︎

“칩도 안 만드는데 왜?” 전 세계 반도체 기업이 LG를 찾는 진짜 이유

What is SonarQube | Introduction SonarQube | SonarQube Tutorial | SonarQube Basics | Intellipaat
▶︎

What is SonarQube | Introduction SonarQube | SonarQube Tutorial | SonarQube Basics | Intellipaat

AI 시대, 덜 가난해지는 법
▶︎

AI 시대, 덜 가난해지는 법

PostgreSQL 입문수업
▶︎

PostgreSQL 입문수업

«Ich bin der Versöhner»: Björn Höcke über die Deutschen, ihre Identität und ihre Zukunft
▶︎

«Ich bin der Versöhner»: Björn Höcke über die Deutschen, ihre Identität und ihre Zukunft