본문 바로가기
728x90
반응형

데이터파이프라인30

ETL은 이대로 괜찮을까? 화제를 던진다기보다는 스스로에게 묻고 답을 구하고자 한다. 글을 쓰는 과정에서 답을 찾고자 한다. ETL은 이대로 괜찮은걸까? 데이터 파이프라인 관련 책을 읽어보고 ETL 관련 툴을 조사하니 예전 기술스택과는 많이 다르다는 점을 느끼고 있다. 결론부터 말하자면 ETL은 새로운 전환점을 맞이하고 있다고 표현하고 싶다. 가장 큰 두 가지 이유는 첫째로 OLAP DBMS의 지속적인 성장이다. PostgreSQL 10 버전에서 1000만 건을 아래 SQL로 조회해보았다. select i from generate_series(1,10000000) as i(i) ; 응답 시간은 평균 20분이었다. Clickhouse 22.6 버전에서 마찬가지로 천만 건의 데이터를 테이블에 생성하여 조회해보았다. select a f.. 2023. 1. 8.
[후기] 데이터 파이프라인 핵심 가이드 카프카를 이용한 cdc를 운영하게 되어 데이터 파이프라인 개념을 한 싸이클 돌리고자 관련 책을 찾아보았다. 구글에 검색해보니 아래의 책이 눈에 띄었고 표지가 예뻐 목차도 봤다. 내용이 딱 내가 찾던 내용이었다. 제임스 댄스모어 저자로 표지는 아래와 같다. 독서 기간은 아래와 같다. 1회차 : 2022.12.09 ~ 2022.12.15 2회차 : 2022.12.15 ~ 2022.12.21 3회차 : 2022.12.21 ~ 2022.12.27 책은 224페이지로 생각보다 글씨도 컸다. 데이터 파이프라인이 생소했던 내게 뭐랄까 이정표 같은, 데이터 파이프라인이란 이런 것이다!의 깨달음을 원했지만 그러기에는 해당 책의 내용은 내용의 깊이 면에서 아쉬웠다. 어떤 용어가 나오면 이 용어는 이 책의 범주를 넘어서므로.. 2022. 12. 27.
728x90
반응형