본문 바로가기
728x90
반응형

IT4

[직업고찰] DBA에게 가장 중요한 것은 무엇일까? DBA가 하는 일부터 먼저 살펴보는게 순서일 것 같다. DBA란 DBMS를 관리하는 사람을 뜻한다. 처음 접했을 땐 DB를 관리하는 사람이라 생각했다. DB는 데이터를 모아 놓은 일련의 논리적 공간이다. DBMS는 데이터를 모아 놓은 일련의 물리적 공간이다. DBMS를 관리한다는 것은 무엇을 의미할까? 아래를 예시로 들 수 있겠다. DBMS 백업/복구 정책 설정 DBMS Version 관리(EOS)를 위한 upgrade(patch) DBMS 보안 이슈 해결(정보보안팀과 연계되어 있겠지만 기능적인 부분은 DBA가 챙겨야 할 것이다) DBMS 성능 문제 해결 Data 정합성 문제 해결(DBMS적인 관점에서) DBMS 자체가 Data랑 관계가 아주 깊다. 어느 부분에서는 서로 간에 경계가 없는 듯하다. 예를 .. 2023. 6. 10.
[논리모델링] 엔터티만 보고 1차 정규화 대상 여부를 알 수는 없다. 1차 정규화에 대한 이론적인 내용부터 간단하게 짚고 가도록 하겠다. 엔터티의 속성이 원자값(Atomic Value, 하나의 값)을 갖도록 테이블을 분해하는 것 속성이 하나의 값을 가진다는 의미는 속성 내에서 하나의 값을 가지는 것과, 레코드 단위에서 하나의 값을 가지는 것으로 나눌 수 있다. 해당 내용에서는 후자에 대해서만 언급하겠다. 아래 엔터티를 보자. 해당 엔터티에 대응되는 테이블에는 아래의 값을 예시로 한다. 여기서 환자번호 2의 김갑수 환자가 몇달 뒤 재진료를 하게 되어 신규 데이터가 발생하였다. 보이는가? 주민등록번호야 업무식별자니까 그렇다 치더라도 아래 4개의 데이터는 중복해서 들어갔다. 지번주소 도로명주소 상세주소 우편번호 성별 휴대폰 등록자명 등록자명의 경우 시스템속성이므로 제외하겠다. .. 2023. 6. 4.
[논리모델링] 논리 모델링과 물리 모델링은 별개일까? 해당 내용을 논리 모델링에 쓸지, 물리 모델링에 쓸지 고민을 하였다. 현업에서는 논리 데이터 모델링을 먼저 진행하므로 해당 주제에 내용을 전개하고자 한다. 논리 모델링이란 무엇인가, 물리 모델링이란 무엇인가 개념적이고 이론적인 내용은 넘어가겠다. 대부분의 이론 책을 보면 다음과 같은 프로세스에 따라 모델링이 진행됨을 소개한다. 여기서 개괄 데이터 모델, 개념 데이터 모델에 대한 부분은 해당 글의 주제를 벗어나므로 제외한다. 논리 데이터 모델링과 물리 데이터 모델링은 언뜻 보기에는 전혀 다른 영역처럼 보인다. 하지만 다른 영역이라고 볼 수는 없다. 다시 아래와 같이 언급하고자 한다. 논리 데이터 모델과 물리 데이터 모델을 별개의 영역이라 보는 것은 좋지 않다. 그렇다면 같은 영역인가? 그것도 아니다. 필자.. 2023. 5. 29.
ETL은 이대로 괜찮을까? 화제를 던진다기보다는 스스로에게 묻고 답을 구하고자 한다. 글을 쓰는 과정에서 답을 찾고자 한다. ETL은 이대로 괜찮은걸까? 데이터 파이프라인 관련 책을 읽어보고 ETL 관련 툴을 조사하니 예전 기술스택과는 많이 다르다는 점을 느끼고 있다. 결론부터 말하자면 ETL은 새로운 전환점을 맞이하고 있다고 표현하고 싶다. 가장 큰 두 가지 이유는 첫째로 OLAP DBMS의 지속적인 성장이다. PostgreSQL 10 버전에서 1000만 건을 아래 SQL로 조회해보았다. select i from generate_series(1,10000000) as i(i) ; 응답 시간은 평균 20분이었다. Clickhouse 22.6 버전에서 마찬가지로 천만 건의 데이터를 테이블에 생성하여 조회해보았다. select a f.. 2023. 1. 8.
728x90
반응형