Talk Lowy(kr)

[DBMS튜닝] 사람들이 쉽게하는 PK및 인덱스 실수

대부분의 사람들의 실수중에 row가 몇백개 없어서 PK자체를 안잡는 사람이 있다. 이런 경우 어떠한 현상이 일어날까? 잘 보이는지는 모르겠지만, 단순 select에 where에 자기 테이블내 특정 필드에 Y값을, 그리고 Z필드로 정렬하고 있다. 하지만 프로파일러에서 보면 20초가 넘었다. 가끔 한 번하는데는 전혀 문제가 없다 500ms미만으로 처리된다. 하지만 왜 이따금 발생하는 것일까? 정확한 DBMS의 엔진 알고리즘을 알고 있지는 않다. 하지만 경험적으로 말할 수 있다. 동일 쿼리를 여러번 시도하는 경우 PK가 없으면 정렬이 되지 않기 때문에 우선 Table Scan을 처음부터 해서 계속 메모리에 올리게 된다. 즉 Disk I/O와 Memory I/O가 지속적으로 일어나는 것이다. 때문에 동시 100번 정도 처리되도 전부 Disk I/O를 사용하게 된다. 단지 800행도 되지 않는데 20초를 먹을 수 있는 것이다. 하지만 PK를 Clustered index로 걸게 되면 처음 Insert할때마다 PK에 의존해서 Sorting을 계속하게 된다. 나중에 Select할때는 언제나 같은 것을 가져오기 때문에 Cache에서 처리할 수 있는 것이다. 그럼 누군가가 다시 질문한다. "50행도 안되는건 괜찮나요?" 그냥 맘대로 해라.. 선을 그어서 어디까지는 되고, 어디부터는 안된다는 흑백논리는 60년대나 하는 것이지, 모든 것을 정해놓고 이렇게 하세요 하는 것은 아직도 현실을 모르는 사람들이나 하는 것이다. 1Row가 1MB가 되도록 짜는 사람들도 있는 것이고, 1000Row가 100KB가 되도록 짜는 사람들도 있을 것이다. DB의 구조설계부터 스스로 판단하고 튜닝도 결정해라. 누누히 얘기하지만, 튜닝이란 것은 만들때 하고 땡이 아니다. 우리가 1년에 한번씩 건강검진을 받듯이, DBMS도 자신에게 축적된 노폐물이 어딨는지 찾고 부정맥이 어딨는지 찾기 위해 건강검진을 받아야 한다. 이...

자세한 내용 보기

Talk Lowy(kr)

이 블로그 검색

글

[DBMS튜닝] 사람들이 쉽게하는 PK및 인덱스 실수