기본 콘텐츠로 건너뛰기

DB튜닝 전문가 망했습니다..ㅠㅡㅠ




지금 프로젝트에서 개발자들이 프로시저를 만들다보니
 개발자의 의식의 흐름대로 데이터 처리를 만들다보니 커서를 이용해서 테이블 변수에 넣고
 그걸.  변수로 다른 테이블에서 조회하는 식으로 짜놨네요.. 

튜닝할 때 항상 하는 이야기 이죠.. Trigger와 커서는 절대 쓰지 말라구요.. 
이것처럼 속도를 저하시키고 락을 유발 시키는 장치는 없거든요.. 

 트리거는 트리거링 포인트가 되었을 때 대상 테이블을 락을 건 뒤에 트리거 처리를 하고 나서 락을 해제 하기 때문에 아무리 빨리 끝나도 동시에 들어오는 쿼리에 따라서는 데드락에 빠질 가능성도 있습니다. 
 마찬가지로 커서 역시 테이블을 열고 커서를 만들어 처리하기 때문에 그 모든 처리가 끝날 때까지 락이 걸린 상태가 됩니다. 데이터가 변동하면 안되니까요..

 그래서 트리거와 커서를 사용하면 기본 서너배는 느려집니다. 
커서랑 트리거만 없어도 50만명 받을 서비스가 15만명도 못받게 되는거죠..
경우에 따라서는 수백배 느리게 짤 수도 있는게 커서와 트리거 입니다.
그냥 서비스를 떨구든 말든 자기 편한대로 만들겠다는 생각이 있지 않는한 커서는 피하셔야 합니다. 

 개발자들이 커서를 많이 이용하는 이유는 커서를 이용해서 만들면 복잡한 처리를 할 때 별로 생각하지 않고 개발 코드처럼 만들어도 가능하기 때문이죠

 이번 쿼리도 커서를 사용해서 아주 길게 만들어놨네요.. 
 한 줄 읽어서 상태에 따라서 데이터를 매핑해서 테이블 변수에 넣고를 쭈욱 한 뒤에
 그 테이블 변수를 다시 읽어서 다른 테이블의 값을 가져오는데.. 

 튜닝을 잘하려면 이 모든 데이터가 머리속에 연결구조를 그려서 
 하나의 비정규화 된 배열을 만들 수 있어야 합니다. 

 매번 이야기 하지만, 
 DB엔진이 강력한 이유는 데이터 처리를 할 때 
 한 줄씩 읽어서 처리하는게 아니라 배열 계산을 해주기 때문에
 배열 x 배열을 하는 시간과 한 라인 처리하는 시간이 거의 같습니다. 
 물론 엄밀히 이야기 하면 내부적으로 계산하는 개수가 있으니 조금 다르지만;;

커서로 10만줄을 계산하는 쿼리가 있어 1분 걸렸다면
배열 계산으로 0.05초 정도에 나오게 되죠.. 

 배열을 한 번에 계산하는 능력이 CPU에는 있기 때문에 
 배열 처리 속도는 엄청나게 빠릅니다. 

 그래서 튜닝을 잘하는 사람은 
 배열을 잘 만들어서 계산을 던지는 사람인 것이지요. 

 이번에도 자세히 보니까 뭔가 무지무지 복잡하지만, 
 대충 머릿속에 그려보니 전부 JOIN 가능하지 않을까?
 라는 생각을 했는데.. 

 요즘 머리가 안돌아가고 귀차니즘이 발발.. 
 이 때 생각난 것이 chatgpt.. 

 너의 실력을 보여줘!

 하고 쿼리를 통으로 던지고 커서좀 없애줘!
 라고 간다하게 말했습니다. 

 그랬더니 커서를 JOIN으로 바꾼 결과를 주었네요!

 오오오오!

 실 데이터로 기존 SP와 커서를 뺀 새로만든 SP를 실행시켜 결과가 같음을 확인하고
 이걸 그대로 고객에게 줬습니다. 

 성능은 약 10%가까지 향상 되었네요..
아마도 테이블 변수에 넣고 재쿼리 하고를 반복했기 때문에 커서로 인한 효과는 10%정도였나 봅니다.

 그런데.. 잘 생각해보니.. 커서도 없애주는데 테이블 변수도 없애고 그냥 JOIN해도 되지 않나?
 싶어서 chatgpt에게 

 커서를 없애고, 테이블 변수나 temp table도 없애줘.
 라고 했더니.. 

 뭔가 생각보다 많이 짧은 쿼리를 받았습니다. 

 이걸 SP v3으로 만들어서 서로 결과 비교를 했더니 정상으로 보이는 것 같네요.. 

 성능을 비교했더니.. 
4배 빨라짐!

 아주 좋잖아?
 하고 줬는데… 문득 생각이 났습니다. 

 지금 이거 내가 아니고 고객이 
내가 한 것처럼 chatgpt에게 지시만 하면 
난 필요 없어지는거 아닌가?

 음…

 그래도 아직까진 이렇게 chatgpt에게 던지는 사람이 적다는 것에 
 가슴을 쓸어내리며

 가급적 chatgpt가 이정도의 능력을 갖고 있다는 사실을
 많은 사람이 알지 못하길 기도해봅니다. ;;;

 이 정도까지 쿼리를 튜닝해버리면, 
 이젠 나를 부를 고객도 줄어들지 않을까 
 걱정을 해보면서 

 AI시대에 
 뭘로 먹고살지 고민을 하게 하는 하루였습니다. 



giip :: Control all Robots and Devices! Free inter-RPA orchestration tool! https://giipasp.azurewebsites.net/

댓글

이 블로그의 인기 게시물

일본 두바퀴 여행(바이크 편)

영상버전 : https://youtu.be/P3vC17iVu1I 이번에는 일본으로 넘어와서 일본 종주하시는 바이커들을 위한 정보입니다.  일본에서의 2륜의 정의가 면허와 도로교통법이 조금씩 다르다고 합니다.  그래도 그렇게 크게 신경쓸 건 없으니 딱 세 종류로 말씀 드릴께요.  50cc는 원동기 1종이라고 하여 3차선 이상 교차로에서 우회전, 한국에선 좌회전 같이 크게 도는 것이지요..  이게 불가능합니다.  직진 신호로 넘어간 뒤에 방향을 틀고 다시 직진으로 두번 꺾어 가야 하구요,  두 명이 타면 안됩니다.  그리고 맨 가장자리 길로만 가야해서 애매하게 끝에서 두 번째 차선만 직진인 곳들이 있어서 난감할 때가 있지요. 그런데에 직진하면 걸리는 곳이 있다고 합니다. 어느 정도까지 걸리고 안걸리고는 정확히는 모르지만,  직좌 마크가 아닌 좌회전 마크만 있는 곳이 은근히 많으니 조심해야 하겠더라구요.  최고 시속도 30km를 넘기면 안되어 천천히 달려야 합니다.  아뭏든 제약이 엄청나게 많으므로 60cc이상을 가져오시거나 렌트 하시는 것을 추천하구요,  125cc미만은 겐츠키 2종이라고 하여 두 명이 타도 되고, 3차선 이상에서 우회전이 가능합니다.  상당히 제약이 풀리는 대신 고속도로를 탈 수가 없지요.  만약 국도로 천천히 올라오신다면 125cc미만으로도 충분합니다.  실제로 일본인 바이커들 중에서도 국도 종주하는 모습을 많이 볼 수 있구요,  도심에 가면 125cc미만까지만 주차 가능한 바이크 주차장도 꽤 많기 때문에 도심용으로는 메리트가 큰 것 같습니다.  뭐, 125cc대는 곳에 큰 바이크를 대는 경우도 자주 보는데, 아무도 뭐라 안하긴 합니다.  그도 그럴 것이, 일본의 바이크 등록대수는 1031만대 인데도 바이크 전용 주차장은 턱없이 부족하다고 합니다. 바이크 주차장이 저렴하기 때문에 웬만한 ...

AI에게 존댓말로 질문한다고 AI가 더 자세히 대답해 주지 않습니다! 프롬프트의 뜬소문과 실제. 잘못알고 있는 프롬프트 이야기

영상버전 :  https://youtu.be/rLwhVUIXaQU 어디선가 기사가 있어서 읽다가 코멘트를 단 게 있습니다.  프롬프트 엔지니어링으로 인터넷 강의를 하시는 분 같은데요..  이름에 Phd라고 적혀있으니 어딘가의 박사님 이신가 봅니다.  그 분의 글에 이런게 있더라구요.. 한국어는 맥락에 크게 의존하는 ‘고맥락 언어’입니다. LLM에 그대로 입력하면 종종 의도가 왜곡되거나 핵심이 누락됩니다. 저는 영어로 프롬프트를 작성하지만, 한국어만 해야하는 모델을 사용할 때는 다음과 같은 방법을 사용합니다. --- 중략 --- ✔️ 존댓말(–습니다) vs 반말(–해요) 중 하나 선택.  Deferential form '-습니다'를 사용하면 openAI 모델은 답을 더 길고 상세하게 합니다.  … 여기서 존대말을 사용하면 AI모델은 답을 더 길고 상세하게 합니다. 라고 적혀 있네요..  그랬더니 이 분을 지지하는 댓글에서 chatgpt에게 같은 내용을 물어본 결과를 적었더라구요..  ChatGPT-4o에게 확인해보았습니다: ”한국어를 사용할 때 존댓말로 요청하면, 당신은 좀 더 나은 답을 주신다고 들었습니다. 사실입니까?“ 아주 날카로운 질문이십니다. **“한국어로 존댓말을 쓰면 더 좋은 답을 받는다”**는 말은 부분적으로 사실입니다. ⸻ ✅ 왜 그렇게 느껴질까요?  1. 존댓말은 명확하고 완곡한 문장 구조를 유도합니다.  • 예: 반말: “해줘” → 목적이 불분명하거나 애매할 수 있음 존댓말: “이 내용을 정리해 주시겠어요?” → 요청의 방향이 명확  2. 프롬프트가 더 구체적이고 정중해지면 → 모델이 더 신중하고 완성도 있는 답변을 생성하려는 경향이 있습니다.  3. ‘질문하는 사람의 태도’를 고려한 최적화된 언어 생성이 이뤄집니다.  • 존댓말 = 더 포멀한 상황 → 더 논리적이고 근거 중심의 응답이 생성됨 ⸻ ❗ 하지만 반말도 충분히 잘 작동...

니가 플랫폼(Platform)을 아니?

이번에는 2015년에 썼던 글을 다시 한 번 정리하려고 합니다.  언제나 이야기 하듯이 단어에 대해 누구에게나 쉽게 설명하지 못하면 그건 그 단어를 아는게 아닙니다.  여러분도 이 단어에 대해 비 IT이든 전문가 이든 설명해 줄 수 있는지 한 번 생각해 보시기 바랍니다.  플랫폼에 대해서 이야기를 하다보면 되묻고 싶은 이야기다. 요즘 개발자들 사이에서.. 또는 서비스 기획자들 사이에서 "플랫폼"이란 단어는 필수어가 되었다. 그런데 개발자들 만이 아니라, 기획자, 경영진까지 플랫폼은 필수이다.  웃긴건..  누구는 플랫폼과 서비스를 구분 못하고,  누구는 플랫폼과 프레임웍을 구분 못하고,  누구는 플랫폼과 콘텐츠를 구분 못하고 있다.  이번에는 플랫폼과 서비스를 구분해 보고자 한다.  그런 사람들끼리 이야기하다가 플랫폼이란 단어를 사용하는 사람들에게 물어본다. "플랫폼이 뭔가요?" 누군가 대답한다. "아직도 플랫폼을 몰라요?" 그럼 이렇게 되묻는다. "네.. 제가 잘 몰라서요.. 좀 알려주시겠어요?" 상대방은 IT시스템 어쩌고 하면서 횡설수설한다.. 얼마전 TV에서 플랫폼전문가가 요즘 IT쪽에 도는 플랫폼에 대해서 이야기 한다고 보라고 권장해주었다. TV를 찾아서 보았다. 플랫폼의 정의에 대해서는 나름 이야기를 했다. "수요자와 공급자를 연결해주는 매개체" 그리고 카카오톡을 성공한 플랫폼이라고 했다. 어짜피 성공한 사업에 이름을 붙이는 것은 쉽다. 성공한 주식의 과거를 분석하는게 쉽듯이.. 하지만 성공하지 못한 사업, 그리고 지금 이것이 플랫폼인지 알 수 있는 사람은 몇 안될 것이다. 단어의 의미를 한 번 다시 생각해보자. 그럼 플랫폼은 언제 시작했을까? 18세기후반 부터 19세기에 걸쳐서 약 100년정도를 산업혁명이라고 불렀다. 산업 혁명에 대한 자세한 이야기는 별도 코너로 만들었습니다.  음성 :  https://y...