기본 콘텐츠로 건너뛰기

클라우드 컴퓨팅이란?


이제서야 다시 이글을 쓰게 된 이유는,
아직도 처음부터 설명을 해야할 필요가 있는 사람들이 많기 때문에다.

새롭게 학교를 마치고 취업전선으로 뛰어든 사람들,
전혀 다른 업종에 있다가 클라우드쪽으로 넘어와야 하는 사람들..
그동안 간과하고 있다가, 대답을 해줄만큼의 지식은 없는데 물어보는 사람들이 많은 윗사람들..

이들을 위해서 클라우드 컴퓨팅에 대해서 명확히 짚어 넘어가보고자 한다.

클라우드 컴퓨팅이란 단어는 어디서 시작했을까?
아는 사람들은 알겠지만,

2006년 8월9일 검색엔진 컨퍼런스에서 구글 CEO인 Eric Schmidt(에릭 슈미츠)가 가볍게 언급하면서 파장이 급속도로 확산되었다.

그 때는 아주 간단한 말을 했다.

What's interesting [now] is that there is an emergent new model, and you all are here because you are part of that new model. I don't think people have really understood how big this opportunity really is. It starts with the premise that the data services and architecture should be on servers. We call it cloud computing – they should be in a "cloud" somewhere. And that if you have the right kind of browser or the right kind of access, it doesn't matter whether you have a PC or a Mac or a mobile phone or a BlackBerry or what have you – or new devices still to be developed – you can get access to the cloud. There are a number of companies that have benefited from that. Obviously, Google, Yahoo!, eBay, Amazon come to mind. The computation and the data and so forth are in the servers.
(http://www.google.com/press/podium/ses2006.html)

번역이 힘드신 분들을 위해.(저도 번역기를 돌리지만 =ㅅ=;;) 간단히 설명하자면.. 앞으로는 "구름" 이라는 어딘가에 담겨져 있는 컴퓨팅을 사용하고 이는 어떠한 OS, 어떠한 장치로도 사용할 수 있다.. 라는 이야기 이다.

여기서 부터 클라우드 컴퓨팅이란 이야기가 확산되었지만..
결국 이를 정의 내린 곳을 아는 사람들은 극소수였다.

2011년부터 한국에 들어와 클라우드 컴퓨팅 전도사 역할을 했지만,
2014년이 되어야 드디어 블로그나 컨퍼런스에서 정의를 언급을 시작했다.
하지만, 이 역시 정의의 의미를 깊이 되새기지는 않고 있다.

클라우드 컴퓨팅은 NIST라는 미국 표준화 협회에서 정의를 내렸다.
1. On-demand self-service
2. Broad network access
3. Resource pooling
4. Rapid elasticity
5. Measured service

(http://csrc.nist.gov/publications/nistpubs/800-145/SP800-145.pdf)

간단하게 이야기 하자면,
1. 즉시 유저 스스로 사용할 수 있는 서비스
2. 다양한 디바이스에서 접속 가능한 서비스
3. 자유롭게 꺼내 쓸 수 있는 대규모 리소스 풀
4. 빠르게 꺼내쓰고 다시 돌려줄 수 있는 신축성
5. 사용량 과금을 위한 사용량 계측 서비스

이 다섯가지만 가지고 있으면 클라우드 컴퓨팅이라고 할 수 있다.
다른 블로그에서도 이런 내용까지 언급한 곳이 슬슬 보이고 있다.
하지만, 언급만 하고 이 내용의 깊이있는 고찰을 해보지 않는 것 같다.

이 내용을 잘 보면 클라우드 컴퓨팅의 정의에 가상화(Virtualization)나 안정성(Stable), 이중화(Redundancy)등의 의미가 없다.
클라우드 컴퓨팅의 정의를 내리고 있는 많은 블로그에서는 이 언급만 하고 바로 가상화가 클라우드라는 인식하에 이야기를 하고 있다.

아마존이 그렇게 하니까?

너무나도 경직된 사고에서 시작된 국내 클라우드 서비스는 아마존 따라하기만 할 뿐 결국 클라우드의 본질을 파악하지 못하고 해외 가상화 서비스 사업자와 단순 비교를 하고 유사 서비스만 만들 뿐이다.

이 글을 읽는 분들이라면 바로 여기서 어떤 포인트를 찾아서 차별점을 가져가야 할지를 찾았으면 하는 바램에 글을 쓰는 것이다.

이미 몇몇 기업은 클라우드의 정의를 새롭게 내리고 한국형 클라우드의 특징을 알고 그에 맞추어 가고 있기도 하다.

2012년6월 IEEE에서 시작한 Inter cloud project(인터 클라우드 프로젝트)를 이제와서 2015년에 서비스를 한다고 만들기 시작하고 있는게 한국의 현실이다.

이렇게 늦은 덕분에 먹고살 거리를 찾기가 쉬운것도 있지만,
세계화의 속도를 앞지르려먼 어떤 생각을 해야할지는 여러분의 숙제가 될 것이다.


목록으로 .. http://link.littleworld.net/LinkBook/mLinkBookDetail.asp?lbsn=362


Free Infrastructure information management tool Global Infrastructure Information Platform http://giip.littleworld.net
Subscribe and publish your links as a book with friends My Favorite Link Share http://link.littleworld.net

댓글

이 블로그의 인기 게시물

Alter table 에서 modify 와 change 의 차이 :: SQL Server

두 개의 차이를 모르는 경우가 많아서 정리합니다.  modify는 필드의 속성값을 바꿀때 사용하구요.. change는 필드명을 바꿀떄 사용합니다.  alter table tbbs modify bNote varchar(2000) NULL; alter table tbbs change bNoteOrg bNoteNew varchar(2000) NULL; change에는 원래 필드와 바꾸고 싶은 필드명을 넣어서 필드명을 바꾸는 것이죠~ 더 많은 SQL Server 팁을 보려면  https://github.com/LowyShin/KnowledgeBase/tree/master/wiki/SQL-Server giip :: Control all Robots and Devices! Free inter-RPA orchestration tool! https://giipasp.azurewebsites.net/

책에서는 안 알려주는 대규모 트래픽을 위한 설계

음성 버전 :  https://www.youtube.com/watch?v=ZZlW6diG_XM 대규모 트래픽을 커버하는 첫 페이지 만드는 법..  보통 DB를 연결할 때 대규모 설계는 어떻게 하시나요?  잘 만들었다는 전제 하에 동접 3000명 이하는  어떤 DBMS를 사용해도 문제 없이 돌아갑니다.  여기서 이미 터졌다면 이 콘텐츠를 보기 전에 DB의 기초부터 보셔야 합니다.  아.. 개발 코드가 터졌다구요? 그럼 개발자를 때리셔야지요..  만약 3000명을 넘겼다면? 이제 Write/Read를 분리해서  1 CRUD + n개의 READ Replica를 만들겠죠?  보통 Read Replica는 5개가 최대라고 보시면 됩니다.  누가 연구한 자료가 있었는데...  6번째 레플리카를 만든느 순간 마스터가 되는 서버의 효율 저하 때문에  5번째에서 6번쨰로 올릴때의 성능이 급격히 줄어든다는 연구 결과가 있습니다.  때문에 Azure에서도 replica설정할 때 5대까지 밖에 설정 못하게 되어 있지요.  유저의 행동 패턴에 따라 다르긴 하지만,  1 CRUD + 5 Read Replica의 경우 동접 15000명 정도는 커버 합니다.  즉, 동접 15000명 에서 다시 터져서 저를 부르는 경우가 많지요..  이 때부터는  회원 DB, 게시판DB, 서비스DB, 과금 DB 등등 으로 성격, 서로의 연관도에 따라 나누기 시작합니다.  물리적으로 DB가 나눠지면 Join을 못하거나 Linked Table또는 LinkDB등의 연결자를 이용해서 JOIN이 되기도 합니다.  그에 따라 성능 차이가 생기지만 가장 중요한 포인트는  서로 다른 물리적 테이블의 JOIN은 인덱스를 타지 않는다!  라는 것입니다. 즉, JOIN할 테이블들을 최소한으로 만든 뒤에 JOIN을 걸지 않으면 NoSQL처럼 느려터져 죽습니다.  양이 많은 DB에서 양이 적은 테이블을 가져와서 JOIN을 해야겠지요..  이렇게 해서 동접 10만명까지 커버를 했다 칩시다.  여기서 일반적인 동접의 기준도 서비스마

BI의 궁극판! Apache Drill을 써보자!

사실 Apache Drill 은 BI(Business Intelligence)라고 부르는 것 보다는 단순 데이터 연결 엔진이다. https://drill.apache.org/ 하지만 내가 왜 극찬을 하느냐면.. DBA로서 항상 문제가 되어왔던게, 이기종 데이터의 변환이나 처리였다. 포맷을 맞추는데 엄청난 시간이 걸리고, 데이터 임포트 실패가 무수하게 나고.. 한 번 잘못 데이터를 추출하면 다시 조정, 변환, 추출하는데 시간이 많이 걸린다. 그런데! Apache Drill은 그냥 RDB를 CSV랑 연결해서 조인해서 통계를 낼 수 있다. 그것도 표준 SQL을 사용하여! 예를 들어, CSV의 세 번째 컬럼이 price 이고, 물건의 판매이력을 PG사에서 CSV로 출력 받았다. 우리 DB와의 검증을 위해서는 수동으로 Import를 한 뒤에 포맷이 안맞아 잘리는 데이터가 있다면 다시 맞춰주고, 재 임포트를 수십 번, 그리고 나서 겨우 들어간 데이터를 조인하여 빠진 데이터를 분간한다. 숫자가 적다면 개발자가 개발로 처리할 수도 있지만, 건수가 하루에 300만건 짜리라면.. 한 달 온 파일은 9천만 건이다. 프로그램으로 고작 처리하는 것이 초당 500건. 거의 20만초, 에러 없이 약 56시간.. 에러가 생기면 다시 56시간.. ㅠㅡㅠ 이런게 현실이기 때문에 쿼리 말고는 방법이 없다. apache drill 의 진면목을 보자! 이번에는 좀 범용 적인 MySQL DB와 붙여 보자. . 난 이번에는 Mac에서 작업을 했기 때문에 그냥 다운 받아서 풀었음.. https://drill.apache.org/download/ 여기서 자기 OS에 맞는 버전을 받아서 설치하시길.. 압축을 풀고 나면 MySQL 커넥터를 붙여야 한다. https://dev.mysql.com/downloads/connector/j/5.1.html 여기서 다운로드 이런 커넥터 들을 붙일 때마다 콘피그를 수정해 줘야 하지만, 몇 번만