기본 콘텐츠로 건너뛰기

라벨이 데이터인 게시물 표시

누구나 버리는 데이터로 인사이트를 보는 힘. Jan Chipchase

영상 버전 :  https://youtu.be/tWg7-EKBiww #테슬러 는 #자동차 한 대에서 매일 3TB정도의 #로그 #데이터 가 나온다고 합니다. 판매된 모든 차량에서 정보를 수집하여 다음 버전의 업그레이드 기반 데이터 및 유저의 #행동 #패턴 #학습에 사용되고 있다고 합니다. 2014년. #Gartner 는 #Data 는 #21세기 #원유 라고도 했습니다. 아무렇지도 않게 그냥 흘려버린 데이터 속에 사실은 돈이 숨어있을 수 있다는 사실. #데이터사이언티스트 를 꿈꾸는 이들에게 던져봅니다. 여러분들은 데이터를 어떻게 보관하고 어떻게 분석하고 있지요? 너무 방대한 데이터라 보지도 않고 버리고 있지 않나요? 누군가에게는 아주 중요한 #비즈니스 가 될 수 있습니다. 그 동안 무심코 지냈던 데이터의 #인사이트 를 가지고 나와봅니다. 예전에 서점에서 책을 보다가 바로 테드 영상을 찾아 본 것이 있습니다. 바로 얀 칩체이스(Jan chipchase)라는 사람인데요. StudioDRadiodurans라는 소비자 행동을 기반으로 전랙 컨설팅을 하는 회사를 창립한 사람입니다. 미국의 500인의 지식인에도 뽑힐 정도의 인물인데, 한국에는 아직 모르시는 분들이 많은 것 같아 소개를 해드라려 합니다. 이 사람은 제가 꿈꾸던 일을 하고 있습니다. 한국에서는 사기꾼 기질이 없으면 살아남을 수 없는 분야라 포기한 분야이지만, 앞으로 해외를 목표로 하시는 분들이라면 참고가 되지 않을까 해서 공유 합니다. 제 설명에 조금 틀린 내용이 있을 수는 있으나, 대체로 맞는 내용에 제 추측이 들어간 거일 수 있으니 양해 바랍니다. 이런 통계 정보로 여러분은 무엇을 느끼시나요? 휴대전화 가입자율 : 전국민의 82% 휴대폰 보유율 : 전국민의 10% 이 사람은 직접 보는것을 좋아 합니다. 우선은 많은 자료를 수집해서 이상한 행동 패턴을 찾는데요.. 어느날 우간다에서 휴대전화 가입율이 82%인데 휴대전화기의 보급이 10%도 되지 않은 것을 보고 이상하

인공지능(AI)은 만능이 아닙니다!

머신러닝(ML)용 데이터를 수집하다보면 이런 질문을 받습니다. * 인공지능은 사람이 못하는걸 해주지 않나요? * 그동안 안쓸거 같아서 버렸는데 필요한 데이터였나요? 제 대답은 언제나 그렇지만, 인공지능(AI)은 사람이 못하는 것을 하지 못합니다. 단지, 사람이 그동안 해오면서 모든 데이터를 볼 시간이 부족하여 꼭 필요하다고 판단되는 데이터만 남기고 버려왔다면, 인공지능은 병렬로 고속으로 그 데이터를 읽고 무한 교차 대입으로 전혀 상관없는 곳에서 상관 관계를 찾아내는 것이 묘미 입니다. 이런 얘기가 있지 않나요? 트위터에 그냥 사람들이 흘린 정보를 가지고 감기가 언제 한국에 상륙하고 얼마만큼의 피해를 낼 것이니 약을 어느정도 준비하면 되겠다 라던가, 전혀 상관없는 미국의 특정 기업의 주식의 변동이 오스트레일리아의 콩의 생산량과 일치한 경우 등. 우리가 나비효과라 이름은 부르지만 그 추적이 불가능 한 것을 인공지능은 역산하여 꺼낼 수 있습니다. 지금도 아무 생각없이 버리고 있는 데이터가 있다면 아래 제 글을 다시 읽어 보시기 바랍니다. https://talklowykr.blogspot.com/2019/03/blog-post_12.html 데이터는 21세기의 원유 입니다. 정유업체가 되지 말고 석유왕이 되십시요! Do not login your server any more! Free server management tool! http://giipweb.littleworld.net Subscribe and publish your links as a book with friends My Favorite Link Share http://link.littleworld.net

여러분은 정유회사가 될건가요? 석유왕이 되지 않고?

제가 2014년부터 부르짖었던 것이 있습니다.  앞으로는 데이터 이다! 2014년에 Gartner가  데이터는 21세기 원유 라고 설명을 했었거든요. 그 말인 즉, 데이터 보유자 = 석유왕 이라는 뜻입니다. 그리고 제 글 중에는  원유라 불리는 데이터를 중요하다고만 하면서  이상하게 SI사업만 하고 있는 사람들이  한국인들이라는 경종을 울리기도 했습니다. 데이터를 모으려는게 아니라  데이터 주시면 분석해 드릴께요..  라면 석유왕이 아니라 정유회사를 꿈꾸는거잖아요..  하지만, 미친X 취급만 받다가  얼마전에 NIA에서 드디어 이런 내용이 나왔네요.  □ 데이터는 4차 산업혁명을 견인하는 핵심 동력 o 데이터 기반의 혁신기업*들은 많은 고객으로부터 데이터를 수집․축적하고, 이를 활용하여 시장 혁신을 주도 * (IBM) 3억명 환자데이터 보유, (구글) 딥마인드는 환자 100만명 안구검사 기록 확보, (AirB&B) 8년간 축적 데이터 분석, (알리페이) 5억명의 스마트폰 결제정보를 매초 2천건씩 축적 ㅇ 新 경쟁원천인 데이터를 바탕으로 시장을 독과점하는 승자독식의 경쟁 환경에서 후발 주자의 시장 진입은 갈수록 어려워지는 구조 □ 데이터 패권 경쟁 본격화로 전략적 대응 시급 ㅇ 이미 주요국*은 미래 경쟁력을 좌우하는 데이터의 중요성을 인식, 데이터 경제 전략수립과 투자확대 등 데이터 패권 경쟁 본격 돌입 * (美)빅데이터R&D/’16, (EU)데이터경제/’17, (日)미래투자전략/’17, (中)빅데이터발전/’17 ㅇ 데이터는 제품ㆍ서비스의 경쟁력을 좌우하는 핵심요소로 데이터 산업 기반 조성 미흡 시, 미래 먹거리 창출 기회 상실 우려 * 세계 데이터 시장규모(IDC, ’17): (’17) 1,508억 달러 → (’20) 2,100억 달러 □ 국내는 데이터 구축‧유통‧활용 등 데이터 인프라 부족 ㅇ 양질의 풍부한 데이터 확보 및 활용 여부가 AI 기술력은 물론 국가 경쟁력에 직결되