ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • Big Data ? No SQL?
    dev/! 2013. 6. 4. 23:16

    빅데이터를 쉽게 설명해줄께. 
    재활용쓰레기를 예를 들어줄께.

    아파트 동마다 재활용쓰레기 나오지. 그게 데이터라고 치고..
    기술이 발전하다 보니까 서울 전체에서 몇개의 캔이 나오는지 알수 있게 되었어.
    서울에서 나오는 캔을 전부 세는 기술이 바로 '하둡' 이야.
    기존 아파트마다 나오는 캔을 전체 숫자 세는대 연결시키는 기술이 '하이브'이고
    캔이나 병, 페트병, 고철, 종이, 플라스틱처럼 딱딱 나눠지는 것들은 '정형데이터'이고
    분리수거할때 어디에 버릴지 애매한 애들 있잖아. 애네들은 '비정형 데이터'야
    빅데이터는 정형, 비정형을 모두 포함하는 데이터구

    빅데이터의 활용이라 함은 모아놓은 데이터를 그냥 쓰는게 아냐.
    예를들면 결혼기념일이 다음주니까 선물사라고 전화오는 거는 아무리 결혼기념일 데이터를 많이 가지고 있다해서 빅데이터의 활용이 아니란 말이지.
    이 결혼기념일 데이터 전체를 분석해보니 특정달에 결혼 기념일이 많아서 그 달에 알맞는 선물 상품 공급을 준비한다면 그건 빅데이터의 활용이야.

    재활용 캔을 가지고 휠체어를 만든다던가 다시 캔을 만드는 일은 빅데이터의 활용이 아니고 그냥 DB의 활용이고

    이번달 캔 배출이 늘어난 것을 보고 이게 음료 시장 전체의 소비가 늘은 것인지 아니면 페트병음료의 소비가 줄고 그만큼 캔소비가 늘어난것인지 가설을 가지고 판단한다면 빅데이터의 활용 맞어.

    빅데이터는 데이터를 많이 모아서 DB마케팅에 쓰는게 아니라 많은 데이터 속에서 가설을 세우고 분석을 하는 것이란 말이지.

      

    니미 그게 그거고만 말장난은~  

     

    CAP 이론이라고 있어~

    • Consistency (일관성)
    • Availability ( 가용성)

    • Partition Tolerance (지속성)

    학교 다닐때 많이 보던 단어들이지?

    CAP 이론은 세가지중 두가지만 충족할수 있다는거야~ 절대로 3가지는 못가진다는 말이지.

    무슨말인지 모르면 지금 당장 Ctrl + W 를 누른 후 반성해도 좋아~

     

    CA가 잘 아는 RDBMS야~ Oracle, MsSQL, MySQL등등등

    AP는 마크 주커버그형이 Mysql로 페이스북 돌리다가 바꿔탄 Cassandra가 있어 (트위터는 아직도 Mysql로 잘 쓰고 있대~)

    CP는 요즘 잘나가는 MongoDB

    나머지는 아래 그림 보고~

     

     

    상황에 맞게 선택하라는 거지~


    결론은  

    Big Data = No SQL이 아니고 Big Data는 RDBMS의 대체수단이 아니야~~~~~~~

    댓글