![](https://blog.kakaocdn.net/dn/DfStk/btr6tXWLPZL/jPQRkzDBkVFpzTzrv1VGuk/img.jpg)
빅 데이터란?
빅데이터(big data)란 디지털 환경에서 생성되는 데이터로 그 규모가 방대하고, 생성 주기도 짧으며, 형태 역시수치 데이터뿐 아니라 문자와 영상 데이터를 포함하는 대규모 데이터를 말한다. 다시말해 기존의 방법이나 도구로는 수집,저장,분석 등이 어려운 정형/비정형 데이터들이다.
세계적인 컨설팅 기관 매켄지(Mckinsey)에서는 빅데이터를 기존 데이터베이스 관리도구의 데이터 수집, 저장, 관리, 분석하는 역량을 넘어서는 규모로서 그 정의는 주관적이며 앞으로도 계속 변화될 것이라고 언급했다.
빅데이터의 특징
빅데이터의 특징으로는 크기(Volume), 속도(Velocity), 다양성(Variety)을 들 수 있다.
크기 - 일반적으로 수십 테라 바이트 혹은 수십 페타바이트 이상 규모의 데이터 속성을 의미한다.
속도 - 대용량의 데이터를 빠르게 처리, 분석할 수 있는 속성.
융복합 환경에서 디지털 데이터는 매우 빠른 속도로 생산되기 때문에 이것을 실시간으로 저장, 유통, 수집, 분석처리가 가능한 성능을 의미한다.
다양성-다양한 종류의 데이터를 의미한다. 정형화의 종류에 따라서 정형, 반정형, 비정형 데이터로 분류할 수 있다.
다양하고 방대한 규모의 빅 데이터는 미래 경쟁력의 우위를 좌우하는 중요한 자원으로 활용될 수 있다는 점에서 주목받고 있다.
대규모 데이터를 분석해서 의미있는 정보를 찾아내는 시도는 예전에도 존재했지만, 현재의 빅데이터 환경은 과거와 비교해보면 데이터의 양은 물론 질과 다양성 측면에서 패러다임의 전환을 의미한다. 이러한 관점에서 빅데이터는 산업혁명 시기의 석탄처럼 IT와 스마트혁명 시기에 혁신과 경쟁력 강화, 생산성 향상을 위한 중요한 원천으로 간주되고 있다.
빅 데이터 핵심기술
빅데이터의 데이터 처리란 먼저 문제를 여러 개의 작은 연산으로 나누고 이것들을 취합하여 하나의 결과로 만드는 것을 뜻한다.
빅데이터를 다루는 처리 프로세스로서 병렬 처리의 핵심은 분할 점령(Divide and Conquer)이다. 다시말해, 데이터를 독립된 형태로 나누고, 이를 병렬로 처리하는 것을 말한다.
대용량의 데이터를 처리하는 기술 중 가장 잘 알려진 것은 아파치 하둡(Apache Hadoop)과 같은 Map-Reduce 방식의 분산 데이터 처리 프레임워크이다.
빅 데이터의 활용/응용사례
![](https://blog.kakaocdn.net/dn/u6QZN/btr6tVYYaFn/OzBOaBkr47XPyMjKoD2W81/img.jpg)
기업의 경우 자신들의 고객 데이터를 활용하여 마케팅 활동을 활성화하는 고객관계관리(CRM, Customer Relationship Management) 하는 활동을 1990년대부터 시작했다. CRM은 기업이 보유하고 있는 데이터를 통합하는 데이터웨어하우스(Datawarehouse), 고객 데이터 분석(Data Mining)을 통한 고객유지와 이탈방지 등과 같은 다양한 마케팅 활동을 진행하는 것을 말한다. 기업 CRM 활동은 자사 고객 데이터뿐만 아니라 제휴회사의 데이터를 활용한 제휴 마케팅 역시 포함한다.
![](https://blog.kakaocdn.net/dn/cp1Ga4/btr6qOsnN6s/4xrYcH8vmLvWhggkH6Whq0/img.jpg)
최근에는 구매 이력 정보와 웹로그(web-log) 분석, 위치기반 서비스(GPS)의 결합을 통해 소비자가 원하는 서비스를 적절한 시기에 적절한 장소에서 제안할 수 있는 기술 기반을 갖추고 있다.
구글은 독감과 관련된 검색어 빈도를 분석하여 독감 환자 수와 유행 지역을 예측하는 독감 동향 서비스를 개발했다(google.org/flutrends). 이는 미 질병통제본부(CDC)보다도 예측력이 뛰어난 것으로 밝혀졌다.
2014년 월드컵과 2016년 올림픽을 준비했던 리우데자네이루는 지능형운영센터(IOC)를 통해 도시 관리와 긴급 대응 시스템을 갖추고 있다.
싱가포르에서는 차량의 기하급수적인 증가로 인한 교통체증을 줄이기 위해 교통량 예측 시스템을 도입했다. 싱가포르는 이 시스템을 통해 85% 이상의 정확성으로 교통량을 측정하고 있다.
자료출처
https://m.terms.naver.com/entry.naver?docId=3386304&cid=58370&categoryId=58370
빅데이터란?
[ 1. 빅데이터의 등장] 오늘날 정보통신 분야에서의 화두는 단연 빅데이터이다. 빅데이터는 기존 데이터보다 너무 방대하여 기존의 방법이나 도구로 수집/저장/분석 등이 어려운 정형 및 비정형
m.terms.naver.com
https://m.terms.naver.com/entry.naver?docId=1691554&cid=42171&categoryId=42183
빅데이터 정의
빅데이터란 디지털 환경에서 생성되는 데이터로 그 규모가 방대하고, 생성 주기도 짧고, 형태도 수치 데이터뿐 아니라 문자와 영상 데이터를 포함하는 대규모 데이터를 말한다. 빅데이터 환경
m.terms.naver.com
'IT' 카테고리의 다른 글
[NFT관련]P2E(Play-to-Earn)의 현 상황과 전망[게임산업] (0) | 2023.03.29 |
---|---|
[IT]빅데이터 분석가 하는 일,자격,전망,연봉 (0) | 2023.03.28 |
[사물인터넷]블루투스(Bluetooth) 개념,유래,역사,원리,연결방법,취약점,보안점[IT기술] (0) | 2023.03.28 |
[IT/의료]AI(인공지능),뇌동맥류의 진단을 돕는다. (0) | 2023.03.28 |
[IT용어]랜선 친구 뜻,생겨난 이유,그외[인터넷 문화] (0) | 2023.03.28 |