머신러닝이란?
머신 러닝(machine learning).
직역을 하자면 "기계학습"이란 말인데 크게 봐서는 인공지능(artificial intelligence)의 한 분야이다.
머신 러닝이란 클라우드 컴퓨터가 학습 모형을 기반으로 외부의 데이터를 통하여 스스로 학습하는 것을 말한다.
다시 말해 빅데이터를 분석, 가공해서 새로운 정보를 얻어 내거나 미래를 예측하는 기술이다.
컴퓨터는 머신러닝을 통해 지능을 더욱 강화할 수 있다. 따라서 컴퓨터는 새로운 데이터가 입력됐을 때 과거의 학습 경험을 토대로 이를 이해하고 분석함으로써, 앞으로 어떤 변화가 다가오는지 예측할 수 있다.
머신러닝 관련 직업으로는 데이터 엔지니어, 데이터 분석가, AI/머신러닝 엔지니어 등이 있다.
머신러닝의 종류
머신러닝은 크게 다음과 같은 3가지 종류로 나뉜다.
1. 지도학습
(Supervised learning)
어떤 데이터가 있다고 하면, 머신러닝을 하기 위해서는 데이터 하나마다 'label'이라고 하는 정답이 있기 마련인데, 이 label이 모델링 하기 전에 주어지고 학습이 진행되어 머신이 정답을 맞추었는지 판별하게 하는 이를 지도 학습(supervised learning)이라고 한다. label이 주어졌을 때 데이터는 확실한 input과 output의 짝을 갖게 되며, 이 지도학습이 이루어지는 머신러닝에는 대표적으로 분류 문제와 회귀 문제(Regression)가 있다.
* 분류문제(classification)
outcome is discrete 즉, 결과가 이진(0,1)이나 범주형으로 나오는 이산적인 양상을 띄는 문제를 말한다.
* 회귀 문제(Regression)
어떤 데이터의 특징값을 토대로 값을 예측한 결과가 실수나 연속된 값의 양상을 띄는 것. 예시로 사람의 기대 수명 예측을 들 수 있다.
2. 비지도학습
(Unsupervised learning)
지도학습과 달리 label이 없거나 제공되지 않은 채 학습을 수행하는 방식을 말한다. 비슷한 데이터들을 군집화(clustering)하는데 사용된다. 다시 말해 기계는 학습을 통해 정답을 내놓지는 않지만, 주어진 데이터를 비슷한 것 끼리 묶어주는 것이다. 군집화 외에도 자동 인코더, 결측치 탐색 등에 사용된다.
3. 강화학습
(Reinforcement / Semisupervised learning)
레이블이 있는 데이터와 없는 데이터를 섞어서 기계를 학습시키고 여기에 긍정이나 부정 피드백을 배우게 하는 것을 말한다. 강화학습은 지도학습과 비지도학습의 하이브리드 형태이다.
머신러닝의 단계
1.획득(Acquisition)
설문조사, 실험, 메타 데이터 분석 등을 실시하여 데이터를 수집한다.
2.준비(Preparation)
데이터를 정돈하고 적절히 전처리를 하여 실험에 알맞는 데이터셋 구조를 갖추는 것.
3. 분석(Analysis)
데이터가 실행되기 위한 사전 평가와 결과물과 비교분석을 위한 데이터를 온전히 파악해두는 것.
4.모델링(Modeling)
데이터가 특정 패턴으로 정형화되고 모델로서 일반화 되는 단계를 말한다. 이를 통해 추론이나 예측을 형성하게 된다.
5. 시각화(Visualization)
직관적인 관찰을 나타내기 위한 단계. 적절한 시각화 툴을 이용해 관찰자가 판단하기 쉽도록 만들어 놓는다.
6. 사용 및 유지보수(deployment and maintenance)
실험 결과를 현장에서 적용하거나 생산적인 효과를 거두는 단계이다.
머신 러닝의 예시
- 네이버, 다음과 같은 포털사이트에서 제공하는 검색어 자동 완성 기능
- 시맨틱 분할을 적용하여 인간의 뇌를 스캔, 종양 여부를 진단
- 음성 명령에 반응하는 음성 인식 프로그램
- 어플리케이션 등에서 과거 구매이력, 관심 상품, 찜 목록 등을 분석하여 상품 추천하는 기능.
머신러닝의 전망
빅마켓리서치 조사 결과 머신 러닝 시장은 2025년 3,980 억 달러까지 성장할 것으로 예상된다. 또한 하나금융경영연구소 동향 자료에 따르면, 글로벌 AI 시장 규모는 2025년 988억 달러까지 성장할 것으로 예상된다.
자료출처
https://m.terms.naver.com/entry.naver?docId=2843009&cid=42107&categoryId=42107
https://ittrue.tistory.com/m/35
'IT' 카테고리의 다른 글
OS(운영체제)뜻,개념,역할,관련 직업,용어,예시[operating system/공학] (0) | 2023.03.29 |
---|---|
PDA(개인용 정보 단말기) 특징과 역사 (0) | 2023.03.29 |
[IT]QR코드 뜻,특징,활용분야,만들기 (사이트) (0) | 2023.03.29 |
VPN(가상사설망)-뜻,특징,역사 (0) | 2023.03.29 |
AI 저작권 논쟁 사례-스티븐 탈러의 다부스(DABUS) (0) | 2023.03.29 |