머신러닝(Machine Learning)은 컴퓨터가 데이터에서 학습하고 패턴을 식별하여 작업을 수행하도록 하는 인공 지능의 한 분야
이는 명시적인 프로그래밍 없이도 기계가 데이터에서 스스로 학습하고 개선할 수 있도록 하는 기술
선형 회귀 모델
분류모델
알고리즘(algorithms) : 어떠한 문제를 해결하기 위한 일 련의 절차나 방법
머신러닝(machine learning) : 기계가 패턴을 학습하여 자동화하는 알고리즘
머신러닝의 3가지 요소
패턴, 규칙, 학습
머신러닝(machine learning) : 데이터를 컴퓨터에 학습 시켜 그 패턴과 규칙을 컴퓨터가 스스로 학습하도록 만 드는 기술
• 이전에는 사람이 지식을 직접 데이터베이스화한 후 컴퓨터 가 처리하도록 프로그램으로 만듦
• 머신러닝은 데이터를 분류하는 수학적 모델을 프로그래밍 하여, 데이터만 입력하면 이미 만들어진 수학 모델이 규칙으 로 적용되어 여러 문제를 풀 수 있음
▪ 딥러닝(deep learning) : 머신러닝 기법 중 신경망(neural network)을 기반으로 사물이나 데이터를 군집화하거나 분류하는 데 사용하는 기술
선형예측, 분류예측(선형)
회귀모델, 분류모델, 군집모델이 들어갈 것.
회귀모델: 연속형 데이터(숫자 단위)
분류모델: 범주형 데이터 (구분할 수 있는 데이터, 남자 여자, 자동차 비행기)
비지도학습: 분류를 위해서 쓰기 때문에 범주형데이터가 자주 쓰인다. 군집
문제 X에 실제 답(ground truth) Y의 존재 여부에 따라 구분
-회귀
독립변수 X
Y는 종속변수
회귀(regression) : 독립변수 x와 종속변수 y의 관계를 함 수식으로 설명
y=ax+b 1차 방정식
b는 절편
-분류
분류: 데이터를 특정 기준(패턴)에 따라 나눔
이진분류: 2개의 값중 1개를 분류
다중 분류: 3개 이상 분류 실행
-군집(비선형)
군집: 기존에 모여 있던 데이터에 대해 따로 분류기준을 주지 않고 모델이 스스로 분류기준을 찾아 집단을 모으는 기법
머신러닝 프레임워크: 사이킷런. 실제 머신러닝 모델을 생성하고 데이터에 적용할 수 있도록 도와주는 도구
### 데이터 처리
### - 방어와 도미 데이터
# - 생선의 종류를 분류(구분)하기 위한 모델 생성을 위해
# - 독립변수와 종속변수로 데이터를 가공해야함
# - 독립변수 (x): 길이, 무게
# - 종속변수 (y): 생성종류(방어 또는 도미)
### 훈련모델 처리 절차
# 1. 데이터 전처리
# 2. 데이터 정규화
# 3. 훈련 : 검증 : 테스트 데이터로 분류(또는 훈련: 테스트 데이터로 분류)
# 6:2:2 또는 7:2:1 데이터가 적은 경우에는 8:2 또는 7:3 정도로 분류
# 4. 모델 생성
# 5. 모델 훈련(fit) ( 훈련 데이터와 검증 데이터 사용, 또는 테스트 데이터)
# 6. 모델 평가( 모델 선정, 검증데이터 )
# 7. 하이퍼파라메터 튜닝
# 8. 5번~6번 진행
# 9. 최종 테스트(예측, predict() )(테스트 데이터 또는 새로운 데이터로 사용)
# 1~5 9
'파이썬' 카테고리의 다른 글
머신러닝 기초 2 (3) | 2023.12.20 |
---|---|
생선분류로 알아보는 머신러닝 (1) | 2023.12.20 |
데이터프레임_정리 (2) | 2023.12.05 |
워드클라우드_시각화 (3) | 2023.12.05 |
원형 그래프 그리기 (1) | 2023.12.05 |