코딩두의 포트폴리오

데이터 전처리 본문

AI/머신러닝 + 딥러닝

데이터 전처리

코딩두 2024. 7. 8. 13:39

 

예측

 

리스트에 리스트 생성

컬럼 스택 - 주어진 배열을 나란히 세우고 차례대로 열에 붙임

numpy _ones 함수 -1로 채워진 어떤 특정 크기 배열 생성 시

numpy _zeros 함수 - 0으로 채워진 어떤 특정 크기의 배열 만들 때

 

 

사이킷런

 

도미 -> 빙어 예측?

 

기준 설정

weight 축만 변경 / 두 샘플 스케일 맞추기

 

표준 점수: (특성 - 평균) / 표준편차

넘파이 브로드캐스팅 - 서로 다른 모양(shape)의 배열도 일정 조건을 만족하면 연산

 

다시 표현

테스트 셋 -> 훈련 셋의 평균, 표준편차로 변경

 

변환된 데이터 훈련

데이터 전처리: 기존의 데이터를 머신러닝 알고리즘에 알맞은 데이터로 바꾸는 과정

'AI > 머신러닝 + 딥러닝' 카테고리의 다른 글

선형 회귀  (0) 2024.07.08
최근접 이웃 회귀  (0) 2024.07.08
훈련 셋, 테스트 셋  (0) 2024.07.08
마켓과 머신러닝  (0) 2024.07.05
코랩, 주피터 노트북  (0) 2024.07.05