코딩두의 포트폴리오

훈련 셋, 테스트 셋 본문

AI/머신러닝 + 딥러닝

훈련 셋, 테스트 셋

코딩두 2024. 7. 8. 01:03

 

 

지도 학습: 입력 + 타겟 데이터롤 사용

비지도 학습: 유용한 작업 수행 시 특성 개수 줄이거나, 비슷한 샘플끼리 군집 등을 수행

 

 

훈련 셋의 일부를 테스트 셋으로 사용

슬라이싱 연산자 - 여러 개의 연산자 다룸

 

 

객체 초기화, train_input, train_target / test_input, test_target 

 

 

모집단의 특정 개인이나 그룹이 다른 개인이나 그룹보다 표본에 포함될 가능성이 높아

-> 표본이 편향되거나 대표성을 갖지 못하는 상황

훈련 셋, 테스트 셋 나눌 시 두 클래스가 잘 섞여 있어야 함

 

 

넘파이: Python에서 과학 연산을 위한 가장 기본적인 패키지

텐서: 다차원의 배열

 

훈련 셋, 데이터 셋 인덱스 섞기

훈련, 데이터 셋을 쌍으로 묶어서 섞기 slice () 함수는  배열 로 부터 특정 범위를 복사한 값들을 담고 있는 새로운  배열 을 만드는데 사용

 

파란색 - 훈련 데이터

주황색 - 테스트 데이터 

 

머신러닝 프로그램 작성

'AI > 머신러닝 + 딥러닝' 카테고리의 다른 글

최근접 이웃 회귀  (0) 2024.07.08
데이터 전처리  (0) 2024.07.08
마켓과 머신러닝  (0) 2024.07.05
코랩, 주피터 노트북  (0) 2024.07.05
인공지능, 머신러닝, 딥러닝 역사  (0) 2024.07.05