로지스틱 회귀

Notice

Recent Posts

Tags more

Archives

관리 메뉴

코딩두의 포트폴리오

AI/머신러닝 + 딥러닝

코딩두 2024. 7. 17. 16:58

럭키 백

확률 계산

데이터셋 준비

다중 분류

사이킷런의 객체 속성에 _가 끝에 붙어 있으면

모델 클래스 생성 시 지정한 값 x, 모델이 데이터로부터 학습한 속성일 경우에 _

과정

로지스틱 회귀

종속 변수가 범주형(categorical)인 경우에 사용되는 통계적 모델로, 이진 분류 문제에 사용

이진 분류

계수 확인

로지스틱 회귀가 이진 분류일 경우 - 사실상 양성 클래스의 z값만 계산

-> 이진 분류일 경우 하나의 함수를 학습

다중 분류

c값이 작을수록 규제가 강해짐

로지스틱 회귀 모델 생성 및 학습
- LogisticRegression 객체를 생성하고, C=20과 max_iter=1000을 설정하여 모델을 학습
모델 성능 평가
- 훈련 데이터와 테스트 데이터에 대한 모델의 정확도를 계산하여 출력
- 훈련 데이터 정확도: 0.9328
- 테스트 데이터 정확도: 0.925
확률 예측:
- predict_proba 메소드를 사용하여 각 샘플에 대한 각 클래스별 예측 확률을 계산하고 출력
회귀 계수와 절편의 형태 확인:
- lr.coef_의 형태는 (7, 5)로, 7개의 클래스와 5개의 특성에 대해 회귀 계수가 존재
- lr.intercept_의 형태는 (7,)로, 7개의 클래스에 대해 절편이 존재

소프트맥스 함수

결정 함수 값을 확률로 변환하는 과정

결정 함수 값 계산:
- decision_function 메소드를 사용하여 각 샘플의 결정 함수 값을 계산
- 예: [[ -6.5, 1.03, 5.16, -2.73, 3.34, 0.33, -0.63], ... ]
소프트맥스 함수 적용:
- softmax 함수를 사용하여 결정 함수 값을 확률로 변환
- 예: [[0.0, 0.014, 0.841, 0.0, 0.136, 0.007, 0.003], ... ]
소프트맥스 함수 개념:
- 소프트맥스 함수는 다중 클래스 분류에서 각 클래스에 속할 확률을 계산

시그모이드 함수 - 이진분류일 경우 확률을 표현하기 위함

소프트맥스 - 다중분류일 경우 확률처럼 표현하기 위함

'AI/머신러닝 + 딥러닝' Related Articles