머신 러닝 교과서 2판
- 분류 알고리즘 선택
- 사이킷런 첫걸음: 퍼셉트론 훈련
- 로지스틱 회귀를 사용한 클래스 확률 모델링
- 로지스틱 회귀의 이해와 조건부 확률
- 로지스틱 비용 함수의 가중치 학습
- 아달린 구현을 로지스틱 회귀 알고리즘으로 변경
- 사이킷런을 사용하여 로지스틱 회귀 모델 훈련
- 규제를 사용하여 과대적합 피하기
- 서포트 벡터 머신을 사용한 최대 마진 분류
- 최대 마진
- 슬랙 변수를 사용하여 비선형 분류 문제 다루기
- 사이킷런의 다른 구현
- 커널 SVM을 사용하여 비선형 문제 풀기
- 선형적으로 구분되지 않는 데이터를 위한 커널 방법
- 커널 기법을 사용하여 고차원 공간에서 분할 초평면 찾기
- 결정 트리 학습
- 정보 이득 최대화: 자원을 최대로 활용
- 결정 트리 만들기
- 랜덤 포레스트로 여러 개의 결정 트리 연결
- k-최근접 이웃: 게으른 학습 알고리즘
- 요약
이 책의 코드를 사용하는 가장 좋은 방법은 주피터 노트북(.ipynb
파일)입니다. 주피터 노트북을 사용하면 단계적으로 코드를 실행하고 하나의 문서에 편리하게 (그림과 이미지를 포함해) 모든 출력을 저장할 수 있습니다.
주피터 노트북은 매우 간단하게 설치할 수 있습니다. 아나콘다 파이썬 배포판을 사용한다면 터미널에서 다음 명령을 실행하여 주피터 노트북을 설치할 수 있습니다:
conda install jupyter notebook
다음 명령으로 주피터 노트북을 실행합니다.
jupyter notebook
브라우저에서 윈도우가 열리면 원하는 .ipynb
가 들어 있는 디렉토리로 이동할 수 있습니다.
설치와 설정에 관한 더 자세한 내용은 1장의 README.md 파일에 있습니다.
(주피터 노트북을 설치하지 않았더라도 깃허브에서 ch03.ipynb
을 클릭해 노트북 파일을 볼 수 있습니다.).
코드 예제 외에도 주피터 노트북에는 책의 내용에 맞는 섹션 제목을 함께 실었습니다. 또한 주피터 노트북에 원본 이미지와 그림을 포함시켰기 때문에 책을 읽으면서 코드를 쉽게 따라할 수 있으면 좋겠습니다.