Skip to content

Latest commit

 

History

History

ch05

Folders and files

NameName
Last commit message
Last commit date

parent directory

..
 
 
 
 
 
 
 
 
 
 

머신 러닝 교과서 2판

5장: 차원 축소를 사용한 데이터 압축

목차

  • 주성분 분석을 통한 비지도 차원 축소
    • 주성분 분석의 주요 단계
    • 주성분 추출 단계
    • 총분산과 설명된 분산
    • 특성 변환
    • 사이킷런의 주성분 분석
  • 선형 판별 분석을 통한 지도 방식의 데이터 압축
    • 주성분 분석 vs 선형 판별 분석
    • 선형 판별 분석의 내부 동작 방식
    • 산포 행렬 계산
    • 새로운 특성 부분 공간을 위해 선형 판별 벡터 선택
    • 새로운 특성 공간으로 샘플 투영
    • 사이킷런의 LDA
  • 커널 PCA를 사용하여 비선형 매핑
    • 커널 함수와 커널 트릭
    • 파이썬으로 커널 PCA 구현
      • 예제 1 - 반달 모양 구분하기
      • 예제 2 - 동심원 분리하기
    • 새로운 데이터 포인트 투영
    • 사이킷런의 커널 PCA
  • 요약

코드 사용 방법 안내

이 책의 코드를 사용하는 가장 좋은 방법은 주피터 노트북(.ipynb 파일)입니다. 주피터 노트북을 사용하면 단계적으로 코드를 실행하고 하나의 문서에 편리하게 (그림과 이미지를 포함해) 모든 출력을 저장할 수 있습니다.

주피터 노트북은 매우 간단하게 설치할 수 있습니다. 아나콘다 파이썬 배포판을 사용한다면 터미널에서 다음 명령을 실행하여 주피터 노트북을 설치할 수 있습니다:

conda install jupyter notebook

다음 명령으로 주피터 노트북을 실행합니다.

jupyter notebook

브라우저에서 윈도우가 열리면 원하는 .ipynb가 들어 있는 디렉토리로 이동할 수 있습니다.

설치와 설정에 관한 더 자세한 내용은 1장의 README.md 파일에 있습니다.

(주피터 노트북을 설치하지 않았더라도 깃허브에서 ch05.ipynb을 클릭해 노트북 파일을 볼 수 있습니다.).

코드 예제 외에도 주피터 노트북에는 책의 내용에 맞는 섹션 제목을 함께 실었습니다. 또한 주피터 노트북에 원본 이미지와 그림을 포함시켰기 때문에 책을 읽으면서 코드를 쉽게 따라할 수 있으면 좋겠습니다.