k-평균(k-means algorithm) 군집 분석이란?
K-평균 알고리즘의 3단계1) 임의로 k개의 데이터 포인트를 시드로 선택 2) 각각의 레코드를 가장 가까운 시드에 배정하여 묶음. (각 개체들과 시드 간의 거리를 구함) 3) 군집의 중심점을 찾아감 → 군집의 중심점이 다음 2단계에서 시드가 됨. → 2와 3 단계가 계속 반복됨. → 군집의 경계가 더 이상 변하지 않을 때까지 계속 됨. k-평균 알고리즘의 예시1) 프로세스 1: 군집수 k를 2로 정함. -> 랜덤으로 2개의 시드를 초기화 함. (이 값은 random seed에 따라 달라짐) 파란 동그라미 - 각 객체들/ 빨란 네모 - 시드2) 프로세스 2: 모든 개체들과 두 시드와의 거리를 계산하여 가장 가까운 시드에 배정함으로써 군집을 생성. 3) 프로세스 3: 묶여진 군집 내에서 중심을 이동. 4) 프로세스 2': 이동한 중심을 기준으로 가장 가까운 시드에 배정하여 군집을 생성. 5) 프로세스 3': 묶여진 군집 내에서 중심이 이동됨. 6) 이동한 중심을 기준으로 가장 가까운 시드에 배정하여 군집을 생성. 만약 군집이 변함이 없다면 프로세스 종료. K-means의 장단점은?장점
단점
실습
2개의 군집, 3개의 군집으로 각각 나눴을 때 |