반응형 전체 글141 계층적 군집과 DBSCAN — K-Means를 넘어서는 클러스터링 [10편] 덴드로그램으로 보는 계층적 군집과 밀도 기반 DBSCAN을 비교합니다목표: K-Means의 한계를 극복하는 계층적 군집과 DBSCAN 알고리즘을 학습하고, 각 알고리즘의 장단점을 비교합니다.1. 계층적 군집(Hierarchical Clustering)이란?계층적 군집은 데이터를 계층적인 트리 구조로 만드는 알고리즘입니다. K-Means와는 달리, 미리 클러스터 개수를 정할 필요가 없습니다.두 가지 방식:응집형(Agglomerative): 각 점에서 시작하여 점진적으로 병합. 상향식(Bottom-up) 접근분열형(Divisive): 모든 점을 하나의 클러스터에서 시작하여 분할. 하향식(Top-down) 접근우리는 주로 응집형 계층적 군집을 사용합니다. 이를 시각화한 그래프를 덴드로그램(Dendrogram).. 2026. 4. 7. Ridge vs LASSO vs ElasticNet — 과적합을 잡는 규제 기법 총정리 [8편] L1, L2 규제의 차이점과 ElasticNet까지, 회귀 모델의 규제 전략을 비교합니다시리즈: 머신러닝 실전 완전 정복6편: 선형 회귀 기초 7편: RANSAC과 다항 회귀 8편: 규제 기법1. 왜 규제가 필요한가?과적합(Overfitting)은 모델이 훈련 데이터의 노이즈까지 학습하여 새로운 데이터에서 성능이 떨어지는 현상입니다. 규제(Regularization)는 모델의 복잡도를 제한하여 과적합을 방지합니다.과적합 vs 과소적합과적합: 훈련 오차 ↓, 검증 오차 ↑ (나쁨)과소적합: 훈련·검증 오차 모두 ↑ (나쁨)이상적: 훈련·검증 오차 모두 낮음2. Ridge 회귀 (L2 규제)Ridge는 비용 함수에 가중치의 제곱합을 페널티로 추가합니다. 모든 가중치를 균등하게 축소합니다.비용 함수: J(w).. 2026. 4. 6. K-Means 클러스터링이란? 엘보우 방법과 실루엣 분석까지 [9편] 비지도 학습의 대표 알고리즘 K-Means의 원리부터 최적 클러스터 수 결정까지 코드로 익힙니다목표: K-Means 알고리즘의 동작 원리를 이해하고, 엘보우 방법과 실루엣 분석으로 최적의 클러스터 수를 결정하는 방법을 학습합니다.1. 비지도 학습과 군집 분석이란?비지도 학습(Unsupervised Learning)은 레이블이 없는 데이터에서 숨겨진 패턴이나 구조를 찾는 머신러닝 기법입니다. 그중 군집 분석(Clustering)은 유사한 데이터들을 그룹으로 나누는 작업입니다.군집 분석의 핵심은 다음과 같습니다:데이터 간의 거리(Distance) 정의유사한 점들을 같은 클러스터로 할당클러스터 중심(Centroid) 업데이트2. K-Means 알고리즘 구현K-Means는 k개의 클러스터로 데이터를 나누는 가장.. 2026. 4. 6. RANSAC과 다항 회귀 — 이상치와 비선형 관계 다루기 [7편] 이상치에 강한 RANSAC과 곡선을 그리는 다항 회귀를 파이썬으로 구현합니다시리즈: 머신러닝 실전 완전 정복6편: 선형 회귀 기초 7편: RANSAC과 다항 회귀 8편: 규제 기법1. RANSAC이란?RANSAC(Random Sample Consensus)은 이상치(Outlier)에 강건한 회귀 방법입니다. 일반 선형 회귀는 이상치의 영향을 크게 받지만, RANSAC은 이를 자동으로 무시합니다.RANSAC 작동 원리무작위로 최소 샘플 선택그 샘플로 모델 학습전체 데이터에 대해 모델 적합도 계산이상치 판정 (임계값 초과)반복 후 최적 모델 선택from sklearn.linear_model import RANSACRegressorransac = RANSACRegressor( LinearRegressio.. 2026. 4. 4. 이전 1 2 3 4 ··· 36 다음 반응형