T-SNE (t-Distributed Stochastic Neighbor Embedding): 고차원의 데이터를 저차원으로 시각화
비선형 변환: 변환은 데이터의 복잡한 패턴이나 클러스터링을 표현합니다.
가까운 데이터는 더 가까이, 먼 데이터는 더 멀리.(사실 신경 안씀) 클러스터링, 군집화.
t-SNE의 목적 함수: t-SNE는 KL 발산(Kullback-Leibler divergence)을 최소화하는 방향으로 gradient descent
KL 발산은 두 확률 분포 간의 차이를 측정하는 방법이 목적 함수는 데이터 포인트 간의 확률적 거리를 비교하여 고차원에서 저차원으로의 매핑을 결정하는데, 이 과정에서 비선형적인 구조를 형성.
$$ D_{KL}
(P∥Q)=∑ _{x∈X}
P(x)log( {P(x)\over Q(x)}
) $$
동일한 데이터셋을 반복적으로 t-SNE에 적용할때, 절대 좌표가 달라질 수 있습니다.
random state
Non - Convex 는 여러개의 최소값을 가지는 최적화 문제. (다항함수 극값이 여러개) 극값이 여러개이므로, 시작 위치에 따라 최적값이 다르다.
PCA : 차원축소 기법. 최대한 특징을 살리며 차원을 낮추자.