less than 1 minute read

고차원 데이터를 저차원 공간으로 변환하여 데이터의 전반적인 구조와 지역적인 관계를 모두 잘 보존하면서 효율적으로 시각화하는 차원 축소 기법

특히 대규모 데이터셋에 대해 t-SNE보다 계산 효율적이며, 데이터의 지역 및 전역 구조를 동시에 보존하는 능력이 뛰어나다. UMAP은 위상 데이터 분석과 알고리즘 최적화를 기반으로 하여, 다양한 데이터 유형과 거리 메트릭에 적용할 수 있으며, 클러스터링, 시각화, 및 데이터 탐색 등 다양한 분야에서 활용된다.

Disadvantage of t-SNE



  • learning speed 가 매우 느리다
  • Cluster 간 similarity 는 not guaranteed

M


UMAP is a method what improved t-sne



1

results

Leave a comment