
1.Abstraction
S+t-SNE는 새로운 데이터가 끊임없이 오는, Streaming 한 data에 대해 점진적으로 업데이트하여 확장성과 적응성을 보장합니다.
각 단계서 가장 중요한 포인트를 선택하는 알고리즘을 사용하고, drift를 관리하고 embedding공간을 조정합니다.
결론 : S+t-SNE가 streaming scenario 에서 패턴을 효과적으로 포착할 수 있습니다.
Out of sample ⇒ 데이터의 작은 부분으로 시작하여 나머지 데이터를 매핑하여 확장성이 좋지만 정확도가 떨어지는 방법으로 S+t-SNE는 해당 방법에 속합니다.
지금까지의 다른 SNE 기법들은 Streaming Scenarios, 즉 concept drift환경을 고려하지 않았습니다. Dynamic t-sne같은경우, 새로운 데이터가 도착을 하더라도 기존 모든 데이터의 정보를 가지고있어야합니다.
S+t-SNE는 Streaming Scenarios와 Concept drift에 초점을 맞췄습니다.
3.S+t-SNE
Streaming Scenarios 의 두가지 문제