Untitled

1.Abstraction

S+t-SNE는 새로운 데이터가 끊임없이 오는, Streaming 한 data에 대해 점진적으로 업데이트하여 확장성과 적응성을 보장합니다.

각 단계서 가장 중요한 포인트를 선택하는 알고리즘을 사용하고, drift를 관리하고 embedding공간을 조정합니다.

결론 : S+t-SNE가 streaming scenario 에서 패턴을 효과적으로 포착할 수 있습니다.

  1. Related Work

Out of sample ⇒ 데이터의 작은 부분으로 시작하여 나머지 데이터를 매핑하여 확장성이 좋지만 정확도가 떨어지는 방법으로 S+t-SNE는 해당 방법에 속합니다.

지금까지의 다른 SNE 기법들은 Streaming Scenarios, 즉 concept drift환경을 고려하지 않았습니다. Dynamic t-sne같은경우, 새로운 데이터가 도착을 하더라도 기존 모든 데이터의 정보를 가지고있어야합니다.

S+t-SNE는 Streaming Scenarios와 Concept drift에 초점을 맞췄습니다.

3.S+t-SNE

Streaming Scenarios 의 두가지 문제

  1. Data streaming의 duration과 termination을 모르기 때문에 언제까지 데이터를 축적하고 t-sne를 적용할지 모른다.