일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- nlp
- textmining
- LSTM
- BERT
- Attention
- Generative model
- 경사하강법
- MLOps
- Support Vector Machine
- NER
- tensorflow
- Ann
- SOMs
- Gradient Descent
- 군집화
- VGGNet
- NMF
- stemming
- ResNet
- cross domain
- Clustering
- Logistic Regression
- RNN
- gaze estimation
- Transfer Learning
- Binary classification
- AI 윤리
- Python
- 자기조직화지도
- TFX
- Today
- Total
목록군집화 (2)
juooo1117

Clustering with NMF(Non-negative factorization) Document Classification 참고 블로그 : https://www.davidsbatista.net/blog/2017/04/01/document_classification/ - classifiy a document into a set of pre-defined categories using different supervised classifiers and text representations. - Only use the plot of the movie and the genre on which the movie is classified. - Dataset: IMDB datasets of movie, genre..

Clustering data instances를 비슷한 것끼리 묶어서 그룹을 만드는 방법으로 같은 cluster에 속해있는 문서들이라면 해당 문서들은 서로 비슷해야 하며, 다른 cluster에 해당되는 문서들끼리는 서로 달라야 한다. unsupervised learning의 한 방법이다. Non-negative Matrix Factorization(NMF) 비음수 행렬 분해: 행렬을 분해하는 방법으로 모든 요소가 음수가 아닌 행렬 V를, 모든 요소가 음수가 아닌 행렬 W, H의 곱으로 분해한다. NMF는 document clustering 에 사용할 수 있다. Goal: V가 주어졌을 때, V ≈ WH 를 만족하는 W, H 를 구해내는 것 V의 column vector는 W의 column vector들과..