Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- Gradient Descent
- nlp
- Generative model
- Logistic Regression
- cross domain
- 자기조직화지도
- Ann
- 경사하강법
- Attention
- NMF
- NER
- Clustering
- ResNet
- MLOps
- TFX
- Binary classification
- gaze estimation
- BERT
- tensorflow
- Transfer Learning
- LSTM
- stemming
- AI 윤리
- textmining
- Support Vector Machine
- RNN
- Python
- VGGNet
- SOMs
- 군집화
Archives
- Today
- Total
목록NLTK (1)
juooo1117

cranfieldDocs 파일(.txt)들을 이용해서 text pre-processing 하는 과정 이용한 전처리 방법들은 다음과 같다. Remove markups Convert to lowercase 특정 tag안의 내용만 가져오기 Remove punctuation, number Tokenization Practice 필요한 패키지를 import하고 'cranfieldDocs'를 불러온 뒤, 파일 안의 line들을 하나의 string안에 각각 길게 저장한다. from bs4 import BeautifulSoup import string from nltk.stem import PorterStemmer # read file doc = "" for line in open('/Users/juhyeon/pyth..
Artificial Intelligence
2023. 10. 27. 15:19