Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- LSTM
- Clustering
- AI 윤리
- stemming
- Python
- TFX
- ResNet
- 경사하강법
- cross domain
- textmining
- 군집화
- Support Vector Machine
- nlp
- NER
- RNN
- NMF
- BERT
- Generative model
- tensorflow
- VGGNet
- Transfer Learning
- Attention
- MLOps
- Gradient Descent
- Ann
- SOMs
- Logistic Regression
- 자기조직화지도
- gaze estimation
- Binary classification
Archives
- Today
- Total
목록cranfieldDocs (1)
juooo1117

cranfieldDocs 파일(.txt)들을 이용해서 text pre-processing 하는 과정 이용한 전처리 방법들은 다음과 같다. Remove markups Convert to lowercase 특정 tag안의 내용만 가져오기 Remove punctuation, number Tokenization Practice 필요한 패키지를 import하고 'cranfieldDocs'를 불러온 뒤, 파일 안의 line들을 하나의 string안에 각각 길게 저장한다. from bs4 import BeautifulSoup import string from nltk.stem import PorterStemmer # read file doc = "" for line in open('/Users/juhyeon/pyth..
Artificial Intelligence
2023. 10. 27. 15:19