일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- Generative model
- ResNet
- Ann
- VGGNet
- nlp
- Logistic Regression
- NER
- Clustering
- 군집화
- tensorflow
- AI 윤리
- 경사하강법
- Attention
- cross domain
- Support Vector Machine
- stemming
- gaze estimation
- SOMs
- 자기조직화지도
- TFX
- Gradient Descent
- RNN
- textmining
- Transfer Learning
- MLOps
- LSTM
- BERT
- NMF
- Python
- Binary classification
- Today
- Total
목록결측치 (2)
juooo1117
원하는 조건을 데이터를 조회하고 일괄적으로 처리하는 방법에 대해 정리해 보자 1. 데이터 조회 - filter() # 'Age'의 평균이 20이상이면 return! def check_mean(data): return data['Age'].mean() >= 20 # 'Country' 별 'Age'의 평균이 20이상인 값 조회 df.groupyby('Country').filter(check_mean) # 'col_name'과 'threshold'를 입력으로 받음 def check_mean2(data, col_name, threshold): return data[col_name].mean() >= threshold df.groupby('Country').filter(check_mean2, col_name='A..
데이터를 불러와서 만질 때 가장 많이 쓰이는 pandas에 대해서 정리하고자 한다. 기본적으로 가장 자주 쓰이는 것들을 정리해 보자 1. .csv 데이터 불러오기 df = pd.read.csv('/data/grade3.csv', header=None, # 원래는 첫 행이 header가 된다. names=['ID','국어','영어'] # column명을 정해준다. na_values=['없음', '미정', '탈락'] # '없음','미정','탈락' 3가지 값이 NaN 이 된다. ) df.isnull().sum() # column별로 null인 값이 몇개인지 확인 df = pd.read.csv('/data/grade3.csv', index_col=0 # 0번 column을 index로 사용 ) df = pd.r..