Coding

과거 정리 - Untitled0.ipynb (import, plt 등)

조케빈 2022. 6. 27. 00:02

최근에 ML/AI 쪽에 관심이 생기면서 책을 사서 공부까지 해보고 있는데, 옛날에는 import 해서 다른 학습 모델들을 가져다 썻었던 것에 비해서 책의 내용은 직접 구현하고 있으니 괴리감이 있었다. 

기억이 희석되고 대체되기 보다는 기존의 내가 알던 것과 새로운 것을 비교해가면서 공부하려 한다.

------------------------------------------------------------------------------------------------------------------------------------------------------

실습 첫번째였던 걸로 기억한다. import 기능에 대해 배웠다.

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
import pandas as pd
import numpy as np
dates = pd.date_range('2019.09.01', periods=5)
df = pd.DataFrame(np.random.randn(6,4), index=dates, columns=['A''B''C''D'])
 
df.columns #columns, 열을 출력한다.
df.values  #데이터를 출력한다. 이때 출력은 행이 기준.
df.tail    #마지막 5개의 데이터를 출력한다.
 
df.sort_values(by='B'#B열 기준으로 Sorting(정렬한) 데이터 출력
 
df[0:3#0~2 까지의 데이터를 출력한다.
df.iloc[0:30:2#데이터 프레임 슬라이싱. 행은 0~2, 열은 0~1
 
data = {'a' : [1,2,3,4], 'b' : ['1st''2nd''3rd''4th']}
pd.DataFrame(data, columns=['b''a']) #Dataframe 
cs

위는 기본적인 pandas의 기능들. 그 때의 기억을 골라보며 주석을 추가했다.

 

 

역시 맛보기, matplotlib.pyplot에 대해서 되게 감탄했던 기억이 있다.

역시 이것도 뭐 ... 기본적인 plot과 label 이름 붙이기.

 

여기서 np.linspace는 구간 첫점, 구간 끝점, 구간 내의 점으로 구성된다.

여기서 주목할건  plt.plot 인데, 세 가지 그래프를 동시에 출력한다.

여기서 맨 앞에 import가 빠졌는데, import seaborn as sns로 불러오면 된다. 불러온 데이터셋은 빌지와 팁 관련 데이터

두번째는 boxplot으로 데이터 집합의 범위와 평균값, outlier를 빠르게 파악할 수 있다.

 

정말 많이썼던 Implot. 회귀선을 줘서 모델 평가하기 딱 좋았던 기억이 잇다.

 

pivot table(row, column, data), heatmap 둘 다 한눈에 보기 좋은 메소드. 

'붓꽃 분류' 할 때 써먹었던 pairplot 종을 기준으로 색을 넣을 수 있어서 한 눈에 어떤 지점이 경계인지 파악할 수 있다.

 

정말 다 맛보기용으로 써봤던, 체험해봤던 기록이 가득하다.