import 구문
import matplotlib.pyplot as plt import numpy as np import pandas as pd from sklearn.linear_model import LinearRegression, LogisticRegression from sklearn.model_selection import cross_val_score, train_test_split
jupyter notebook에서 파일에 바로 내용을 써 넣어서 채우고 싶을 때
#test2 파일에 쓰기 %%writefile test2 1,2,3,4,5 2,3,4,5,6 7,8,9,0,1
그래프 한글폰트 설정
# 운영 체제마다 한글이 보이게 하는 설정
# 윈도우
import matplotlib.font_manager
if platform.system() == 'Windows':
path = "c:\Windows\Fonts\malgun.ttf"
font_name = matplotlib.font_manager.FontProperties(fname=path).get_name()
plt.rc('font', family=font_name)
# 맥
elif platform.system() == 'Darwin':
rc('font', family='AppleGothic')
# 리눅스
elif platform.system() == 'Linux':
rc('font', family='NanumBarunGothic')datetime 데이터 분해하는 코드
train["d-year"] = train["datetime"].dt.year train["d-month"] = train["datetime"].dt.month train["d-day"] = train["datetime"].dt.day train["d-hour"] = train["datetime"].dt.hour train["d-minute"] = train["datetime"].dt.minute train["d-second"] = train["datetime"].dt.second train[["datetime", "d-year", "d-month", "d-day", "d-hour", "d-minute", "d-second"]].head()
zip파일 압축풀기
local_zip = './data/cats_and_dogs_filtered.zip'
zip_ref = zipfile.ZipFile(local_zip, 'r')
zip_ref.extractall('./data')
zip_ref.close()폴더 없으면 폴더 만들기. 그리고 wget
if not os.path.exists("./data"):
os.makedirs("./data")
if not os.path.exists("./data/cats_and_dogs_filtered.zip"):
!wget --no-check-certificate \
https://storage.googleapis.com/mledu-datasets/cats_and_dogs_filtered.zip \
-O ./data/cats_and_dogs_filtered.zipcsv 파일 읽기
import pandas as pd
df_train = pd.read_csv('data/ratings_train.txt', delimiter='\t', keep_default_na=False)
df_test = pd.read_csv('data/ratings_test.txt', delimiter='\t', keep_default_na=False)
df_train.head()학습 데이터, 테스트 데이터로 분리하기
import numpy as np from sklearn.model_selection import train_test_split X = [[0,1],[2,3],[4,5],[6,7],[8,9]] Y = [0,1,2,3,4] # 데이터(X)만 넣었을 경우 X_train, X_test = train_test_split(X, test_size=0.2, random_state=123) # X_train : [[0,1],[6,7],[8,9],[2,3]] # X_test : [[4,5]] # 데이터(X)와 레이블(Y)을 넣었을 경우 X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.33, random_state=321) # X_train : [[4,5],[0,1],[6,7]] # Y_train : [2,0,3] # X_test : [[2,3],[8,9]] # Y_test : [1,4]
Designed by sketchbooks.co.kr / sketchbook5 board skin
Sketchbook5, 스케치북5
Sketchbook5, 스케치북5
Sketchbook5, 스케치북5
Sketchbook5, 스케치북5