파이썬-머신러닝(3)
-
데이터 전처리
모듈 및 데이터 호출import pandas as pdimport matplotlib.pyplot as plt%matplotlib inlinedf = pd.read_csv('data/housing/housing.csv')캘리포니아 지역에서 발견된 주택과 1990년 인구조사 데이터를 기반으로 한 몇 가지 요약 통계에 관한 데이터 칼럼 정보variableDefinitionkeylongitude경도 latitude위도 housing_median_age블록 내 주택들의 중간 연식 total_rooms블록 내 주택들의 총 방의 수 total_bedrooms total_rooms블록 내 주택들의 총 침실 수 population블록 내 총 주민 수 households블록 내 총 가구 수 median_income블록 ..
2024.09.27 -
Pandas 개요
ML에서 Pandas의 핵심: Series, DataFramepd.read_csv()df = pd.read_csv('data/train.csv')경로에 있는 파일읽기현재 작업위치에서 data폴더 안의 train.csv 파일을 불러옴구분자 설정df = pd.read_csv('data/train.tsv', sep='\t')tab으로 구분된 아이는 set 파라미터를 이용해 불러올 수 있음데이터에 따라 구분자(separator)가 매우 다양한데, 제대로 안읽혀도 separator를 변경하면 됨df.head(n)윗 n줄 출력default=5df.head()df.dtypes각 column별 dtype 파악df.dtypesPassengerId int64Survived int64Pclass ..
2024.09.20 -
Numpy 개요
편리하기 생성하기: zeros, ones, arange, fullzeros: 입력한 인자만큼의 크기로 0이 채워진 arrayones: 입력한 인자만큼의 크기로 1이 채워진 arrayarange: '시작', '끝', '간격'을 입력하여, '시작'과 '끝' 사이의 수를 '간격'만큼의 차이를 둔 arraynp.full((3,3), 5) 5로 채워진 3,3 배열arr_zeros = np.zeros(shape=(3,2))arr_ones = np.ones(shape=(3,2))arr_arange = np.arange(10)print(arr_zeros)print(arr_ones)print(arr_arange)[[0. 0.] [0. 0.] [0. 0.]][[1. 1.] [1. 1.] [1. 1.]][0 1 2 3 4 ..
2024.09.19