일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 핸즈온머신러닝 #handson
- IDE #spyder
- 선형회귀 #정규방정식 #계산복잡도 #LinearRegression #Python #ML
- 확률적경사하강법 #경사하강법 #머신러닝 #선형회귀 #ML #Chap4
- ML #핸즈온머신러닝 #학습곡선 #편향분산트레이드오프
- python #dataframe #파생변수 #map #lambda #mapping
- 경사하강법 #핸즈온머신러닝 #머신러닝 #ML
- 티스토리 #수학수식 #수학수식입력 #티스토리블로그 #수식입력
- Chap4 #다항회귀 #PolynomialRegression #ML #머신러닝
- Chap4 #릿지회귀 #정규방정식 #확률적경사하강법 #SGD #규제가있는선형모델
- 인덱싱 #슬라이싱 #python #파이썬 #수정및삭제 #원소의수정 #객체의함수 #keys#values#items#get#len#append#sort#sorted
- adp #데이터분석전문가 #데이터분석자격증 #adp후기 #adp필기
- 키워드추출 #그래프기반순위알고리즘 #RandomSurferModel #MarcovChain #TextRank #TopicRank #EmbedRank
- Chap4 #ML #미니배치경사하강법 #경사하강법 #머신러닝 #핸즈온머신러닝
- 객체의종류 #리스트 #튜플 #딕셔너리 #집합 #Python #파이썬 #list #tuple #dictionary #set
- 티스토리블로그 #티스토리 #PDF #블로그PDF저장
- python #파이썬 #pandas #dataframe #dataframe생성 #valueerror
- 파이썬 #Python #가상환경 #anaconda #python설치 #python가상환경
- Chap4 #핸즈온머신러닝 #머신러닝 #핸즈온머신러닝연습문제
- Chap4
- Chap4 #ML #배치경사하강법 #경사하강법 #핸즈온머신러닝 #핸즈온
- 라쏘회귀 #엘라스틱넷 #조기종료
- Today
- Total
목록Python/데이터 시각화 (13)
StudyStudyStudyEveryday

1. 한 번에 많은 데이터 불러오기 'game_user_data' 폴더의 데이터를 python으로 불러올 것이다. 'game_user_data' 폴더는 'dau'와 'dpu'라는 하위 폴더를 포함하고 있다. dau : daily active users의 약자로, 하루동안 게임을 실행한 유저들의 데이터를 포함하고 있다. dpu : daily pay users의 약자로, 하루동안 게임에 돈을 지불한 유저의 데이터를 포함하고 있다. import os os.listdir(r"C:/Users/LG/Desktop/데이터시각화/data/game_user_data") path = r"C:/Users/LG/Desktop/데이터시각화/data/game_user_data" folder = "dau" subfolder = "..

필요한 변수가 모형에서 빠진 경우 1. 'simulation.csv' 파일을 읽어오고 x1, x2, y를 이용해 3D scatter plot 그리기 import os import pandas as pd import statsmodels.api as sm from sklearn import linear_model import plotly.graph_objects as go import plotly.io as pio pio.renderers.default='browser' os.chdir(r'C:\Users\LG\Desktop\데이터시각화\data') data = pd.read_csv('./simulation.csv', header=0) scatter = go.Scatter3d(x=data.x1, y=dat..

3D plots 산점도, 선 그래프 등은 간혹 2차원 평면상에 표현하는 것이 제한적일 수 있다. 이럴 경우 더 많은 정보를 제공하고자 3차원 공간상에서의 산점도 및 선 그래프 등을 생각할 수 있다. 3차원 산점도 그리기 matplotlib의 pyplot을 통해 3차원 산점도를 그려보겠다. pyplot에서 3차원 산점도를 그리려면 먼저 3차원 축을 생성해야한다. axes변수를 통해 3차원 객체를 생성하고 scatter을 이용해 x, y, z축을 입력으로 받아 3차원 산점도를 그린다. mtcars = sm.datasets.get_rdataset('mtcars', 'datasets') mtcars_dat = mtcars.data.copy() # 3d 그래프 그리기 fig = plt.figure() axes =..

Histogram 히스토그램은 수치형 자료의 분포를 근사적으로 보여주는 그래프이다. 값들의 도수 분포를 나타낸다. 히스토그램은 pyplot의 hist 함수로 그릴 수 있다. R에 있는 iris 데이터를 이용해 히스토그램을 그려보겠다. import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns import statsmodels.api as sm iris = sm.datasets.get_rdataset('iris', 'datasets') iris_dat = iris.data.copy() plt.hist(iris_dat['Sepal.Length']) 히스토그램은 계급구간을 어떻게 설정하는가에 따라 달라진..

막대 그래프 막대 그래프는 특정 값을 가진 범주형 데이터를 막대와 그의 높이, 너비 등을 통해 표현하는 그래프이다. matplotlib의 pyplot에서는 bar 함수를 통해 막대 그래프를 그릴 수 있다. R에 있는 usa_states 데이터셋을 불러와 region 변수에 대한 막대그래프를 그려보겠다. import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns import statsmodels.api as sm # 데이터 불러오기 state_region = sm.datasets.get_rdataset('usa_states', 'stevedata') state = state_region.data.co..

산점도 산점도는 데이터를 좌표평면 (xy평면) 상의 점으로 표현하여 두 변수 간의 관계를 나타내는 그래프이다. Python 그래프를 그리기 위해서 matplotlib 라이브러리를 설치해야한다. anaconda prompt 창에서 설치하는 코드는 다음과 같다. conda install matplotlib 그럼 산점도에 대한 예시를 들어보겠다. import matplotlib.pyplot as plt import numpy as np import pandas as pd from math import pi # 0에서 2*pi 사이에서 균일한 간격으로 30개의 값 추출 x = np.linspace(0, 2*pi, 30) y1 = np.sin(x) y2 = np.cos(x) plt.plot(x, y1,"o") p..
조건문 조건문은 특정 조건을 만족하는지 여부에 따라 코드의 실행 여부를 결정한다. 조건문은 프로그래밍에서 매우 자주 사용하게 되므로 꼭 이해하고 넘어가야한다. if 문 조건 (condition) 의 값이 True일 경우 해당 코드를 실행하고 False일 경우 실행하지 않는다. if문의 문법은 다음과 같다. if condition : 실행할 내용 예를 들어보자. # x, y가 같으면 You are a liar, 다르면 That's a right 출력 x = 'Jenny' y = 'Rose' if x == y: print('You are a liar') else: print("That's a right") That's a right ## x가 175보다 크면 Jenny, 170보다 크면 Rose, 둘 다 아..
Pandas pandas는 효율적인 데이분석을 위한 라이브러리이다. dataframe 등 데이터 분석을 위한 다양한 객체와 함수를 제공한다. anaconda prompt에서 다음 명령어로 설치가 가능하다. conda install pandas 이후 python에서 pandas 라이브러리를 불러와줘야한다. import pandas as pd 시리즈(series)와 데이터 프레임(data frame) 생성 시리즈는 리스트, 튜플, numpy의 array를 입력하고 이름을 지정해 생성한다. 데이터프레임은 일반적으로 dictionary를 입력으로 받아 생성하거나, numpy array를 받아 생성한다. 만약 dictionary를 입력으로 받을 경우, key가 열 이름이 되며, value가 열의 데이터 값이 된다..