๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ

์ „์ฒด ๊ธ€36

[python/ํŒŒ์ด์ฌ] Numpy ๋„˜ํŒŒ์ด (1) ๋„˜ํŒŒ์ด(Numpy) ๋„˜ํŒŒ์ด(Numpy)๋Š” ์ˆ˜์น˜ ๋ฐ์ดํ„ฐ๋ฅผ ๋‹ค๋ฃจ๋Š” ํŒŒ์ด์ฌ ํŒจํ‚ค์ง€ ๋‹ค์ฐจ์› ํ–‰๋ ฌ ์ž๋ฃŒ๊ตฌ์กฐ์ธ ndarray๋ฅผ ํ†ตํ•ด ๋ฒกํ„ฐ ๋ฐ ํ–‰๋ ฌ์„ ์‚ฌ์šฉํ•˜๋Š” ์„ ํ˜• ๋Œ€์ˆ˜ ๊ณ„์‚ฐ์—์„œ ์ฃผ๋กœ ์‚ฌ์šฉ # ์•„๋‚˜์ฝ˜๋‹ค๋ฅผ ์„ค์น˜ํ•˜์ง€ ์•Š์•˜๋‹ค๋ฉด numpy ๋ณ„๋„ ์„ค์น˜ pip install numpy 1. Numpy arrays 1D array : axis0 2D array : axis0. axis1 3D array : axis0, axis1, axis2 2. Creating arrays Numpy์˜ ํ•ต์‹ฌ์€ ndarray. np.array()๋Š” ๋ฆฌ์ŠคํŠธ, ํŠœํ”Œ, ๋ฐฐ์—ด๋กœ ๋ถ€ํ„ฐ ndarray ์ƒ์„ฑ import numpy as np 1์ฐจ์› ๋ฐฐ์—ด ์ƒ์„ฑ a = np.array([1, 2, 3]) a array([1, 2, 3]) 2์ฐจ์› ๋ฐฐ์—ด ์ƒ์„ฑ. ์ฃผ์˜.. 2022. 8. 15.
[python/ํŒŒ์ด์ฌ] ๋ฉœ๋ก ์ฐจํŠธ ํฌ๋กค๋ง ๋ฉœ๋ก  ์ฐจํŠธ ํฌ๋กค๋ง ๋ฉ€ํ‹ฐ์บ ํผ์Šค ๊ตญ๋น„์ง€์› '์„œ๋น„์Šค ์‚ฐ์—… ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•œ ๋น…๋ฐ์ดํ„ฐ ๋ถ„์„' ๊ณผ์ •์„ ์ˆ˜๊ฐ•ํ•˜๋ฉฐ ์ฒซ ๋ฒˆ์งธ๋กœ ํ–ˆ๋˜ ํ”„๋กœ์ ํŠธ # 2021๋…„ 12์›” ์›”๊ฐ„ top100 ๋ฐ์ดํ„ฐ ํฌ๋กค๋ง ํ›„ ์„ ํ˜ธ ์žฅ๋ฅด ์กฐ์‚ฌ # ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ import import sys import os import pandas as pd import numpy as np from selenium import webdriver from selenium.webdriver import ActionChains as AC import chromedriver_autoinstaller from tqdm import tqdm from tqdm import tqdm_notebook import re from time import sleep import time.. 2022. 8. 10.
[python/ํŒŒ์ด์ฌ] ํŒ๋‹ค์Šค ํ”„๋กœํŒŒ์ผ๋ง(Pandas-Profiling) ํŒ๋‹ค์Šค ํ”„๋กœํŒŒ์ผ๋ง(Pandas Profiling) ์ข‹์€ ๋จธ์‹  ๋Ÿฌ๋‹ ๊ฒฐ๊ณผ๋ฅผ ์–ป๊ธฐ ์œ„ํ•ด์„œ ๋ฐ์ดํ„ฐ์˜ ์„ฑ๊ฒฉ์„ ํŒŒ์•…ํ•˜๋Š” ๊ณผ์ •์ด ์„ ํ–‰๋˜์–ด์•ผ ํ•œ๋‹ค. ์ด ๊ณผ์ •์—์„œ ๋ฐ์ดํ„ฐ ๋‚ด ๊ฐ’์˜ ๋ถ„ํฌ, ๋ณ€์ˆ˜ ๊ฐ„์˜ ๊ด€๊ณ„, Null๊ฐ’๊ณผ ๊ฐ™์€ ๊ฒฐ์ธก๊ฐ’(missing values)์กด์žฌ ์œ ๋ฌด ๋“ฑ์„ ํŒŒ์•…ํ•˜๊ฒŒ ๋˜๋Š”๋ฐ ์ด์™€ ๊ฐ™์ด ๋ฐ์ดํ„ฐ๋ฅผ ํŒŒ์•…ํ•˜๋Š” ๊ณผ์ •์„ EDA(Exploratory Data Analysis, ํƒ์ƒ‰์  ๋ฐ์ดํ„ฐ ๋ถ„์„) ์ด๋ผ๊ณ  ํ•œ๋‹ค. ์ด๋Ÿฌํ•œ ํƒ์ƒ‰์  ๋ฐ์ดํ„ฐ ๋ถ„์„์— ๋“œ๋Š” ์‹œ๊ฐ„์„ ์ ˆ์•ฝํ•˜๊ธฐ ์œ„ํ•ด ๋ช‡ ์ค„์˜ ์ฝ”๋“œ๋กœ ์—ฌ๋Ÿฌ ๋ถ„์„ ํ†ต๊ณ„๋Ÿ‰์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ๋Š” ๊ธฐ๋Šฅ์„ ์ œ๊ณตํ•˜๋Š” ํ•˜๋Š” ๋ฐ ์ด๋ฅผ ํŒ๋‹ค์Šค ํ”„๋กœํŒŒ์ผ๋ง(Pandas-Profiling) ์ด๋ผ๊ณ  ํ•œ๋‹ค. pip ๋ช…๋ น์„ ํ†ตํ•ด ํŒจํ‚ค์ง€ ์„ค์น˜ pip install -U pandas-profiling ๋ฐ์ดํ„ฐ ๋กœ๋“œํ•˜๊ธฐ im.. 2022. 8. 5.
[python/ํŒŒ์ด์ฌ] Matplotlib (3) - ๋ฐ•์Šค ํ”Œ๋กฏ(box plot), ํžˆ์Šคํ† ๊ทธ๋žจ, ํŒŒ์ด ์ฐจํŠธ(Pie chart), 3์ฐจ์› ํ”Œ๋กœํŒ… Matplotlib ๋ฐ•์Šค ํ”Œ๋กฏ(box plot) ax.boxplot() ์ˆ˜์น˜ ๋ฐ์ดํ„ฐ๋ฅผ ํ‘œํ˜„ํ•˜๋Š” ํ•˜๋‚˜์˜ ๋ฐฉ์‹ ์ผ๋ฐ˜์ ์œผ๋กœ ๋ฐ•์Šค ํ”Œ๋กฏ์€ ์ „์ฒด ๋ฐ์ดํ„ฐ๋กœ๋ถ€ํ„ฐ ์–ป์–ด์ง„ ๋‹ค์„ฏ ๊ฐ€์ง€ ์š”์•ฝ ์ˆ˜์น˜๋ฅผ ์‚ฌ์šฉํ•ด์„œ ๊ทธ๋ฆผ ์ตœ์†Œ๊ฐ’ ์ œ 1์‚ฌ๋ถ„์œ„ ์ˆ˜(Q1) ์ œ 2์‚ฌ๋ถ„์œ„ ์ˆ˜ ๋˜๋Š” ์ค‘์œ„์ˆ˜(Q2) ์ œ 3์‚ฌ๋ถ„์œ„ ์ˆ˜(Q3) ์ตœ๋Œ€๊ฐ’ import matplotlib.pyplot as plt import seaborn as sns sns.set(rc={'figure.figsize':(10, 5)}) import pandas as pd # ๋ฐ์ดํ„ฐ ์ค€๋น„ r1 = np.random.normal(loc=0, scale=0.5, size=100) r2 = np.random.normal(loc=0.5, scale=1, size=100) r3 = np.random.. 2022. 8. 4.