๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
study๐Ÿ“š/python

[python/ํŒŒ์ด์ฌ] ๋ฐ์ดํ„ฐ ์ „์ฒ˜๋ฆฌ - ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„ ์ƒ์„ฑ, ์นผ๋Ÿผ๋ช… ์ถ”์ถœ/๋ณ€๊ฒฝ

by ์Šค๋‹ 2022. 7. 22.

๋ฐ์ดํ„ฐ ์ „์ฒ˜๋ฆฌ

1) ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„ ์ƒ์„ฑ

  1. dict ๋ฅผ ์ด์šฉํ•œ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„ ์ƒ์„ฑ
import pandas as pd

df = pd.DataFrame({'a' : [1, 2, 3], 'b' : [4, 5, 6], 'c' : [7, 8, 9]})  
type(df)

pandas.core.frame.DataFrame

df

dummy = {'a': [1, 2, 3], 'b' : [4, 5, 6], 'c' : [7, 8, 9]}

df2 = pd.DataFrame(dummy)

df2

  1. List ๋ฅผ ์ด์šฉํ•œ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„ ์ƒ์„ฑ
a = [[1, 4, 7], [2, 5, 8], [3, 6, 9]]

df3 = pd.DataFrame(a)

df3

df3.columns = ['a', 'b', 'c']

df3

  • ๋ฌธ์ œ : ์•„๋ž˜ ํ…Œ์ด๋ธ”๊ณผ ๊ฐ™์€ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„ ๋งŒ๋“ค๊ธฐ

a = {'company' : ['abc', 'ํšŒ์‚ฌ', 123], '์ง์›์ˆ˜' : [400, 10, 6]}

df4 = pd.DataFrame(a)

df4

  • ๋ฌธ์ œ : ์•„๋ž˜ ํ…Œ์ด๋ธ”๊ณผ ๊ฐ™์€ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„ ๋งŒ๋“ค๊ธฐ

a = {'company' : ['abc', 'ํšŒ์‚ฌ', 123], '์ง์›์ˆ˜' : [400, 10, 6], '์œ„์น˜' : ['Seoul', NaN, 'Busan']}

a = {'company' : ['abc', 'ํšŒ์‚ฌ', 123], '์ง์›์ˆ˜' : [400, 10, 6], '์œ„์น˜' : ['Seoul', , 'Busan']}

-numpy ๋ฅผ ํ†ตํ•œ ํ•ด๊ฒฐ

import numpy as np

a = {'company' : ['abc', 'ํšŒ์‚ฌ', 123], '์ง์›์ˆ˜' : [400, 10, 6], '์œ„์น˜' : ['Seoul', np.NaN, 'Busan']}

df5 = pd.DataFrame(a)

df5

2) ์นผ๋Ÿผ๋ช… ์ถ”์ถœ/ ๋ณ€๊ฒฝ

  1. ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„ ์ƒ์„ฑ
import pandas as pd

df = pd.DataFrame({'a': [1, 2, 3], 'b' : [4, 5, 6], 'c' : [7, 8, 9]})

df

  1. ์นผ๋Ÿผ๋ช… ์–ป๊ธฐ
df.columns

Index(['a','b','c'], dtype='object')

df.colums[1]

'b'

  • ๋ฌธ์ œ : ์นผ๋Ÿผ๋ช…์ธ a, b, c๋ฅผ d, e, f๋กœ ๋ฐ”๊พธ์–ด๋ผ
  1. ์น˜ํ™˜์„ ํ†ตํ•œ ์นผ๋Ÿผ๋ช… ๋ณ€๊ฒฝ
df.columns = ['d', 'e', 'f']

df

  • ๋ฌธ์ œ : ์นผ๋Ÿผ๋ช…์ธ d, e, f ์ค‘ d๋ฅผ '๋””' ๋กœ f๋ฅผ '์—ํ”„'๋กœ ๋ฐ”๊พธ์–ด๋ผ
df.colums = ['๋””', 'e', '์—ํ”„']

df

  1. rename์„ ํ†ตํ•œ ์นผ๋Ÿผ๋ช… ๋ณ€๊ฒฝ
# ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„ ์žฌ์ƒ์„ฑ
df = pd.DataFrame({'a': [1, 2, 3], 'b' : [4, 5, 6], 'c' : [7, 8, 9]})
df.columns = ['d', 'e', 'f']

df

df.rename(columns = {'d' : '๋””', 'f' : '์—ํ”„'})

df

rename ์„ ํ†ตํ•ด์„œ ์ปฌ๋Ÿผ๋ช…์ด ๋ณ€๊ฒฝ๋˜์—ˆ์ง€๋งŒ, ์ €์žฅ์€ ์•ˆ ๋จ.

-inplace = True ๋กœ ๋˜์–ด ์žˆ์–ด์•ผ ์ €์žฅ๋จ

df.rename(columns = {'d' : '๋””', 'f' : '์—ํ”„'}, inplace = True)

df

๋Œ“๊ธ€