๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
study๐Ÿ“š/python

[python/ํŒŒ์ด์ฌ] ๋ฐ์ดํ„ฐ ์ „์ฒ˜๋ฆฌ - ๋ ˆ์ฝ”๋“œ, ์นผ๋Ÿผ ์ถ”๊ฐ€ / ์‚ญ์ œ

by ์Šค๋‹ 2022. 7. 26.

๋ ˆ์ฝ”๋“œ, ์นผ๋Ÿผ ์ถ”๊ฐ€ / ์‚ญ์ œ

import pandas as pd

df = pd.DataFrame({'a' : [1, 1, 3, 4, 5], 'b' : [2, 3, 2, 3, 4], 'c' : [3, 4, 7, 6, 4]})
df

1. ์นผ๋Ÿผ(column) ์ถ”๊ฐ€

  • [] ์—ฐ์‚ฐ์ž๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๊ธฐ์กด DataFrame์— ์ƒˆ ์—ด ์ถ”๊ฐ€ ํ•  ์ˆ˜ ์žˆ๋‹ค

-๋ฌธ์ œ : 1, 3, 6, 4. 8 ๋กœ ์ด๋ฃจ์–ด์ง„ d ์นผ๋Ÿผ์„ ์ถ”๊ฐ€ํ•˜๊ธฐ

df['d'] = [1, 3, 6, 4, 8]
df

-๋ฌธ์ œ : 1๋กœ ์ด๋ฃจ์–ด์ง„ e ์นผ๋Ÿผ ์ถ”๊ฐ€ํ•˜๊ธฐ

df['e'] = [1, 1, 1, 1, 1]
df

์ด๋ ‡๊ฒŒ ํ•˜๋Š” ๋ฐฉ๋ฒ•๋„ ์žˆ์ง€๋งŒ ์กฐ๊ธˆ ๋” ์‰ฝ๊ฒŒ ํ•˜๋Š” ๋ฐฉ๋ฒ•์ด ์žˆ๋‹ค.

df['e'] = 1
df

df.dtypes

a  int64
b  int64
c  int64
d  int64
e  int64
dtype:  object

-๋ฌธ์ œ : a + b - c ์˜ ๊ฒฐ๊ณผ๋กœ ์ด๋ฃจ์–ด์ง„ f ์นผ๋Ÿผ์„ ์ถ”๊ฐ€ํ•˜๊ธฐ

df['f'] = df['a'] + df['b'] - df['c']
df

2. ์นผ๋Ÿผ (column) ์‚ญ์ œ

  • drop(labels) : DataFrame ์—ด ์‚ญ์ œ

-๋ฌธ์ œ : ์นผ๋Ÿผ d, e, f ๋ฅผ ์‚ญ์ œํ•˜๊ธฐ

df.drop(['d', 'e', 'f'], axis=1)

df

df.drop(['d', 'e', 'f'], axis=1, inplace=True)
df

3. ๋ ˆ์ฝ”๋“œ ์ถ”๊ฐ€

  • append() : ์‚ฌ์ „์˜ ๊ฐ’์„ ํ–‰์œผ๋กœ ์ง์ ‘ ๊ฐ€์ง€๊ณ  ์™€์„œ DataFrame์— ์ถ”๊ฐ€

-๋ฌธ์ œ : a์—๋Š” 6, b์—๋Š” 7, c์—๋Š” 8์„ ์ถ”๊ฐ€ํ•˜๊ธฐ

df.append({'a' : 6, 'b' : 7, 'c' : 8})

- ignore_index = True : ๊ธฐ์กด index๋ฅผ ๋ฌด์‹œํ•˜๊ณ  ์‹ถ์„ ๋•Œ , DataFrame์„ ํ•ฉ์น  ๋•Œ ignore_index๋ฅผ ํ•˜์ง€ ์•Š์œผ๋ฉด ๋ฐ์ดํ„ฐ์— ์žˆ๋˜ ์ธ๋ฑ์Šค๋ฅผ ๊ทธ๋Œ€๋กœ ๊ฐ€์ง€๊ณ  ์˜ด

df.append({'a' : 6, 'b' : 7, 'c' : 8}, ignore_index = True)

df

df = df.append({'a' : 6, 'b' : 7, 'c' : 8}, ignore_index = True)
df

  • loc[index] : ๋ชฉ๋ก์ด ์žˆ๋Š” ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์— ํ–‰์„ ์ถ”๊ฐ€

-๋ฌธ์ œ : a์—๋Š” 7, b์—๋Š” 8, c์—๋Š” 9๋ฅผ ์ถ”๊ฐ€ํ•˜๊ธฐ

df.loc[6] = [7, 8, 9]
df

๋Œ“๊ธ€