ํ์ ๋ณํ
- ๋ฐ์ดํฐ ์์ฑ
import pandas as pd
df = pd.DataFrame({'ํ๋งค์ผ' : ['5/11/21', '5/12/21', '5/13/21', '5/14/21', '5/15/21'],
'ํ๋งค๋' : ['10', '15', '20', '25', '30'], '๋ฐฉ๋ฌธ์์' : ['10', '-', '17', '23', '25'],
'๊ธฐ์จ' : ['24.1', '24.3', '24.8', '25', '25.4']})
df
- dtype : ๋ฐ์ดํฐ ํ์ ํ์ธ
df.dtypes
ํ๋งค์ผ object
ํ๋งค๋ object
๋ฐฉ๋ฌธ์์ object
๊ธฐ์จ object
dtype: object
df['ํ๋งค๋ ๋ณด์ '] = df['ํ๋งค๋'] + 1
- astype(ํ์ ) : ๋ฐ์ดํฐํ๋ ์ ํ์ ์ ์ฒด ํ๊บผ๋ฒ์ ๋ฐ๊พธ๊ธฐ
- astype({'column' : 'type'}) : ์ํ๋ ์ปฌ๋ผ๋ง ํ์ ๋ฐ๊พธ๊ธฐ
-๋ฌธ์ : ํ๋งค๋์ ์ ์ ํํ๋ก ๋ณํํ๊ธฐ
df.astype({'ํ๋งค๋' : 'int'})
df.dtypes
ํ๋งค์ผ object
ํ๋งค๋ object
๋ฐฉ๋ฌธ์์ object
๊ธฐ์จ object
dtype: object
df = df.astype({'ํ๋งค๋' : 'int'})
df.dtypes
ํ๋งค์ผ object
ํ๋งค๋ int64
๋ฐฉ๋ฌธ์์ object
๊ธฐ์จ object
dtype: object
df['ํ๋งค๋ ๋ณด์ '] = df['ํ๋งค๋'] + 1
df
-๋ฌธ์ : ๋ฐฉ๋ฌธ์์๋ฅผ ์ซ์ ํ์ ์ผ๋ก ๋ณํํ๊ธฐ
df.astype({'๋ฐฉ๋ฌธ์์' : 'int'})
pd.to_numeric(df['๋ฐฉ๋ฌธ์์'])
pd.to_numeric(df['๋ฐฉ๋ฌธ์์'], errors = 'coerce')
0 10.0
1 NaN
2 17.0
3 23.0
4 25.0
Name: ๋ฐฉ๋ฌธ์์, dtype: float64
df.dtypes
ํ๋งค์ผ object
ํ๋งค๋ int64
๋ฐฉ๋ฌธ์์ object
๊ธฐ์จ object
ํ๋งค๋ ๋ณด์ int64
dtype: object
df['๋ฐฉ๋ฌธ์์'] = pd.to_numeric(df['๋ฐฉ๋ฌธ์์'], errors = 'coerce')
df.dtypes
ํ๋งค์ผ object
ํ๋งค๋ int64
๋ฐฉ๋ฌธ์์ float64
๊ธฐ์จ object
ํ๋งค๋ ๋ณด์ int64
dtype: object
df
df = df.astype({'๋ฐฉ๋ฌธ์์' : 'int'})
df.fillna(0, inplace = True)
df
df = df.astype({'๋ฐฉ๋ฌธ์์' : 'int'})
df.dtypes
ํ๋งค์ผ object
ํ๋งค๋ int64
๋ฐฉ๋ฌธ์์ int64
๊ธฐ์จ object
ํ๋งค๋ ๋ณด์ int64
dtype: object
df
- to_datetime(param, format="") : ์ฃผ์ด์ง ์ธ์๋ฅผ datetime ์ผ๋ก ๋ณํ
-๋ฌธ์ : ํ๋งค์ผ์ datetime ์ ํํ๋ก ๋ฐ๊พธ๊ธฐ
df['ํ๋งค์ผ'] = pd.to_datetime(df['ํ๋งค์ผ'], format="%m/%d/%y")
df
df.dtypes
ํ๋งค์ผ datetime64[ns]
ํ๋งค๋ int64
๋ฐฉ๋ฌธ์์ int64
๊ธฐ์จ object
ํ๋งค๋ ๋ณด์ int64
dtype: object
๋๊ธ