[python/ํ์ด์ฌ] ๊ทธ๋ฃนํ - groupby(), agg(), set_index(), reset_index()
๊ทธ๋ฃนํ import pandas as pd df1 = pd.DataFrame({'ID' : [1, 2, 3, 4, 5], '๊ฐ์
์ผ' : ['2021-01-02', '2021-01-04', '2021-01-10', '2021-02-10', '2021-02-24'], '์ฑ๋ณ' : ['F', 'M', 'F', 'M', 'M']}) df2 = pd.DataFrame({'๊ตฌ๋งค์์' : [1, 2, 3, 4, 5], 'ID' : [1, 1, 2, 4, 1], '๊ตฌ๋งค์' : [1, 1, 2, 2, 3], '๊ธ์ก' : [1000, 1500, 2000, 3000, 4000]}) -๋ฌธ์ : df1 ์ ํ์์ ์ ๋ณด๋ฅผ ์ ์ฅํ ๋ฐ์ดํฐ ํ๋ ์์ด๋ฉฐ, df2 ๋ ๊ฐ ํ์์ ๊ตฌ๋งค ๋ด์ญ์ ์ ์ฅํ ๋ฐ์ดํฐ ํ๋ ์์ด๋ค. ๊ฐ ํ์์ ์ ๋ณด์ ๊ตฌ..
2022. 7. 29.
[python/ํ์ด์ฌ] ๋ฐ์ดํฐ ํ๋ ์ ๊ฒฐํฉ - ์ํ ๊ฒฐํฉ, ์ข์ฐ ๊ฒฐํฉ
๋ฐ์ดํฐ ํ๋ ์ ๊ฒฐํฉ 1. ์ํ ๊ฒฐํฉ pd.concat([df1, df2], axis = 0) : ๋์ผํ column ๊ธฐ์ค์ผ๋ก ์/์๋๋ก ํฉ์น๊ธฐ, ํ ๊ธฐ์ค์ผ๋ก ๋ฐ์ดํฐ ํ๋ ์ ๊ฒฐํฉ import pandas as pd df1 = pd.DataFrame({'A' : [1, 2, 3], 'B' : [11, 12, 13], 'C' : [21, 22, 23]}) df2 = pd.DataFrame({'A' : [4, 5, 6], 'B' : [14, 15, 16], 'C' : [24, 25, 26]}) pd.concat([df1, df2]) pd.concat([df2, df1]) #index ์ด๊ธฐํ๋ฅผ ์ํด์ ignore_index = True pd.concat([df1, df2], ignore_index = True #..
2022. 7. 28.
[python/ํ์ด์ฌ] ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ - ๋ ์ฝ๋, ์นผ๋ผ ์ถ๊ฐ / ์ญ์
๋ ์ฝ๋, ์นผ๋ผ ์ถ๊ฐ / ์ญ์ import pandas as pd df = pd.DataFrame({'a' : [1, 1, 3, 4, 5], 'b' : [2, 3, 2, 3, 4], 'c' : [3, 4, 7, 6, 4]}) df 1. ์นผ๋ผ(column) ์ถ๊ฐ [] ์ฐ์ฐ์๋ฅผ ์ฌ์ฉํ์ฌ ๊ธฐ์กด DataFrame์ ์ ์ด ์ถ๊ฐ ํ ์ ์๋ค -๋ฌธ์ : 1, 3, 6, 4. 8 ๋ก ์ด๋ฃจ์ด์ง d ์นผ๋ผ์ ์ถ๊ฐํ๊ธฐ df['d'] = [1, 3, 6, 4, 8] df -๋ฌธ์ : 1๋ก ์ด๋ฃจ์ด์ง e ์นผ๋ผ ์ถ๊ฐํ๊ธฐ df['e'] = [1, 1, 1, 1, 1] df ์ด๋ ๊ฒ ํ๋ ๋ฐฉ๋ฒ๋ ์์ง๋ง ์กฐ๊ธ ๋ ์ฝ๊ฒ ํ๋ ๋ฐฉ๋ฒ์ด ์๋ค. df['e'] = 1 df df.dtypes a int64 b int64 c int64 d int64 e..
2022. 7. 26.