[python/ํ์ด์ฌ] ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ - loc์ iloc๋ฅผ ์ด์ฉํ ๋ฐ์ดํฐ ์ถ์ถ
loc์ iloc์ ์ฐจ์ด loc ๋ฐ์ดํฐํ๋ ์์ ํ์ด๋ ์ปฌ๋ผ์ label์ด๋ boolean array๋ก ์ ๊ทผ location์ ์ฝ์ด๋ก, ์ธ๊ฐ์ด ์ฝ์ ์ ์๋ label ๊ฐ์ผ๋ก ๋ฐ์ดํฐ์ ์ ๊ทผ iloc ๋ฐ์ดํฐํ๋ ์์ ํ์ด๋ ์ปฌ๋ผ์ ์ธ๋ฑ์ค ๊ฐ์ผ๋ก ์ ๊ทผ integer location์ ์ฝ์ด๋ก, ์ปดํจํฐ๊ฐ ์ฝ์ ์ ์๋ indexing ๊ฐ์ผ๋ก ๋ฐ์ดํฐ์ ์ ๊ทผ ๋ฐ์ดํฐ ์์ฑ import pandas as pd df = pd.DataFrame({'a' : [i for i in range(1, 11)], 'b' : [i for i in range(11, 21)], 'c' : [i for i in range(21, 31)]}) df -๋ฌธ์ : a, b์ด์ ์ถ์ถํ๊ธฐ df['a', 'b'] df[['a', 'b']] ์ฃผ์ํด์ผํ ์ ..
2022. 7. 23.
[python/ํ์ด์ฌ] ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ - ์๋ฆฌ์ฆ(Series)
์๋ฆฌ์ฆ(Series) ๋ฐ์ดํฐ ์์ฑ import pandas as pd df = pd.DataFrame({'a' : [1, 2, 3], 'b' : [4, 5, 6], 'c' : [7, 8, 9]}) df -a ์ด ์ถ์ถํ๊ธฐ df['a'] 0 1 1 2 2 3 Name: a, dtype: int64 type(df['a']) pandas.core.series.Series ์๋ฆฌ์ฆ ์์ฑ๋ฐฉ๋ฒ a = pd.Series(data, index=index, name=name) # ํ์ ์ด๋ฆ(index), ์ด์ ์ด๋ฆ(name). ๋ฐ๋ก ์
๋ ฅํ์ง ์๋๋ค๋ฉด index๋ 0๋ถํฐ ์์ํ๋ ์ ์๊ฐ, name์ ๋น ๊ฐ(None)์ด ์
๋ ฅ๋จ ์) a = pd.Series([1, 2, 3, 1, 2, 3]) a 0 1 1 2 2 3 3 1 4..
2022. 7. 22.
๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ - copy๋ฅผ ์ด์ฉํ ๋ฐ์ดํฐ ๋ณต์ฌ
3) copy๋ฅผ ์ด์ฉํ ๋ฐ์ดํฐ ๋ณต์ฌ ์๋ณธ ๋ฆฌ์คํธ๋ฅผ ๋ณด์กดํ๊ธฐ ์ํด ๋ฆฌ์คํธ๋ฅผ ๋ณต์ฌํด์ผ ํ๋ ๊ฒฝ์ฐ๊ฐ ์๋ค ๋ณต์ฌ์ ๋ํด ์ ๋๋ก ์์ง ๋ชปํ ์ฑ๋ก ํจ๋ถ๋ก ๋ณต์ฌํ๋ฉด, ์๋ณธ ๊ฐ์ฒด๊ฐ ๋ณ๊ฒฝ๋์ด ๋ฌธ์ ๊ฐ ์๊ธธ ์ ์๋ค ๋ฐ์ดํฐ ์์ฑ import pandas as pd df = pd.DataFrame({'a': [1, 2, 3], 'b' : [4, 5, 6], 'c' : [7, 8, 9]}) -๋ฌธ์ : ํ๋๋ช
์ a, b, c ์์ d, e, f๋ก ๋ณ๊ฒฝํ๊ธฐ df.columns = ['d', 'e', 'f'] df -๋ฌธ์ : ํ๋๋ช
a๋ฅผ '์์ด'๋ก ๋ณ๊ฒฝํ๊ธฐ df df = pd.DataFrame({'a': [1, 2, 3], 'b' : [4, 5, 6], 'c' : [7, 8, 9]}) df.rename(columns = {'a' :..
2022. 7. 22.
[python/ํ์ด์ฌ] ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ - ๋ฐ์ดํฐ ํ๋ ์ ์์ฑ, ์นผ๋ผ๋ช
์ถ์ถ/๋ณ๊ฒฝ
๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ 1) ๋ฐ์ดํฐ ํ๋ ์ ์์ฑ dict ๋ฅผ ์ด์ฉํ ๋ฐ์ดํฐ ํ๋ ์ ์์ฑ import pandas as pd df = pd.DataFrame({'a' : [1, 2, 3], 'b' : [4, 5, 6], 'c' : [7, 8, 9]}) type(df) pandas.core.frame.DataFrame df dummy = {'a': [1, 2, 3], 'b' : [4, 5, 6], 'c' : [7, 8, 9]} df2 = pd.DataFrame(dummy) df2 List ๋ฅผ ์ด์ฉํ ๋ฐ์ดํฐ ํ๋ ์ ์์ฑ a = [[1, 4, 7], [2, 5, 8], [3, 6, 9]] df3 = pd.DataFrame(a) df3 df3.columns = ['a', 'b', 'c'] df3 ๋ฌธ์ : ์๋ ํ
์ด๋ธ๊ณผ ๊ฐ..
2022. 7. 22.