[๋จธ์ ๋ฌ๋] ์ฌ์ดํท๋ฐ(scikit-learn) - ๋ฐ์ดํฐ_์ ์ฒ๋ฆฌ(๋ฐ์ดํฐ ์ธ์ฝ๋ฉ, ํผ์ฒ์ค์ผ์ผ๋ง๊ณผ ์ ๊ทํ)
๋ฐ์ดํฐ_์ ์ฒ๋ฆฌ(๋ฐ์ดํฐ ์ธ์ฝ๋ฉ, ํผ์ฒ์ค์ผ์ผ๋ง๊ณผ ์ ๊ทํ) ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ(Data Preprocessing) ๋ฐ์ดํฐ ํด๋ฆฐ์ง ๊ฒฐ์๊ฐ ์ฒ๋ฆฌ(Null/NaN ์ฒ๋ฆฌ) ๋ฐ์ดํฐ ์ธ์ฝ๋ฉ(๋ ์ด๋ธ, ์-ํซ ์ธ์ฝ๋ฉ) ๋ฐ์ดํฐ ์ค์ผ์ผ๋ง ์ด์์น ์ ๊ฑฐ Feature ์ ํ, ์ถ์ถ ๋ฐ ๊ฐ๊ณต ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ๋ ML ์๊ณ ๋ฆฌ์ฆ๋งํผ ์ค์ํ๋ค ๋จผ์ , ๊ฒฐ์ ๊ฐ, ์ฆ Null,NaN ๊ฐ์ ํ์ฉ๋์ง ์๋๋ค. ์ด๋ฌํ Null๊ฐ์ ๊ณ ์ ๋ ๋ค๋ฅธ ๊ฐ์ผ๋ก ๋ณํํด ์ฃผ์ด์ผ ํ๋ค. ์ฒ๋ฆฌ ๋ฐฉ๋ฒ์ ๋ค์ํ๋ฐ, ํผ์ฒ ๊ฐ ์ค Null๊ฐ์ด ์ผ๋ง ๋์ง ์์ ๊ฒฝ์ฐ์๋ ํผ์ฒ์ ํ๊ท ๊ฐ์ผ๋ก ๋์ฒดํ ์ ์๊ณ , Null ๊ฐ์ด ๋๋ถ๋ถ์ด๋ผ๋ฉด ์คํ๋ ค ํด๋น ํผ์ฒ๋ ๋๋กญํ๋ ๊ฒ์ด ์ข๋ค. ํ์ง๋ง Null๊ฐ์ด ์ผ์ ์์ค ์ด์์ผ ๊ฒฝ์ฐ ๊ฐ์ฅ ๊ฒฐ์ ์ด ํ๋ ๋ฐ, ํด๋น ํผ์ฒ๊ฐ ์ค์๋๊ฐ ๋์ ํผ์ฒ์ด๊ณ Null์ ๋จ..
2022. 9. 4.