๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ

์ „์ฒด ๊ธ€36

ํ”ผ๊ทธ๋งˆ๋ฅผ ์ด์šฉํ•œ ์–ดํ”Œ ์‹œ๊ฐํ™” ์ฃผ๋ฆฐ์ด๋“ค์„ ์œ„ํ•œ ์„œ๋น„์Šค๋ฅผ ๊ตฌํ˜„ - ํ”ผ๊ทธ๋งˆ๋กœ ์‹œ๊ฐํ™” ์ฒ˜์Œ ์ฃผ์‹ํˆฌ์ž๋ฅผ ์‹œ์ž‘ํ•˜๋Š” ์‚ฌ๋žŒ๋“ค์„ ์œ„ํ•œ ๋งˆ๋ธ” ๋ฏธ๋‹ˆ KB์ฆ๊ถŒ ๊ณต๋ชจ์ „์„ ์ค€๋น„ํ•  ๋•Œ ์ฃผ์‹์„ ํ•˜์ง€๋„ ์•Š๊ณ  ์ž˜ ๋ชจ๋ฅด๋Š” ์ฃผ๋ฆฐ์ด์—ฌ์„œ ์–ด๋–ป๊ฒŒ ์‹œ์ž‘ํ•ด์•ผํ•˜๋Š”์ง€ ๋ง‰๋ง‰ํ•˜๊ณ  ํ•˜๋ฉด์„œ๋„ '์ด๊ฒŒ ๋งž๋‚˜?' ์‹ถ๋‹ค๊ฐ€ ๋‚ด๊ฐ€ ์ฃผ๋ฆฐ์ด์ด๊ธฐ ๋•Œ๋ฌธ์— ํ•„์š”ํ•œ ์„œ๋น„์Šค๊ฐ€ ๋ฌด์—‡์ธ์ง€ ๋‹ค๋ฅธ ์ฆ๊ถŒ์‚ฌ ์–ดํ”Œ๋„ ์ด์šฉํ•˜๋ฉด์„œ ์—ด์‹ฌํžˆ ํ–ˆ์—ˆ๋‹ค. ์•„์ด๋””์–ด๋ฅผ ๋‚ธ๋‹ค๊ณ  ํ•ด์„œ ๋ฐ”๋กœ ์„œ๋น„์Šค๋ฅผ ๊ตฌํ˜„ํ•ด๋‚ด๋Š” ๊ฒƒ๋„ ์–ด๋ ค์› ๊ณ  ์šฐ๋ฆฌ์˜ ์„œ๋น„์Šค๋ฅผ ์ž˜ ํ‘œํ˜„ํ•  ์ˆ˜ ์žˆ๋Š” ์‹œ๊ฐํ™”๋ฅผ ์–ด๋–ป๊ฒŒ ํ•  ์ˆ˜ ์žˆ์„์ง€ ์ด๋Ÿฐ ๊ฒƒ๋“ค์ด ์–ด๋ ค์› ๋‹ค. ํ”ผ๊ทธ๋งˆ๋„ ์ฒ˜์Œ ํ•ด๋ณด๋Š” ๊ฒƒ์ด์˜€๊ธฐ ๋•Œ๋ฌธ์— ์˜์ƒ์„ ์ฐพ์•„๋ณด๋ฉด์„œ ๋”ฐ๋ผํ•˜๋Š”๋ฐ ์–ด๋ ค์› ์ง€๋งŒ ์žฌ๋ฐŒ์—ˆ๋‹ค. ๋‚˜ ํฌํ•จ ์ด 3๋ช…์ด ํŒ€์ด ๋˜์–ด ํ•˜๋Š”๋ฐ ๋งค์ผ ๋งŽ์€ ์‹œ๊ฐ„์„ ๋ณด๋‚ด๋ฉด์„œ ์„œ๋กœ์—๊ฒŒ ๋ฐฐ์šด ์ ๋„ ๋งŽ์•˜๊ณ  ์กฐ๊ธˆ ๋” ๊ณต๋ถ€ํ•ด์„œ ์‹œ๊ฐํ™”๋„ ๋” ์ž˜ ํ•  ์ˆ˜ ์žˆ๊ฒŒ ๊ณต๋ถ€ํ•ด์•ผ.. 2022. 10. 17.
[KB ์ฆ๊ถŒ ๋””์ง€ํ„ธ Idea Market ๊ณต๋ชจ์ „] m-able mini review ํฌ๋กค๋ง kb ์ฆ๊ถŒ MTS(M-able, M-able mini) ๋˜๋Š” HTS์˜ ๊ธฐ๋Šฅ ๊ฐœ์„  ๋ฐฉ์•ˆ ๋ฐ ์„œ๋น„์Šค ๊ธฐํš kb ์ฆ๊ถŒ MTS(M-able, M-able mini)์˜ ๊ธฐ๋Šฅ ๊ฐœ์„  ๋ฐฉ์•ˆ์„ ์œ„ํ•ด ์–ดํ”Œ๋ฆฌ์ผ€์ด์…˜์˜ ๋ฆฌ๋ทฐ ํฌ๋กค๋งํ•ด๋ณด์•˜๋‹ค 1. m-able mini ํ”Œ๋ ˆ์ด์Šคํ† ์–ด ์ ‘์† ํ›„, ๋ฆฌ๋ทฐ ์ˆ˜์ง‘ 2. ์Šคํฌ๋กค ๋‹ค์šด ํ›„, for๋ฌธ์„ ์ด์šฉํ•˜์—ฌ ๋ชจ๋“  ๋ฆฌ๋ทฐ ์ˆ˜์ง‘ 3์›Œ๋“œํด๋ผ์šฐ๋“œ ๋งŒ๋“ค๊ธฐ 2022. 10. 13.
[๋จธ์‹ ๋Ÿฌ๋‹] ์‚ฌ์ดํ‚ท๋Ÿฐ(scikit-learn) - ๋ฐ์ดํ„ฐ_์ „์ฒ˜๋ฆฌ(๋ฐ์ดํ„ฐ ์ธ์ฝ”๋”ฉ, ํ”ผ์ฒ˜์Šค์ผ€์ผ๋ง๊ณผ ์ •๊ทœํ™”) ๋ฐ์ดํ„ฐ_์ „์ฒ˜๋ฆฌ(๋ฐ์ดํ„ฐ ์ธ์ฝ”๋”ฉ, ํ”ผ์ฒ˜์Šค์ผ€์ผ๋ง๊ณผ ์ •๊ทœํ™”) ๋ฐ์ดํ„ฐ ์ „์ฒ˜๋ฆฌ(Data Preprocessing) ๋ฐ์ดํ„ฐ ํด๋ฆฐ์ง• ๊ฒฐ์†๊ฐ’ ์ฒ˜๋ฆฌ(Null/NaN ์ฒ˜๋ฆฌ) ๋ฐ์ดํ„ฐ ์ธ์ฝ”๋”ฉ(๋ ˆ์ด๋ธ”, ์›-ํ•ซ ์ธ์ฝ”๋”ฉ) ๋ฐ์ดํ„ฐ ์Šค์ผ€์ผ๋ง ์ด์ƒ์น˜ ์ œ๊ฑฐ Feature ์„ ํƒ, ์ถ”์ถœ ๋ฐ ๊ฐ€๊ณต ๋ฐ์ดํ„ฐ ์ „์ฒ˜๋ฆฌ๋Š” ML ์•Œ๊ณ ๋ฆฌ์ฆ˜๋งŒํผ ์ค‘์š”ํ•˜๋‹ค ๋จผ์ €, ๊ฒฐ์† ๊ฐ’, ์ฆ‰ Null,NaN ๊ฐ’์€ ํ—ˆ์šฉ๋˜์ง€ ์•Š๋Š”๋‹ค. ์ด๋Ÿฌํ•œ Null๊ฐ’์€ ๊ณ ์ •๋œ ๋‹ค๋ฅธ ๊ฐ’์œผ๋กœ ๋ณ€ํ™˜ํ•ด ์ฃผ์–ด์•ผ ํ•œ๋‹ค. ์ฒ˜๋ฆฌ ๋ฐฉ๋ฒ•์€ ๋‹ค์–‘ํ•œ๋ฐ, ํ”ผ์ฒ˜ ๊ฐ’ ์ค‘ Null๊ฐ’์ด ์–ผ๋งˆ ๋˜์ง€ ์•Š์„ ๊ฒฝ์šฐ์—๋Š” ํ”ผ์ฒ˜์˜ ํ‰๊ท ๊ฐ’์œผ๋กœ ๋Œ€์ฒดํ•  ์ˆ˜ ์žˆ๊ณ , Null ๊ฐ’์ด ๋Œ€๋ถ€๋ถ„์ด๋ผ๋ฉด ์˜คํžˆ๋ ค ํ•ด๋‹น ํ”ผ์ฒ˜๋Š” ๋“œ๋กญํ•˜๋Š” ๊ฒƒ์ด ์ข‹๋‹ค. ํ•˜์ง€๋งŒ Null๊ฐ’์ด ์ผ์ • ์ˆ˜์ค€ ์ด์ƒ์ผ ๊ฒฝ์šฐ ๊ฐ€์žฅ ๊ฒฐ์ •์ด ํž˜๋“ ๋ฐ, ํ•ด๋‹น ํ”ผ์ฒ˜๊ฐ€ ์ค‘์š”๋„๊ฐ€ ๋†’์€ ํ”ผ์ฒ˜์ด๊ณ  Null์„ ๋‹จ.. 2022. 9. 4.
[๋จธ์‹ ๋Ÿฌ๋‹] ์‚ฌ์ดํ‚ท๋Ÿฐ(scikit-learn) - train_test_split, ๊ต์ฐจ๊ฒ€์ฆ, GridSearchCV Model Selection - ํ•™์Šต ๋ฐ์ดํ„ฐ์™€ ํ…Œ์ŠคํŠธ ๋ฐ์ดํ„ฐ 1. ํ•™์Šต ๋ฐ์ดํ„ฐ ์„ธํŠธ ๋จธ์‹ ๋Ÿฌ๋‹ ์•Œ๊ณ ๋ฆฌ์ฆ˜์˜ ํ•™์Šต์„ ์œ„ํ•ด ์‚ฌ์šฉ. ๋ฐ์ดํ„ฐ์˜ ์†์„ฑ๋“ค๊ณผ ๊ฒฐ์ •๊ฐ’(๋ ˆ์ด๋ธ”๊ฐ’) ๋ชจ๋‘๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ์Œ. ํ•™์Šต ๋ฐ์ดํ„ฐ๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ๋จธ์‹ ๋Ÿฌ๋‹ ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด ๋ฐ์ดํ„ฐ ์†์„ฑ๊ณผ ๊ฒฐ์ •๊ฐ’์˜ ํŒจํ„ด์„ ์ธ์ง€ํ•˜๊ณ  ํ•™์Šต 2. ํ…Œ์ŠคํŠธ ๋ฐ์ดํ„ฐ ์„ธํŠธ ํ…Œ์ŠคํŠธ ๋ฐ์ดํ„ฐ ์„ธํŠธ์—์„œ ํ•™์Šต๋œ ๋จธ์‹ ๋Ÿฌ๋‹ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ํ…Œ์ŠคํŠธ. ์†์„ฑ ๋ฐ์ดํ„ฐ๋งŒ ๋จธ์‹ ๋Ÿฌ๋‹ ์•Œ๊ณ ๋ฆฌ์ฆ˜์— ์ œ๊ณตํ•˜๋ฉฐ, ๋จธ์‹ ๋Ÿฌ๋‹ ์•Œ๊ณ ๋ฆฌ์ฆ˜์€ ์ œ๊ณต๋œ ๋ฐ์ดํ„ฐ๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ๊ฒฐ์ •๊ฐ’์„ ์˜ˆ์ธก. ํ…Œ์ŠคํŠธ ๋ฐ์ดํ„ฐ๋Š” ํ•™์Šต ๋ฐ์ดํ„ฐ์™€ ๋ณ„๋„์˜ ๋ฐ์ดํ„ฐ ์„ธํŠธ๋กœ ์ œ๊ณต๋˜์–ด์•ผ ํ•จ. 3. ํ•™์Šต ๋ฐ์ดํ„ฐ์™€ ํ…Œ์ŠคํŠธ ๋ฐ์ดํ„ฐ ๋ถ„๋ฆฌ - train_test_split() sklearn.model_selection์˜ train_test_split()ํ•จ์ˆ˜ X_train, X_test.. 2022. 8. 29.