Search
Duplicate

Session

ํƒœ๊ทธ

๊ต์œก ์„ธ์…˜

์ธ์‚ฌ์ดํŠธ๋Š” ์ด 7ํšŒ์˜ ๊ต์œก์„ธ์…˜(OT ํฌํ•จ)์„ ํ†ตํ•ด ์‹ ์ž… ๊ธฐ์ˆ˜์˜ ์†Œํ”„ํŠธ๋žœ๋”ฉ์„ ๋„๋ชจํ•˜๊ณ , ํ•™ํšŒ์›๋“ค์˜ ์ฒด๊ณ„์ ์ธ ๋ฐ์ดํ„ฐ ๋ถ„์„ ๋ฐ ๋ชจ๋ธ๋ง์„ ์œ„ํ•œ ๊ธฐ์ดˆ๋ฅผ ๋‹ค์ง€๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

๊ต์œก ์„ธ์…˜ [ํŒŒ์ด์ฌ]

ํ•™๊ธฐ ์ดˆ์—๋Š” Github์˜ ์‚ฌ์šฉ๋ฒ•๊ณผ Python์„ ํ•™์Šตํ•ฉ๋‹ˆ๋‹ค. Pandas๋ฅผ ์œ„์ฃผ๋กœ Python์˜ ๊ธฐ์ดˆ๋ถ€ํ„ฐ ์‹ฌํ™”๊นŒ์ง€, ๊ทธ๋ฆฌ๊ณ  EDA์— ํ•„์š”ํ•œ ๋ฐ์ดํ„ฐ ์ „์ฒ˜๋ฆฌ ๋ฐ ์‹œ๊ฐํ™”๋ฅผ 4๋ฒˆ์˜ ์„ธ์…˜์— ๊ฑธ์ณ ํ•™์Šตํ•ฉ๋‹ˆ๋‹ค.

Session 0 (OT). Jupyter Notebook, ํŒŒ์ด์ฌ ๊ธฐ์ดˆ

๋ณธ ์„ธ์…˜์€ ๋ณธ๊ฒฉ์ ์ธ ๊ต์œก ์„ธ์…˜ ์ง„ํ–‰์— ์•ž์„  ์‚ฌ์ „ ํ•™์Šต๊ณผ์ •์— ํ•ด๋‹นํ•ฉ๋‹ˆ๋‹ค. Jupyter Notebook์„ ์„ค์น˜ํ•˜๊ณ  ์ดˆ๊ธฐ ์„ค์ •์„ ์ง„ํ–‰ํ•˜์˜€์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ, ๊ธฐ๋ณธ์ ์ธ ํŒŒ์ด์ฌ ๋ฌธ๋ฒ•์„ ํ•™์Šต ๋ฐ ๋ณต์Šตํ•˜๊ณ , Pandas ๊ธฐ์ดˆ ์ดํ•ด๋ฅผ ์œ„ํ•œ ํ•™์Šต์„ ์ง„ํ–‰ํ–ˆ์Šต๋‹ˆ๋‹ค.

Session 1. Github, Pandas

๋ณธ ์„ธ์…˜์—์„œ๋Š” ๊ณผ์ œ ์ œ์ถœ ๋ฐ ํฌํŠธํด๋ฆฌ์˜ค ๊ด€๋ฆฌ๋ฅผ ์œ„ํ•œ Github ํ™œ์šฉ ๋ฐฉ๋ฒ•์— ๋Œ€ํ•ด ํ•™์Šตํ–ˆ์œผ๋ฉฐ, Pandas ๋ฌธ๋ฒ•์„ ์‹ค์ œ ๋ฐ์ดํ„ฐ์— ์ ์šฉํ•ด๋ณด๋ฉฐ ๋ณธ๊ฒฉ์ ์œผ๋กœ ํ•™์Šตํ–ˆ์Šต๋‹ˆ๋‹ค.

Session 2. ์ฝ๊ธฐ, ์ „์ฒ˜๋ฆฌ

์œ ์˜๋ฏธํ•œ ์ธ์‚ฌ์ดํŠธ๋ฅผ ๋„์ถœํ•ด๋‚ด๊ธฐ ์œ„ํ•ด์„œ๋Š” ์ „์ฒ˜๋ฆฌ ๊ณผ์ •์ด ํ•„์ˆ˜์ ์ž…๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ, ๋ณธ ์„ธ์…˜์—์„œ๋Š” ์ „๋ฐ˜์ ์ธ ๋ฐ์ดํ„ฐ ์ •์ œ ๋ฐ ์ „์ฒ˜๋ฆฌ ๊ณผ์ •์— ๋Œ€ํ•ด ํ•™์Šตํ–ˆ์Šต๋‹ˆ๋‹ค.

Session 3. EDA ๋ฐ ๋ฐ์ดํ„ฐ ์‹œ๊ฐํ™”

๋ณธ ์„ธ์…˜์—์„œ๋Š” ์ „์ฒ˜๋ฆฌํ•œ ๋ฐ์ดํ„ฐ๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ matplotlib, seaborn ๋“ฑ ๋‹ค์–‘ํ•œ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋ฅผ ํ™œ์šฉํ•ด ๋‹ค๋ฐฉ๋ฉด์œผ๋กœ ์‹œ๊ฐํ™”ํ•˜๋Š” ๋ฐฉ๋ฒ•๊ณผ ์ธ์‚ฌ์ดํŠธ๋ฅผ ๋„์ถœํ•ด๋‚ด๋Š” ๋ฐฉ๋ฒ•์„ ํ•™์Šตํ–ˆ์Šต๋‹ˆ๋‹ค.

๊ต์œก ์„ธ์…˜ [ํ†ต๊ณ„]

ํŒŒ์ด์ฌ ๊ต์œก ์„ธ์…˜ ์ดํ›„, ์ด 3ํšŒ์˜ ํ†ต๊ณ„ ์„ธ์…˜(ํ†ต๊ณ„, ํšŒ๊ท€, ๋ถ„๋ฅ˜)์„ ํ†ตํ•ด ๋ฐ์ดํ„ฐ ๋ถ„์„์˜ ๊ธฐ๋ฐ˜์ด ๋˜๋Š” ๊ธฐ์ดˆ์ ์ธ ํ†ต๊ณ„ ๊ฐœ๋…๊ณผ ๋จธ์‹  ๋Ÿฌ๋‹(ํšŒ๊ท€, ๋ถ„๋ฅ˜)์˜ ์ด๋ก ์  ๊ธฐ๋ฐ˜์„ ํ•™์Šตํ–ˆ์Šต๋‹ˆ๋‹ค.

Session 4. ํ†ต๊ณ„(๊ธฐ์ˆ ํ†ต๊ณ„๋Ÿ‰, ํ™•๋ฅ ๋ถ„ํฌ, ๊ฐ€์„ค๊ฒ€์ •)

๋ณธ ์„ธ์…˜์—์„œ๋Š” ๊ธฐ์ˆ  ํ†ต๊ณ„๋Ÿ‰, ๋ชจ์ง‘๋‹จ ๋ฐ ํ‘œ๋ณธ์˜ ํŠน์„ฑ, ๋‹ค์–‘ํ•œ ๋ถ„ํฌ๋“ค๊ณผ ๊ฐ€์„ค๊ฒ€์ •์˜ ์ ˆ์ฐจ ๋ฐ ํ•ด์„ ๋“ฑ ํ†ต๊ณ„์™€ ๊ด€๋ จํ•œ ๋‹ค์–‘ํ•œ ์ด๋ก ์  ๊ธฐ๋ฐ˜์— ๋Œ€ํ•ด ํ•™์Šตํ–ˆ์Šต๋‹ˆ๋‹ค.

Session 5. ํšŒ๊ท€ ์ด๋ก  / ์‹ค์Šต

๋ณธ ์„ธ์…˜์—์„œ๋Š” ๋‹จ์ˆœ ์„ ํ˜• ํšŒ๊ท€, ๋‹ค์ค‘ ์„ ํ˜• ํšŒ๊ท€, ํšŒ๊ท€ ๋ชจํ˜•์˜ ๊ฐ€์ • ์ง„๋‹จ ๋“ฑ ํšŒ๊ท€ ๋ถ„์„๊ณผ ๊ด€๋ จํ•œ ์ด๋ก ์  ๊ธฐ๋ฐ˜์— ๋Œ€ํ•ด ํ•™์Šตํ•˜๊ณ , ์‹ค์Šตํ•ด๋ณด๋Š” ์‹œ๊ฐ„์„ ๊ฐ€์กŒ์Šต๋‹ˆ๋‹ค.

Session 6. ํšŒ๊ท€ ์‹ฌํ™” ๋ฐ ์‹ค์Šต

๋ณธ ์„ธ์…˜์—์„œ๋Š” ๊ฒฝ์‚ฌํ•˜๊ฐ•๋ฒ•, ๋‹ค์ค‘ ์„ ํ˜• ๋ชจ๋ธ์˜ ๊ณผ์ ํ•ฉ๊ณผ ๊ทœ์ œ, ๋ฐ์ดํ„ฐ ์Šค์ผ€์ผ๋ง ๋“ฑ ํšŒ๊ท€ ๋ถ„์„์„ ๋ณด๋‹ค ์‹ฌ๋„ ์žˆ๊ฒŒ ํ•™์Šตํ•˜๋Š” ์‹œ๊ฐ„์„ ๊ฐ€์กŒ์Šต๋‹ˆ๋‹ค.

์‹ฌํ™” ์„ธ์…˜

๊ต์œก ์„ธ์…˜์„ ๋งˆ์นœ ํ›„์—๋Š” ์‹ฌํ™” ์„ธ์…˜์„ ์ง„ํ–‰ํ–ˆ์Šต๋‹ˆ๋‹ค. ๋ฐ์ดํ„ฐ ๋ถ„์„๊ณผ ๋จธ์‹ ๋Ÿฌ๋‹ ์‹ฌํ™” ์ฃผ์ œ ์ค‘ ๊ด€์‹ฌ ๋ถ„์•ผ์— ๋”ฐ๋ผ ํŒ€์„ ๊ตฌ์„ฑํ•˜์˜€๊ณ , ๊ฐ ํŒ€์€ ํ•™์Šต ์ž๋ฃŒ์™€ ์‹ค์Šต ๊ณผ์ œ๋ฅผ ์ œ์ž‘ํ•˜์—ฌ ์ฃผ 2ํšŒ ์ •๊ทœ ์„ธ์…˜์„ ์ง„ํ–‰ํ–ˆ์Šต๋‹ˆ๋‹ค.

Session 1. ๋ถ„๋ฅ˜ ๋ฐ ๊ตฐ์ง‘ํ™”

๋ณธ ์„ธ์…˜์—์„ , ๋ณธ๊ฒฉ์ ์ธ ์‹ฌํ™”์„ธ์…˜ ์ด์ˆ˜์— ์•ž์„œ ๊ธฐ๊ณ„ํ•™์Šต์˜ ๊ฐœ๋… ์‚ดํ”ผ๊ณ  ๋ถ„๋ฅ˜ ๋ชจ๋ธ์˜ ๋Œ€ํ‘œ์ ์ธ ํ‰๊ฐ€์ง€ํ‘œ๋“ค์„ ์•Œ์•„๋ณด์•˜์Šต๋‹ˆ๋‹ค.
์†์‹คํ•จ์ˆ˜, ํ˜ผ๋™ํ–‰๋ ฌ, F-1 Score ํ‰๊ฐ€์ง€ํ‘œ์— ๋Œ€ํ•œ ํ•ด์„, ๋Œ€ํ‘œ์ ์ธ ๋‹จ์ผ๋ถ„๋ฅ˜ ๋ชจ๋ธ์ธ ๋กœ์ง€์Šคํ‹ฑํšŒ๊ท€, ์˜์‚ฌ๊ฒฐ์ •ํŠธ๋ฆฌ, ์„œํฌํŠธ๋ฒกํ„ฐ์˜ ๊ฐœ๋…๊ณผ ๊ธฐ๋ณธ ์›๋ฆฌ๋ฅผ ๋‹ค์‹œ ํ•œ ๋ฒˆ ์ตํžˆ๊ณ  ์‹ค์Šต์„ ํ†ตํ•ด ์žฌํ™•์ธ ํ–ˆ์Šต๋‹ˆ๋‹ค. ๋‚˜์•„๊ฐ€ ์•™์ƒ๋ธ”์„ ๊ตฌ์ถ•ํ•˜๊ฑฐ๋‚˜ ํŒŒ๋ผ๋ฏธํ„ฐ ์ตœ์ ํ™”๋ฅผ ํ†ตํ•ด ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์„ ๋†’์ด๋Š” ์›๋ฆฌ๋ฅผ ๊ณต๋ถ€ํ–ˆ์Šต๋‹ˆ๋‹ค.
๋ถ„๋ฅ˜/๊ตฐ์ง‘ ๋ชจ๋ธ ๊ตฌํ˜„์— ์•ž์„œ ๋ฐ์ดํ„ฐ์— ์ ํ•ฉํ•˜๊ฒŒ ์ด๋ฃจ์–ด์ ธ์•ผ ํ•˜๋Š” ํ‘œ์ค€ํ™”/์ •๊ทœํ™” ์ „์ฒ˜๋ฆฌ๋ฅผ ํ•™์Šตํ•˜๊ณ , Scikit-Learn ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋ฅผ ๋ถˆ๋Ÿฌ์™€ ๋Œ€ํ‘œ์ ์ธ ๋ถ„๋ฅ˜/๊ตฐ์ง‘ ๋ชจ๋ธ์„ ๊ตฌํ˜„ํ•˜์˜€์Šต๋‹ˆ๋‹ค. ์ฐจ์›๊ณผ ๋ณ€์ˆ˜์˜ ๊ด€๊ณ„, ์ฐจ์›์ถ•์†Œ ์•Œ๊ณ ๋ฆฌ์ฆ˜(PCA, LDA, SVD, NMF)์˜ ๊ฐœ๋…๊ณผ ํ•„์š”ํ•œ ์ด์œ ์— ๋Œ€ํ•ด ๊ณต๋ถ€ํ•˜๊ณ , ๋‚˜์•„๊ฐ€ ๊ตฐ์ง‘ํ™” ๋ชจ๋ธ์˜ ํ‰๊ฐ€์ง€ํ‘œ์™€ ํ™œ์šฉ์‚ฌ๋ก€๋ฅผ ๋‹ค๋ฃจ์—ˆ์Šต๋‹ˆ๋‹ค.
์ฐจ์›์ถ•์†Œ
๋Œ€ํ‘œ์ ์ธ ๊ตฐ์ง‘ํ™” ๋ชจ๋ธ์ธ K-means, GMM, DBSCAN์„ ํ•™์Šตํ•˜๊ณ  ๋ถ“๊ฝƒ ๋ฐ์ดํ„ฐ ์„ธํŠธ์— ์ ์šฉํ•ด๋ณด๋ฉฐ ๊ฐ ๊ตฐ์ง‘ ๋ชจ๋ธ์˜ ์ฐจ์ด๋ฅผ ํ•™์Šตํ–ˆ์Šต๋‹ˆ๋‹ค.
class sklearn.cluster.KMeans(n_cluster=8, init='k-means++', n_init=10, max_iter=300, tol=0.001, precompute_distance='auto', verbose=0, random_state=None, copy_x=True, n_jobs=1, algorithm='auto')![Untitled](https://s3-us-west-2.amazonaws.com/secure.notion-static.com/9aa43031-011e-466f-8d30-194676efa43d/Untitled.png)
JavaScript
๋ณต์‚ฌ
K-means
GMM

Session 2~3. ์ถ”์ฒœ์‹œ์Šคํ…œ

์ถ”์ฒœ์‹œ์Šคํ…œ์˜ ๋“ฑ์žฅ ๋ฐฐ๊ฒฝ๊ณผ ๊ด€๋ จ ๊ธฐ์ˆ ์˜ ๋ฐœ์ „์„ ์‚ดํ”ผ๊ณ , ๋‚ด์šฉ ๊ธฐ๋ฐ˜ ํ•„ํ„ฐ๋ง๊ณผ ํ˜‘์—… ํ•„ํ„ฐ๋ง์˜ ์›๋ฆฌ๋ฅผ ์ดํ•ดํ•ฉ๋‹ˆ๋‹ค. ๋‚ด์šฉ ๊ธฐ๋ฐ˜ ํ•„ํ„ฐ๋ง๊ณผ ๊ด€๋ จํ•˜์—ฌ ์ƒํ’ˆ(์•„์ดํ…œ)์— ๋Œ€ํ•œ ๋ฒกํ„ฐ ์—ฐ์‚ฐ์„ ์‹ค์Šตํ–ˆ์Šต๋‹ˆ๋‹ค. ํ˜‘์—… ํ•„ํ„ฐ๋ง๊ณผ ๊ด€๋ จํ•˜์—ฌ, ๋ฉ”๋ชจ๋ฆฌ ๊ธฐ๋ฐ˜๊ณผ ๋ชจ๋ธ ๊ธฐ๋ฐ˜ ๋ฐฉ์‹์„ ํ•™์Šตํ•˜๊ณ , ๊ฐ ๋ฐฉ์‹์— ๋Œ€ํ•œ ์œ ์‚ฌ๋„, ํ–‰๋ ฌ ์—ฐ์‚ฐ์„ ์‹ค์Šตํ–ˆ์Šต๋‹ˆ๋‹ค.
๋ชจ๋ธ ๊ธฐ๋ฐ˜ ํ•„ํ„ฐ๋ง๊ณผ ๊ด€๋ จํ•˜์—ฌ, ํด๋Ÿฌ์Šคํ„ฐ๋ง, ํ† ํ”ฝ ๋ชจ๋ธ, ํ–‰๋ ฌ ๋ถ„ํ•ด ๋ชจ๋ธ์„ ์‚ดํŽด๋ณด๊ณ  ์ถ”์ฒœ ๋ชจ๋ธ์˜ ํ‰๊ฐ€ ์ง€ํ‘œ๋ฅผ ํ•™์Šตํ–ˆ์Šต๋‹ˆ๋‹ค.
์—ฐ๋Œ€๋ณ„ ์ถ”์ฒœ์‹œ์Šคํ…œ์— ์‚ฌ์šฉ๋œ ๋Œ€ํ‘œ์ ์ธ ๊ธฐ์ˆ 
์ถ”์ฒœ์‹œ์Šคํ…œ์˜ ๋ถ„๋ฅ˜

๋‚ด์šฉ(์ฝ˜ํ…์ธ ) ๊ธฐ๋ฐ˜ ํ•„ํ„ฐ๋ง

โ€ข
์ฑ…์˜ ์ œ๋ชฉ์ด๋‚˜ ์ €์ž, ์žฅ๋ฅด ๋“ฑ๊ณผ ๊ฐ™์ด ์•„์ดํ…œ์˜ ๋‚ด์šฉ์„ ๋‚˜ํƒ€๋‚ด๋Š” ์ •๋ณด๋ฅผ ์‚ฌ์šฉ
โ€ข
์‚ฌ์šฉ์ž๊ฐ€ ์„ ํ˜ธํ•˜๋Š” ์ •๋ณด๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ๋‚ด์šฉ์ด ๋น„์Šทํ•œ ์•„์ดํ…œ์„ ๊ณ„์‚ฐํ•จ์œผ๋กœ์จ ์ถ”์ฒœ์„ ์ˆ˜ํ–‰ํ•˜๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜

ํ˜‘์—…(ํ˜‘์กฐ) ํ•„ํ„ฐ๋ง

โ€ข
์„œ๋น„์Šค ๋‚ด์— ์žˆ๋Š” ๋‹ค๋ฅธ ์‚ฌ์šฉ์ž์˜ ๊ณผ๊ฑฐ ํ–‰๋™ ๋“ฑ์„ ํ†ตํ•ด ์–ป์–ด์ง„ ๊ธฐํ˜ธ ๊ฒฝํ–ฅ์„ ํ™œ์šฉํ•˜๋Š” ์ถ”์ฒœ ์•Œ๊ณ ๋ฆฌ์ฆ˜.
ํŠน์ด๊ฐ’ ๋ถ„ํ•ด

Session 4. ๋จธ์‹ ๋Ÿฌ๋‹/๋”ฅ๋Ÿฌ๋‹

Desicion Tree ์˜ ํ›ˆ๋ จ, ์‹œ๊ฐํ™”, ์˜ˆ์ธก ๋ฐฉ๋ฒ•์— ๋Œ€ํ•ด ๊ณต๋ถ€ํ•˜๊ณ , Scikit-Learn์˜ CART ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ํ†ตํ•ด ๊ตฌํ˜„ํ•˜์˜€์Šต๋‹ˆ๋‹ค. ํŠธ๋ฆฌ์— ๊ทœ์ œ๋ฅผ ์ ์šฉํ•˜๋Š” ๋ฐฉ๋ฒ•๊ณผ ํšŒ๊ท€ ๋ฌธ์ œ์—์˜ ์ ์šฉ์„ ์‚ดํŽด๋ณด์•˜์Šต๋‹ˆ๋‹ค.
์˜์‚ฌ๊ฒฐ์ • ๋‚˜๋ฌด์˜ ํ•™์Šต๊ณผ์ •
์˜์‚ฌ๊ฒฐ์ • ๋‚˜๋ฌด์™€ โ€˜๊ทœ์ œโ€™
๊ฐ๊ฐ์˜ ๊ฐœ๋ณ„ ์˜์‚ฌ๊ฒฐ์ •๋‚˜๋ฌด์— bagging ์•™์ƒ๋ธ”์„ ํ†ตํ•ด ๊ตฌ์„ฑํ•œ RandomForest ๋ชจ๋ธ
์˜์‚ฌ๊ฒฐ์ •ํŠธ๋ฆฌ์˜ ์›๋ฆฌ๋ฅผ ์‚ดํ•€ ํ›„์—”, ์•™์ƒ๋ธ”์˜ ์•Œ๊ณ ๋ฆฌ์ฆ˜๋ณ„ ๋ณ‘๋ ฌ/์ง๋ ฌ ์—ฐ๊ฒฐ์„ ํšจ์œจ์ ์œผ๋กœ ๊ตฌ์„ฑํ•˜์—ฌ ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์„ ๋†’์ด๋Š” ๋ฐฉ๋ฒ•์„ ํ•™์Šตํ–ˆ์Šต๋‹ˆ๋‹ค. ํšจ๊ณผ์ ์ธ ๊ธฐ๋ฒ•/๋ฐฉ๋ฒ•๋ก ์œผ๋กœ์„œ์˜ ์•™์ƒ๋ธ” ๊ตฌํ˜„์„ ์œ„ํ•ด voting, bagging & pasting, boosting, stacking ๊ฐœ๋…์„ ํ•™์Šตํ•˜๊ณ  ์ƒํ™ฉ๋ณ„ ์ ํ•ฉํ•œ ์•™์ƒ๋ธ” ๊ตฌํ˜„์„ ์‹ค์Šตํ•˜์˜€์Šต๋‹ˆ๋‹ค. ๋‚˜์•„๊ฐ€ ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ ์ตœ์ ํ™”๋ฅผ ํ†ตํ•ด ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์„ ๋†’์ด๋Š” ๋ชจ๋“ˆ์˜ ์‚ฌ์šฉ๋ฒ•๊ณผ ๊ฐ๊ฐ์˜ ์žฅ๋‹จ, ํŠน์ง•์„ ์‚ดํ”ผ์—ˆ์Šต๋‹ˆ๋‹ค.
์ธ๊ณต์ง€๋Šฅ(AI), ๋จธ์‹ ๋Ÿฌ๋‹, ๋”ฅ๋Ÿฌ๋‹์˜ ๊ฐœ๋…์„ ์‚ดํ”ผ๊ณ  ๋น„์ •ํ˜• ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•ด ์ž๊ฐ€ํ•™์Šต ํ•˜๋Š” ๋”ฅ๋Ÿฌ๋‹์— ๋Œ€ํ•ด ๊ณต๋ถ€ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ธ๊ณต์‹ ๊ฒฝ๋ง(Artificial Neural Network, ANN) ๋ชจ๋ธ ๋‚ด ์˜์‚ฌ๊ฒฐ์ • ์›๋ฆฌ๋ฅผ ์‚ดํ”ผ๊ณ  ํผ์…‰ํŠธ๋ก ์˜ ๊ตฌ์กฐ์™€ ๋‹ค์ธตํ™”์™€ ์‹ ๊ฒฝ๋ง์œผ๋กœ์˜ ์—ฐ๊ฒฐ, ๊ตฌ์ฒด์ ์ธ ์‹ ๊ฒฝ๋ง ํ•™์Šต ๋ชจ๋ธ์„ ๋‹ค๋ฃจ์—ˆ์Šต๋‹ˆ๋‹ค.
(์ขŒ) ์šฐ๋ฆฌ ๋‡Œ์˜ ์‹ ๊ฒฝ(๋‰ด๋Ÿฐ) vs (์šฐ) ์ธ๊ณต์‹ ๊ฒฝ
์€๋‹‰์ธต๊ณผ ์—ญ์ „
์—ญ์ „ํŒŒ์™€ chain rule
CNN๊ณผ ์ด๋ฏธ์ง€ ์ฒ˜๋ฆฌ ์—ฐ์‚ฐ
์ดํ›„, ๊ณ ์ • ์ž…๋ ฅํฌ๊ธฐ ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•ด ํ•ฉ์„ฑ๊ณฑ pooling ๊ณ„์ธต ์—ฐ์‚ฐ์„ ์ˆ˜ํ–‰ํ•˜๋Š” CNN, ํฌ๊ธฐ์— ๊ฐ€๋ณ€์„ฑ์ด ์žˆ๋Š” ์ˆœ์ฐจ์  ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•ด ์ด์ „ ์‹œ์ ์˜ ์ถœ๋ ฅ์„ ๊ณ ๋ คํ•˜์—ฌ ๊ธฐ์–ต๊ณผ ์—ฐ์‚ฐ์„ ์ˆ˜ํ–‰ํ•˜๋Š” RNN์„ ๋น„๊ตํ•˜๊ณ , ์ˆ˜ํ–‰ํ•˜๊ณ ์ž ํ•˜๋Š” task์™€ ๋ฐ์ดํ„ฐ์˜ ์ข…๋ฅ˜์— ๋”ฐ๋ผ ์ ํ•ฉํ•  DL ๋ชจ๋ธ์„ ๋…ผ์˜ํ•˜๊ณ , ๊ตฌ์ฒด์ ์ธ ์›๋ฆฌ์™€ ์šฉ๋ก€๋ฅผ ๋น„๊ตํ•˜๋ฉฐ ํ•™์Šตํ–ˆ์Šต๋‹ˆ๋‹ค.
RNN์˜ ์€๋‹‰์ธต๊ณผ ํ’ˆ์‚ฌ ํƒœ๊น…

Session 5~6. ์‹œ๊ณ„์—ด

์‹œ๊ณ„์—ด ๋ฐ์ดํ„ฐ์˜ ์ •์˜, ์ข…๋ฅ˜, ํ†ต๊ณ„์  ํŠน์„ฑ์„ ์‚ดํ”ผ๊ณ , ํšจ์œจ์ ์ธ EDA๋ฅผ ์œ„ํ•œ ์ฐจ๋ถ„, ๋นˆ๋„, Lag์— ๋Œ€ํ•œ ์ „์ฒ˜๋ฆฌ ๊ธฐ๋ฒ•์„ ํ•™์Šตํ–ˆ์Šต๋‹ˆ๋‹ค. ๋ณ€๋™์„ฑ๋ถ„์— ๋Œ€ํ•œ ์š”์†Œ๋ถ„ํ•ด์™€ ํ‰ํ™œํ™”๋ฅผ ์‹ค์Šตํ•˜๊ณ , ์‹œ๊ณ„์—ด ๋ฐ์ดํ„ฐ ๊ฐ„ ์ƒ๊ด€ ๋ถ„์„์— ์“ฐ์ด๋Š” ๋Œ€ํ‘œ์ ์ธ ๊ณ„์ˆ˜์™€ ํ‰ํ™œํ™”/ํ•„ํ„ฐ๋ง EDA๋ฅผ ์‚ดํŽด๋ณด์•˜์Šต๋‹ˆ๋‹ค.
์‹œ๊ณ„์—ด ๋ฐ์ดํ„ฐ์—์„œ์˜ ๋ณ€๋™ : ์ถ”์„ธ, ์ˆœํ™˜, ๊ณ„์ ˆ, ์šฐ์—ฐ
์‹œ๊ณ„์—ด ๋ฐ์ดํ„ฐ๋Š”?
(1) ์ž๊ธฐ์ƒ๊ด€์„ฑ(Autocorrelation)
(2) ๋น„์ •์ƒ์„ฑ(Non-stationarity)
(3) ๊ณ„์ ˆ์„ฑ(Seasonality)
์‹œ๊ณ„์—ด ๋ฐ์ดํ„ฐ์™€ ์ฐจ๋ถ„
ํ”ผ์–ด์Šจ ์ƒ๊ด€๊ณ„์ˆ˜
์‹œ๊ณ„์—ด ๋ฐ์ดํ„ฐ์˜ ํ‰ํ™œํ™”
๋‹จ๋ณ€๋Ÿ‰/๋‹ค๋ณ€๋ž‘ ์‹œ๊ณ„์—ด ๋ชจ๋ธ์„ ์‚ดํ”ผ๊ณ , ์ž๊ธฐ์ƒ๊ด€, ์ž๊ธฐํšŒ๊ท€, ์•ˆ์ •์‹œ๊ณ„์—ด์— ๋Œ€ํ•ด ํ•™์Šตํ–ˆ์Šต๋‹ˆ๋‹ค. ๋ณ€๋™์„ฑ์„ ๋‹ค๋ฃจ๋Š” ๋ชจํ˜•๋“ค์˜ ํŠน์ง•๊ณผ ์šฉ๋ก€๋ฅผ ๊ณต๋ถ€ํ•˜๊ณ  ์‹œ๊ณ„์—ด ๋ฐ์ดํ„ฐ ๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ๋“ค์— ๋Œ€ํ•ด ๋น„๊ตํ•˜๋ฉฐ ํ•™์Šตํ–ˆ์Šต๋‹ˆ๋‹ค.
์ž๊ธฐ์ƒ๊ด€ํ•จ์ˆ˜(Auto Correlation Function, ACF)
๋ถ€๋ถ„์ž๊ธฐ์ƒ๊ด€ํ•จ์ˆ˜(Partial ACF, PACF)
๋‹ค๋ณ€๋Ÿ‰ ์‹œ๊ณ„์—ด ๋ชจ๋ธ : ARCH
LSTM๊ณผ GRU์˜ ๋น„๊ต
๋‹จ๋ณ€๋Ÿ‰ ์‹œ๊ณ„์—ด ๋ชจ๋ธ : N-Beat

Session 7~8. ์ž์—ฐ์–ธ์–ด์ฒ˜๋ฆฌ(Natural Language Processing)

์ž์—ฐ์–ธ์–ด์ฒ˜๋ฆฌ์˜ ๊ฐœ๋…๊ณผ ํ…์ŠคํŠธ ์ „์ฒ˜๋ฆฌ, ํ”ผ์ฒ˜ ๋ฒกํ„ฐํ™”, ์ฃผ์š” ์–ธ์–ด๋ชจ๋ธ๊ณผ ํ…์ŠคํŠธ ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•œ ๋ฒกํ„ฐ์—ฐ์‚ฐ์„ ์‚ดํŽด๋ณด์•˜์Šต๋‹ˆ๋‹ค. ์ง์ ‘ ํ…์ŠคํŠธ๋ฐ์ดํ„ฐ์˜ ์ „์ฒ˜๋ฆฌ๋ฅผ ํ•˜๊ณ , KoNLPy ํŒจํ‚ค์ง€๋ฅผ ์‚ฌ์šฉํ•ด ํ˜•ํƒœ์†Œ ๋ถ„์„์„ ์ˆ˜ํ–‰ํ•˜๋Š” ์‹ค์Šต์„ ์ง„ํ–‰ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ „ํ†ต์  ๋ฐฉ๋ฒ•์ธ BoW(Bag-of-Words)๋กœ๋ถ€ํ„ฐ TF-IDF(Term Frequency-Inverse Document Frequency) ๊นŒ์ง€์˜ ๊ฐœ์„ ์‚ฌํ•ญ์„ ์‚ดํ”ผ๊ณ , ์ตœ์‹ ์˜ ์ธ๊ณต์‹ ๊ฒฝ๋ง์„ ์‚ฌ์šฉํ•˜๋Š” Word2Vec์ด ์˜๋ฏธ๋ก ์  ๊ด€๊ณ„๋ฅผ ๋ฐ˜์˜ํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋œ ๋ฐฐ๊ฒฝ๊นŒ์ง€ NLP ๋ชจ๋ธ์˜ ๋ฐœ์ „๊ณผ์ •๊ณผ ๊ธฐ๋ฐ˜ ์›๋ฆฌ๋ฅผ ํ•™์Šตํ–ˆ์Šต๋‹ˆ๋‹ค.
LSTM : ์€๋‹‰์ธต์˜ ์…€์— ์ž…์ถœ๋ ฅ ๊ฒŒ์ดํŠธ์™€ ๋ง๊ฐ ๊ฒŒ์ดํŠธ๋ฅผ ์ถ”๊ฐ€ํ•˜์—ฌ ๊ธฐ์–ต์— ๋Œ€ํ•œ ์—ฐ์‚ฐ์„ ๊ฐœ์„ ํ•˜์—ฌ RNN์˜ ๋‹จ์ ์„ ๊ฐœ์„ ํ•œ ๋ชจ๋ธ.
Word2Vec๋ฅผ ํ™œ์šฉํ•ด, ๋‹จ์–ด ๊ฐ„์˜ ์˜๋ฏธ์—ฐ์‚ฐ์„ ์ˆ˜ํ–‰ํ•œ ์˜ˆ.
์ฃผ๋ณ€๋‹จ์–ด๋กœ๋ถ€ํ„ฐ ์ค‘์‹ฌ๋‹จ์–ด๋ฅผ ํ•™์Šต/์˜ˆ์ธกํ•˜๋Š”, Word2Vec-CBOW.
์ค‘์‹ฌ๋‹จ์–ด๋กœ๋ถ€ํ„ฐ ์ฃผ๋ณ€๋‹จ์–ด๋ฅผ ํ•™์Šต/์˜ˆ์ธกํ•˜๋Š”, Word2Vec-Skip Gram.
๋ฒˆ์—ญ๊ธฐ์— ๋„์ž…๋˜์–ด ์˜จ seq2seq, ๋ฒˆ์—ญ ์„ฑ๋Šฅ์˜ ํ˜์‹ ์„ ์ผ์œผํ‚จ Transformer , ํ…์ŠคํŠธ ์ƒ์„ฑํ˜• AI๋กœ ์ฃผ๋ชฉ ๋ฐ›์œผ๋ฉฐ ๋˜ ํ•œ ๋ฒˆ์˜ ํ˜์‹ ์„ ์ผ์œผํ‚ค๊ณ  ์žˆ๋Š” BERT ๋ชจ๋ธ์˜ ๊ตฌ์„ฑ์„ encoder, decoder ๋‹จ์—์„œ๋ถ€ํ„ฐ ์‚ดํ”ผ์—ˆ์œผ๋ฉฐ ์ถœ๋ ฅ ์‹œํ€€์Šค์˜ ์ •ํ™•๋„๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ๋†’์ธ Attention ํ•จ์ˆ˜์˜ ์›๋ฆฌ๋ฅผ ํ•™์Šตํ–ˆ์Šต๋‹ˆ๋‹ค.
Attention Value ์—ฐ์‚ฐ : ์ถœ๋ ฅ ๋‹จ์–ด ์˜ˆ์ธก์‹œ์ ๋งˆ๋‹ค ์—ฐ๊ด€ ๋‹จ์–ด์— ์ง‘์ค‘ํ•˜๋„๋ก ๊ฐ’์„ ํ• ๋‹นํ•œ๋‹ค.
Attention ๋ถ„ํฌ ์—ฐ์‚ฐ ๋„์‹๊ณผ softmax ํ•จ์ˆ˜ ์‹œ๊ฐํ™”
BERT ๋ชจ๋ธ์—์„œ์˜ self-Attention