๊ต์ก ์ธ์
์ธ์ฌ์ดํธ๋ ์ด 7ํ์ ๊ต์ก์ธ์
(OT ํฌํจ)์ ํตํด ์ ์
๊ธฐ์์ ์ํํธ๋๋ฉ์ ๋๋ชจํ๊ณ ,
ํํ์๋ค์ ์ฒด๊ณ์ ์ธ ๋ฐ์ดํฐ ๋ถ์ ๋ฐ ๋ชจ๋ธ๋ง์ ์ํ ๊ธฐ์ด๋ฅผ ๋ค์ง๊ณ ์์ต๋๋ค.
๊ต์ก ์ธ์ [ํ์ด์ฌ]
ํ๊ธฐ ์ด์๋ Github์ ์ฌ์ฉ๋ฒ๊ณผ Python์ ํ์ตํฉ๋๋ค.
Pandas๋ฅผ ์์ฃผ๋ก Python์ ๊ธฐ์ด๋ถํฐ ์ฌํ๊น์ง, ๊ทธ๋ฆฌ๊ณ EDA์ ํ์ํ ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ ๋ฐ ์๊ฐํ๋ฅผ 4๋ฒ์ ์ธ์
์ ๊ฑธ์ณ ํ์ตํฉ๋๋ค.
Session 0 (OT). Jupyter Notebook, ํ์ด์ฌ ๊ธฐ์ด
๋ณธ ์ธ์
์ ๋ณธ๊ฒฉ์ ์ธ ๊ต์ก ์ธ์
์งํ์ ์์ ์ฌ์ ํ์ต๊ณผ์ ์ ํด๋นํฉ๋๋ค.
Jupyter Notebook์ ์ค์นํ๊ณ ์ด๊ธฐ ์ค์ ์ ์งํํ์์ต๋๋ค.
๋ํ, ๊ธฐ๋ณธ์ ์ธ ํ์ด์ฌ ๋ฌธ๋ฒ์ ํ์ต ๋ฐ ๋ณต์ตํ๊ณ , Pandas ๊ธฐ์ด ์ดํด๋ฅผ ์ํ ํ์ต์ ์งํํ์ต๋๋ค.
Session 1. Github, Pandas
๋ณธ ์ธ์
์์๋ ๊ณผ์ ์ ์ถ ๋ฐ ํฌํธํด๋ฆฌ์ค ๊ด๋ฆฌ๋ฅผ ์ํ Github ํ์ฉ ๋ฐฉ๋ฒ์ ๋ํด ํ์ตํ์ผ๋ฉฐ, Pandas ๋ฌธ๋ฒ์ ์ค์ ๋ฐ์ดํฐ์ ์ ์ฉํด๋ณด๋ฉฐ ๋ณธ๊ฒฉ์ ์ผ๋ก ํ์ตํ์ต๋๋ค.
Session 2. ์ฝ๊ธฐ, ์ ์ฒ๋ฆฌ
์ ์๋ฏธํ ์ธ์ฌ์ดํธ๋ฅผ ๋์ถํด๋ด๊ธฐ ์ํด์๋ ์ ์ฒ๋ฆฌ ๊ณผ์ ์ด ํ์์ ์
๋๋ค.
๋ฐ๋ผ์, ๋ณธ ์ธ์
์์๋ ์ ๋ฐ์ ์ธ ๋ฐ์ดํฐ ์ ์ ๋ฐ ์ ์ฒ๋ฆฌ ๊ณผ์ ์ ๋ํด ํ์ตํ์ต๋๋ค.
Session 3. EDA ๋ฐ ๋ฐ์ดํฐ ์๊ฐํ
๋ณธ ์ธ์
์์๋ ์ ์ฒ๋ฆฌํ ๋ฐ์ดํฐ๋ฅผ ๋ฐํ์ผ๋ก matplotlib, seaborn ๋ฑ ๋ค์ํ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ํ์ฉํด ๋ค๋ฐฉ๋ฉด์ผ๋ก ์๊ฐํํ๋ ๋ฐฉ๋ฒ๊ณผ ์ธ์ฌ์ดํธ๋ฅผ ๋์ถํด๋ด๋ ๋ฐฉ๋ฒ์ ํ์ตํ์ต๋๋ค.
๊ต์ก ์ธ์ [ํต๊ณ]
ํ์ด์ฌ ๊ต์ก ์ธ์
์ดํ, ์ด 3ํ์ ํต๊ณ ์ธ์
(ํต๊ณ, ํ๊ท, ๋ถ๋ฅ)์ ํตํด ๋ฐ์ดํฐ ๋ถ์์ ๊ธฐ๋ฐ์ด
๋๋ ๊ธฐ์ด์ ์ธ ํต๊ณ ๊ฐ๋
๊ณผ ๋จธ์ ๋ฌ๋(ํ๊ท, ๋ถ๋ฅ)์ ์ด๋ก ์ ๊ธฐ๋ฐ์ ํ์ตํ์ต๋๋ค.
Session 4. ํต๊ณ(๊ธฐ์ ํต๊ณ๋, ํ๋ฅ ๋ถํฌ, ๊ฐ์ค๊ฒ์ )
๋ณธ ์ธ์
์์๋ ๊ธฐ์ ํต๊ณ๋, ๋ชจ์ง๋จ ๋ฐ ํ๋ณธ์ ํน์ฑ, ๋ค์ํ ๋ถํฌ๋ค๊ณผ ๊ฐ์ค๊ฒ์ ์ ์ ์ฐจ ๋ฐ ํด์ ๋ฑ ํต๊ณ์ ๊ด๋ จํ ๋ค์ํ ์ด๋ก ์ ๊ธฐ๋ฐ์ ๋ํด ํ์ตํ์ต๋๋ค.
Session 5. ํ๊ท ์ด๋ก / ์ค์ต
๋ณธ ์ธ์
์์๋ ๋จ์ ์ ํ ํ๊ท, ๋ค์ค ์ ํ ํ๊ท, ํ๊ท ๋ชจํ์ ๊ฐ์ ์ง๋จ ๋ฑ ํ๊ท ๋ถ์๊ณผ ๊ด๋ จํ ์ด๋ก ์ ๊ธฐ๋ฐ์ ๋ํด ํ์ตํ๊ณ , ์ค์ตํด๋ณด๋ ์๊ฐ์ ๊ฐ์ก์ต๋๋ค.
Session 6. ํ๊ท ์ฌํ ๋ฐ ์ค์ต
๋ณธ ์ธ์
์์๋ ๊ฒฝ์ฌํ๊ฐ๋ฒ, ๋ค์ค ์ ํ ๋ชจ๋ธ์ ๊ณผ์ ํฉ๊ณผ ๊ท์ , ๋ฐ์ดํฐ ์ค์ผ์ผ๋ง ๋ฑ ํ๊ท ๋ถ์์ ๋ณด๋ค ์ฌ๋ ์๊ฒ ํ์ตํ๋ ์๊ฐ์ ๊ฐ์ก์ต๋๋ค.
์ฌํ ์ธ์
๊ต์ก ์ธ์
์ ๋ง์น ํ์๋ ์ฌํ ์ธ์
์ ์งํํ์ต๋๋ค.
๋ฐ์ดํฐ ๋ถ์๊ณผ ๋จธ์ ๋ฌ๋ ์ฌํ ์ฃผ์ ์ค ๊ด์ฌ ๋ถ์ผ์ ๋ฐ๋ผ ํ์ ๊ตฌ์ฑํ์๊ณ , ๊ฐ ํ์ ํ์ต ์๋ฃ์ ์ค์ต ๊ณผ์ ๋ฅผ ์ ์ํ์ฌ ์ฃผ 2ํ ์ ๊ท ์ธ์
์ ์งํํ์ต๋๋ค.
Session 1. ๋ถ๋ฅ ๋ฐ ๊ตฐ์งํ
๋ณธ ์ธ์
์์ , ๋ณธ๊ฒฉ์ ์ธ ์ฌํ์ธ์
์ด์์ ์์ ๊ธฐ๊ณํ์ต์ ๊ฐ๋
์ดํผ๊ณ ๋ถ๋ฅ ๋ชจ๋ธ์ ๋ํ์ ์ธ ํ๊ฐ์งํ๋ค์ ์์๋ณด์์ต๋๋ค.
์์คํจ์, ํผ๋ํ๋ ฌ, F-1 Score ํ๊ฐ์งํ์ ๋ํ ํด์, ๋ํ์ ์ธ ๋จ์ผ๋ถ๋ฅ ๋ชจ๋ธ์ธ ๋ก์ง์คํฑํ๊ท, ์์ฌ๊ฒฐ์ ํธ๋ฆฌ, ์ํฌํธ๋ฒกํฐ์ ๊ฐ๋
๊ณผ ๊ธฐ๋ณธ ์๋ฆฌ๋ฅผ ๋ค์ ํ ๋ฒ ์ตํ๊ณ ์ค์ต์ ํตํด ์ฌํ์ธ ํ์ต๋๋ค. ๋์๊ฐ ์์๋ธ์ ๊ตฌ์ถํ๊ฑฐ๋ ํ๋ผ๋ฏธํฐ ์ต์ ํ๋ฅผ ํตํด ๋ชจ๋ธ์ ์ฑ๋ฅ์ ๋์ด๋ ์๋ฆฌ๋ฅผ ๊ณต๋ถํ์ต๋๋ค.
๋ถ๋ฅ/๊ตฐ์ง ๋ชจ๋ธ ๊ตฌํ์ ์์ ๋ฐ์ดํฐ์ ์ ํฉํ๊ฒ ์ด๋ฃจ์ด์ ธ์ผ ํ๋ ํ์คํ/์ ๊ทํ ์ ์ฒ๋ฆฌ๋ฅผ ํ์ตํ๊ณ , Scikit-Learn ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ๋ถ๋ฌ์ ๋ํ์ ์ธ ๋ถ๋ฅ/๊ตฐ์ง ๋ชจ๋ธ์ ๊ตฌํํ์์ต๋๋ค. ์ฐจ์๊ณผ ๋ณ์์ ๊ด๊ณ, ์ฐจ์์ถ์ ์๊ณ ๋ฆฌ์ฆ(PCA, LDA, SVD, NMF)์ ๊ฐ๋
๊ณผ ํ์ํ ์ด์ ์ ๋ํด ๊ณต๋ถํ๊ณ , ๋์๊ฐ ๊ตฐ์งํ ๋ชจ๋ธ์ ํ๊ฐ์งํ์ ํ์ฉ์ฌ๋ก๋ฅผ ๋ค๋ฃจ์์ต๋๋ค.
์ฐจ์์ถ์
๋ํ์ ์ธ ๊ตฐ์งํ ๋ชจ๋ธ์ธ K-means, GMM, DBSCAN์ ํ์ตํ๊ณ ๋ถ๊ฝ ๋ฐ์ดํฐ ์ธํธ์ ์ ์ฉํด๋ณด๋ฉฐ ๊ฐ ๊ตฐ์ง ๋ชจ๋ธ์ ์ฐจ์ด๋ฅผ ํ์ตํ์ต๋๋ค.
class sklearn.cluster.KMeans(n_cluster=8, init='k-means++', n_init=10, max_iter=300, tol=0.001,
precompute_distance='auto', verbose=0, random_state=None,
copy_x=True, n_jobs=1, algorithm='auto')![Untitled](https://s3-us-west-2.amazonaws.com/secure.notion-static.com/9aa43031-011e-466f-8d30-194676efa43d/Untitled.png)
JavaScript
๋ณต์ฌ
K-means
GMM
Session 2~3. ์ถ์ฒ์์คํ
์ถ์ฒ์์คํ
์ ๋ฑ์ฅ ๋ฐฐ๊ฒฝ๊ณผ ๊ด๋ จ ๊ธฐ์ ์ ๋ฐ์ ์ ์ดํผ๊ณ , ๋ด์ฉ ๊ธฐ๋ฐ ํํฐ๋ง๊ณผ ํ์
ํํฐ๋ง์ ์๋ฆฌ๋ฅผ ์ดํดํฉ๋๋ค. ๋ด์ฉ ๊ธฐ๋ฐ ํํฐ๋ง๊ณผ ๊ด๋ จํ์ฌ ์ํ(์์ดํ
)์ ๋ํ ๋ฒกํฐ ์ฐ์ฐ์ ์ค์ตํ์ต๋๋ค. ํ์
ํํฐ๋ง๊ณผ ๊ด๋ จํ์ฌ, ๋ฉ๋ชจ๋ฆฌ ๊ธฐ๋ฐ๊ณผ ๋ชจ๋ธ ๊ธฐ๋ฐ ๋ฐฉ์์ ํ์ตํ๊ณ , ๊ฐ ๋ฐฉ์์ ๋ํ ์ ์ฌ๋, ํ๋ ฌ ์ฐ์ฐ์ ์ค์ตํ์ต๋๋ค.
๋ชจ๋ธ ๊ธฐ๋ฐ ํํฐ๋ง๊ณผ ๊ด๋ จํ์ฌ, ํด๋ฌ์คํฐ๋ง, ํ ํฝ ๋ชจ๋ธ, ํ๋ ฌ ๋ถํด ๋ชจ๋ธ์ ์ดํด๋ณด๊ณ ์ถ์ฒ ๋ชจ๋ธ์ ํ๊ฐ ์งํ๋ฅผ ํ์ตํ์ต๋๋ค.
์ฐ๋๋ณ ์ถ์ฒ์์คํ
์ ์ฌ์ฉ๋ ๋ํ์ ์ธ ๊ธฐ์
์ถ์ฒ์์คํ
์ ๋ถ๋ฅ
๋ด์ฉ(์ฝํ ์ธ ) ๊ธฐ๋ฐ ํํฐ๋ง
โข
์ฑ
์ ์ ๋ชฉ์ด๋ ์ ์, ์ฅ๋ฅด ๋ฑ๊ณผ ๊ฐ์ด ์์ดํ
์ ๋ด์ฉ์ ๋ํ๋ด๋ ์ ๋ณด๋ฅผ ์ฌ์ฉ
โข
์ฌ์ฉ์๊ฐ ์ ํธํ๋ ์ ๋ณด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๋ด์ฉ์ด ๋น์ทํ ์์ดํ
์ ๊ณ์ฐํจ์ผ๋ก์จ ์ถ์ฒ์ ์ํํ๋ ์๊ณ ๋ฆฌ์ฆ
ํ์ (ํ์กฐ) ํํฐ๋ง
โข
์๋น์ค ๋ด์ ์๋ ๋ค๋ฅธ ์ฌ์ฉ์์ ๊ณผ๊ฑฐ ํ๋ ๋ฑ์ ํตํด ์ป์ด์ง ๊ธฐํธ ๊ฒฝํฅ์ ํ์ฉํ๋ ์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ.
ํน์ด๊ฐ ๋ถํด
Session 4. ๋จธ์ ๋ฌ๋/๋ฅ๋ฌ๋
Desicion Tree ์ ํ๋ จ, ์๊ฐํ, ์์ธก ๋ฐฉ๋ฒ์ ๋ํด ๊ณต๋ถํ๊ณ , Scikit-Learn์ CART ์๊ณ ๋ฆฌ์ฆ์ ํตํด ๊ตฌํํ์์ต๋๋ค. ํธ๋ฆฌ์ ๊ท์ ๋ฅผ ์ ์ฉํ๋ ๋ฐฉ๋ฒ๊ณผ ํ๊ท ๋ฌธ์ ์์ ์ ์ฉ์ ์ดํด๋ณด์์ต๋๋ค.
์์ฌ๊ฒฐ์ ๋๋ฌด์ ํ์ต๊ณผ์
์์ฌ๊ฒฐ์ ๋๋ฌด์ โ๊ท์ โ
๊ฐ๊ฐ์ ๊ฐ๋ณ ์์ฌ๊ฒฐ์ ๋๋ฌด์ bagging ์์๋ธ์ ํตํด ๊ตฌ์ฑํ RandomForest ๋ชจ๋ธ
์์ฌ๊ฒฐ์ ํธ๋ฆฌ์ ์๋ฆฌ๋ฅผ ์ดํ ํ์, ์์๋ธ์ ์๊ณ ๋ฆฌ์ฆ๋ณ ๋ณ๋ ฌ/์ง๋ ฌ ์ฐ๊ฒฐ์ ํจ์จ์ ์ผ๋ก ๊ตฌ์ฑํ์ฌ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ๋์ด๋ ๋ฐฉ๋ฒ์ ํ์ตํ์ต๋๋ค.
ํจ๊ณผ์ ์ธ ๊ธฐ๋ฒ/๋ฐฉ๋ฒ๋ก ์ผ๋ก์์ ์์๋ธ ๊ตฌํ์ ์ํด voting, bagging & pasting, boosting, stacking ๊ฐ๋
์ ํ์ตํ๊ณ ์ํฉ๋ณ ์ ํฉํ ์์๋ธ ๊ตฌํ์ ์ค์ตํ์์ต๋๋ค.
๋์๊ฐ ํ์ดํผํ๋ผ๋ฏธํฐ ์ต์ ํ๋ฅผ ํตํด ๋ชจ๋ธ์ ์ฑ๋ฅ์ ๋์ด๋ ๋ชจ๋์ ์ฌ์ฉ๋ฒ๊ณผ ๊ฐ๊ฐ์ ์ฅ๋จ, ํน์ง์ ์ดํผ์์ต๋๋ค.
์ธ๊ณต์ง๋ฅ(AI), ๋จธ์ ๋ฌ๋, ๋ฅ๋ฌ๋์ ๊ฐ๋
์ ์ดํผ๊ณ ๋น์ ํ ๋ฐ์ดํฐ์ ๋ํด ์๊ฐํ์ต ํ๋ ๋ฅ๋ฌ๋์ ๋ํด ๊ณต๋ถํ์ต๋๋ค. ์ธ๊ณต์ ๊ฒฝ๋ง(Artificial Neural Network, ANN) ๋ชจ๋ธ ๋ด ์์ฌ๊ฒฐ์ ์๋ฆฌ๋ฅผ ์ดํผ๊ณ ํผ์
ํธ๋ก ์ ๊ตฌ์กฐ์ ๋ค์ธตํ์ ์ ๊ฒฝ๋ง์ผ๋ก์ ์ฐ๊ฒฐ, ๊ตฌ์ฒด์ ์ธ ์ ๊ฒฝ๋ง ํ์ต ๋ชจ๋ธ์ ๋ค๋ฃจ์์ต๋๋ค.
(์ข) ์ฐ๋ฆฌ ๋์ ์ ๊ฒฝ(๋ด๋ฐ) vs (์ฐ) ์ธ๊ณต์ ๊ฒฝ
์๋์ธต๊ณผ ์ญ์
์ญ์ ํ์ chain rule
CNN๊ณผ ์ด๋ฏธ์ง ์ฒ๋ฆฌ ์ฐ์ฐ
์ดํ, ๊ณ ์ ์
๋ ฅํฌ๊ธฐ ๋ฐ์ดํฐ์ ๋ํด ํฉ์ฑ๊ณฑ pooling ๊ณ์ธต ์ฐ์ฐ์ ์ํํ๋ CNN, ํฌ๊ธฐ์ ๊ฐ๋ณ์ฑ์ด ์๋ ์์ฐจ์ ๋ฐ์ดํฐ์ ๋ํด ์ด์ ์์ ์ ์ถ๋ ฅ์ ๊ณ ๋ คํ์ฌ ๊ธฐ์ต๊ณผ ์ฐ์ฐ์ ์ํํ๋ RNN์ ๋น๊ตํ๊ณ , ์ํํ๊ณ ์ ํ๋ task์ ๋ฐ์ดํฐ์ ์ข
๋ฅ์ ๋ฐ๋ผ ์ ํฉํ DL ๋ชจ๋ธ์ ๋
ผ์ํ๊ณ , ๊ตฌ์ฒด์ ์ธ ์๋ฆฌ์ ์ฉ๋ก๋ฅผ ๋น๊ตํ๋ฉฐ ํ์ตํ์ต๋๋ค.
RNN์ ์๋์ธต๊ณผ ํ์ฌ ํ๊น
Session 5~6. ์๊ณ์ด
์๊ณ์ด ๋ฐ์ดํฐ์ ์ ์, ์ข
๋ฅ, ํต๊ณ์ ํน์ฑ์ ์ดํผ๊ณ , ํจ์จ์ ์ธ EDA๋ฅผ ์ํ ์ฐจ๋ถ, ๋น๋, Lag์ ๋ํ ์ ์ฒ๋ฆฌ ๊ธฐ๋ฒ์ ํ์ตํ์ต๋๋ค. ๋ณ๋์ฑ๋ถ์ ๋ํ ์์๋ถํด์ ํํํ๋ฅผ ์ค์ตํ๊ณ , ์๊ณ์ด ๋ฐ์ดํฐ ๊ฐ ์๊ด ๋ถ์์ ์ฐ์ด๋ ๋ํ์ ์ธ ๊ณ์์ ํํํ/ํํฐ๋ง EDA๋ฅผ ์ดํด๋ณด์์ต๋๋ค.
์๊ณ์ด ๋ฐ์ดํฐ์์์ ๋ณ๋ : ์ถ์ธ, ์ํ, ๊ณ์ , ์ฐ์ฐ
์๊ณ์ด ๋ฐ์ดํฐ๋?
(1) ์๊ธฐ์๊ด์ฑ(Autocorrelation)
(2) ๋น์ ์์ฑ(Non-stationarity)
(3) ๊ณ์ ์ฑ(Seasonality)
์๊ณ์ด ๋ฐ์ดํฐ์ ์ฐจ๋ถ
ํผ์ด์จ ์๊ด๊ณ์
์๊ณ์ด ๋ฐ์ดํฐ์ ํํํ
๋จ๋ณ๋/๋ค๋ณ๋ ์๊ณ์ด ๋ชจ๋ธ์ ์ดํผ๊ณ , ์๊ธฐ์๊ด, ์๊ธฐํ๊ท, ์์ ์๊ณ์ด์ ๋ํด ํ์ตํ์ต๋๋ค. ๋ณ๋์ฑ์ ๋ค๋ฃจ๋ ๋ชจํ๋ค์ ํน์ง๊ณผ ์ฉ๋ก๋ฅผ ๊ณต๋ถํ๊ณ ์๊ณ์ด ๋ฐ์ดํฐ ๋ฅ๋ฌ๋ ๋ชจ๋ธ๋ค์ ๋ํด ๋น๊ตํ๋ฉฐ ํ์ตํ์ต๋๋ค.
์๊ธฐ์๊ดํจ์(Auto Correlation Function, ACF)
๋ถ๋ถ์๊ธฐ์๊ดํจ์(Partial ACF, PACF)
๋ค๋ณ๋ ์๊ณ์ด ๋ชจ๋ธ : ARCH
LSTM๊ณผ GRU์ ๋น๊ต
๋จ๋ณ๋ ์๊ณ์ด ๋ชจ๋ธ : N-Beat
Session 7~8. ์์ฐ์ธ์ด์ฒ๋ฆฌ(Natural Language Processing)
์์ฐ์ธ์ด์ฒ๋ฆฌ์ ๊ฐ๋
๊ณผ ํ
์คํธ ์ ์ฒ๋ฆฌ, ํผ์ฒ ๋ฒกํฐํ, ์ฃผ์ ์ธ์ด๋ชจ๋ธ๊ณผ ํ
์คํธ ๋ฐ์ดํฐ์ ๋ํ ๋ฒกํฐ์ฐ์ฐ์ ์ดํด๋ณด์์ต๋๋ค. ์ง์ ํ
์คํธ๋ฐ์ดํฐ์ ์ ์ฒ๋ฆฌ๋ฅผ ํ๊ณ , KoNLPy ํจํค์ง๋ฅผ ์ฌ์ฉํด ํํ์ ๋ถ์์ ์ํํ๋ ์ค์ต์ ์งํํ์ต๋๋ค. ์ ํต์ ๋ฐฉ๋ฒ์ธ BoW(Bag-of-Words)๋ก๋ถํฐ TF-IDF(Term Frequency-Inverse Document Frequency) ๊น์ง์ ๊ฐ์ ์ฌํญ์ ์ดํผ๊ณ , ์ต์ ์ ์ธ๊ณต์ ๊ฒฝ๋ง์ ์ฌ์ฉํ๋ Word2Vec์ด ์๋ฏธ๋ก ์ ๊ด๊ณ๋ฅผ ๋ฐ์ํ ์ ์๊ฒ ๋ ๋ฐฐ๊ฒฝ๊น์ง NLP ๋ชจ๋ธ์ ๋ฐ์ ๊ณผ์ ๊ณผ ๊ธฐ๋ฐ ์๋ฆฌ๋ฅผ ํ์ตํ์ต๋๋ค.
LSTM : ์๋์ธต์ ์
์ ์
์ถ๋ ฅ ๊ฒ์ดํธ์ ๋ง๊ฐ ๊ฒ์ดํธ๋ฅผ ์ถ๊ฐํ์ฌ ๊ธฐ์ต์ ๋ํ ์ฐ์ฐ์ ๊ฐ์ ํ์ฌ RNN์ ๋จ์ ์ ๊ฐ์ ํ ๋ชจ๋ธ.
Word2Vec๋ฅผ ํ์ฉํด, ๋จ์ด ๊ฐ์ ์๋ฏธ์ฐ์ฐ์ ์ํํ ์.
์ฃผ๋ณ๋จ์ด๋ก๋ถํฐ ์ค์ฌ๋จ์ด๋ฅผ ํ์ต/์์ธกํ๋, Word2Vec-CBOW.
์ค์ฌ๋จ์ด๋ก๋ถํฐ ์ฃผ๋ณ๋จ์ด๋ฅผ ํ์ต/์์ธกํ๋, Word2Vec-Skip Gram.
๋ฒ์ญ๊ธฐ์ ๋์
๋์ด ์จ seq2seq, ๋ฒ์ญ ์ฑ๋ฅ์ ํ์ ์ ์ผ์ผํจ Transformer , ํ
์คํธ ์์ฑํ AI๋ก ์ฃผ๋ชฉ ๋ฐ์ผ๋ฉฐ ๋ ํ ๋ฒ์ ํ์ ์ ์ผ์ผํค๊ณ ์๋ BERT ๋ชจ๋ธ์ ๊ตฌ์ฑ์ encoder, decoder ๋จ์์๋ถํฐ ์ดํผ์์ผ๋ฉฐ ์ถ๋ ฅ ์ํ์ค์ ์ ํ๋๋ฅผ ํจ๊ณผ์ ์ผ๋ก ๋์ธ Attention ํจ์์ ์๋ฆฌ๋ฅผ ํ์ตํ์ต๋๋ค.
Attention Value ์ฐ์ฐ : ์ถ๋ ฅ ๋จ์ด ์์ธก์์ ๋ง๋ค ์ฐ๊ด ๋จ์ด์ ์ง์คํ๋๋ก ๊ฐ์ ํ ๋นํ๋ค.
Attention ๋ถํฌ ์ฐ์ฐ ๋์๊ณผ softmax ํจ์ ์๊ฐํ
BERT ๋ชจ๋ธ์์์ self-Attention