๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
๐Ÿ”ฅ/AI ๐Ÿค–

[1์ฃผ์ฐจ] LSTM

by narang111 2021. 9. 29.

LSTM - Long Short-Term Memory Network

RNN์˜ ๋ณ€ํ˜•๋œ ๋ชจ๋ธ๋กœ ๊ธด ๊ธฐ๊ฐ„์˜ ์˜์กด๋„ ์—ญ์‹œ ํ•™์Šตํ•  ์ˆ˜ ์žˆ๋„๋ก ์„ค๊ณ„๋˜์–ด ์žˆ๋‹ค.

 

 

LSTM์˜ ํŠน์ง• ๋ฐ ์žฅ์ 

RNN์€ ์šฐ๋ฆฌ๊ฐ€ ๋ฐฐ์› ๋“ฏ์ด ๋ฐ˜๋ณต๋ชจ๋“ˆ์ด ๋‹จ ํ•˜๋‚˜์˜ Layer๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ์ง€๋งŒ

LSTM์€ 4๊ฐœ์˜ Layer๊ฐ€ ์„œ๋กœ ์ •๋ณด๋ฅผ ์ฃผ๊ณ ๋ฐ›๋„๋ก ์„ค๊ณ„๋˜์–ด์žˆ๋‹ค.

LSTM์˜ ํ•ต์‹ฌ์€ C_t ๋ผ๊ณ  ํ‘œํ˜„๋˜๋Š” "Cell State"์ด๋‹ค.

๋ง ๊ทธ๋Œ€๋กœ ์ƒํƒœ๋ฅผ ์ „๋‹ฌ ํ•ด์ฃผ๋Š” ์ปจ๋ฒ ์ด์–ด์™€ ๊ฐ™์€ ์—ญํ• ์ด๋‹ค. ์ด ์ปจ๋ฒ ์ด์–ด๋ฒจํŠธ์—์„œ ๊ฐ t ์˜ ๋ฐ์ดํ„ฐ๊ฐ€ ์ถ”๊ฐ€๋˜๋ฉด์„œ ์ƒํƒœ ์ •๋ณด๊ฐ€ ๋ฐ”๋€”์ˆ˜๋„, ๊ทธ๋Œ€๋กœ ํ๋ฅด๊ฒŒ๋งŒ ํ•  ์ˆ˜๋„ ์žˆ๋‹ค.

 

C_t๋ฅผ ๋ฐ”๊ฟ€์ง€ ๊ฒฐ์ •ํ•˜๋Š” ์ธ์ž๋Š” "Gate"์ธ๋ฐ ์ด 3๊ฐœ์˜ gate๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ๊ณ  ์ด ๋ฌธ๋“ค์ด cell state๋ฅผ ์ œ์–ดํ•˜๊ธฐ๋„ ํ•˜๊ณ  ๋ณดํ˜ธํ•˜๊ธฐ๋„ ํ•ฉ๋‹ˆ๋‹ค. ์ •๋ณด์˜ ์ „๋‹ฌ์„ ์ค‘์š”๋„์— ๋”ฐ๋ผ ๊ฐ•๋„๋ฅผ ์กฐ์ ˆํ•˜๋ฉด์„œ ์ปจ๋ฒ ์ด์–ด๋ฒจํŠธ์— ์ „๋‹ฌํ•œ๋‹ค.

 

 

Forget Gate๋Š” ๋ถˆํ•„์š”ํ•œ ๊ณผ๊ฑฐ์ •๋ณด๋ฅผ ์žŠ๊ธฐ์œ„ํ•œ Gate,

Input Gate๋Š” ์ €์žฅํ•  ์ƒˆ ์ •๋ณด๋ฅผ ๊ฒฐ์ •ํ•œ๋‹ค. ์ด๋•Œ ๊ณผ๊ฑฐ์˜ cell state์ธ C_{t-1}๋ฅผ ์—…๋ฐ์ดํŠธํ• ๋•Œ ์ฒ˜์Œ์—” ๊ณฑ์…ˆ์œผ๋กœ ์žŠ๊ธฐ๋กœ ํ–ˆ๋˜ ๊ณผ๊ฑฐ์ •๋ณด๋ฅผ ์‚ญ์ œํ•˜๊ณ  ๋ง์…ˆ์œผ๋กœ ์ƒˆ ์ •๋ณด๋ฅผ ์—…๋ฐ์ดํŠธํ•œ๋‹ค.

Output gate์—์„œ๋Š” ์ตœ์ข…์ ์œผ๋กœ output(์˜ˆ์ธก๊ฒฐ๊ณผ๊ฐ’)์„ cell state๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ํ•„ํ„ฐ๋œ ๊ฐ’์„ ๋‚ด๋ณด๋‚ด๊ฒŒ ๋œ๋‹ค.

 

 

LSTM ์‹ค์Šต

- RNN์˜ ํ•œ ํ˜•ํƒœ์ธ LSTM์„ ํ†ตํ•œ Univariate, Multivariate, Single step, Multistep ๊ธฐํ›„ ์˜ˆ์ธก์„ ์‹ค์Šต

1-10 ๋‹ค์‹œ๋“ฃ๊ธฐ