๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ

๐Ÿ”ฅ/AI ๐Ÿค–6

[2์ฃผ์ฐจ] ํŒŒ๋ผ๋ฉ”ํ„ฐ ํŠœ๋‹2 ๊ฐ€์ค‘์น˜ ๊ทœ์ œ ํ•™์Šต์ค‘ ๊ฐ€์ค‘์น˜๊ฐ€ ํฐ ๊ฒƒ์— ๋Œ€ํ•˜์—ฌ ์ผ์ข…์˜ ํŒจ๋„ํ‹ฐ๋ฅผ ๋ถ€๊ฐ€ํ•ด์„œ ๊ณผ์ ํ•ฉ ์œ„ํ—˜์„ ์ค„์ž„ (ํ•œ๊บผ๋ฒˆ์— ๋„ˆ๋ฌด ๋งŽ์ด ํ•™์Šตํ•˜์ง€๋งˆ!) ⇒ ๋ชจ๋ธ์ด ์ €์žฅํ•  ์ˆ˜ ์žˆ๋Š” ์ •๋ณด์˜ ์–‘๊ณผ ์ข…๋ฅ˜์— ์ œ์•ฝ์„ ๋ถ€๊ณผํ•˜๋Š” ๋ฐฉ๋ฒ• ๋ณต์žกํ•œ ๋ชจ๋ธ์ผ์ˆ˜๋ก ๊ฐ€์ค‘์น˜ ๊ทœ์ œ์˜ ํšจ๊ณผ๊ฐ€ ๋†’์•„์ง ๋„คํŠธ์›Œํฌ๊ฐ€ ์†Œ์ˆ˜์˜ ํŒจํ„ด๋งŒ ๊ธฐ์–ต⇒ ์ตœ์ ํ™” ๋™์•ˆ ์ผ๋ฐ˜ํ™” ๊ฐ€๋Šฅ์„ฑ์ด ๋†’์€ ๊ฐ€์žฅ ์ค‘์š”ํ•œ ํŒจํ„ด์— ์ดˆ์ ์„ ๋งž์ถค "๊ฐ„๋‹จํ•œ๋ชจ๋ธ"=๊ฐ€์ค‘์น˜๊ฐ€ ์ž‘์€ ๊ฐ’์„ ๊ฐ€์ง€๋„๋ก ๋ณต์žก๋„์— ์ œ์•ฝ์„ ์ฃผ๊ธฐ ⇒ ๊ฐ€์ค‘์น˜ ๊ทœ์ œ (Weight Regularization) ๋‘๊ฐ€์ง€ ๋ฐฉ๋ฒ• L1๊ทœ์ œ: ๊ฐ€์ค‘์น˜์˜ ์ ˆ๋Œ“๊ฐ’์— ๋น„๋ก€ํ•˜๋Š” Penalty๊ฐ€ ์ถ”๊ฐ€ L2๊ทœ์ œ: ๊ฐ€์ค‘์น˜์˜ ์ œ๊ณฑ์— ๋น„๋ก€ํ•˜๊ฒŒ ์ถ”๊ฐ€ ⇒ Weight Decay *์ฐจ์ด์ : ํšจ๊ณผ๋Š” ๋น„์Šทํ•˜์ง€๋งŒ L1์€ ๊ฐ€์ค‘์น˜ ํŒŒ๋ผ๋ฉ”ํ„ฐ๋ฅผ 0์œผ๋กœ ๋งŒ๋“ค์ˆ˜ ์žˆ๊ธฐ๋•Œ๋ฌธ์— L2๋ฅผ ๋” ๋งŽ์ด ์‚ฌ์šฉํ•จ Drop .. 2021. 10. 6.
[2์ฃผ์ฐจ] ํŒŒ๋ผ๋ฉ”ํ„ฐ ํŠœ๋‹ - 'ํŠน์ง•' ์‚ด๋ฆฌ๊ธฐ ์ˆ˜์—…๋ชฉํ‘œ ํŠน์ง•์„ ์ž˜ ์‚ด๋ ค๋‚ด๋Š” ๋”ฅ๋Ÿฌ๋‹ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ๋ฐฐ์šฐ๊ณ  ์‹ค์ œ ๋ฐ์ดํ„ฐ์— ํ™œ์šฉํ•ด์„œ ์ทจ์†Œ์œจ, ์ฃผ๊ฐ€ ๋“ฑ์„ ์˜ˆ์ธกํ•œ๋‹ค. - ๋”ฅ๋Ÿฌ๋‹์˜ ๊ฐ€์žฅ ํฐ ์žฅ์ ์€ feature extraction ์ด๋‹ค. ์ด๋Ÿฌํ•œ ์žฅ์ ์„ ์˜ˆ์ธก ์‹œ์Šคํ…œ์— ์ ์šฉ์„ ํ•˜๋А๋ƒ! ํŒŒ๋ผ๋ฏธํ„ฐ ํŠœ๋‹ ํŒŒ๋ผ๋ฏธํ„ฐ์˜ ๊ฐœ๋… ⇒ ์ตœ์ ์˜ ๋ชจ๋ธ ๊ตฌํ˜„์„ ์œ„ํ•ด ํ•™์Šต๋ฅ , ๋ฐฐ์น˜ํฌ๊ธฐ, ํ›ˆ๋ จ๋ฐ˜๋ณตํšŒ์ˆ˜, ๊ฐ€์ค‘์น˜ ์ดˆ๊ธฐํ™”๋ฐฉ๋ฒ• ๋“ฑ ์‚ฌ์šฉ์ž๊ฐ€ ์„ค์ •ํ•˜๋Š” ๋ณ€์ˆ˜ ⇒ ์ผ๋ฐ˜์ ์œผ๋กœ Parameter Tuning ์ด๋ผ๊ณ  ํ•˜์ง€๋งŒ ์‹ค์ œ๋กœ ํŒŒ๋ผ๋ฉ”ํ„ฐ๋Š” ๋ชจ๋ธ์ด ํ•™์Šตํ•˜๋Š” ๋ณ€์ˆ˜๋กœ Weight, Bias๋“ฑ์ด๊ณ  ์šฐ๋ฆฌ๊ฐ€ ์‹ค์ œ๋กœ ์„ค์ •ํ•˜๋Š” ๋ณ€์ˆ˜๋“ค์€ ํ•˜์ดํผํŒŒ๋ผ๋ฉ”ํ„ฐ ํŒŒ๋ผ๋ฏธํ„ฐ๋Š” ๋ชจ๋ธ์ด ์•Œ์•„์„œ ํ•™์Šตํ•˜๋Š” ์•„์ด๋“ค์ด๊ณ  ์šฐ๋ฆฌ๋“ค์€ ์–ด๋–ค ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ์–ด๋–ค์‹์œผ๋กœ ๋ณ€ํ˜•ํ•˜๋ฉด ๋˜๋Š”์ง€ ์•Œ์•„๋ณด์•˜๋‹ค. ๊ฐ€์žฅ ๊ธฐ๋ณธ์ ์ธ ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ๋Š”? 1) ์€๋‹‰์ธต ์ˆ˜์™€ ์€๋‹‰ ๋…ธ๋“œ ์ˆ˜.. 2021. 10. 2.
[1์ฃผ์ฐจ] ์š”์•ฝ & ๋งˆ๋ฌด๋ฆฌ ํ†ต๊ณ„๋ถ„์„๊ณผ AI๋ถ„์„์˜ ์ฐจ์ด์ ์€ AI๋Š” ์ž…๋ ฅ๋ฐ์ดํ„ฐ๊ฐ€ (1) ๋น„์ •ํ˜• ๋ฐ์ดํ„ฐ์—ฌ๋„ ๋œ๋‹ค๋Š”๊ฒƒ, (2) ๋น„์„ ํ˜• ํ˜•ํƒœ์˜ ๋ชจํ˜•์ด์–ด๋„ ๋œ๋‹ค๋Š”์ ์ด ์žˆ๋‹ค. ๋‹ค์ค‘ ํผ์…‰ํŠธ๋ก  ๋ชจํ˜•์˜ ๊ฐ€์žฅ ํฐ ํŠน์ง•์€ (3) Hidden Layer๊ฐ€ ์žˆ๋‹ค๋Š” ์ ์ด๋‹ค. (4) RNN ๋ชจํ˜•์€ ์‹œ๊ณ„์—ด ๋ฐ์ดํ„ฐ ๋ถ„์„์˜ ๊ฐ€์žฅ ๊ธฐ์ดˆ๊ฐ€ ๋˜๋Š”๋ฐ ์—ฌ๋Ÿฌ๊ฐœ์˜ Unit์ด ์—ฎ์—ฌ์ ธ ์žˆ๋Š” Chainํ˜• ๋ชจ๋ธ์ด๊ณ  ๊ณผ๊ฑฐ์˜ ์ƒํƒœ๋ฅผ ๊ธฐ์–ตํ•œ๋‹ค๋Š” ์žฅ์ ์ด ์žˆ๋‹ค. (5) LSTM๋ชจํ˜•์€ ์ด 4๊ฐœ์˜ Gate๋กœ ๊ตฌ์„ฑ์ด ๋˜์–ด์žˆ๊ณ  (6) Forget Gate์—์„œ ํ•„์š”์—†๋Š” ์ƒํƒœ ๋ฐ์ดํ„ฐ๋ฅผ ์‚ญ์ œ, (7) Input Gate์—์„œ ์ƒˆ๋กœ์šด ์ •๋ณด๋ฅผ ์ €์žฅํ•ด์„œ ์—…๋ฐ์ดํŠธ ํ•˜๋Š” ์—ญํ• ์„ ํ•˜๊ณ  ์ด ๋ชจ๋“  ์ •๋ณด๋ฅผ ๊ณผ๊ฑฐ๋กœ๋ถ€ํ„ฐ ๋ณด์กดํ•˜๊ฑฐ๋‚˜ ์ง€์šฐ๋Š” ์ปจ๋ฒ ์ด์–ด์—ญํ• ์„ ํ•˜๋Š” (8) Cell state๋ผ๋Š” ํŠน์ˆ˜ํ•œ ํˆด์ด Chain์˜ ํ๋ฆ„์„ ๊ฐ€์ ธ๊ฐ„๋‹ค. 2021. 9. 29.
[1์ฃผ์ฐจ] LSTM LSTM - Long Short-Term Memory Network RNN์˜ ๋ณ€ํ˜•๋œ ๋ชจ๋ธ๋กœ ๊ธด ๊ธฐ๊ฐ„์˜ ์˜์กด๋„ ์—ญ์‹œ ํ•™์Šตํ•  ์ˆ˜ ์žˆ๋„๋ก ์„ค๊ณ„๋˜์–ด ์žˆ๋‹ค. LSTM์˜ ํŠน์ง• ๋ฐ ์žฅ์  RNN์€ ์šฐ๋ฆฌ๊ฐ€ ๋ฐฐ์› ๋“ฏ์ด ๋ฐ˜๋ณต๋ชจ๋“ˆ์ด ๋‹จ ํ•˜๋‚˜์˜ Layer๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ์ง€๋งŒ LSTM์€ 4๊ฐœ์˜ Layer๊ฐ€ ์„œ๋กœ ์ •๋ณด๋ฅผ ์ฃผ๊ณ ๋ฐ›๋„๋ก ์„ค๊ณ„๋˜์–ด์žˆ๋‹ค. LSTM์˜ ํ•ต์‹ฌ์€ C_t ๋ผ๊ณ  ํ‘œํ˜„๋˜๋Š” "Cell State"์ด๋‹ค. ๋ง ๊ทธ๋Œ€๋กœ ์ƒํƒœ๋ฅผ ์ „๋‹ฌ ํ•ด์ฃผ๋Š” ์ปจ๋ฒ ์ด์–ด์™€ ๊ฐ™์€ ์—ญํ• ์ด๋‹ค. ์ด ์ปจ๋ฒ ์ด์–ด๋ฒจํŠธ์—์„œ ๊ฐ t ์˜ ๋ฐ์ดํ„ฐ๊ฐ€ ์ถ”๊ฐ€๋˜๋ฉด์„œ ์ƒํƒœ ์ •๋ณด๊ฐ€ ๋ฐ”๋€”์ˆ˜๋„, ๊ทธ๋Œ€๋กœ ํ๋ฅด๊ฒŒ๋งŒ ํ•  ์ˆ˜๋„ ์žˆ๋‹ค. C_t๋ฅผ ๋ฐ”๊ฟ€์ง€ ๊ฒฐ์ •ํ•˜๋Š” ์ธ์ž๋Š” "Gate"์ธ๋ฐ ์ด 3๊ฐœ์˜ gate๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ๊ณ  ์ด ๋ฌธ๋“ค์ด cell state๋ฅผ ์ œ์–ดํ•˜๊ธฐ๋„ ํ•˜๊ณ  ๋ณดํ˜ธํ•˜๊ธฐ๋„ ํ•ฉ๋‹ˆ๋‹ค. ์ •๋ณด์˜ ์ „๋‹ฌ์„ ์ค‘.. 2021. 9. 29.