PC, Game์ฝ์ ๋ฟ๋ง ์๋๋ผ, AI์ ๋ฐ์ดํฐ์ผํฐ์์๋ ์์ฒญ๋๊ฒ ๋ง์ GPU๊ฐ ์ฌ์ฉ๋ฉ๋๋ค.
์ด๋ค ๋ฐ๋์ฒด๊ฐ ์ข์๊ฑด์ง ์๊ณ ์ถ์์์?
์ ๊ฐ ์ผํ๊ณ ์๋ ๋ฐ๋์ฒด ์ ๊ณ์์ PPA๋ผ๊ณ ๋ถ๋ฆฝ๋๋ค.
Performance(์ฑ๋ฅ), Power(์ ๋ ฅ), Area(๋ฉด์ ). PPA ํจ์จ์ด ์ข์ ๋ฐ๋์ฒด๊ฐ ์ข์ ๋ฐ๋์ฒด์ ๋๋ค.
โ์๋ฅผ๋ค์ด ์ ์ ๋ ฅ ๋ฐ๋์ฒด๋ฅผ ์ค๊ณํ๋ฉดโฆ ์๋๋ฅผ ๋ฎ์ถ๋๊ฐ, ์ ์ ๋ ฅ์ ์ํ ํน์ ๋ก์ง๋ค์ ์ถ๊ฐํด์ผ ํ๊ธฐ๋๋ฌธ์โฆ ์ฑ๋ฅ ํน์ ๋ฉด์ ํจ์จ์ด ๋จ์ด์ง๋๋ค.
โ
๊ทธ๋์ PPA๋ฅผ ๋ชจ๋ ๋ง์กฑํ๊ธฐ ์ด๋ ค์ด๋ฐ์.
ํ๋์ ๊ฐ์ฅ ์ค์ํ ๊ฒ์ ์ฑ๋ฅ๊ณผ ์ ๋ ฅ์ ๋๋ค. ์ ๋ ฅ์ ๋ํด์ ๋ง์ด ์ค๋ช ํด์๊ธฐ์ ์งง๊ฒ ์๊ฐํ๊ณ , ์ฑ๋ฅ ์์ฃผ๋ก ์ค๋ช ํ๊ฒ ์ต๋๋ค.
์ฑ๋ฅ ์์ฃผ๋ก ๋ณด์ค ๋ถ๋ค์ ์คํฌ๋กค ์ญ ๋ด๋ ค์ฃผ์ธ์.
โ
ํ์ฌ๊น์ง๋ ์ฌ๋๋ค ๋๋ถ๋ถ์ด ๋ฐ๋์ฒด ์ ๋ ฅ ํจ์จ์ ๋ํด ๊ด์ฌ์ด ์์์์?
ํ์ง๋ง AI, ์์จ์ฃผํ ์๋์๋ ์ข ๋ฌ๋ผ์ง ์๋ ์์๊ฑฐ๋ผ๊ณ ์๊ฐํฉ๋๋ค.
โ
์๋๋ Chat GPT์ GPT-3์์ ์ง๋ฌธ ๋น ์ ๋ ฅ ์๋น๋ฅผ ๊ฐ๊ฒฉ์ผ๋ก ์ฐ์ถํ ๊ฐ๊ฒฉ์ ๋๋ค. 2์ผํธ(์ฝ 26์)
GPT-4๋ 5๋ก ๋ฒ์ ์ ๋๋ฉด ์ด ๊ฐ๊ฒฉ๋ ๊ฐ์ด ์ค๋ฅผ๊ฑฐ์์.
์ ๊ฐ ์์ ์ ์ด ์ ๊ธฐ/ํ์ด๋ธ๋ฆฌ๋ ์๋์ฐจ ๊ด๋ จ ๊ธ์ ๋ณด์ ๋ถ๋ค์ ์์๊ฒ ์ง๋ง, ๋ฏธ๊ตญ์ ์์ฒญ๋๊ฒ ํ๊ฒฝ์ ๊ด์ฌ์ด ๋ง์ ๊ตญ๊ฐ์ ๋๋ค.
โ
ํนํ ์บ๋ฆฌํฌ๋์๋ ์ด๊ธฐ ์ข์ ์ง์คํด ๋ ์จ๊ธดํ๋ฐ, ๊ฐ๋ญ๊ณผ ํ์๊ฐ ๋ฐ๋ณต ๋๊ณ , ๋๊ธฐ ์ํ์ด ์ ์ ๋๋ ์ง์ญ์ ๋๋ค.
์ด ์บ๋ฆฌํฌ๋์ ์ฌ๋๋ค์ ๊ธฐํ๋ฌธ์ ๋ฅผ ์๋ผ๋ฉด์ ๋ชธ์ผ๋ก ๋๊ผ๊ณ , ๊ณ์ ๊ต์ก ๋ฐ์๊ณ , ๋๋ ์๋ ์ง์ญ์ ๋๋ค. (LA, ์ํ๋์์ค์ฝ.. ํนํ ์ค๋ฆฌ์ฝ ๋ฐธ๋ฆฌ๊ฐ ์ฌ๊ธฐ ์์ด์.)
โ์บ๋ฆฌํฌ๋์ ์ฌ๋๋ค์ด ๊ธฐํ์ ๊ด์ฌ์ด ๋ง์๋ฐ ์ด์ฉ๋ผ๊ณ ?โ ์ด๋ ๊ฒ ์๊ฐํ์ค ์๋ ์๋๋ฐ,
โ
์บ๋ฆฌํฌ๋์์๋ Califonia Air Resources Board. CARB๋ผ๋ ๊ธฐ๊ด์ด ์์ต๋๋ค.
์ด๋ฆ์ฒ๋ผ ์บ๋ฆฌํฌ๋์ ๋๊ธฐ ํ๊ฒฝ ์์ํ๋ผ๊ณ ๋ณด์๋ฉด ๋๋๋ฐ, ์ฌ๊ธฐ์ ์บ๋ฆฌํฌ๋์์ ๋ค์ํ ๋ฐฐ์ถ๊ฐ์ค ๊ท์ ๋ฅผ ํด์.
โ๋์ ค ์๋์ฐจ, ๋ด์ฐ๊ธฐ๊ด ์๋์ฐจ, ํ๋ผ์คํฑ, x ๋ฐฐ๊ธฐ๋ ์ด์์ 20xx๋ ๋ถํฐ๋ ์ฐ๋ฆฌ ์บ๋ฆฌํฌ๋์์์ ๋ฒ๊ธ ๋์์ ๋๋ค.โ ํ๋๊ฑด๋ฐ, ๋ณดํต ์บ๋ฆฌํฌ๋์ ์ฃผ์์ ์ด๋ฐ ๋ฒ์ ๋ง๋ค๋ฉด, ๋ฏธ๊ตญ ์ฐ๋ฐฉ์ผ๋ก 3~5 ๋ ๋ด์ ํผ์ง๊ฒ ๋ฉ๋๋ค.
โ
์ธ๊ณ์์ ๊ฐ์ฅ ์๋น๋ ฅ ์ข์ ๋ฏธ๊ตญ์ธ๋ฐ, ๋ฏธ๊ตญ ์ฌ๋๋ค์ด ๋ช ๋ ํ๋ถํฐ ๋ด์ฐ๊ธฐ๊ด ์ฐจ ๋ชป ํ๋ค๊ณ ํ๋ฉด.. ๋ฏธ๊ตญ ์ฌ๋๋ค์ด ๋ด์ฐ๊ธฐ๊ด ์ฐจ ์ ์ฌ๊ฒ ์ฃ ?
ํ๋ ๊ธฐ์์๋์ฐจ์์ ๋น์ฐํ ์ ๊ธฐ/ํ์ด๋ธ๋ฆฌ๋ ์๋์ฐจ๋ก ์์ถํ๊ธฐ ์ํด R&Dํ ๊ฑฐ๊ณ , ๋น์ฐํ ๊ตญ๋ด์๋ ์ ๊ธฐ/ํ์ด๋ธ๋ฆฌ๋ ์๋์ฐจ๋ฅผ ํ๊ธฐ ์ํด ์ ์ฑ ๊ธฐ์กฐ๋ฅผ ๋ฐ๊ฟ ๊ฒ์ ๋๋ค.
โ
โ
๋ฐ๋์ฒด๋ ๋ง์ฐฌ๊ฐ์ง์ ๋๋ค. OpenAI์ GPT-3๋ ์ง๋ฌธ๋น ๊ฐ๊ฒฉ(์ ๋ ฅ ํ์ฐ)์ด 26์ ์ ๋์์. GPT-4๋ ์ผ๋ง์ธ์ง ๋ชจ๋ฅด๊ฒ ์ง๋ง, GPT-3์ ๋๋ฐฐ ์ด์์ ๋ฐ์ดํฐ ํ๋ผ๋ฏธํฐ ํฌ๊ธฐ๋ฅผ ๊ฐ๊ณ ์์ต๋๋ค.
์ด ๋ฐ์ดํฐ๋ ๋ฐ์ดํฐ์ผํฐ์ ๋ค์ด์์ด์. ์ ์ ๊ฐ GPT์๊ฒ ๋ฉ์ธ์ง๋ฅผ ๋ณด๋ด๋ฉด, ๋ฐ์ดํฐ์ผํฐ์์ ๊ทธ ๋ฉ์ธ์ง๋ฅผ ์ฒ๋ฆฌํ๊ณ , ๊ทธ ๋ฉ์ธ์ง๋ฅผ ๋ค์ ์ ์ ์๊ฒ ๋ณด๋ ๋๋ค.
โ
ํ์ฌ๋ ์ฌ๋๋ค์ด ๋ชจ๋ฅด๋๊ฒ ์์ผ๋ฉด ๋ค์ด๋ฒ, ๊ตฌ๊ธ์ ๊ฒ์ํด๋ณด์ง๋ง.. ์์ผ๋ก๋ GPT์ ๋ฌผ์ด๋ณผ ๊ฐ๋ฅ์ฑ์ด ์ปค์. ๊ทธ๋ฌ๋ฉด ์์ญ ์๋ฐฑ์ต ์ฌ๋๋ค์ด ์ฌ์ฉํ ๊ฑฐ์์
๊ทธ๋ฆฌ๊ณ ์ด ๋ฐ๋์ฒด๋ ๋ง์ ์ ๋ ฅ ์๋น๋ฅผ ํ๊ณ , ๊ทธ๋ฌ๋ฉด์ ์ด์ ๋ด๋ฟ์ต๋๋ค. ์ด ์ด์ ๊ณต๊ธฐ๋ง์ผ๋ก๋ ์ก์ ์ ์๊ธฐ ๋๋ฌธ์ ๋ฌผ๋ก ์ํ์ฃผ๋๋ฐ์.
๊ตฌ๊ธ์ ๊ทธ๋์ ๋ฐ์ดํฐ์ผํฐ๋ฅผ ์ง์ ๋ ์๋์ง์์ ํ๋ณด๋ฅผ ์ํด ์ฃผ๋ก ๋ฐ๋์ด ๋ง์ด ๋ถ๋ ๊ฐ๊ฐ์ ์ง์ต๋๋ค.
๋ด์ค ๋ด์ฉ์ฒ๋ผ ๋ฌผ ์ฆ๋ฐ๋์ด ์์ฒญ๋๊ฒ ๋ง์ต๋๋ค. ๋ฌผ ์ฆ๋ฐ๋์ด ๋ง์ผ๋ ์ง์ญ ๊ธฐํ ์์ฒด๊ฐ ๋ณํด๋ฒ๋ฆฌ์ฃ .
โ
๊ทธ๋์ ๋ฐ์ดํฐ์ผํฐ ๊ด๋ จ ํ๊ฒฝ์ด์๋ ๋ฒ์จ ์ฌ๋ผ์ค๊ณ ์์ต๋๋ค.
์๋ฌดํผ ์ด๋ฌ์ฟต์ ๋ฌ์ฟตํด์,
1) ์ธ๊ณต์ง๋ฅ/์์จ์ฃผํ ์๋์๋ ์์ฒญ๋๊ฒ ๋ง์ ๋ฐ๋์ฒด ์ ๋ ฅ์ด ์๋ชจ ๋ ๊ฒ์ด๊ณ ,
2) ์ด๊ฒ์ ์กฐ๊ธ์ด๋ผ๋ ์ค์ด๋ ๋ฐฉ๋ฒ์ด ์์ด์ผ ํ๋ฉฐ,
3) ์ถํ์ ์ด๋ฐ ๊ฒ๋ค์ด ๊ธฐํ์ ์ผ๋ก + ์ ์น์ ์ผ๋ก ๋ฌธ์ ๊ฐ ๋ ์ ์๋ ๋ฌธ์ ์ ๋๋ค.
โ
โ
์ ๊ทธ๋ฆฌ๊ณ ์ด์ ์ฑ๋ฅ ์๊ธฐ๋ฅผ ํด๋ณด๊ฒ ์ต๋๋ค.
์ฑ๋ฅ ์ธก๋ฉด์์ ๊ฐ์ฅ ์ค์ํ๊ฒ โ๋จ์ ์๊ฐ๋น ์ฐ์ฐ๋โ์ ๋๋ค. ๋ค๋ฅธ ๊ฒ๋ ์ค์ํ์ง๋ง์.
โ์ผ๋ง๋ ๋ ์ดํด์๊ฐ ์งง์์ง?โ
โ์ฐ๋ฃจํ์ด ํ๋ฒ์ ์ผ๋ง๋ ๋ง์ด ๊ฐ๋ฅํ์ง?โ
โ๋ช ์ข ๋ฅ์ ์ฐ์ฐ์ด ๊ฐ๋ฅํ์ง?โ
๊ทธ๋ฌ๋ฉด ์ด ์ฑ๋ฅ์ ๋จ์๋ฅผ ์์๋ณด๊ณ , ๋น๊ตํด๋ณด๋ฉด ๋๊ฒ ์ฃ .
โ
์ด ์ฑ๋ฅ ๋จ์๋ก TOPS, teraFLOPS๊ฐ ์์ฃผ ์ธ์ฉ๋ฉ๋๋ค. ๊ทผ๋ฐ TOPS๋ โ์ด๋น ๋ช๊ฐ์ ๋ช ๋ น์ ์ฒ๋ฆฌํ๋์ง?โ์ธ๋ฐ, ์ด๋ค ํ ์ ๋ช ๋ น์ธ์ง.. ๋ช ํํ ๊ธฐ์ค์ด ์์ต๋๋ค. ๊ทธ๋์ ์ ๊ฐ ์ ๋ชจ๋ฅด๊ฒ ๊ณ , ๋ฐ์ ์๋น๋์ ์์ง๋์ด์กฐ์ฐจ๋ TOPS๊ฐ ๋ญ ์๋ฏธํ๋์ง ๋ชจ๋ฅด๊ฒ ๋ค๊ณ ํ๋, TOPS์ ๋ํ ์ค๋ช ์ ์ฌ๊ธฐ๊น์ง๋ง ํ๊ณ , teraFLOPS ์์ฃผ๋ก ์ค๋ช ์ ํ๊ฒ ์ต๋๋ค.
์ค์ ์ฑ๋ฅ์ ALU(์ฐ์ ์ฐ์ฐ ๋ก์ง)์ ๊ตฌ์กฐ์ ๊ธฐํ ๋ค๋ฅธ ์์์ ๋ฐ๋ผ์ ๊ฒฐ์ ๋์ง๋ง,
GPU์์์ ์ฑ๋ฅ์ ์ฌํํ๊ฒ โALU ์ * GPU์ clock frequency * nโ๋ก ๊ฒฐ์ ๋ฉ๋๋ค. (* n์ ํ๋ ์ด์ ๋, ์ฐ์ฐ ์ข ๋ฅ/ํ๋์จ์ด ์ข ๋ฅ์ ๋ฐ๋ผ ALU ์ ๊ทผ ํ์๊ฐ ๋ค๋ฅด๊ฑฐ๋ ์.)
์ข ๋ ์์ธํ ๋ณด๊ณ ์ ํ์๋ฉด, ์๋ ์ ์ฐธ๊ณ ํ์๋ฉด ๋๋๋ฐ ์ ๊ฐ ํ ๋ด์ฉ์ด๋ ๊ฑฐ์ ๊ฐ์ต๋๋ค.
PC๋ ๊ฒ์ ์ฝ์ ์ฑ๋ฅ์ ์ด์ผ๊ธฐ ํ ๋ ํ ๋ผํ๋กญ์ค๊ฐ ์ผ๋ง๋ค ๋ผ๋ ์ด์ผ๊ธฐ๋ฅผ ๋ง์ด ํ๊ณ ,
๋ฐ์ดํฐ์ผํฐ๋ AI, HPC ์ชฝ์ ๊ฐ๋ฉด TOPS์ ๋ํ ์๊ธฐ๊ฐ ๋์ต๋๋ค. FLOPS ์๊ธฐ๋ฅผ ๋จผ์ ํด๋ณผ๊ฒ์.
โ
์ฌ๊ธฐ์ ์ด์ผ๊ธฐํ๋ ํ๋กญ์ค(FLOPS, FLoating point OPerations per Second)๋ ์ฐ๋ฆฌ๋ง ๋ฒ์ญํ๋ฉด โ์ด๋น ๋ถ๋์์์ ์ฐ์ฐโ ์ ๋๋ค.
์ปดํจํฐ๊ฐ 1์ด๋์ ์ํํ ์ ์๋ ๋ถ๋์์์ ์ฐ์ฐ์ ํ์๋ฅผ ์ด์ผ๊ธฐ ํ๋๊ฒ์ผ๋ก ์ปดํจํฐ ์ฑ๋ฅ์ ์์น๋ก ๋ํ๋ด๋ ๋จ์์ธ๊ฒ์ด์ฃ . ๋์ ์๋ก ์ข์๊ฑฐ๊ตฌ์.
๋ถ๋์์์ ์ด๋ผ๋ ๋ง์ดโฆ C์ธ์ด๋ฅผ ํ๋ ์ ์๊ฒ๋ ์ต์ํ์ง ์๊ณ .. float number ํน์ ์ค์(real number)๋ผ๊ณ ๋งํ๋๊ฒ ํธํ๋, ์์ผ๋ก float number๋ผ๊ณ ํ๊ฒ ์ต๋๋ค.
โ
ํ๋กญ์ค (FLoating point OPerations per Second) : 1์ด์ 1๋ฒ ์ฐ์ฐ
ํฌ๋กํ๋กญ์ค (kiloFLOPS, 10^3) : 1์ด์ 1์ฒ๋ง๋ฒ ์ฐ์ฐ
๋ฉ๊ฐํ๋กญ์ค (MegaFLOPS, 10^6) : 1์ด์ 100๋ง๋ฒ ์ฐ์ฐ
๊ธฐ๊ฐํ๋กญ์ค (GigaFLOPS, 10^9) : 1์ด์ 10์ต๋ฒ ์ฐ์ฐ
ํ ๋ผํ๋กญ์ค (TeraFLOPS, 10^12) : 1์ด์ 1์กฐ๋ฒ ์ฐ์ฐ
ํํํ๋กญ์ค (PetaFLOPS, 10^15) : 1์ด์ 1,000์กฐ๋ฒ ์ฐ์ฐ
โ
- ๊ทธ๋ํฝ์นด๋๋ณ ํ๋กญ์ค ์ฑ๋ฅ
RTX 4090 = 90 ํ ๋ผํ๋กญ์ค
RTX 3090 = 35.7 ํ ๋ผํ๋กญ์ค
RTX 2080 = 11.14 ํ ๋ผํ๋กญ์ค
GTX 1080 = 9.0 ํ ๋ผํ๋กญ์ค
GTX 980 = 4.981 ํ ๋ผํ๋กญ์ค
- ์ฝ์๊ธฐ๊ธฐ ๊ทธ๋ํฝ ์ฑ๋ฅ
์์ค๋ฐ์ค ์๋ฆฌ์ฆ X = 12.15 ํ ๋ผํ๋กญ์ค
์์ค๋ฐ์ค ์๋ฆฌ์ฆ S = 4 ํ ๋ผํ๋กญ์ค
์์ค๋ฐ์ค ์ X = 6 ํ ๋ผํ๋กญ์ค
์์ค๋ฐ์ค ์ S = 1.4 ํ ๋ผํ๋กญ์ค
ํ์ค5 = 10.28 ํ ๋ผํ๋กญ์ค
ํ์ค4 = 1.84 ํ ๋ผํ๋กญ์ค
๋ํ ๋ ์ค์์น(๊ฑฐ์น๋ชจ๋) = 0.5 ํ ๋ผํ๋กญ์ค
๋ํ ๋ ์ค์์น(ํด๋๋ชจ๋) = 0.393 ํ ๋ผํ๋กญ์ค
โ
2023๋ ์ ๋ฐ์ดํฐ์ผํฐ์์ ๊ฐ์ฅ ์ ๋๊ฐ๊ณ โฆ ํ๋์ 6000๋ง์์ ๋ ํ๋ H100 ๊ฐ์ ๊ฒฝ์ฐ, ์๋ ์ ๋ ์ ๋๋ค.
์ด ๋ฐ์๋ ์ํํธ์จ์ด๋ ์ ๋ง ํฐ ์ํฅ์ ๋ผ์นฉ๋๋ค.
NVIDIA์ ๊ตญ์ด ๊ฐ๋ฅํ ์ด์ ์ค ํ๋๋ NVIDA์ CUDA ๋๋ฌธ์ธ๋ฐโฆ ์ด๊ฒ๋ ์ดํ ํฌ์คํ ์์ ๋ค๋ค๋ณด๊ฒ ์ต๋๋ค.