Fault Tolerance๋ ์์คํ ์ด ๊ณ ์ฅ์ด๋ ์ค๋ฅ๊ฐ ๋ฐ์ํ์ ๋์๋ ์ ์์ ์ผ๋ก ๊ธฐ๋ฅ์ ์ ์งํ ์ ์๋๋ก ์ค๊ณ๋ ๋ฅ๋ ฅ์ ์๋ฏธํฉ๋๋ค. ์ด๋ ํนํ Digital Circuit Design์์ ๋งค์ฐ ์ค์ํ ๊ฐ๋ ์ผ๋ก, ์ ๋ขฐ์ฑ ๋์ ์์คํ ์ ๊ตฌ์ถํ๊ธฐ ์ํด ํ์์ ์ ๋๋ค. Fault Tolerance์ ์ฃผ์ ์ญํ ์ ์์คํ ์ ์์ ์ฑ์ ๋ณด์ฅํ๊ณ , ์ฌ์ฉ์์๊ฒ ์ง์์ ์ธ ์๋น์ค๋ฅผ ์ ๊ณตํ๋ ๊ฒ์ ๋๋ค. ์ด๋ฌํ ํน์ฑ์ ํนํ VLSI ์์คํ ์์ ๋์ฑ ๋๋๋ฌ์ง๋ฉฐ, ๋ค์ํ ์ํฉ์์์ ์ค๋ฅ๋ฅผ ์๋ฐฉํ๊ณ ๋ณต๊ตฌํ๋ ๋ฉ์ปค๋์ฆ์ ํฌํจํฉ๋๋ค.
Fault Tolerance๋ ์ผ๋ฐ์ ์ผ๋ก ํ๋์จ์ด์ ์ํํธ์จ์ด ๋ชจ๋์ ์ ์ฉ๋ ์ ์์ผ๋ฉฐ, ๋ค์ํ ๊ธฐ์ ์ ์ ๊ทผ ๋ฐฉ์์ด ์กด์ฌํฉ๋๋ค. ์๋ฅผ ๋ค์ด, ๋ฐ์ดํฐ ์ค๋ณต์ฑ, ์๋ฌ ๊ฒ์ถ ๋ฐ ์์ ์ฝ๋, ๊ทธ๋ฆฌ๊ณ ๋ฆฌ๋๋์ ๊ธฐ๋ฒ ๋ฑ์ด ์์ต๋๋ค. ์ด๋ฌํ ๊ธฐ๋ฒ๋ค์ ๊ฐ๊ฐ์ ๊ณ ์ ํ ํน์ฑ๊ณผ ์ฅ์ ์ ๊ฐ์ง๊ณ ์์ผ๋ฉฐ, ์์คํ ์ ์๊ตฌ ์ฌํญ์ ๋ฐ๋ผ ์ ์ ํ ์ ํํ์ฌ ๊ตฌํํด์ผ ํฉ๋๋ค. Fault Tolerance๋ ์์คํ ์ค๊ณ ์ด๊ธฐ ๋จ๊ณ์์๋ถํฐ ๊ณ ๋ ค๋์ด์ผ ํ๋ฉฐ, ์ ์ฒด ๊ตฌ์กฐ์ ๋์ ๋ฐฉ์์ ๊น์ ์ํฅ์ ๋ฏธ์นฉ๋๋ค.
Fault Tolerance์ ์ค์์ฑ์ ํนํ ์๋ฒ ๋๋ ์์คํ , ๋ฐ์ดํฐ ์ผํฐ, ํญ๊ณต์ฐ์ฃผ ๋ฐ ์๋์ฐจ ์ฐ์ ์์ ๋์ฑ ๊ฐ์กฐ๋ฉ๋๋ค. ์ด๋ฌํ ๋ถ์ผ์์๋ ์์คํ ์ ์ ๋ขฐ์ฑ์ด ์๋ช ๊ณผ ์ง๊ฒฐ๋ ์ ์๊ธฐ ๋๋ฌธ์, Fault Tolerance๋ฅผ ํตํด ์์คํ ์ ์ง์์ ์ธ ์ด์์ ๋ณด์ฅํ๋ ๊ฒ์ด ํต์ฌ์ ๋๋ค. ๋ฐ๋ผ์ Fault Tolerance๋ ๋จ์ํ ์ค๋ฅ ๋ณต๊ตฌ๋ฅผ ๋์ด์, ์ ์ฒด ์์คํ ์ ์ ๋ขฐ์ฑ๊ณผ ์์ ์ฑ์ ํ๋ณดํ๋ ๋ฐ ํ์์ ์ธ ์์๋ก ์๋ฆฌ ์ก๊ณ ์์ต๋๋ค.
Fault Tolerance์ ๊ตฌ์ฑ ์์์ ์๋ ์๋ฆฌ๋ ๋ค์๊ณผ ๊ฐ์ด ์ค๋ช ํ ์ ์์ต๋๋ค. Fault Tolerance ์์คํ ์ ์ผ๋ฐ์ ์ผ๋ก ์ค๋ฅ ๊ฐ์ง, ์ค๋ฅ ์์ , ๊ทธ๋ฆฌ๊ณ ์์คํ ๋ณต๊ตฌ์ ์ธ ๊ฐ์ง ์ฃผ์ ๋จ๊ณ๋ก ๋๋ ์ ์์ต๋๋ค. ๊ฐ ๋จ๊ณ๋ ์๋ก ๋ฐ์ ํ๊ฒ ์ฐ๊ฒฐ๋์ด ์์ผ๋ฉฐ, ์ ์ฒด ์์คํ ์ ์ ๋ขฐ์ฑ์ ๋์ด๋ ๋ฐ ๊ธฐ์ฌํฉ๋๋ค.
์ฒซ ๋ฒ์งธ ๋จ๊ณ์ธ ์ค๋ฅ ๊ฐ์ง(Error Detection)๋ ์์คํ ๋ด์์ ๋ฐ์ํ ์ ์๋ ๋ค์ํ ์ค๋ฅ๋ฅผ ์๋ณํ๋ ๊ณผ์ ์ ๋๋ค. ์ด๋ฅผ ์ํด ์ฒดํฌ์ฌ, ํจ๋ฆฌํฐ ๋นํธ, ๊ทธ๋ฆฌ๊ณ CRC(Cyclic Redundancy Check)์ ๊ฐ์ ๋ค์ํ ๊ธฐ๋ฒ์ด ์ฌ์ฉ๋ฉ๋๋ค. ์ด๋ฌํ ๊ธฐ๋ฒ๋ค์ ๋ฐ์ดํฐ ์ ์ก ์ค ๋ฐ์ํ ์ ์๋ ์ค๋ฅ๋ฅผ ๊ฐ์งํ๊ณ , ์ด๋ฅผ ํตํด ์์คํ ์ ์ํ๋ฅผ ๋ชจ๋ํฐ๋งํฉ๋๋ค.
๋ ๋ฒ์งธ ๋จ๊ณ์ธ ์ค๋ฅ ์์ (Error Correction)์ ๊ฐ์ง๋ ์ค๋ฅ๋ฅผ ์์ ํ๋ ๊ณผ์ ์ ๋๋ค. ์ด ๋จ๊ณ์์๋ Hamming Code, Reed-Solomon Code์ ๊ฐ์ ๋ณต์กํ ์๊ณ ๋ฆฌ์ฆ์ด ํ์ฉ๋ฉ๋๋ค. ์ด๋ฌํ ์๊ณ ๋ฆฌ์ฆ๋ค์ ๋ฐ์ดํฐ์ ์ค๋ณต์ฑ์ ์ด์ฉํ์ฌ ์ค๋ฅ๋ฅผ ์๋ณํ๊ณ , ํ์ ์ ์๋์ ๋ฐ์ดํฐ๋ฅผ ๋ณต์ํ๋ ์ญํ ์ ํฉ๋๋ค.
๋ง์ง๋ง์ผ๋ก, ์์คํ ๋ณต๊ตฌ(System Recovery)๋ ์ค๋ฅ๊ฐ ๋ฐ์ํ ํ ์์คํ ์ ์ ์ ์ํ๋ก ๋๋๋ฆฌ๋ ๊ณผ์ ์ ๋๋ค. ์ด ๋จ๊ณ์์๋ ๋ฆฌ๋๋์ ๊ธฐ๋ฒ์ด ์ค์ํ ์ญํ ์ ํฉ๋๋ค. ์๋ฅผ ๋ค์ด, ๋ค์คํ(Multiplexing)์ ์ด์คํ(Redundancy) ๊ธฐ๋ฒ์ ์์คํ ์ ์ฌ๋ฌ ๊ตฌ์ฑ ์์๋ฅผ ์ฌ์ฉํ์ฌ ํ๋์ ๊ตฌ์ฑ ์์๊ฐ ์คํจํ๋๋ผ๋ ์ ์ฒด ์์คํ ์ ๊ธฐ๋ฅ์ด ์ ์ง๋๋๋ก ๋ณด์ฅํฉ๋๋ค.
์ด๋ฌํ ๊ฐ ๋จ๊ณ๋ Fault Tolerance๋ฅผ ๊ตฌํํ๊ธฐ ์ํด ํ์์ ์ด๋ฉฐ, ์ด๋ฅผ ํตํด ์์คํ ์ ์ ๋ขฐ์ฑ์ ๋์ด๊ณ , ์ฌ์ฉ์์๊ฒ ์์ ์ ์ธ ์๋น์ค๋ฅผ ์ ๊ณตํ ์ ์์ต๋๋ค.
์ค๋ฅ ๊ฐ์ง ๊ธฐ์ ์ Fault Tolerance์ ํต์ฌ ์์ ์ค ํ๋์ ๋๋ค. ์ฒดํฌ์ฌ์ ๋ฐ์ดํฐ ๋ธ๋ก์ ํฉ๊ณ๋ฅผ ๊ณ์ฐํ์ฌ ์ค๋ฅ๋ฅผ ๊ฐ์งํ๋ ๊ฐ๋จํ ๋ฐฉ๋ฒ์ ๋๋ค. ํจ๋ฆฌํฐ ๋นํธ๋ ๋ฐ์ดํฐ ๋นํธ์ ํ์ ๋๋ ์ง์ ๊ฐ์๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ถ๊ฐ ๋นํธ๋ฅผ ์ฝ์ ํ์ฌ ์ค๋ฅ๋ฅผ ๊ฒ์ถํฉ๋๋ค. CRC๋ ๋ฐ์ดํฐ ์ ์ก์์ ๋ฐ์ํ ์ ์๋ ์ค๋ฅ๋ฅผ ๋ณด๋ค ์ ๊ตํ๊ฒ ๊ฐ์งํ๊ธฐ ์ํด ๋คํญ์์ ์ฌ์ฉํ๋ ๊ธฐ๋ฒ์ ๋๋ค. ์ด๋ฌํ ๊ธฐ์ ๋ค์ ๊ฐ๊ธฐ ๋ค๋ฅธ ์ํฉ์์ ์ฌ์ฉ๋๋ฉฐ, ์์คํ ์ ์๊ตฌ ์ฌํญ์ ๋ฐ๋ผ ์ ์ ํ ์ ํ๋์ด์ผ ํฉ๋๋ค.
์ค๋ฅ ์์ ๊ธฐ์ ์ ๊ฐ์ง๋ ์ค๋ฅ๋ฅผ ์ค์ ๋ก ์์ ํ๋ ์ญํ ์ ํฉ๋๋ค. Hamming Code๋ ๋จ์ผ ๋นํธ ์ค๋ฅ๋ฅผ ์์ ํ ์ ์๋ ๊ฐ๋จํ ๋ฐฉ๋ฒ์ผ๋ก, ์ค๋ฅ์ ์์น๋ฅผ ์๋ณํ ์ ์๋ ์ถ๊ฐ ๋นํธ๋ฅผ ์ฌ์ฉํฉ๋๋ค. Reed-Solomon Code๋ ๋ฐ์ดํฐ ๋ณต๊ตฌ๊ฐ ํ์ํ ์ํฉ์์ ๋๋ฆฌ ์ฌ์ฉ๋๋ฉฐ, ํนํ CD์ DVD์ ๊ฐ์ ์ ์ฅ ๋งค์ฒด์์ ํจ๊ณผ์ ์ ๋๋ค. ์ด๋ฌํ ๊ธฐ์ ๋ค์ ์์คํ ์ ์ ๋ขฐ์ฑ์ ๋์ด๋ ๋ฐ ๊ธฐ์ฌํ๋ฉฐ, ๋ค์ํ ์์ฉ ๋ถ์ผ์์ ํ์ฉ๋ฉ๋๋ค.
Fault Tolerance๋ ์ฌ๋ฌ ๊ด๋ จ ๊ธฐ์ ๋ฐ ๊ฐ๋ ๊ณผ ๋น๊ตํ ์ ์์ต๋๋ค. ์๋ฅผ ๋ค์ด, Error Detection๊ณผ Error Correction์ Fault Tolerance์ ํ์ ๊ฐ๋ ์ผ๋ก, ๊ฐ๊ฐ์ ๊ธฐ๋ฅ์ด ๋ค๋ฅด์ง๋ง ์๋ก ๋ณด์์ ์ธ ๊ด๊ณ์ ์์ต๋๋ค. Error Detection์ ์ค๋ฅ๋ฅผ ์๋ณํ๋ ๋ฐ ์ค์ ์ ๋๋ ๋ฐ๋ฉด, Error Correction์ ์๋ณ๋ ์ค๋ฅ๋ฅผ ์์ ํ๋ ๋ฐ ์ด์ ์ ๋ง์ถฅ๋๋ค.
Fault Tolerance์ Reliability๋ ๋ฐ์ ํ ๊ด๊ณ๋ฅผ ๊ฐ์ง๊ณ ์์ต๋๋ค. Reliability๋ ์์คํ ์ด ์ฃผ์ด์ง ์กฐ๊ฑด์์ ์ ์์ ์ผ๋ก ์๋ํ ํ๋ฅ ์ ์๋ฏธํ๋ฉฐ, Fault Tolerance๋ ์์คํ ์ด ์ค๋ฅ ๋ฐ์ ์์๋ ์๋์ ์ ์งํ ์ ์๋ ๋ฅ๋ ฅ์ ๋๋ค. ์ฆ, Fault Tolerance๋ Reliability์ ์ค์ํ ๊ตฌ์ฑ ์์๋ก ์์ฉํฉ๋๋ค.
๋ํ, Fault Tolerance๋ Redundancy์๋ ๊ด๋ จ์ด ์์ต๋๋ค. Redundancy๋ ์์คํ ์ ๊ตฌ์ฑ ์์๋ฅผ ์ค๋ณตํ์ฌ ๋ฐฐ์นํจ์ผ๋ก์จ ๊ณ ์ฅ์ ๋ฐฉ์งํ๋ ๋ฐฉ๋ฒ์ ๋๋ค. ์๋ฅผ ๋ค์ด, ์ด์คํ๋ ํ๋์จ์ด ๊ตฌ์ฑ ์์๋ ํ๋์ ๊ตฌ์ฑ ์์๊ฐ ์คํจํ๋๋ผ๋ ์์คํ ์ด ๊ณ์ ์๋ํ ์ ์๋๋ก ํฉ๋๋ค. ๊ทธ๋ฌ๋ Redundancy๋ Fault Tolerance์ ํ ๊ธฐ๋ฒ์ผ ๋ฟ์ด๋ฉฐ, Fault Tolerance๋ ๋ณด๋ค ํฌ๊ด์ ์ธ ๊ฐ๋ ์ผ๋ก ๋ค์ํ ๋ฐฉ๋ฒ๋ก ์ ํฌํจํฉ๋๋ค.
์ค์ ์ฌ๋ก๋ก๋ NASA์ ์ฐ์ฃผ์ ์์คํ ์ด ์์ต๋๋ค. ์ด ์์คํ ์ ๋์ ์ ๋ขฐ์ฑ์ ์๊ตฌํ๋ฉฐ, Fault Tolerance ๋ฉ์ปค๋์ฆ์ ํตํด ๋ค์ํ ์ค๋ฅ ์ํฉ์์๋ ์๋ฌด๋ฅผ ์ํํ ์ ์๋๋ก ์ค๊ณ๋์์ต๋๋ค. ๋ํ, ๋ฐ์ดํฐ ์ผํฐ์์๋ Fault Tolerance ๊ธฐ์ ์ด ์ ์ฉ๋์ด ์๋ฒ์ ๊ณ ์ฅ ์์๋ ์๋น์ค๊ฐ ์ค๋จ๋์ง ์๋๋ก ํฉ๋๋ค.
Fault Tolerance๋ ์์คํ ์ด ์ค๋ฅ ๋ฐ์ ์์๋ ์ ์์ ์ผ๋ก ์๋์ ์ ์งํ ์ ์๋ ๋ฅ๋ ฅ์ผ๋ก, ์ ๋ขฐ์ฑ๊ณผ ์์ ์ฑ์ ํ๋ณดํ๋ ๋ฐ ํ์์ ์ธ ์์์ ๋๋ค.