GPT-Realtime-2๋ GPT-5์ ์ง๋ฅ์ ์์ฑ API์ ์ ์ฉํฉ๋๋ค
OpenAI๋ ์์์ผ์ API์ ์ฐจ์ธ๋ ์์ฑ ๋ชจ๋ธ์ ๊ณต๊ฐํ์ฌ ๊ฐ๋ฐ์๋ค์ด ์์ฑ ์์ฒญ์ ๋ถ์ํ๊ณ , 70๊ฐ ์ด์์ ์ธ์ด๋ก ๋ฒ์ญํ๊ณ , ์์ฑ์ ์ค์๊ฐ์ผ๋ก ํ ์คํธ๋ก ๋ณํํ๋ ์ฑ์ ๊ตฌ์ถํ ์ ์๋ ๋๊ตฌ๋ฅผ ์ ๊ณตํ์ต๋๋ค.
์ด ์ธ ๊ฐ์ง ๋ชจ๋ธ์ ๊ฐ๊ฐ GPT-Realtime-2, GPT-Realtime-Translate, GPT-Realtime-Whisper๋ผ๊ณ ๋ช ๋ช ๋์์ต๋๋ค. ์ด ๋ชจ๋ธ๋ค์ AI ์์ฑ ์ธํฐํ์ด์ค๋ฅผ ๋จ์ํ ์ง๋ฌธ๊ณผ ๋ต๋ณ ๊ตํ์ ๋์ด AI ์์ด์ ํธ๊ฐ ๋ํ ๋์ค์ ๋ฃ๊ณ , ์๊ฐํ๊ณ , ํ๋ํ ์ ์๋ ์์ญ์ผ๋ก ๋์ด์ฌ๋ฆฝ๋๋ค.
GPT-Realtime-2๋ ์์ฑ ์ธ์์ ๋์ฑ ์ ๊ตํ ์ถ๋ก ๊ธฐ๋ฅ์ ์ ๊ณตํฉ๋๋ค
GPT-Realtime-2๋ OpenAI์ ํ๋๊ทธ์ญ ๋ชจ๋ธ์ ๋๋ค. OpenAI๋ ์ด ๋ชจ๋ธ์ด ์ด์ ๋ฒ์ ์ธ GPT-Realtime-1.5๋ณด๋ค ํฌ๊ฒ ํฅ์๋ GPT-5๊ธ ์ถ๋ก ๋ฅ๋ ฅ์ ์ ๊ณตํ๋ค๊ณ ๋ฐํ์ต๋๋ค.
๋ฒค์น๋งํฌ์ธ Big Bench Audio์์ 15.2% ๋ ๋์ ์ ์๋ฅผ, ์ค๋์ค ์ง๋ฅ์ฌ๋ฌ ์ฐจ๋ก์ ์์ฑ ๋ํ์์ ์ง์๋ฅผ ๋ฐ๋ฅด๋ ๋ฅ๋ ฅ์ ํ ์คํธํ๋ Audio MultiChallenge์์ 13.8% ๋ ๋์ ์ ์๋ฅผ ๊ธฐ๋กํ์ต๋๋ค.
์ด๋ฒ ์ค์ง์ ์ธ ๊ฐ์ ์ฌํญ์ ์ค์ ์์ฑ ์์ด์ ํธ๋ฅผ ๊ฐ๋ฐํ๋ ๊ฐ๋ฐ์๋ฅผ ๋์์ผ๋ก ํฉ๋๋ค. ์ด ๋ชจ๋ธ์ ์ด์ ๊ธฐ์กด 32K ์ ํ์์ 4๋ฐฐ ์ฆ๊ฐํ 128K ์ปจํ ์คํธ ์ฐฝ์ ์ง์ํ๋ฉฐ, "์ต์"์์ "๋งค์ฐ ๋์"๊น์ง 5๋จ๊ณ๋ก ์กฐ์ ๊ฐ๋ฅํ ์ถ๋ก ๋ ธ๋ ฅ ์์ค์ ์ ๊ณตํฉ๋๋ค
์ด ์์คํ ์ ์ฌ๋ฌ ๋๊ตฌ๋ฅผ ๋์์ ํธ์ถํ๊ณ , ์์ฑ ์๋ต์ผ๋ก ์ค๋ฅ๋ฅผ ๋ณต๊ตฌํ๋ฉฐ, ์์ฒญ์ ์ฒ๋ฆฌํ๋ ๋์ "ํ์ธํด ๋ณด๊ฒ ์ต๋๋ค"์ ๊ฐ์ ์งง์ ์ฐ๊ฒฐ ๋ฌธ๊ตฌ๋ฅผ ์์ฑํ ์ ์์ต๋๋ค.
GPT-Realtime-Translate๋ ์ค์๊ฐ ์์ฑ ๋ฒ์ญ์ ์ง์ํฉ๋๋ค. 70๊ฐ ์ด์์ ์ ๋ ฅ ์ธ์ด๋ฅผ ์ง์ํ๋ฉฐ, 13๊ฐ ์ธ์ด๋ก ์ถ๋ ฅํ์ฌ ํ์์ ๋งํ๋ ์๋์ ๋ง์ถฐ ์ค์๊ฐ์ผ๋ก ๋ฒ์ญํฉ๋๋ค.
GPT-Realtime-Whisper๋ ์คํธ๋ฆฌ๋ฐ ์์ฑ-ํ ์คํธ ๋ณํ(STT) ๊ธฐ๋ฅ์ ์ ๊ณตํ์ฌ, ๋ฐํ๊ฐ ์๋ฃ๋ ๋๊น์ง ๊ธฐ๋ค๋ฆฌ์ง ์๊ณ ๋งํ๋ ์ฆ์ ๋จ์ด๋ฅผ ํ ์คํธ๋ก ๋ณํํฉ๋๋ค.
์ง๋ก์ฐ์ ๋์ด์นํ ๋ ์ฝค์ ์ค์ ์์ฐ ํ๊ฒฝ์์ ๋ชจ๋ธ์ ํ ์คํธํ๊ณ ์์ต๋๋ค
์ฌ๋ฌ ํ์ฌ๊ฐ ์กฐ๊ธฐ์ ์๋น์ค๋ฅผ ์ด์ฉํ ์ ์์์ต๋๋ค. ์ง๋ก์ฐ๋ ๋ณต์กํ ๋ถ๋์ฐ ๊ด๋ จ ์ง๋ฌธ์ ์ฒ๋ฆฌํ๊ณ , ๋งค๋ฌผ ๊ฒ์ ๋๊ตฌ๋ฅผ ํธ์ถํ๋ฉฐ, ๊ณต์ ์ฃผํ ๊ท์ ์ ์ค์ํ ์ ์๋ ์์ฑ ๋น์๋ฅผ ๊ฐ๋ฐ ์ค์ ๋๋ค.
ํด๋น ํ์ฌ๋ GPT-Realtime-2๋ฅผ ์ฌ์ฉํ ์ฆ๊ฐ์ ์ธ ์ต์ ํ ํ ๊ฐ์ฅ ๊น๋ค๋ก์ด ๊ณต๊ฒฉ์ ๋์ ๋ฒค์น๋งํฌ์์ ํตํ ์ฑ๊ณต๋ฅ ์ด 26ํฌ์ธํธ ํฅ์๋์ด ์ด์ 69%์์ 95%๋ก ์ฆ๊ฐํ๋ค๊ณ ๋ณด๊ณ ํ์ต๋๋ค.
๋์ด์นํ ๋ ์ฝค์ ๊ณ ๊ฐ ์ง์์ ์ํ ์ค์๊ฐ ๋ฒ์ญ ์๋น์ค๋ฅผ ํ ์คํธ ์ค์ด๋ฉฐ, ์ด๋ฅผ ํตํด ๋ฐ์ ์๋ ์ํ๋ ์ธ์ด๋ก ๋งํ ์ ์๊ณ ๋ชจ๋ธ์ด ์์ชฝ ๋ชจ๋์์ ๋ฒ์ญ์ ์ฒ๋ฆฌํฉ๋๋ค.
ํ๋ผ์ด์ค๋ผ์ธ์ ์์ฑ ๊ธฐ๋ฐ ์ฌํ ๋์ฐ๋ฏธ๋ฅผ ๊ฐ๋ฐ ์ค์ธ๋ฐ, ์ด ๋์ฐ๋ฏธ๋ ํญ๊ณตํธ ๊ฒ์, ํธํ ๋ณ๊ฒฝ, ํ์ง ํต์ญ๊น์ง ํ ๋ฒ์ ์ฒ๋ฆฌํ ์ ์์ ๊ฒ์ผ๋ก ์์๋ฉ๋๋ค.
์ด ๋ชจ๋ธ๋ค์ ๊ณ ๊ฐ ์๋น์ค ์ญ๋์ ํ์ฅํ๋ ค๋ ๊ธฐ์ ์ ๋์์ผ๋ก ํ์ง๋ง, ๊ต์ก, ๋ฏธ๋์ด, ์ด๋ฒคํธ ๋ฐ ํฌ๋ฆฌ์์ดํฐ ํ๋ซํผ ์ ๋ฐ์ ๊ฑธ์ณ ์ ์ฌ์ ์ธ ์ ์ฉ ๊ฐ๋ฅ์ฑ๋ ์ธ๊ธํ์ต๋๋ค.
์คํ์์ด(OpenAI)๋ ๋ฐํ์ต๋๋ค . ํ์ฌ๋ ์ด๋ฌํ ์์ ์ฅ์น๊ฐ ์คํธ, ์ฌ๊ธฐ ๋ฐ ๊ธฐํ ํํ์ ์ ์ฉ์ ๋ฐฉ์งํ๋ ๋ฐ ๋์์ด ๋๋ค๊ณ ์ค๋ช ํ์ต๋๋ค.
๊ฐ๊ฒฉ ์ฑ ์ ๋ฐฉ์์ Translate ๋ฐ Whisper ๋ชจ๋ธ์ ๊ฒฝ์ฐ ๋ถ ๋จ์๋ก, GPT-Realtime-2 ๋ชจ๋ธ์ ๊ฒฝ์ฐ ํ ํฐ ์ฌ์ฉ๋ ๋จ์๋ก ๊ณ์ฐ๋ฉ๋๋ค. ์ธ ๋ชจ๋ธ ๋ชจ๋ OpenAI์ Realtime API๋ฅผ ํตํด ์ด์ฉ ๊ฐ๋ฅํ๋ฉฐ, WebRTC, WebSocket ๋ฐ SIP ์ฐ๊ฒฐ ๋ฐฉ์์ ์ง์ํฉ๋๋ค.
์ ๋ํ ๋ฌด๋ฃ ์์์ ์์ฒญํ์ธ์. ๋๋ง์ ์ํ์ด ๋๋ ๋ฐฉ๋ฒ
์ถ์ฒ ๊ธฐ์ฌ













์ฝ๋ฉํธ (0)
$ ๋ฒํผ์ ํด๋ฆญํ๊ณ , ์ข ๋ชฉ ์ฝ๋๋ฅผ ์ ๋ ฅํ ํ ์ฃผ์, ETF ๋๋ ๊ธฐํ ํฐ์ปค๋ฅผ ์ฐ๊ฒฐํฉ๋๋ค.