구글, 엔비디아, 마이크로소프트, 메타 등 글로벌기업을 비롯해
LG, 네이버, 카카오, KT 등 국내 대기업들은 초거대 AI 경쟁력 확보에 많은 투자를 하고 있다.
* 초거대(Hyperscale) AI는 대용량 연산이 가능한 컴퓨팅 인프라를 기반으로 대규모 데이터를 학습한 AI 모델
1. AI의 종류는 다양 하지만 초거대 AI는 유독 사람의 뇌를 닮았다는 평가를 받는다.
2. 시냅스와 유사한 역할을 하는 파라미터(매개변수)를 크게 늘려 사람처럼 스스로 학습해 결과물을 낼 수
있기 때문이다.
1. 모델별 현황
1) GPT
(1) 초거대 AI가 등장한 것은 2020년이다.
(2) 일론 머스크 테슬라 최고경영자(CEO)가 설립하고 마이크로소프트 등
글로벌 기업이 투자한 미국 연구기관 오픈AI는 수많은 데이터를 학습시킨 ‘GPT-3’를 대중에 공개했다.
(3) 이후 글로벌 빅테크 기업들은 GPT-3와 유사한 많은 초거대 AI 모델 개발에 적극 나서
2) MT-NLG 530B
(1) 마이크로소프트와 엔비디아는 지난해 10월 5300억 개 매개변수를 가진 언어모델 ‘MT-NLG 530B’
3) PaLM
(1) 구글은 지난 4월 5400억 개 매개변수를 가진 ‘PaLM’
4) GPT
(1) GPT-3가 유료 서비스로 제공되고 모델 자치나 코드를 공유하지 않은 반면,
메타는 이 언어모델이 훈련한 모델과 코드, 개발 로그북을 공개
5) 하이퍼클로바
(1) 국내에서 초거대 AI를 가장 먼저 개발한 곳은 네이버다. 2021년 5월 2040억 개의 파라미터를 탑재한
‘하이퍼클로바’
(2) 하이퍼클로바를 적용한 사례로 ‘클로바 MD’와 ‘클로바케어콜’
(3) 하이퍼클로바는 기존 운영자가 직접 운영하던 큐레이션 영역 중 일부를 AI로 대체할 수 있는 기반을 마련
(4) 하이퍼클로바로 문구 생성 능력이 대폭 향상되면서 90% 이상 기획전이 AI에 의해 소개
(5) 클로바케어콜은 독거 어르신의 안부를 확인하는 서비스
(6) 높은 수준의 대화 시나리오를 사람이 구축하려면 많은 비용과 시간이 필요한데 하이퍼클로바를 사용할 경우,
단 몇 개월 만에 실행이 가능하다
6) 엑사원
(1) LG AI연구원을 통해 초거대 AI를 개발하고, 2021년 12월 초거대 AI인 ‘엑사원(EXAONE)’을 공개했다.
(2) 언어와 이미지를 함께 사용하는 멀티모달(multi-modality) 기능 역시 갖췄다.
또한, 텍스트와 이미지 양방향 소통이 가능하다.
(3) 엑사원은 텍스트를 입력하면 이에 맞는 이미지를 만들어주고 이미지에 대해 텍스트로 설명할 수 있다.
GPT-3나 하이퍼클로바가 언어를 바탕으로만 결과물을 내는 것과 차별
(4) LG는 엑사원을 바탕으로 기업과 협력을 이끌어 초거대 AI의 상용화를 이끌고 있다.
현재 △구글 △우리은행 △셔터스톡 △엘스비어 △EBS △고려대의료원 △한양대병원 △브이에이코퍼레이션
△LG전자 △LG화학 △LG유플러스 △LG CNS 등과 협력해 교육, 금융, 유통, 의료, 플랫폼 등
다양한 분야에서 상용화 모델을 만들고 있다.
(5) 엘스비어(세계 과학 전문 출판업체), LG화학과 화학 분야에서 200년의 역사를 가진 논문과 특허 등의 문건을
데이터베이스화하는 작업을 하고 있다.
LG AI연구원은 엘스비어와 LG화학이 보유한 방대한 양의 화학 분야 논문을 초거대 AI로 학습
(6) 2021년 GPT-3 모델의 한국어 버전인 KoGPT를 오픈소스 커뮤니티 ‘깃허브’에 공개했다.
12월에는 멀티모달 모델인 민달리(minDALL-E)도 공개했다
7) 기타
(1) 카카오브레인은 31일 약 7억 4000만 개의 이미지-텍스트로 이루어진 데이터셋 ‘코요(Coyo)’를
공식 홈페이지를 통해 공개
(2) KT는 현재 기존 언어모델을 뛰어넘는 새로운 초거대 AI 모델을 개발 중
2. 초거대 AI가 이끄는 변화
1) 파라미터
(1) 파라미터는 이론상 AI 성능을 좌우한다. 파라미터가 많을수록 정교한 학습이 가능
(2) 2018년 등장한 AI 모델의 파라미터가 9000만 개에서 3억 개
(3) 최근 등장한 초거대 AI는 2천억개 이상 파라미터 보유
2) 범용 사용
(1) 기존 AI가 특정 분야 데이터 학습해 그 분야에 맞는 결과물만 낼 수 있다
(2) 초거대 AI는 방대한 양의 데이터를 학습한 만큼 범용적으로 사용할 수 있다.
3) GPT-2 vs GPT-3
(1) 전 모델인 GPT-2가 보유한 파라미터 15억 개
(2) GPT-3는 1750억 개 파라미터를 탑재(전 모델 대비 117배 많은 양),
자연어 번역과 더불어 대화와 작문 등 수행, 2020년 9월 8일 영국 가디언지에 실린 칼럼을 GPT-3가 작성
(3) GPT-3는 ‘인간, 아직도 무서운가’라는 제목의 칼럼 작성
4) 활용
(1) 2016년 알파고가 딥러닝을 통해 AI가 사람보다 우수하다는 것을 입증
GPT-3는 수많은 파라미터를 탑재한 거대 모델을 바탕으로 AI가 사람처럼 행동할 수 있다는 것을 보여줬다
(2) 기존에는 신약을 개발하기 위해선 후보물질 발굴에만 상당한 시간, 많은 논문과 자료를 찾아야 했기 때문
앞으로는 이 작업을 AI가 대신할 수 있다. 초거대 AI가 가진 컴퓨팅 인프라를 활용해 수많은 자료를 학습한 만큼
이를 빠르게 계산해 사용자가 원하는 결괏값을 단숨에 제공할 예정
(3) 기존 AI는 높은 성능을 위해 많은 기업들이 수작업으로 이미지-텍스트 쌍을 맞추어 데이터셋을 수집하는데
높은 비용과 많은 시간이 투입된다.
카카오브레인은 ‘코요’ 개발 시 독자 개발한 기술로 이미지-텍스트를 온라인에서 자동 수집함으로써
투입되는 비용과 시간을 효과적으로 줄이고 동시에 양질의 데이터를 선별해 높은 성능을 구현했다.
(4) 기존 AI는 모든 작업에서 대량의 훈련 데이터를 수집하는 방식은 시간이 오래 걸려 다양한 영역으로
확장이 불가능하였으나, 새로운 비즈니스 영역에 AI 적용 시간을 단축시키기 위해 초거대 AI 모델을
개발 중이다.
(출처 : http://newstheai.com/site/data/html_dir/2022/08/31/2022083180283.html)
댓글