경제신문스크랩 > 한국경제 > '인공지능 불모지' 논란 끝…토종 AI 10종 美 리포트에 이름 올려
헤드라인
'인공지능 불모지' 논란 끝…토종 AI 10종 美 리포트에 이름 올려 하이퍼클로바X·엑사원 등 10종 스탠퍼드AI리포트에 지각 등재 |
https://n.news.naver.com/mnews/article/015/0005015145 |
본문
미국 스탠퍼드대의 인공지능(AI) 모델 생태계 조사 프로젝트에 국내 기업의 AI 모델이 새롭게 이름을 올렸다. 올해 초 이 기관이 발간한 AI 보고서에 한국 모델이 제외된 후 국내 업체들이 앞다퉈 이의를 제기한 결과다.
28일 업계에 따르면 미국 스탠퍼드대 기초모델연구센터(CRFM)의 ‘에코시스템 그래프’에 국내 기업 모델 10종이 새로 포함됐다. 네이버가 2021년 공개한 첫 대규모언어모델(LLM)인 ‘하이퍼클로바’와 지난해 공개한 개선 모델 ‘하이퍼클로바X’를 비롯해 LG AI 연구원의 ‘엑사원 2.0’, SK텔레콤의 ‘에이닷엑스’, KT의 ‘믿음’, 엔씨소프트의 ‘바르코-LLM’등 국내 주요 기업의 AI 모델이 등재됐다. 코난의 ‘코난 LLM’등 국내 스타트업이 공개한 모델도 명단에 이름을 올렸다.
국내에서는 뒤늦게나마 한국의 AI 역량을 알릴 수 있게 됐다며 환영하는 분위기다. 하정우 네이버클라우드 AI 이노베이션센터장은 페이스북을 통해 “과학기술정보통신부와 기업들의 적극적인 노력 덕분에 이번에 반영된 것 같다”며 “한국 기업들도 글로벌 인지도를 높일 수 있도록 노력해야 한다”고 강조했다.
에코시스템 그래프는 CRFM이 세계 파운데이션 모델 생태계 조사를 위해 운영 중인 프로젝트다. AI 자산의 사회적 영향력을 명확하게 파악하기 위해 세계 AI 모델, 데이터 세트, 응용프로그램을 조사한다. 이 프로젝트는 스탠퍼드대 인간중심 AI 연구소(HAI)가 발표하는 AI 인덱스리포트의 기반이 된다.
지난 4월 발표된 ‘AI 인덱스리포트 2024’에는 국내 파운데이션 모델이 포함되지 않아 논란이 일었다. 파운데이션 모델은 AI 서비스의 기반이 되는 시스템을 의미한다. 미국이 109개로 가장 많은 파운데이션 모델을 보유하고 있는 것으로 조사됐다. 중국과 영국이 각각 20개와 8개 모델을 보유해 2~3위에 올랐다. 국산 모델은 하나도 등재되지 않았다. 이 조사 결과가 발표된 후 국내 AI 기업과 정부는 스탠퍼드대가 국내 사례를 누락했다고 강하게 항의했다.
에코시스템 그래프에는 193개 기업·기관의 AI 자산 정보가 정리돼 있다. 등록된 자산 중 AI 모델은 359개, 데이터 세트는 112개, 응용프로그램은 97개다. 이 프로젝트가 처음 발표된 지난해 5월보다 AI 모델이 세 배가량 늘었다.
기사 내용의 수치화, 인사이트 나누기
1. 28일 업계에 따르면 미국 스탠퍼드대 기초모델연구센터(CRFM)의 ‘에코시스템 그래프’에 국내 기업 모델 10종이 새로 포함됐다.
2. 미국이 109개로 가장 많은 파운데이션 모델을 보유하고 있는 것으로 조사됐다. 중국과 영국이 각각 20개와 8개 모델을 보유해 2~3위에 올랐다.
3. 에코시스템 그래프에는 193개 기업·기관의 AI 자산 정보가 정리돼 있다. 등록된 자산 중 AI 모델은 359개, 데이터 세트는 112개, 응용프로그램은 97개다.
4.이 프로젝트가 처음 발표된 지난해 5월보다 AI 모델이 세 배가량 늘었다.
추가조사할 내용 또는 결과
CRFM(Core Research for Foundation Model): 스탠퍼드 대학의 기초모델 연구센터로, AI 기초 모델들에 대한 연구를 진행하며 그 모델들의 발전과 사회적 영향력을 조사하여 기록한다. 파운데이션 모델들의 발전 상황과 어떻게 다양한 응용 분야에 통합되고 있는지에 대한 데이터를 제공하고, AI 기술의 최전선에 있는 연구와 응용을 지원하고자 한다.
에코시스템 그래프 : CRFM이 세계 파운데이션 모델 생태계 조사를 위해 운영 중인 프로젝트다. AI 자산의 사회적 영향력을 명확하게 파악하기 위해 세계 AI 모델, 데이터 세트, 응용프로그램을 조사한다. 이 프로젝트는 스탠퍼드대 인간중심 AI 연구소(HAI)가 발표하는 AI 인덱스리포트의 기반이 된다.
HAI(Human-Centered Aritificial Intelligence) : 스탠포드 인간중심 인공지능 연구소
파운데이션 모델 : AI 서비스의 기반이 되는 모델로, 데규모 데이터셋을 기반으로 학습된 광범위한 범용성을 가진 AI 모델을 의미한다. ChatGPT나 BERT 같은 대규모 언어가 이에 속함.
프론티어 AI : 특정 기술을 적용한 모델 범주에 국한되는 것이 아니라 최근에 등장한 뛰어난 능력을 갖춘 AI 모델들을 말한다. 즉 특정 분야에만 사용되지 않고 최근에 나온 성능이 좋은 AI 모델을 말한다.
AI 인덱스 리포트 : AI 분야의 10가지 시사점을 이야기하고 있는데 500페이지 분량의 보고서
AI 인덱스 리포트의 10가지 시사점
1) AI는 일부 작업에서 인간을 능가하지만 모든 작업에서 그렇지는 않다. AI는 이미지 분류, 시각적 추론 및 영어 이해 등 몇 가지 벤치마크에서 인간의 성능을 뛰어넘었지만, 경쟁 수준의 수학, 시각적 상식 및 계획 같은 복잡한 작업에서는 뒤쳐져 있다.
2) 산업은 프론티어 AI 연구를 지속적으로 주도하고 있다. 2023년에 기업들에선 51개의 ML 모델을 생산했고 학계는 15개만 생산했다. 또한 협력을 통해 21개의 모델이 나왔다.
3) 프론티어 모델의 비용이 크게 증가했다. 최첨단 AI 모델의 훈련 비용이 사상 최고 수준이다. 예시로 GPT-4는 학습에 약 7800만 달러, Gemini는 1억 9100만 달러가 들었다.
4) 미국은 중국, EU, 영국을 앞서 최고 AI 모델의 주요 출처이다. 2023년에 미국에서만 61개, 유럽에서 21개, 중국에서 15개의 모델이 나왔다.
5) LLM 책임 평가에 대한 견고하고 표준화된 평가가 심각하게 부족하다. LLM 평가 시 주로 다양한 벤치마크에 대해 테스트 하는데 이는 최고 AI 모델의 위험과 한계를 체계적으로 비교하는 노력을 복잡하게 한다.
6) 생성 AI에 대한 투자는 급증한다. 2022년에 비해 2023년에는 252억 달러가 투자되어 약 8배 증가했다.
7) 데이터는 AI가 근로자의 생산성을 높이고 작업 품질을 향상시키는 것을 보여준다. 여러 연구를 통해 AI가 근로자들이 작업을 더 빨리하고 품질을 개선할 수 있는 것을 보여주었다. 하지만 감독 없이 사용하는 경우 성능이 저하될 수 있다.
8) AI로 인해 과학적 진보가 가속화된다. AI 알고리즘 정렬을 더 효율적으로 하거나 과학 관련 AI 애플리케이션이 출시되었다.
9) 미국의 AI 규제가 급격히 증가했다. 미국에선 지난 5년 동안 AI 관련 규제가 크게 증가했는데, 2023년엔 25건으로 작년에 총 56.3% 증가했다. 2016년에는 단 한건만 증가했다.
10) 전 세계적으로 AI의 잠재적 영향에 대해 더 많이 인식하며 더 불안해한다. 3년~5년 사이에 자신의 삶에 엄청난 영향을 미칠 것이라고 생각하는 사람들의 비율이 60%에서 66%로 증가했다. 또한 AI 제품 및 서비스에 대해 불안함을 표시하는 사람들의 비율은 2022년에 비해 13% 포인트 증가한 52%이다. 미국의 Pew 자료에 따르면 52%의 미국인들이 AI에 대해 흥분하기보다는 우려를 느낀다고 보고했으며, 이는 2022년의 37%에서 증가한 수치이다.
파라미터 개수
a. LG AI 연구원의 엑사원 2.0 : 390억개의 파라미터
b. SKT 텔레콤의 에이닷엑스(A.X) : 390억개의 파라미터
c. KT의 믿음 : 70억개의 파라미터
요약
CRFM의 에코시스템 그래프에 국내 AI 모델 총 10개가 추가되었다. 네이버의 클로바X, LG AI의 엑사원 2.0, SK텔레콤의 에이닷엑스, KT의 믿음, 코난의 코난 LLM 이다. 에코시스템 그래프는 CRFM이 세계의 파운데이션 모델을 조사하기 위한 프로젝트이며 이는 AI 인덱스 리포트의 기반이 된다. 지난 4월 발표된 에코시스템 그래프에 따르면 미국이 109개, 중국과 영국이 각 20개, 8개의 모델을 보유해 1~3위로 선정되었다. 에코시스템 그래프에는 193개의 기업, 기관의 AI 자산 정보가 있으며 그 중 AI 모델은 359개, 데이터 세트는 112개, 응용프로그램은 97개다. 프로젝트가 처음 발표된 지난 5월보다 AI 모델이 세 배가량 늘었다.
현직자에게 할 질문
파운데이션 모델을 학습하는 데 있어서 엄청난 비용이 투자되는데, 투자 비용을 감축시킬 방법은 없는지 궁금합니다.
미국의 AI 규제로 인해 다른 나라에 미칠 영향이 있는지 궁금합니다.
파운데이션 모델을 개발할 때 가장 어려운 점이 무엇인지 궁금합니다.
다른 기업들이 파라미터를 공개하지 않는 이유가 궁금합니다.
연관기사 링크
https://www.mk.co.kr/news/it/11073465
네이버 1세대 초거대 AI ‘하이퍼클로바’, 파라미터 수는 820억개 - 매일경제
美 스탠포드대 ‘에코시스템 그래프’ 발표 후속 모델인 ‘하이퍼클로바X’는 비공개
www.mk.co.kr
https://blog.naver.com/buscar03/223330311110
프론티어 AI
https://www.nia.or.kr/site/nia_kor/ex/bbs/View.do?cbIdx=82618&bcIdx=26191&par...
blog.naver.com
https://jkim83.tistory.com/525
AI 인덱스 리포트 2024
미 스탠포드대학교 (Stanford University)의 스탠포드 인간중심 인공지능연구소 ( Human-Centered Artificial Intelligence, HAI)에서 인공지능 인덱스 2024 (AI Index 2024)를 공개하였습니다. AI 분야의 10가지 시사점을
jkim83.tistory.com