페이지

▶블로그 검색◀

(보고서) LLM을 당장 중앙은행 업무에 투입하기는 어려울 듯 - 신현송 공저 BIS 보고서

챗GPT와 LLaMa 등 생성형 AI 열풍을 불러일으키면서 세계적인 주목을 끌고 있는 거대언어모델(LLM, '대규모언어모델'로도 불림)의 능력과 한계에 관한 논문이 쏟아지고 있다. 아주 제한적인 규모의 언어와 제한적인 패턴에 기반해 작동하던 이전 모델과 달리 LLM은 막대한 양의 자연어를 이해하고 생성할 수 있도록 훈련된 AI 모델로 각광을 받고 있다.

심지어 LLM이 많은 분야에서 인간의 능력을 앞서고 인간의 노동을 대체하리라는 전망도 쏟아지고 있다. 여기에 덧붙여, 경제와 관련해 가장 광범위하고 신속하며 정확한 정보 수집과 처리, 그리고 분석과 예측 기능을 보유해야 하는 기관 중 하나인 중앙은행 업무에 과연 조만간 LLM이 인간을 대체할 수 있을 것인가?

이런 질문과 관련해 국제결제은행(BIS)이 "아직은 부족한 점이 많다"는 결론을 제시한 간이 보고서를 발간했다. 이 보고서(스위스데이터사이언스센터의 페르난도-페레즈 크루즈와 BIS의 신현송 공동 저술) 주요 내용을 소개하고 링크 전문을 공유한다. 보고서 자체는 비교적 짧지만, 생성형 AI 관련 참고자료 목록이 공개돼 있어서 관심 있는 사람에게 큰 도움이 될 것이다.

(사진 출처: www.techopedia.com)

LLM은 컴퓨터 코딩, 이미지 생성, 복잡한 수학 문제 풀기 등 여러 분야에서 인상적인 능력을 보이며 전 세계에서 대중의 상상력을 자극하고 있다. 그러나, 이런 LLM이 과연 자신이 생성해내는 진술에 담긴 내용을 '알고' '이해'하고 있는지, 아니면 그저 광범위한 훈련 과정에서 인터넷에서 접한 텍스트를 앵무새처럼 따라하고 있는지에 대한 의문이 남는다.

이런 의문에 답하기 위한 노력 중 하나로 셰릴의 생일 퍼즐을 통해 GPT-4를 시험해 보았다. 광범위한 공개 데이터를 이미 학습했기에 GPT-4도 아마 내용을 잘 알고 있을 것이다. 시험 결과 GPT-4는 퍼즐의 원래 문구가 제시되었을 때는 완벽하게 퍼즐을 풀었지만, 등장 인물의 이름이나 특정 날짜와 같은 사소한 세부 사항을 변경했을 때는 지속적으로 실패했다. 

물론 이 보고서가 공개되면 GPT-4도 이를 반영해 재빨리 수정하겠지만, 그 전에는 실패를 계속할 수밖에 없을 것이다. 

중앙은행의 업무는 정형⸱비정형 데이터를 막대한 규모로 이용하고 정교한 분석을 필요로 한다는 점을 고려하면 머신러닝과 AI을 확용하기에 매우 적합하다. AI가 지금처럼 널리 알려지기 전부터 중앙은행들은 이미 통계, 거시경제 분석, 규제/감독 분야에서 머신러닝 방법을 채택해 왔다. 따라서 이 보고서가 AI의 발전 속도와 가능성을 폄하하려는 것은 아니다.

그럼에도 불구하고 이번 연구 결과는 신중하고 엄격한 경제적 추론이 필요한 상황에서 LLM을 실제로 사용할 때 주의를 기울여야 하는 이유를 다시 한번 확인했다. 즉, LLM은 인터넷에 이미 공개된 퍼즐의 원래 문구를 제시할 때는 완벽하게 작동하지만, 세부 사항을 변경하면 성능이 저하되며, 이는 기본 논리에 대한 진정한 이해가 부족함을 시사한다.

따라서, 이번 연구 결과는 중앙은행이 데이터 관리, 거시적 분석, 규제/감독에 머신러닝을 적용하는 데 있어 상당한 진전을 이룬 것과는 별개로, 경제 분석에서 엄격한 추론이 요구되는 상황에서 LLM을 사용할 때는 주의를 기울여야 한다는 점을 시사한다.

▶ 간이 보고서 전문 보기: Testing the cognitive limits of large language models


★★★★★ ★★★★★

▶최근 7일간 많이 본 글◀

태그

국제 경제일반 경제정책 경제지표 금융시장 기타 한국경제 *논평 보고서 산업 중국경제 fb KoreaViews *스크랩 부동산 책소개 트럼포노믹스 일본경제 뉴스레터 tech 미국경제 통화정책 공유 무역분쟁 아베노믹스 가계부채 블록체인 가상화폐 한국은행 환율 원자재 국제금융센터 외교 AI 암호화페 북한 외환 중국 반도체 인공지능 미국 인구 한은 논평 에너지 정치 증시 하이투자증권 코로나 금리 자본시장연구원 연준 주가 하나금융경영연구소 수출 중동 산업연구원 생성형AI 채권 한국금융연구원 대외경제정책연구원 일본 일본은행 BOJ 자동차 칼럼 ICO 국회입법조사처 한국 KIEP 미중관계 삼성증권 세계경제 신한투자증권 에너지경제연구원 우크라이나 인플레이션 전기차 지정학 IBK투자증권 TheKoreaHerald 분쟁 브렉시트 현대경제연구원 BIS CRE IT KB경영연구소 KB증권 KIET NBER OECD 대신증권 무역 미국대선 배터리 상업용부동산 수소산업 원유 유럽 유진투자증권 자본시장 저출산 전쟁 ECB EU IBK기업은행 IEA LG경영연구원 PF PIIE 경제학 공급망 관광 광물 규제 기후변화 로봇 로봇산업 보험연구원 비트코인 생산성 선거 신용등급 신흥국 아르헨티나 연금 원자력 유럽경제 유안타증권 유춘식 이차전지 자연이자율 중앙은행 키움증권 타이완 터키 패권경쟁 한국무역협회 혁신 환경 AI반도체 Bernanke CBDC CEPR DRAM ESG HBM IPEF IRA ITIF KDB미래전략연구소 KISTEP KOTRA MBC라디오 NIA NIPA NYSBA ODA RSU SNS Z세대 iM증권 경제안보외교센터 경제특구 고용 골드만삭스 공급위기 광주형일자리 교역 구조조정 국민연금 국제금융 국제무역통상연구원 국제유가 국회미래연구원 국회예산정책처 넷제로 논문 대만 대한무역투자진흥공사 독일 동북아금융허브 디지털트윈 러시아 로슈 로이터통신 말레이시아 머스크 물류 물적분할 미래에셋투자와연금센터 방위산업 버냉키 법조 복수상장 부실기업 블룸버그 사회 삼프로TV 석유화학 소고 소비 소통 수출입 스테이블코인 스티글리츠 스페이스X 신한금융투자증권 싱가포르 씨티그룹 아이엠증권 아프리카 액티브시니어 양도제한조건부주식 예금보험공사 외국인투자 원전 위안 유럽연합 유로 은행 이승만 인도 인도네시아 인재 자산관리서비스 자산운용업 잘파세대 재정건전성 정보통신산업진흥원 주간프리뷰 중립금리 참고자료 철강 코리아디스카운트 코스피 테슬라 통계 통화스왑 통화신용정책보고서 트럼프 팬데믹 프랑스 플라자합의 피치 하나증권 하마스 한국과학기술기획평가원 한국수출입은행 한국조세재정연구원 한국지능정보사회진흥원 한국투자증권 한화투자증권 해리스 해외경제연구소 홍콩 횡재세 휴머노이드