[어싱크(Async)] 생성형 AI 동향과 활용 방안 > 지원사업

연구모임활동

[어싱크(Async)] 생성형 AI 동향과 활용 방안

2023.07.24

본문

IT기자 공부모임인 '어싱크(Async)'(간사:임민철 아주경제 차장)가 7월 17일 '생성형 AI'를 주제로 모임을 가졌습니다.

연구모임 대표이자 간사인 임민철 기자가 정리한 내용을 공유합니다.

□ 주제 : 생성형 AI 동향과 활용 방안

□ 강사 : 이주열 LG CNS 수석연구위원

<어싱크 회원들이 이주열 LG CNS 수석연구위원의 강의를 듣고 있다.>

인공지능(AI)이 지금처럼 전 세계 대중의 이목을 끌게 된 계기는 2022년 11월 챗GPT(ChatGPT)라는 AI 챗봇 서비스 출시입니다. 챗GPT는 미국의 AI 연구소인 오픈AI(OpenAI)가 개발하고 운영하는 서비스인데요. 사람의 언어, 그러니까 텍스트 데이터를 다루는 재주가 뛰어났습니다. 예를 들어 긴 글을 읽고 요약하거나, 사람과 일상적인 주제로 대화를 나눌 수 있어요.

챗GPT는 영어 기반 서비스지만 한국어를 비롯해 다양한 언어를 이해하고 답해 줍니다. 번역은 기본이고 시사나 역사, 기술과 산업에 대한 질문도 받아 냅니다. 공동체 안에서 일어나는 인간관계나 조직 내 협력, 대외 활동과 같은 사안으로도 문답이 가능하지요. 특정 주제의 동화나 시, 이야기를 지어 주기도 하고 말로 설명한 수식이나 통계치를 계산하고 가공한 결과도 돌려줍니다. 챗GPT를 특별하게 만드는 지점은 이 서비스가 기존 챗봇과 달리 생성(generative) AI 기술을 적극적으로 활용했다는 사실입니다.

AI 기술과 이로 인한 일상과 산업의 변화, 미래상에 주목하는 언론인 연구모임 어싱크는 7월 정기 활동으로 생성 AI 기술의 등장 배경과 최근 동향을 탐구해 보기로 했습니다. 이 주제로 IT 서비스 기업인 LG CNS의 이주열 수석연구위원이 강연을 진행했습니다.

이전까지 사람들이 알고 있는 AI 기술은 대부분 주어진 정보나 데이터를 가지고 유형을 나누거나 평가를 내리는 기능을 수행했죠. 이런 것을 판별(discriminative) AI라고 합니다. 입력된 값을 이용해서 새로운 글을 쓰거나 그림을 그리거나 소리, 영상을 만들어내는 것을 생성 AI라고 하고요. 요즘 사람들이 접하고 있는 생성 AI에 가까운 기술은 2014년 생성적 적대 신경망(Generative Adversarial Networks)이라는 딥러닝 알고리즘 기반 모델에서 출발해 2020년 디퓨전(Diffusion) 모델로 진화한 것이라고 합니다. 챗GPT처럼 텍스트로 된 명령이나 정보, 질문을 입력받아 역시 텍스트로 된 결과를 돌려주는 것만이 아니라, 이미지로 된 결과를 돌려주는 유형(text-to-image)의 서비스도 다양하게 나와 있고요. 오픈AI도 글을 쓰는 챗GPT 뿐 아니라 이미지를 만드는 ‘달리(DALL-E)’라는 AI 기술도 선보인 바 있습니다. 프로그래밍 언어로 짠 코드, 말소리, 음악, 3D 컴퓨터 그래픽 등 다양한 유형의 결과물을 생성 AI로 만들 수 있게 됐어요.

챗GPT와 같은 서비스가 그럴듯한 결과물을 제공하려면 두뇌에 해당하는 초거대 AI 모델이 필요한데요. 오픈AI는 챗GPT의 기반이 되는 초거대 AI 모델을 GPT라는 이름으로 꾸준히 개발하고 있습니다. GPT-4가 2023년 3월 출시됐고, 유료 버전의 챗GPT를 작동하는 기반 역할을 하고 있죠. GPT-4는 26가지 언어를 지원하고, 무료 버전 챗GPT에 적용된 GPT-3.5보다 2배 긴 질문이나 명령 정보를 받아들일 수 있고, 더 높은 답변 정확도를 보여 준다고 합니다. 복잡한 질문에 답하는 고급 추론 기능의 정확도는 10% 이상 개선됐고, 생성 AI의 문제점 중 하나인 ‘환각(hallucination)’ 답변은 40% 정도 줄었습니다. 오픈AI는 웹 서비스로 선보인 챗GPT를 모바일 환경에서 음성 인식 입력으로 간편하게 쓸 수 있는 앱도 만들었습니다. 올해 5월 아이폰용 iOS 버전 챗GPT 앱이 나왔고, 강연 당시는 아니었지만 7월 하순 들어 안드로이드용 챗GPT 앱도 시험 버전 출시를 앞두고 있네요.

사실 챗GPT의 기본 능력은 2021년 이전까지 일어난 사건만을 알고 있다든지, 자릿수가 긴 산수 문제를 잘 풀지 못한다든지, 실존하지 않는 사건, 인물, 장소, 사물 따위를 결과로 제공하는 등 결함이 있습니다.

그런데 많은 사람들이 챗GPT를 이용해서 단순한 대화나 계획안, 창작물의 초안을 만드는 데 유용함이 크다는 것을 깨달았죠. 이 약점을 극복할 방법이 있다면 더 폭넓게 활용할 수 있을 것이라고 기대하기 시작했습니다. 오픈AI는 이 점을 간파하고 챗GPT의 제약을 극복할 수 있는 외부 서비스 기능을 플러그인(Plugins)과 코드 인터프리터(Code Interpreter) 기능을 만들어 제공하기 시작했죠. 사용자가 목적에 맞게 플러그인을 이용하면 챗GPT와 대화하면서 인터넷으로 최신 정보를 가져와 활용하고, PDF 파일로 된 문서 내용을 가공할 수 있습니다. 코드 인터프리터를 사용하면 챗GPT에 파일을 업로드해 데이터를 그래프로 표현하거나 간단한 영상, 이미지 편집을 할 수 있고요. 외부 서비스와 연계하는 플러그인 종류가 더 늘어나면 챗GPT의 활용도는 그만큼 더 높아질 것 같습니다.

기업 환경에서 업무에 챗GPT와 같은 생성 AI를 활용하는 시나리오도 상상해 볼 수 있는데요. 아직 이 분야는 실험적인 단계입니다. 업무에 필요한 기능을 기본 제공하지 않는다면 챗GPT 플러그인처럼 외부 서비스와 연동하는 방식으로 해결할 수 있겠지만, 기업이 내부에 보유한 정보와 지식을 활용하는 것에 제약이 있거든요. 이주열 수석연구위원의 설명에 따르면 지식을 주입할 방안, 동작 명령이나 조건을 입력하기 위한 입력 글자 수 제한에 따른 컨텍스트를 관리할 방안이 필요합니다. 답변 품질을 높이기 위해 최적 명령문(프롬프트)를 구성할 수 있는 프롬프트 엔지니어링 기법과, 예상하지 못한 비정상 동작과 환각 문제를 최소화할 통제 방안도 갖춰야 합니다.

이런 제약을 고려한다면 챗GPT와 같은 텍스트 기반 생성 AI 서비스를 기업이 활용할 방법은 ‘검색 증강 생성(RAG)’이라는 모델이 유력합니다. 이는 기업의 사용자가 생각하는 ‘질문’을 기업이 보유한 데이터나 문서에서 찾은 정보로 먼저 최적화하고, 이 결과를 다시 챗GPT에 전달하는 ‘프롬프트’로 가공해 최종 답변을 얻는 방식을 의미합니다.

생성 AI를 도입하는 기업이 기술 구축과 운영 관점에서 고려해야 할 지점이 있는데, 기반 기술인 초거대 AI 모델을 어떻게 접근하고 활용할 것인지가 관건입니다. 현재 상용화한 주요 생성 AI 서비스는 대부분 빅테크 기업의 클라우드 서비스에 포함된 일부 상품 유형으로 제공됩니다. 이는 기반 기술을 기업이 직접 최적화하는 게 불가능하거나 제한적이고, 사용자가 입력한 데이터가 모두 외부로 반출될 가능성이 높다는 뜻이죠. 일부 생성 AI 모델은 오픈소스 기술로 공개돼 기업이 자체 구축할 수 있지만 성능이 검증되지 않았고, 기업이 자체 데이터센터에 값비싼 하드웨어를 설치해야 하는 부담이 있습니다. 아직까지 실용성을 기대할 만한 선택지는 현실적으로 빅테크 기업의 클라우드 서비스 뿐이라고 하네요.