본문 바로가기
ChatGPT

ChatGPT란

by 비유얼원의 ChatGPT탐방 2023. 5. 15.

ChatGPT란

2022년 12월 1일, 샘 올트먼과 일론 머스크를 포함한 7명의 창업자가 세상에 안전하고 유익한 방식의 AI를 제공한다는 목표 아래 설립한 연구기관인 OpenAI에서 출시한 인공지능 언어 모델입니다. 출시 된 지 단 5일 만에 100만 명을 돌파하면서 엄청난 반응을 가져온 ChatGPT가 무엇인지 알아보겠습니다.

썸네일

ChatGPT란

ChatGPT란 인간과 자연스럽게 대화할 수 있도록 설계된 AI 기반 대화형 에이전트/소프트웨어 애플리케이션입니다. 즉, 텍스트를 기반으로 사람과 소통할 수 있는 인공지능 챗봇입니다. ChatGPT는 인터넷의 방대한 텍스트에 대해 학습하고 질문에 대해 답변을 생성하고 인간과 대화를 나누고 더 나아가 이메일, 에세이를 작성하고 텍스트를 요약하는 등 언어와 관련된 다양한 작업을 수행할 수 있습니다. 이외에도 다음과 같은 여러 기능을 수행할 수 있습니다.

-100가지 이상의 언어 번역이 가능합니다.
-방대한 분야와 주제에 관해 물어도 그에 대해 답변을 얻을 수 있습니다. 또한 사용자의 명령에 따라 다양한 토픽의 텍스트 생성이 가능하여 소설, 이메일, 에세이 등을 작성할 수 있습니다.
-주제에 따른 텍스트를 분류하거나 요약할 수 있습니다.
-'딥러닝과 머싱러닝을 비교해서 표로 정리해 줘'와 같은 비교 분석 요청이 가능합니다.
-애플리케이션을 만들 때 필요한 코딩 생성을 요청할 수 있고 이미 작성한 코딩에 오류를 찾는 요청도 가능합니다.
-사람과 마치 대화하는 것처럼 대화하고 상담도 해줍니다.

이처럼 다양한 기능을 수행하는 ChatGPT는 완성도 높은 답변을 생성하면서 전 세계의 수많은 사람들에게 폭발적인 반응을 보이고 있습니다. 기존의 챗봇들은 사용자가 요구하는 정보를 찾고 인출하는 정도였고 그마저도 오류가 많아 사용자의 기대에 부합하지 못하였다면 ChatGPT는 강화 학습과 자기 지도 학습 등의 기술을 적용하면서 단순한 정보 인출을 넘어서 일상 대화를 하는 착각이 들 정도의 수준으로 진화하였습니다. ChatGPT는 Generative Pre-trained Transformer의 약어로, '사전 훈련을 받은 생성형 트랜스포머 챗봇'이라고 말할 수 있습니다. 해당 약어를 이해하기 위해서는 ChatGPT에 활용되는 아래와 같은 배경 기술 등을 이해할 필요가 있습니다.

ChatGPT : Generative

ChatGPT : Generative는 생성형 AI라고 이해할 수 있습니다. 인간의 언어를 처리하고 이용하는 작업으로 인공지능의 한 분야로 자연어 처리(Natural Language Processing)가 있는데 여기에는 감정 분석, 텍스트 분류, 질의응답, 번역, 요약 등의 작업이 포함됩니다. 이런 작업을 수행하기 위해서는 알고리즘으로 인간의 언어를 분석하고 이해하고 처리하는 과정이 필요합니다. 자연어 처리 기술은 형태소 분석 등을 활용한 통계적인 방법에 의존했지만, 최근에는 머신러닝과 딥러닝의 기술이 도입되면서 기존의 형태소 분석 등의 통계 기반 자연어 처리 모델보다 그 성능이 훨씬 발전했습니다. 자연어 처리 모델로 활용되는 언어 모델은 다음의 올 단어를 예측하여 문장을 완성하는데, 쉽게 이해하자면 자동 완성 기능과 유사하다고 생각하면 됩니다. 예를 들어, "하루 종일 핸드폰만 봤더니 시험점수가 빈칸이다."라는 문장을 가정해 봤을 때, 언어 모델은 빈칸에 올 단어들의 후보 중 확률이 가장 높은 단어를 선택하는 것입니다. 즉, 문장을 앞에서부터 순차적으로 학습하며 다음에 나올 단어의 확률을 계산하기 때문에 문장을 생성하는데 강점을 갖고 있습니다. 이러한 언어 모델을 기반으로 한 자연어 처리 방식은 방대한 양의 데이터를 학습하고 해당 지식을 사용하여 일관된 맥락을 가진 새로운 문장이나 스토리를 생성할 수 있어 생성형 AI라고 말할 수 있습니다.

ChatGPT : Pre-trained

ChatGPT : Pre-trained는 사전학습을 의미합니다. 이는 대규모 데이터를 훈련하여 학습된 모델을 뜻합니다. ChatGPT는 딥러닝을 통해 사전 학습을 하고 인간처럼 추론하는 능력을 갖춘 생성형 AI 챗봇의 엔진이 되었습니다. 이 과정에서는 인간 피드백 기반 강화 학습이라는 미세 조정 방법이 적용됩니다. 이 단계는 3단계에 걸쳐 진행되는데 첫 번째는 특정 명령 또는 프롬프트에 대해서 사람이 이상적인 설명을 작성합니다. 인간이 정답에 가까운 설명을 직접 작성하고 지도 학습을 시킵니다. 두 번째는 여러 개의 아웃풋에 대해 인간이 어떤 아웃풋이 좋고 나쁜지 순위를 매기고 AI는 매겨진 순위의 데이터를 학습합니다. 마지막은 확보한 답변 중에서 최적화된 답변을 선택할 수 있도록 GPT의 학습 정책을 업데이트합니다. 이것은 모두 AI가 자체적으로 학습하는 자기 지도 학습이 가능하도록 설계되었고 인간 피드백 기반 강화 학습의 미세 조정을 통해서 언어 모델은 더 빠르고 효율적으로 인간의 의도와 일치하는 방향으로 진화해 갈 수 있음을 알 수 있습니다.

ChatGPt : Transformer

ChatGPT : Transformer는 신경망 모델을 의미합니다. ChatGPT의 기본이 되는 딥러닝 기술이 해당 부분이라고 볼 수 있습니다. 딥러닝은 신경의 정보 전달 원리에서 영감을 받은 인공신경망을 머신러닝에 적용한 기술입니다. 머신러닝은 기계에서 데이터의 패턴을 학습시키는 인공지능 훈련 방법을 통칭합니다. 머신러닝은 학습에 효과적인 특징을 추출하는 방법과 통계 기반 학습, 사람의 수동 조작을 통한 데이터 훈련 등이 성능에 중대한 영향을 미칩니다. 반면에 딥러닝은 인간의 사전 작업 과정은 생략되고 알고리즘을 통해 원본 데이터에서 스스로 규칙을 배우고 답을 찾도록 합니다. 예를 들어 잘 분류된 개와 고양이 사진을 딥러닝 알고리즘에 제시하면 딥러닝 알고리즘이 혼자서 사진에 포함된 특성을 계산하고 패턴을 찾은 뒤, 개와 고양이 사진이 들어오면 미리 찾아둔 패턴을 갖고 답을 내리게 되는 것입니다. 이러한 딥러닝의 성능 차이를 결정하는 것은 파라미터의 수의 차이로 딥러닝을 통해 학습한 모델이 저장되는 곳입니다. 더 많은 파라미터로 구성된 모델일수록 학습 데이터가 많아지고 실제값과 AI의 출력값 사이의 오차가 줄어들 수 있는 중요한 역할을 하는 곳입니다. ChatGPT는 이러한 딥러닝이 적용된 대표적인 언어 모델입니다.

'ChatGPT' 카테고리의 다른 글

ChatGPT AI 한국시장  (0) 2023.05.26
ChatGPT AI 글로벌 시장  (0) 2023.05.23
ChatGPT의 학습원리  (0) 2023.05.22
ChatGPT의 역사  (0) 2023.05.18
ChatGPT의 등장  (0) 2023.05.16