본문 바로가기
IT

[ChatGPT] ChatGPT란?, GPT 작동 원리, 한계, 활용분야(1)

by LazyPM 2024. 1. 6.

안녕하세요, 게으른 PM입니다.

 

오늘은 최근 굉장히 주목받고 있는 ‘ChatGPT’에 대해 알아보겠습니다.

여러분은 ChatGPT를 사용하고 계신가요?

 

2022년 11월 30일에 최초로 출시되어 2023년 6월에 약 17억명에 이르렀다고 합니다.

1년도 채 되지 않은 기간에 엄청난 성장을 보였다고 할 수 있는데요.

"ChatGPT: 세계와 미국의 젊은 세대가 대부분 사용한다... "새로운 트렌드"

 

"ChatGPT: 세계와 미국의 젊은 세대가 대부분 사용한다... "새로운 트렌드" - 시애틀코리안데일리

세계의 챗봇 분야에서 가장 큰 주목을 받고 있는 ChatGPT의 사용자가 지속적으로 증가하고 있다. 많은 전문가들이 초기에 이 서비스의 사용자가 어느 정도 증가하다 감소할 것이라 예상했으나 현

www.seattlekdaily.com

 

이렇게 많은 사람들이 사용하고 있는 ChatGPT!

같은 ChatGPT를 가지고도 사람들마다 갖는 인식이 달랐습니다.

맹목적으로 신뢰하는 사람이 있고, 도구로써 활용하는 사람도 있고, 전혀 신뢰하지 못하고 사용하지 않는 사람까지 다양하게 있습니다.

같은 도구를 가지고도 이렇게 활용도가 다른 이유는 ChatGPT의 동작 원리에 대한 이해가 다르기 때문이라고 분석했습니다.

동작원리에 대해서 이해를 하고 있다면 맹목적으로 신뢰할 수도, 무작정 배척할 수도 없거든요!

무작정 배척하는 경우를 보면 생각나서 가져와봤습니다.

 

 

동작 원리를 이해함으로써 ChatGPT가 가지는 강점, 한계점을 명확하게 이해한다면 적재적소에 잘 활용할 수 있을 겁니다.

 

 

그런 차원에서 IT에 지식이 거의 없는 사람도 이해하기 쉽게

ChatGPT가 무엇인지?
어떻게 작동하는지? 그리고
어떤 한계와 활용 가능성이 있는지?

 

에 대해서 써보려 합니다.

분량이 너무 길어져서 파트 2개로 나눠서 작성하겠습니다.

 

 

이번에는 ChatGPT의 정의작동 원리 이렇게 2가지만 설명드릴게요!

 

ChatGPT란?

대화형 인공지능 챗봇.
대화하듯이 정보를 얻을 수 있는 인공지능입니다.

 

기존에는 저희가 인터넷에서 정보를 찾을 때 구글, 네이버와 같은 검색엔진에서 입력한 검색어에 맞는 게시글을 제공해주면 그 안에서 일일이 뒤져보면서 원하는 정보를 찾았습니다.

하지만 ChatGPT는 방대한 양의 텍스트 데이터를 학습한 상태에서 사용자의 질문에 가장 적합할 확률이 높은 글을 정리해서 제공합니다.

여기서 강조된 “적합할 확률이 높은”을 잘 기억하시기 바랍니다.

ChatGPT 동작 원리

저도 이 동작원리를 알고 싶어서 굉장히 많은 영상을 찾아봤습니다.

그 중에서 가장 이해하기 쉽게 설명해준 영상 링크를 첨부해드릴테니 10분만 투자해서 꼭 시청하시기 바랍니다.

 

 

자 영상을 볼 시간이 없는 분들을 위해 제가 요약을 해보겠습니다.

 

ChatGPT는 GPT라는 LLM을 채팅 방식으로 사용할 수 있게 만든 서비스 입니다.

GPT는 LLM의 한 종류이며 GPT가 뭔지 설명하면 굉장히 길어지니 다 집어치우고 가장 기본이 되는 LLM에 대해 간단하게 설명하겠습니다.

 

LLM의 기본 동작 원리는 통계입니다.

 

내가 채팅을 통해 한 질문을 기준으로 답변으로 가장 대답일 확률이 높은 문장을 생성해서 제공하는 방식입니다.

책과 인터넷에 있는 방대한 양의 텍스트 정보를 가지고, 단어별로 뒤따르는 단어의 확률에 대해 통계를 내고, 특정 단어가 나왔을 때 뒤따를 확률이 가장 높은 단어를 제시하는 방식입니다.

 

 

LLM(Language Model)의 작동 방식을 이해하기 쉽게 설명하기 위한 예시를 만들어 보겠습니다.

"나는 오늘 ___에 갔다."라는 문장을 생각해봅시다. 여기서 빈 칸에 들어갈 수 있는 단어들과 그 확률을 표로 나타내면 다음과 같습니다.

단어 확률
학교 0.4
회사 0.3
공원 0.2
병원 0.1

이 표는 LLM이 "나는 오늘 ___에 갔다."라는 문장에서 빈 칸에 올 수 있는 단어들과 그 확률을 예측한 것을 나타냅니다.

LLM은 '나는 오늘'까지의 정보를 바탕으로 다음 단어를 예측하려고 합니다. 이 경우, LLM은 '학교'가 빈 칸에 들어갈 확률이 가장 높다고 판단했습니다. 이는 대부분의 사람들이 평일에 학교나 회사에 가는 경우가 많기 때문일 수 있습니다.

그러나, 여기서 '병원'이나 '공원'이 절대로 올 수 없다는 것은 아닙니다. 이들 단어가 올 확률은 상대적으로 낮지만, 특정 상황에서는 이들 단어가 더 적절할 수 있습니다. 이처럼 LLM은 주어진 문맥을 바탕으로 다음 단어의 확률을 예측하고, 그 중 가장 높은 확률의 단어를 선택합니다.

 

이런 방식으로 LLM은 문장의 다음 단어를 예측하고, 이를 바탕으로 자연스러운 문장을 생성해냅니다. 이러한 과정을 통해, LLM은 대화, 글쓰기 보조, 번역 등 다양한 작업을 수행할 수 있습니다.

 

 

현재 ChatGPT 말고도 구글의 Bard, 마이크로소프트의 Bing, 네이버의 ClovaX, 메타의 llama 등 많은 LLM 서비스들이 나오고 있는데 이들 모두 이러한 기본 원리 위에서 동작합니다.

인터넷에 존재하는 텍스트를 가지고 학습했고, input으로 주어진 문장 뒤에 올 확률이 가장 높은 문장을 output으로 제공한다.

똑똑하신 분들은 위의 한 문장 만으로도 단점과 한계를 느끼실텐데요.

 

그 부분은 다음 글에서 다시 설명하겠습니다.