반응형
해당 포스팅은 'Learn Prompting' 블로그 내용을 학습하며 요약한 글로
정확한 내용은 하단의 링크를 이용해 본문을 확인하시길 바랍니다.

LLM의 한계점

  • LLM은 매우 강력하지만 사용할 때 주의해야 할 한계점이 많이 존재

1. 인용(Citing Sources)

  • LLM은 대부분 소스를 정확하게 인용할 수 없음
    • 인터넷에 접속할 수 없고 정보가 어디에서 왔는지 정확히 기억하지 못하기 때문
    • 좋아 보이지만 완전히 부정확한 소스를 생성하는 경우가 많음
    • 이 문제는 검색 증강 LLM(인터넷 및 기타 소스를 검색할 수 있는 LLM)을 사용하면 어느정도 해결할 수 있음

2. 편향(Bias)

  • LLM은 종종 편향된 결과를 생성할 수 있음
    • 안전요원이 있어도 가끔 성차별/인종차별/동성애혐오적인 말을 함
    • 소비자가 사용하는 애플리케이션에서 LLM을 사용할 때 또는 연구에 사용할 때 주의 필요

3. 거짓(Hallucinations)

  • LLM은 답변을 모르는 질문을 받았을 때 거짓을 자주 생성
    • 답을 모른다고 말할 때도 있지만 대부분의 경우 자신 있게 잘못된 대답을 함

4. 수학(Math)

  • LLM은 종종 수학을 잘 못함
    • 이 문제는 Tool Augmented LLM을 사용하여 어느 정도 해결할 수 있음

5. 프롬프트 해킹(Prompt Hacking)

  • 사용자는 종종 LLM을 속여 원하는 콘텐츠를 생성할 수 있음

 

LLM 설정

  • LLM의 output은 다양한 측면을 제어하는 ​​하이퍼파라미터의 영향을 받을 수 있음
    • 하이퍼파라미터를 조정하여 보다 창의적이고 다양하며 흥미로운 결과를 생성할 수 있음
    • 대표적으로 Temperature, Top p등이 있음
    • 학습률, 레이어 수, 은닉 크기 등과 같은 일반 하이퍼파라미터와 다름

 

Temperature(온도)

  • 언어 모델의 임의성을 제어하는 하이퍼파라미터
  • 높은 온도는 보다 예측 불가능하고 창의적인 결과를, 낮은 온도는 보다 일반적이고 보수적인 결과를 생성
    • ex. 모델의 온도를 1.0에서 0.5로 설정하는 경우, 보다 더 예측 가능하고 덜 창의적인 텍스트를 생성

 

Top p

  • 언어 모델의 무작위성을 제어하는 ​​하이퍼파라미터
  • 임계 확률 설정 -> 누적 확률이 임계 값을 초과하는 상위 토큰 선택 -> 토큰 집합에서 무작위로 샘플링하여 output 생성
    • 이 방법은 전체 어휘를 ​​무작위로 샘플링하는 기존 방법보다 더 다양하고 흥미로운 결과를 생성할 수 있음
    • ex. 상위 p를 0.9로 설정하면 모델은 확률 질량의 90%를 구성하는 가장 가능성이 높은 단어만 고려

 

그 외 관련 하이퍼파라미터

  • 빈도(frequency), 존재(presence) 패널티 등과 같이 언어 모델 성능에 영향을 줄 수 있는 다른 많은 하이퍼 매개변수가 존재

 

하이퍼파라미터가 모델에 미치는 영향

  • 온도와 top p는 모두 생성된 텍스트의 무작위성과 다양성 정도를 제어하여 언어 모델의 출력에 영향을 줄 수 있음
    • 높은 온도 또는 높은 p 값은 더 예측할 수 없고 흥미로운 결과를 생성하지만 오류 또는 무의미한 텍스트의 가능성도 증가시킴
      • 텍스트 생성 작업 중 창의로운 결과가 필요한 경우 사용할 수 있음
    • 낮은 온도 또는 낮은 p 값은 보다 보수적이고 예측 가능한 결과를 생성할 수 있지만 반복적이거나 흥미롭지 않은 텍스트가 될 수 있음
      • 번역 작업이나 질문 답변과 같이 정확성이 중요한 작업의 경우 낮은 온도 또는 최고 p 값을 사용해야 함
  • 하이퍼파라미터와 모델 출력 간의 관계를 이해하면 특정 작업 및 애플리케이션에 대한 프롬프트를 최적화할 수 있음
    • ChatGPT와 같은 일부 모델에서는 하이퍼파라미터를 조정할 수 없음
반응형
반응형

이전 포스팅을 통해 기획 아이디어와 개요를 정리하여 작성하였다.

[AI 서비스]기획 아이디어 & 개요

 

기획 아이디어 & 개요

기획 아이디어 구상 기존에 조사한 모델 포함, 다양한 모델을 활용하여 어떤 AI 서비스를 만들지 기획한다. 우선 스터디를 진행하는 인원 중 개발자가 없고, AI 모델을 이용하여 간단한 웹 서비스

jobdahan-tech.tistory.com

이번에는 기획 아이디어와 개요를 바탕으로 요구사항 정의서를 작성하도록 한다.  

 

요구사항 정의서는 ChatGPT를 활용하여 작성하였고, 작성 과정은 다음을 참고한다.

ChatGPT로 요구사항 정의서 작성하기

 

ChatGPT로 요구사항 정의서 작성하기

AI서비스 구축 스터디를 하며 구상한 아이디어를 요구사항 정의서로 작성하기 위해 ChatGPT를 활용해보도록 한다. 기획 아이디어 & 개요 기획 아이디어 & 개요 기획 아이디어 구상 기존에 조사한

jobdahan-tech.tistory.com

 

ChatGPT로 작성한 요구사항 정의서 내용을 엑셀에 형식에 맞게 작성하며 추가로 필요한 기능을 추가하고, 불필요한 내용을 삭제하여 작성을 완료하였다.

 

요구사항 정의서가 작성이 완료되면 IA 정보 구조도, 기능정의서 등을 작성하는게 기존의 프로세스이지만 서비스가 매우 간단하므로 다음 포스팅에서는 바로 플로우 차트를 작성해보도록 한다.

반응형
반응형

AI서비스 구축 스터디를 하며 구상한 아이디어를 요구사항 정의서로 작성하기 위해 ChatGPT를 활용해보도록 한다.

기획 아이디어 & 개요

 

기획 아이디어 & 개요

기획 아이디어 구상 기존에 조사한 모델 포함, 다양한 모델을 활용하여 어떤 AI 서비스를 만들지 기획한다. 우선 스터디를 진행하는 인원 중 개발자가 없고, AI 모델을 이용하여 간단한 웹 서비스

jobdahan-tech.tistory.com

 

처음으로 내가 작성한 요구사항을 요구사항 정의서로 작성해달라고 요청한다.

다음으로 내가 만드려는 서비스의 이름과 목적을 ChatGPT에게 설명한다.

따로 요구사항을 입력하지 않고 제목과 목적만 설명해도 꽤 적절한 요구사항 정의서를 작성해주는 것을 알 수 있다.

 

여기서, 추가하고 싶은 요구사항을 추가하고 불필요한 요구사항을 제외시켜 달라고 요청한다.

다음과 같이 ChatGPT를 이용하여 요구 사항 정의서의 전체적인 틀을 잡고 추가적으로 수정하는 작업을 진행하였다.

 

처음부터 생각 이상의 적절한 답변을 제공하였으며 추가 요청을 통해 원하는 요구사항 정의서를 이끌어낼 수 있었다. 해당 내용을 각자의 방법, 양식에 맞게 잘 활용하면 매우 효율적일 것이라고 생각한다.

 

Reference

ChatGPT

 

Introducing ChatGPT

We’ve trained a model called ChatGPT which interacts in a conversational way. The dialogue format makes it possible for ChatGPT to answer followup questions, admit its mistakes, challenge incorrect premises, and reject inappropriate requests.

openai.com

 

 

반응형

'ChatGPT 이용 및 활용 > 기획' 카테고리의 다른 글

요구 사항 정의서  (0) 2023.04.04
반응형

ChatGPT를 이용하여 요구 사항 정의서가 무엇인지, 어떻게 작성하는지, 양식은 어떻게 되는지 등을 학습한다.

 

요구사항 정의서란

ChatGPT에게 요구사항 정의서가 무엇인지 물어본다.

 

 

요구사항 정의서 작성 방법

ChatGPT에게 요구사항 정의서 작성하는 방법을 물어본다.

 

답변 1.

답변 2.

 

요구사항 정의서 작성 예시

ChatGPT에게 요구사항 정의서 작성 예시를 물어본다.

 

답변 1.

답변 2.

 

요구사항 정의서 작성 양식

ChatGPT에게 요구사항 정의서 작성 양식을 물어본다.

 

답변 1.

답변 2.

반응형

'ChatGPT 이용 및 활용 > 기획' 카테고리의 다른 글

ChatGPT로 요구사항 정의서 작성하기  (0) 2023.04.13
반응형

ChatGPT란

GPT(Generative Pre-trained Transformer)-3는 OpenAI에서 공개한 트랜스포머 구조 기반의 사전 학습된 언어 생성 모델로, 인간과 유사한 텍스트를 생성할 수 있다.

https://jobdahan-tech.tistory.com/entry/Transformer

 

Transformer

Transformer Transformer는 RNN 언어 모델에서부터 시작었다. 기존의 RNN은 하나의 고정된 크기의 벡터(Context vector)에 모든 정보를 압축하므로 정보 손실이 발생하며 순차적 입력 구조 때문에 먼저 입력

jobdahan-tech.tistory.com

GPT-3는 약 1750억 개의 파라미터를 가지고, 메타 학습(Meta learning)인간의 피드백을 통한 강화 학습(Reinforcement learning)을 수행하여 더욱 인간과 유사하며 정확한 답변을 생성한다.

 

ChatGPT는 GPT-3를 챗봇 기능에 특화시키고, 모델의 윤리성을 보완한 모델이며 GPT-3.5라고도 한다.

 

Meta Learning

메타 학습은 GPT가 추가적인 학습을 할 필요 없는 이유학습 데이터에 없었던 데이터에 대해서도 자체적인 유사도 계산을 통해 분류가 가능하도록 학습한다.(Learning to learn)

zero/one/few-shot learning은 적은 수의 샘플 만으로 답변을 예측할 수 있도록 학습하므로 미세 조정(fine-tuning) 없이 간단한 instruction/example만으로도 문맥에 맞는 답변을 유추할 수 있다.

 

RLHF(Reinforcement learning from human feedback)

GPT가 사람과 유사한 답변을 할 수 있는 이유로 GPT-3는 사람이 직접 답변 생성 결과에 score를 매기고, 이를 별도의 보상 모델(Reward model)을 이용해 높은 score를 가지는 방향으로 학습한다.

 

ChatGPT API 사용법

1. https://platform.openai.com/overview 접속 & 로그인

2. 프로필 클릭 후 Manage account 클릭

2. User -> API Keys 메뉴에서 API Key 발급 (API Key는 생성시에만 확인 가능하므로 백업 필수)

3. Billing -> Payment methods -> Add Payment method 메뉴에서 결제 카드 정보 등록(등록 완료시 자동으로 허용 한도 내 API 사용 가능)

4. Billing -> Usage limits 메뉴에서 월 사용량 한도 설정

5. ChatGPT API 설치

- pip install openai를 실행하여 OpenAI 라이브러리 설치

- API Key 설정

6. ChatGPT 생성 모듈 구성 요소 설정

- system: 챗봇이 어떤 방향으로 답변을 할 지 결정

- user: 사용자의 입력 텍스트

- assistant: 챗봇의 이전 답변, 이전 답변을 바탕으로 대화를 이어나갈 수 있음

7. 챗봇 구현

- 챗봇의 답변을 다시 챗봇 모듈에 넣어 대화가 지속될 수 있게 함

 

Reference

https://platform.openai.com/overview

 

OpenAI API

An API for accessing new AI models developed by OpenAI

platform.openai.com

 

반응형

'AI 서비스 구축 스터디 > 모델 조사' 카테고리의 다른 글

GAN  (0) 2023.04.03
Whisper  (0) 2023.04.03
Transformer  (0) 2023.04.03
Naver Clova  (0) 2023.04.03
간단한 AI 웹서비스 예제  (0) 2023.04.03

+ Recent posts