일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- Rocky Linux
- KAKAO
- rnn
- 크롤링 개발
- GoogleDrive
- Powershell
- Github
- 국가과제
- colab
- ChatGPT
- Spring Boot
- 코딩도장
- Database
- suricata
- ICT멘토링
- Docker
- C언어
- git
- Kubernetes
- 인터넷의이해
- 고등학생 대상
- Machine Learning
- Resnet
- LINUX MASTER
- Spring
- Python
- API
- OSS
- cloud
- VSCode
- Today
- Total
코딩두의 포트폴리오
OSS - 14_ ChatGPT & Transformers 라이브러리 활용 본문
ChatGPT란?
ChatGPT 개요
ChatGPT란?
OpenAI에서 개발한 인공지능 모델
Generative Pre-trained Transformer의 약자
언어 이해와 생성 분야에서 뛰어난 성능을 보임
ChatGPT 핵심 개념
Generative: 새로운 텍스트 생성 가능
Pre-trained: 대규모 데이터 학습으로 언어 이해와 생성 능력 향상
Transformer: 시퀀스 데이터 처리와 이해에 사용되는 모델 구조
ChatGPT 활용
대화형 인터페이스로 동작
사용자의 입력에 따라 적절한 대답 및 텍스트 생성
고객 서비스, 정보 검색, 창작적 글쓰기 등 다양한 분야에서 활용
ChatGPT 한계
학습 데이터에 기반한 생성
종종 부정확한 정보나 편향된 응답 제공
최신 정보나 신뢰성을 요하는 상황에서 주의 필요
ChatGPT vs 인터넷 정보검색
대형 언어 모델 (Large Language Model, LLM)
인공 신경망(Neural Netword) 기초
대형 언어 모델(Large Language Model, LLM)
수많은 파라미터(보통 수십억 이상)를 보유한 인공 신경망으로 구성되는 언어 모델
자기 지도 학습이나 반자기지도학습을 사용하여 레이블링되지 않은 상당한 양의 텍스트로 훈련
LLM은 2018년 즈음에 모습을 드러냈으며 다양한 작업을 위해 수행
이전의 특정 작업의 특수한 지도 학습 모델의 훈련 패러다임에서 벗어나 자연어 처리 연구로 초점이 옮겨짐
Foundation Model
레이블이 없는 방대한 데이터세트에서 훈련한 AI 신경망으로 텍스트 번역과 의료 이미지 등 광범위한 작업을 수행
TransFormer 기반으로 구현
대규모 언어 모델
BERT (Bidirectional Encoder Representation from Transformers)
문장의 일부 단어를 마스킹하고, 이 단어를 예측하는 방식으로 학습(양방향 학습)
더 깊이 있는 문맥 이해 가능
GPT (Generative Pre-trained Transformer)
다음 단어를 예측하는 방식으로 학습(단방향 학습)
자연스러운 텍스트 생성 잘 수행
GPT-1 vs GPT-2 vs GPT-3
GPT 프롬프트 만들기
프롬프트의 6가지 구성요소
1. 작업(Task)
명료하게 작성되어야 하며, 프롬프트의 핵심 요소. 작업이 없으면 인공지능은 작동하지 않음
ex) 생성해줘, 요약해줘, 분석해줘
2. 맥락(Context)
작업과 관련된 내용을 입력하는 것으로, 프롬프트의 가장 어려운 구성요소
맥락은 주관적이고 넓은 범위를 가지므로 적절한 정보를 입력해야 함
ex) 나의 배경에 대해, 프롬프트의 목적에 대해, 환경적 요인에 대해
3. 예시(Example)
프롬프트에 원하는 결과물에 대한 예시를 제공하여 더 정확한 답변을 얻을 수 있도록 도와줌
ex) 예시를 근거로 업그레이드 요청
4. 페르소나(Persona)
인공지능에 부여하는 가면 또는 인격
특정 개인이나 유명인을 설정하면 해당 인물의 능력 활용 가능
ex) 너는 수학 선생님이야, 너는 빌 게이츠야, 너는 덴 케네디(유명한 카피라이트 전문가)야
5. 형식(Form)
최종 결과물의 형식을 지정하는 것으로, 표나 리스트 등 다양한 형식으로 답변을 가공할 수 있음
특정 단어를 굵게 표시하거나 마크다운 형식을 요청할 수도 있음
ex) 표, 도표, 특정 문구를 볼드체로, 마크다운 형식으로
6. 톤(Tone)
대답의 어조를 결정하는 것으로, 상황에 맞는 어조로 결과물을 생성할 수 있음
특정 형용사를 입력하여 원하는 어조를 지정하거나, 만약 형용사가 많아서 결정하기 어렵다면
gpt에게 상황을 설명하고 어울리는 톤을 물어보면 됨
ex) 착하게, 따뜻하게, 부드럽게, 정중하게 등 형용사 사용
응용
유투브 요약
발표자료 생성
이미지자료 만들기
ChatGPT API 활용
API (Application Program Interface)
애플리케이션 프로그램에 접근하기 위한 인터페이스
API: SW APP들이 서로 상호작용할 수 있도록 정의한 규약, 명령어, 함수 등의 집합
- 공개 API (Open API): 외부 개발자가 자유롭게 사용할 수 있도록 공개된 API
- 내부 API (Private API): 내부 개발자가 시스템 간에만 사용되는 비공개 API
OpenAI의 ChatGPT는 다른 웹사이트에서 이용할 수 있도록 API를 무료로 제공
API를 이용하는 방식은 ChatGPT에서 제공하는 규칙에 따라 사용되어야 함
LangChain vs. Transformers
공통점
- 오픈소스 - 모두 OSS로 제공, 누구나 사용, 수정, 배포
- 자연어 처리 지원
- 다양한 NLP 작업 수행 - 텍스트 생성, 분류, 번역 등 다양한 NLP 작업을 수행
- 커뮤니티 기반 - 활발한 커뮤니티로 사용자들이 기술적인 지원을 받거나 기여
차이점
LangChain
- NLP APP을 구축하기 위한 도구와 프로세를 모듈화하고 통합하는데 초점
- 여러 NLP 모델과 기술을 통합하여 복잡한 NLP 시스템을 보다 쉽게 구축할 수 있도록 설계
Transformers
- 다양한 사전 훈련된 트랜스포머 모델(BERT, GPT 등)을 제공
- 강력한 트랜스포머 기반의 모델을 쉽게 사용, 미세 조정
허깅페이스 Transformers
허깅페이스(Hugging Face)의 트랜스포머(Transformers) 라이브러리
NLP를 위한 강력하고 다양한 기능을 제공하는 오픈소스 라이브러리
트랜스포머 아키텍처를 기반으로 하는 다양한 사전 훈련된 모델들을 쉽게 접근하고 사용할 수 있게 함
- 다양한 사전 훈련된 모델들
- 여러 언어 및 작업 지원
- 사용 편의성
- 활발한 커뮤니티와의 지속적인 업데이트
- 교육 및 연구 용이성
'Open Source Software' 카테고리의 다른 글
순차데이터 처리하는 RNN (1) | 2024.05.27 |
---|---|
OSS - 15_ 이미지 처리 능력이 탁월한 CNN (0) | 2024.05.25 |
OSS - 13_ 패션 아이템을 구분하는 DNN (0) | 2024.05.16 |
OSS - 12_ 파이토치로 구현하는 ANN (0) | 2024.05.11 |
OSS - 11_ AI-NLP 개요 (0) | 2024.05.11 |