My Dev & Engineering Repository

🗣️ Large Language Model (LLM)

[LLM] LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS 리뷰

2024. 11. 30.

[LLM] LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS 리뷰

2024. 11. 30.

[LLM] LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS 리뷰

이번에는 "LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS" 논문을 한번 리뷰해 보겠습니다.논문 링크 LoRA: Low-Rank Adaptation of Large Language ModelsAn important paradigm of natural language processing consists of large-scale pre-training on general domain data and adaptation to particular tasks or domains. As we pre-train larger models, full fine-tuning, which retrains all model parameters, becomes learxiv.orgAb..

[LLM] LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS 리뷰

2024. 11. 30.

[LLM] Parameter-Efficient Transfer Learning for NLP 리뷰

2024. 11. 18.

[LLM] Parameter-Efficient Transfer Learning for NLP 리뷰

🗣️ Large Language Model (LLM)

2024. 11. 18.

[LLM] Parameter-Efficient Transfer Learning for NLP 리뷰

이번에는 "Parameter-Efficient Transfer Learning for NLP" 논문을 한번 리뷰해보겠습니다.논문 링크 Parameter-Efficient Transfer Learning for NLPFine-tuning large pre-trained models is an effective transfer mechanism in NLP. However, in the presence of many downstream tasks, fine-tuning is parameter inefficient: an entire new model is required for every task. As an alternative, we propose transferarxiv.orgAbstract대규모 사전..

[LLM] Parameter-Efficient Transfer Learning for NLP 리뷰

2024. 11. 18.

[LLM] Training language models to follow instructions with human feedback (Instruct GPT / RLHF) Review

2024. 10. 30.

[LLM] Training language models to follow instructions with human feedback (Instruct GPT / RLHF) Review

🗣️ Large Language Model (LLM)

2024. 10. 30.

[LLM] Training language models to follow instructions with human feedback (Instruct GPT / RLHF) Review

스터디 준비를 하다가 정리한 내용을 한번 Review를 해보겠습니다.Training language models to follow instructions with human feedbackAbstract언어 모델의 크기를 키우는 것만으로는 사용자 의도에 더 잘 부합하도록 만드는 것이 아닙니다. 예를 들어, 대규모 언어 모델은 진실하지 않거나, 유해하거나, 사용자에게 도움이 되지 않는 출력을 생성할 수 있습니다. 즉, 이러한 모델은 사용자의 의도에 맞춰져 있지 않습니다. 여기서는 인간의 피드백으로 미세 조정하여 다양한 작업에서 사용자 의도와 일치하는 언어 모델을 개발하는 방법을 제시합니다.OpenAI API를 통해 수집된 레이블러가 작성한 프롬프트와 데모 데이터를 사용하여 모델이 원하는 동작을 시연하는 데..

[LLM] Training language models to follow instructions with human feedback (Instruct GPT / RLHF) Review

2024. 10. 30.

[LLM] Improving Language Understanding by Generative Pre-Training (GPT-1 논문 Review)

2024. 10. 25.

[LLM] Improving Language Understanding by Generative Pre-Training (GPT-1 논문 Review)

🗣️ Large Language Model (LLM)

2024. 10. 25.

[LLM] Improving Language Understanding by Generative Pre-Training (GPT-1 논문 Review)

이번엔 GPT-1 Model에 데하여 논문을 읽고 공부한 내용을 리뷰해 보겠습니다.이 논문에서는 Transformer 모델에 데한 설명이 포함되어 있습니다. 그래서, 어느정도 Transformer Model에 데한 지식이 잇어야 이해하실수 있습니다. 한번 읽고 와주세요! [NLP] Transformer Model - 트랜스포머 모델 알아보기이번 글에서는 Transformer 모델의 전반적인 Architecture 및 구성에 데하여 알아보겠습니다. Transformer: Attention is All You Need Transformer 모델은 2017년에 "Attention is All You Need"라는 논문을 통해서 소개되었습daehyun-bigbread.tistory.comAbstract자연어 이..

[LLM] Improving Language Understanding by Generative Pre-Training (GPT-1 논문 Review)

2024. 10. 25.

[LLM] Retrieve Augmented Generation (RAG)

2024. 9. 15.

[LLM] Retrieve Augmented Generation (RAG)

🗣️ Large Language Model (LLM)

2024. 9. 15.

[LLM] Retrieve Augmented Generation (RAG)

이번 글에선 Retrieve Augmented Generation (RAG)에 데하여 한번 알아보겠습니다.Retrieve Augmented Generation (RAG) RAG(Retrieve-Augmented Generation)은 대규모 언어 모델(LLM)의 한계점을 극복하고 더 정확하고 풍부한 응답을 제공하기 위해 고안된 아키텍처입니다.RAG는 특정 질의에 대해 외부 지식 베이스에서 관련 정보를 검색한 후, 이 정보를 기반으로 텍스트를 생성하는 방식으로 작동합니다.특히 정보가 풍부한 응답을 생성하는 데 유리합니다.RAG ArchitectureRAG(Retrieve Augmented Generation)은 크게 세 가지 단계로 구성됩니다.Retrieve 단계, Augmented 단계, 그리고 Gene..

[LLM] Retrieve Augmented Generation (RAG)

2024. 9. 15.

[LLM] Prompt Engineering (프롬포트 엔지니어링)

2024. 9. 14.

[LLM] Prompt Engineering (프롬포트 엔지니어링)

🗣️ Large Language Model (LLM)

2024. 9. 14.

[LLM] Prompt Engineering (프롬포트 엔지니어링)

앞에 LLM 소개 글에서 Prompt Engineering에 관한 소개를 간단히 했습니다. 이번글에서 더 자세히 다뤄보겠습니다.Prompt EngineeringPrompt Engineering이란 생성형 인공지능(AI), 특히 LLM을 활용하여 원하는 결과를 얻을 수 있도록 효과적인 프롬프트를 설계하고 구성하는 과정 을 말합니다. 이는 AI의 능력을 최대한 활용하여 더 나은 결과를 얻는 방법을 연구하고 적용하는 기술 입니다.예를 들어, 특정한 질문을 했을 때, 답변의 정확성과 품질을 높이기 위해 프롬프트를 더 구체적이고 명확하게 만드는 것이 바로 Prompt Engineering입니다. 이를 통해 모델이 더 나은 성능을 발휘하고, 사용자는 원하는 결과를 정확하게 얻을 수 있습니다.효율적인 프롬프트 작성:..

[LLM] Prompt Engineering (프롬포트 엔지니어링)

2024. 9. 14.

[LLM] What is Large Language Model (LLM)?

2024. 9. 11.

[LLM] What is Large Language Model (LLM)?

🗣️ Large Language Model (LLM)

2024. 9. 11.

[LLM] What is Large Language Model (LLM)?

LLM 파트 부분에 대한 글을 처음써보네요. 앞으로 당분간은 LLM에 관한 글만 올릴거 같아요..공부를 그쪽으로 하고 있어서. 한번 시작해볼께요.Large Language Model (LLM)LLM으로 들어가기 전에, 일단 AI가 어떠한 개념인지 한번 짚고 넘어가야 할 필요가 있습니다.AI는 인간의 학습 능력, 추론 능력, 지각 능력을 인공적으로 구현하려는, 컴퓨터 과학의 세부 분야중 하나입니다.즉, AI는 인간의 인지 능력을 모방하여 데이터를 처리하고 분석하는 기술입니다. 한번 다이어그램을 보고 어떠한 Flow로 구성되는지 설명을 드리겠습니다.INPUT (입력): AI 시스템에 주어지는 데이터 또는 정보입니다. 예를 들어, 텍스트, 이미지, 음성 등이 입력으로 들어갈 수 있습니다.학습, 추론, 지각: ..

[LLM] What is Large Language Model (LLM)?

2024. 9. 11.

SUBSCRIBE

Notice

[LLM] LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS 리뷰

[LLM] LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS 리뷰

[LLM] LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS 리뷰

[LLM] Parameter-Efficient Transfer Learning for NLP 리뷰

[LLM] Parameter-Efficient Transfer Learning for NLP 리뷰

[LLM] Parameter-Efficient Transfer Learning for NLP 리뷰

[LLM] Training language models to follow instructions with human feedback (Instruct GPT / RLHF) Review

[LLM] Training language models to follow instructions with human feedback (Instruct GPT / RLHF) Review

[LLM] Training language models to follow instructions with human feedback (Instruct GPT / RLHF) Review

[LLM] Improving Language Understanding by Generative Pre-Training (GPT-1 논문 Review)

[LLM] Improving Language Understanding by Generative Pre-Training (GPT-1 논문 Review)

[LLM] Improving Language Understanding by Generative Pre-Training (GPT-1 논문 Review)

[LLM] Retrieve Augmented Generation (RAG)

[LLM] Retrieve Augmented Generation (RAG)

[LLM] Retrieve Augmented Generation (RAG)

[LLM] Prompt Engineering (프롬포트 엔지니어링)

[LLM] Prompt Engineering (프롬포트 엔지니어링)

[LLM] Prompt Engineering (프롬포트 엔지니어링)

[LLM] What is Large Language Model (LLM)?

[LLM] What is Large Language Model (LLM)?

[LLM] What is Large Language Model (LLM)?

티스토리툴바