My Dev Repository

[kakaotech] Pitching 개발기 - PLLaVA Paper Review

[kakaotech] Pitching 개발기 - PLLaVA Paper Review

VLM (Vision Language Model)을 공부하던중 PLLaVA 논문을 읽은후 정리한 내용을 공유합니다.Paper Link PLLaVA : Parameter-free LLaVA Extension from Images to Videos for Video Dense CaptioningVision-language pre-training has significantly elevated performance across a wide range of image-language applications. Yet, the pre-training process for video-related tasks demands exceptionally large computational and data resources,..

[kakaotech] Pitching 개발기 - PLLaVA Paper Review

2025. 4. 7.

[kakaotech] Pitching 개발기 - Video-LLaMA Paper Review

[kakaotech] Pitching 개발기 - Video-LLaMA Paper Review

🦁 kakaotech

[kakaotech] Pitching 개발기 - Video-LLaMA Paper Review

Q. VLM을 적용해서 발표자의 행동을 탐지 & 분석 → Prompt로 특징이 나오려면?1. VLM으로 Object Detection을 한 사레를 알아야 한다.2. VLM으로 최대 몇분까지의 영상 분석이 가능한가? (max 1시간)3. 사용할수 있는 모델이 있는가? Fine-tuning및 모델 사용법은?VLM (Vision Language Model)을 공부하던중 Video-LLaMA 논문을 읽어서 정리한 내용을 공유합니다. Paper Link Video-LLaMA: An Instruction-tuned Audio-Visual Language Model for Video UnderstandingWe present Video-LLaMA a multi-modal framework that empowers L..

[kakaotech] Pitching 개발기 - Video-LLaMA Paper Review

2025. 4. 7.

[kakaotech] Pitching 개발기 - Vision Language Model Research

[kakaotech] Pitching 개발기 - Vision Language Model Research

🦁 kakaotech

[kakaotech] Pitching 개발기 - Vision Language Model Research

Pitching Project를 PM & AI Tech 담당자로 개발한지 몇달이 지났지만, 다시 한번 정리하는 개념으로 어떠한 내용을 개발했는지 올려보려고 합니다.Pitching Github Organization Pitching-kakaotechPitching은 "모두가 편하게 소통하고, 자신있게 말하며 연결된 세상을 만들자." 라는 생각으로 탄생한 플랫폼입니다. - Pitching-kakaotechgithub.com 팀에서 AI기술을 활용한 실시간 발표 피드백 기능을 제공하는 프로덕트를 만들어보자고 아이디어가 나와서 개발을 할때,주제와 MVP & 요구사항 명세서(SRS)를 정의한후, 내용을 한번 정리해 보았습니다.기능 우선순위 설정: 우선순위는 "P0", "P1", "P2"으로 구분되며, 사용자 ..

[kakaotech] Pitching 개발기 - Vision Language Model Research

2025. 4. 7.

[LLM] LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS 리뷰

2024. 11. 30.

[LLM] LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS 리뷰

2024. 11. 30.

[LLM] LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS 리뷰

이번에는 "LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS" 논문을 한번 리뷰해 보겠습니다.논문 링크 LoRA: Low-Rank Adaptation of Large Language ModelsAn important paradigm of natural language processing consists of large-scale pre-training on general domain data and adaptation to particular tasks or domains. As we pre-train larger models, full fine-tuning, which retrains all model parameters, becomes learxiv.orgAb..

[LLM] LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS 리뷰

2024. 11. 30.

[LLM] Training language models to follow instructions with human feedback (Instruct GPT / RLHF) Review

2024. 10. 30.

[LLM] Training language models to follow instructions with human feedback (Instruct GPT / RLHF) Review

2024. 10. 30.

[LLM] Training language models to follow instructions with human feedback (Instruct GPT / RLHF) Review

스터디 준비를 하다가 정리한 내용을 한번 Review를 해보겠습니다.Training language models to follow instructions with human feedbackAbstract언어 모델의 크기를 키우는 것만으로는 사용자 의도에 더 잘 부합하도록 만드는 것이 아닙니다. 예를 들어, 대규모 언어 모델은 진실하지 않거나, 유해하거나, 사용자에게 도움이 되지 않는 출력을 생성할 수 있습니다. 즉, 이러한 모델은 사용자의 의도에 맞춰져 있지 않습니다. 여기서는 인간의 피드백으로 미세 조정하여 다양한 작업에서 사용자 의도와 일치하는 언어 모델을 개발하는 방법을 제시합니다.OpenAI API를 통해 수집된 레이블러가 작성한 프롬프트와 데모 데이터를 사용하여 모델이 원하는 동작을 시연하는 데..

[LLM] Training language models to follow instructions with human feedback (Instruct GPT / RLHF) Review

2024. 10. 30.

[LLM] Improving Language Understanding by Generative Pre-Training (GPT-1 논문 Review)

2024. 10. 25.

[LLM] Improving Language Understanding by Generative Pre-Training (GPT-1 논문 Review)

2024. 10. 25.

[LLM] Improving Language Understanding by Generative Pre-Training (GPT-1 논문 Review)

이번엔 GPT-1 Model에 데하여 논문을 읽고 공부한 내용을 리뷰해 보겠습니다.이 논문에서는 Transformer 모델에 데한 설명이 포함되어 있습니다. 그래서, 어느정도 Transformer Model에 데한 지식이 잇어야 이해하실수 있습니다. 한번 읽고 와주세요! [NLP] Transformer Model - 트랜스포머 모델 알아보기이번 글에서는 Transformer 모델의 전반적인 Architecture 및 구성에 데하여 알아보겠습니다. Transformer: Attention is All You Need Transformer 모델은 2017년에 "Attention is All You Need"라는 논문을 통해서 소개되었습daehyun-bigbread.tistory.comAbstract자연어 이..

[LLM] Improving Language Understanding by Generative Pre-Training (GPT-1 논문 Review)

2024. 10. 25.

[DL] Quantization(양자화), LoRA & QLoRA

[DL] Quantization(양자화), LoRA & QLoRA

🖥️ Deep Learning

[DL] Quantization(양자화), LoRA & QLoRA

이번에는 Quantization(양자화), LoRA & QLoRA에 데하여 한번 알아보겠습니다.Quantization(양자화)? Quantization(양자화)는 딥러닝 모델의 메모리 사용량과 계산 효율성을 향상시키기 위한 기술로, 고정 소수점(fixed-point) 숫자 표현을 사용하여 모델의 가중치와 활성화 값을 표현하는 방식입니다. 이는 훈련된 모델의 정확성을 최대한 유지하면서도 성능을 개선하는 것을 목표로 합니다.Quantization(양자화)의 필요성딥러닝에서 Quantization(양자화)가 필요한 이유에 데하여 한번 알아보겠습니다.메모리 절감: 모델 파라미터의 크기를 줄여 메모리 사용량을 절감합니다.연산 속도 향상: 고정 소수점 연산은 부동 소수점 연산보다 빠르기 때문에 추론 속도가 빨라집니..

[DL] Quantization(양자화), LoRA & QLoRA

2024. 9. 18.

[DL] Model Distillation (모델 증류)

[DL] Model Distillation (모델 증류)

🖥️ Deep Learning

[DL] Model Distillation (모델 증류)

이번에는 Model Distillation (모델 증류)에 관한 내용에 데하여 한번 설명해 보도록 하겠습니다.What is Model Distillation (모델 증류)? 모델 증류는 딥러닝에서 큰 모델의 지식을 작은 모델로 전달하여, 작은 모델이 큰 모델의 성능을 최대한 모방하도록 하는 기법입니다.이 방법은 큰 모델(교사 모델, Teacher Model)이 복잡한 패턴과 지식을 이미 학습한 상태에서, 그 지식을 작은 모델(학생 모델, Student Model)에 전달하여 더 효율적인 모델을 만드는 것을 목표로 합니다. Model Distillation (모델 증류)의 필요성그러면 Model Distillation (모델 증류)가 필요한 이유는 무엇일까요?자원 효율성: 대형 모델은 높은 성능을 보이지만..

[DL] Model Distillation (모델 증류)

2024. 9. 18.

[DL] Finetuning (파인튜닝)

[DL] Finetuning (파인튜닝)

🖥️ Deep Learning

[DL] Finetuning (파인튜닝)

이번에는 Fine-Tuning (파인튜닝)에 데하여 한번 알아보겠습니다. 파인튜닝(Finetuning)은 딥러닝과 LLM 모두에서 널리 사용되는 방법론으로, 이미 사전 학습된 모델을 특정 작업에 맞게 추가 학습시키는 과정을 의미합니다. 파인튜닝은 기본적으로 동일한 원리를 공유합니다. Fine-Tuning? Fine-Tuning(파인튜닝)은 사전 학습(Pre-training)된 모델을 특정한 작업에 맞게 추가로 학습하는 과정입니다.사전 학습 단계에서는 모델이 일반적인 패턴을 학습하고, 파인튜닝 단계에서는 이 모델을 특정한 목적에 맞춰 최적화합니다.이미 사전 학습을 통해 학습된 모델의 일반적인 지식을 활용하여, 새로운 작업이나 데이터셋에 빠르게 적응하는 것이 목표입니다.Pre-Training vs Fine..

[DL] Finetuning (파인튜닝)

2024. 9. 18.

[LLM] Retrieve Augmented Generation (RAG)

2024. 9. 15.

[LLM] Retrieve Augmented Generation (RAG)