Develop
  • VLM (Vision Language Model)을 공부하던중 PLLaVA 논문을 읽은후 정리한 내용을 공유합니다.Paper Link PLLaVA : Parameter-free LLaVA Extension from Images to Videos for Video Dense CaptioningVision-language pre-training has significantly elevated performance across a wide range of image-language applications. Yet, the pre-training process for video-related tasks demands exceptionally large computational and data resources,..

    Read more
  • Q. VLM을 적용해서 발표자의 행동을 탐지 & 분석 → Prompt로 특징이 나오려면?1. VLM으로 Object Detection을 한 사레를 알아야 한다.2. VLM으로 최대 몇분까지의 영상 분석이 가능한가? (max 1시간)3. 사용할수 있는 모델이 있는가? Fine-tuning및 모델 사용법은?VLM (Vision Language Model)을 공부하던중 Video-LLaMA 논문을 읽어서 정리한 내용을 공유합니다. Paper Link Video-LLaMA: An Instruction-tuned Audio-Visual Language Model for Video UnderstandingWe present Video-LLaMA a multi-modal framework that empowers L..

    Read more
  • Pitching Project를 PM & AI Tech 담당자로 개발한지 몇달이 지났지만, 다시 한번 정리하는 개념으로 어떠한 내용을 개발했는지 올려보려고 합니다.Pitching Github Organization Pitching-kakaotechPitching은 "모두가 편하게 소통하고, 자신있게 말하며 연결된 세상을 만들자." 라는 생각으로 탄생한 플랫폼입니다. - Pitching-kakaotechgithub.com 팀에서 AI기술을 활용한 실시간 발표 피드백 기능을 제공하는 프로덕트를 만들어보자고 아이디어가 나와서 개발을 할때,주제와 MVP & 요구사항 명세서(SRS)를 정의한후, 내용을 한번 정리해 보았습니다.기능 우선순위 설정: 우선순위는 "P0", "P1", "P2"으로 구분되며, 사용자 ..

    Read more
  • 요즘 프로젝트를 하면서 FastAPI Router를 개발하면서 생긴 Trouble Shooting에 데하여 한번 적어보려고 합니다.FastAPI와 Swagger를 사용하여 VLM 영상 처리 서버를 개발하고, 이를 AWS EC2에 배포하여 Docker 이미지로 빌드하고 컨테이너를 실행했습니다. 서버 자체는 정상적으로 작동했지만, 프론트엔드와 연동했을 때 예상치 못한 CORS(Cross-Origin Resource Sharing) 에러를 마주하게 되었습니다. 이 글에서는 CORS 에러가 발생한 원인과 이를 어떻게 해결했는지, 그리고 운영 환경에서의 보안 고려 사항에 대해 자세히 다뤄보겠습니다.브라우저에서의 CORS 에러프론트엔드 애플리케이션을 연결하면서, http://localhost:5173에서 FastA..

    Read more