A A
패스트캠퍼스 환급챌린지 35일차 : 10개 프로젝트로 한 번에 끝내는 MLOps 파이프라인 구현 초격차 패키지 Online 강의 후기
본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다. (https://fastcampus.info/4oKQD6b)

 

이번에는 머신러닝 상품화를 위한 클라우드 플팻폼 부분에서 MLops 구현을 도와주는 플랫폼들중 하나인 오픈소스 플랫폼 kubeflow에 대해 주요 기능과 특징에 대해서 스터디를 했습니다.

 

일단 kubeflow는 복잡한 머신러닝 시스템을 컨테이너 기반으로 구축하여 확장성, 이식성, 안정성을 보장하는 End to End MLOps 플랫폼 입니다. 그리고 머신러닝의 빌드-배포-관리 과정을 마이크로서비스 아키텍처 처럼 운영하여 어디서는 동일하게 실행되도록 합니다. 그리고 이제 주요한 구성 요소들이 있는데 먼저 데이터 전처리, 학습, 평가, 배포등 각 단계를 그래프 형태로 연결하여 저동화하는 kubeflow pipeline이 있다고 합니다. 

 

그리고 이제 학습된 모데을 실제 서비스로 배포하는 kubeflow serving으로 트래픽이 없으면 0으로 줄이고, 트래픽이 폭주하면 자동으로 확장합니다. 또한 이제 배포전략인 Canary 배포나 A/B 테스트 같은 고급 트래픽 관리 기능을 제공한다고 합니다. 그리고 이번에 처음으로 알게된 하이퍼퍼라미터 튜닝과 신경망 구조 탐색을 자동화 하는 도구인 카티브라는 것도 있다고 합니다. 이건 이제 회적의 파라미터를 찾기 위한 Grid Search나 Random Search와 같은 구조라고 합니다. 

 

또한 이제 학습에 사용한 데이터셋, 모델, 실행 학습 기록등 여러 메타데이터를 추적하여 누가, 언제, 무엇을, 어떻게 만들었는지를 관리하는 메타데이터 스토어도 있습니다. 그리고 이제 DS에서 쿠버네티스 클러스터 자원을 할당받아 개발하는 juypter notebook integration 기능도 제공하는걸 알았습니다. 이렇게 직접 나중에 이러한 시스템을 구축해보고 개발팀에 할당해서 업무를 하면 매우 좋을거 같고, 유용할거 같다는 느낌이 들었습니다.

 

1개 클립 수강 인증 사진 1장, 학습 인증샷 1장
오늘자 날짜 + 공부 시작, 종료 시각 인증 사진