A A
패스트캠퍼스 환급챌린지 34일차 : 10개 프로젝트로 한 번에 끝내는 MLOps 파이프라인 구현 초격차 패키지 Online 강의 후기
본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다. (https://fastcampus.info/4oKQD6b)

 

학습 후기

이번에는 머신러닝 상품화를 위한 클라우드 플팻폼 부분에서 MLops 구현을 도와주는 플랫폼들에 대해서 스터디를 해보았습니다. 머신러닝 모델의 전체 수명주기 (LifeCycle)을 효율적으로 관리하기 위해 사용되는 오픈소스 플랫폼인 MLflow의 4가지 기능들에 대해서 스터디를 해보았습니다.

 

먼저 MLflow Tracking. 이건 실행 중 발생하는 모든 메타데이터를 기록하는 블랙박스의 개념으로 생각했습니다. Learning Rate, Batch Size와 같은 모델의 설정값을 기록. 정확도, 손실 지표를 기록하는 Metric, 학습된 모델 파일, 데이터 스냅샷등 여러 저장소에 저장하는 아티펙트와 같은 기능들이 있다고 배웠습니다.

 

다음은 MLflow 프로젝트에 대해서 알게 되었는데 이건 코드와 개발&실행 환경을 패키징 하여, 누가 어디서 돌려도 똑같은 결과가 나오도록 재현성을 보장하는 역할을 한다고 배웠습니다. 그리고 학습된 모델을 다양한 환경, 예를 들어 Docker, Apache Spark, AWS SageMaker와 같이 여러 클라우드 플랫폼에 쉽게 배포할 수 있도록 표준화된 포맷으로 관리한다고 합니다. 그리고 마지막으로 모델의 버전을 관리하고, Staging(검증, 테스트) 환경을 거쳐 최종적으로 Production(운영) 환경으로 배포하도록 관리하는 MLflow Registry가 있다고 배웠습니다.

 

가장 신기했던건 과거에는 그냥 콘솔상에서 모델 돌리고 결과 나오면 끝이라고 생각했는데, 이렇게 모델을 관리하고 관리해준다는 개념이 매우 신기했습니다. 이전에는 이러한 도구를 전혀 알 지 못했는데, 이렇게 코드 한줄로 모든 모델의 히스토리, 상태를 그래프로 그려주고 관리를 할수 있다는 점을 알게 되었고 나중에 활용하여 이러한 히스토리를 토대로 모델 개발을 할 때 활용할 수 있다는 생각이 들었습니다.

 

1개 클립 수강 인증 사진 1장, 학습 인증샷 1장
오늘자 날짜 + 공부 시작, 종료 시각 인증 사진