A A
패스트캠퍼스 환급챌린지 36일차 : 10개 프로젝트로 한 번에 끝내는 MLOps 파이프라인 구현 초격차 패키지 Online 강의 후기
본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다. (https://fastcampus.info/4oKQD6b)

 

이번에는 머신러닝 상품화를 위한 클라우드 플팻폼 부분에서 MLops 구현을 도와주는 플랫폼들중 하나인 AWS에서 제공하는 머신러닝 플랫폼인 SageMaker에 대해 주요 기능과 특징에 대해서 스터디를 했습니다. 앞서 kubeflow나 mlflow같이 이러한 오픈소스 플랫폼들은 직접 구축을 해야 하지만, SageMaker는 이미 구축이 되었기 때문에 내가 설정만 하면 돌아가는 구조입니다.

 

일반적으로 SageMaker는 머신러닝 모델의 빌드, 학습, 배포의 전 과정을 단일 환경에서 제공하는 AWS의 클라우드 서비스 입니다. 일단, 인프라 관리의 복잡한 부분을 제거하여, DS, DE 엔지니어가 모델링 자체에만 집중할 수 있게 한다고 합니다. 

 

먼저 머신러닝 개발을 위한 통합 개발 환경인 SageMaker Studio, 코드 작성, 실험 추적, 모델 시각화등 웹 브라우저에서 한번에 처리가 가능하다는 특징이 있습니다. SageMaker Pipeline은 데이터 전처리부터 모델 배포의 모든 과정인 워크플로우를 자동화 할 수 있고, 코드로도 정의 가능. 자동화 하는 Ci/CD 도구라고 합니다. 그리고 수많은 모델 실험의 파라미터와 결과를 자동으로 추적, 비교관리하는 SageMaker Experiments, 그리고 모델의 배포된 성능, 상태를 모니터링하여 데이터의 속성이 변하면 알림을 보내는 SageMaker Model Monitor도 있다고 합니다.

 

가장 흥미로운 점은 인프라가 아닌 데이터와 모델 품질에 집중할 수 있게 해주는 느낌이 들었습니다. 보통 kubeflow, mlflow는 일일이 설정, 설치, 관리를 해야했었는데 SageMaker는 이걸 AWS가 대신 관리를 해준다는 점이 매우 대조적이고 신기했습니다. 이제 실제 일일이 환경 구성이나 그런것에 대해 리소스가 많이 든다면 SageMaker를 활용해 보는것도 고려해 볼 수 있다고 생각했습니다. 

 

1개 클립 수강 인증 사진 1장, 학습 인증샷 1장
오늘자 날짜 + 공부 시작, 종료 시각 인증 사진