A A
패스트캠퍼스 환급챌린지 22일차 : 10개 프로젝트로 한 번에 끝내는 MLOps 파이프라인 구현 초격차 패키지 Online 강의 후기
본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다. (https://fastcampus.info/4oKQD6b)

 

학습 후기

오늘은 Chapter Part.2 머신러닝 상품화 내용에서 머신러닝 상품화를 위한 인프라와 도구들들에 대해 공부한 내용들을 정리해보면서 실제 MLOps를 실현하기 위해서 필요한 하드웨어 및 소프트웨어 인프라의 구성요소를 보고 스터디를 진행하였습니다. 주로 우리가 MLOps를 실행하기 위해서 사용하는 크게 4가지 요소 스토리지, 컴퓨팅, 자원관리, 개발환경. 이렇게 4가지로 구성이 된다는걸 배웠고 데이터 저장, 모델 학습, 배포와 같이 여러 물리/논리적 기반을 제공한다는 사실을 깨달았습니다.

 

이제 하나하나 정리해보면 스토리지도 데이터의 형태에 따라 저장소가 나뉜다는걸 알았습니다. 이미지, 영상과 같은 비정형 데이터는 일반 Object Storage, 정형 데이터는 일반 DB에 저장합니다. 특히 이제 우리가 일반적으로 생각하는 머신러닝의 고유 개념인 변수 값을 저장하는 Feature Store를 생각해 볼수 있는데, 이건 전처리된 Feature를 재사용하고 중복 개발을 막는다고 합니다.

 

또한 이제 여러 연산 자원에 대해서 생각을 해볼수도 있었는데, 잘 아는 CPU, GPU로 분류가 된다고 하고, 병렬 연산에 주로 최적화가 된 GPU, TPU가 필수적 이라는것을 깨달았습니다. 또한 이제 우리가 인프라에서 환경을 관리하는 도구도 배웟는데, 실행에 필요한 모든 환경 설정을 컨테이너 라는 개념으로 패키징 하여 모든 환경에서도 똑같이 사용할 수 있게 적용합니다. 그리고 오케스트레이션이라는 개념도 공부했습니다. 

 

또한, 제일 신기했던 점은 옛날에는 환경의 불일치를 해결하는 기능, 도구가 없었는데 이제는 이러한 문제를 해결할 수 있다는 점이 신기했습니다. 단순히 코드를 공유하는것이 아니라, 코드가 실행되는 환경 자체를 실행할 수 있게 스크립트를 공유해서 실행한다는 개념이 매우 신기했고, 앞으로 나중에 똑똑한 개발자가 되기 위해서 잘 스터디를 하고, 활용을 해야 한다는 점을 깨달은 강의였습니다.

 

1개 클립 수강 인증 사진 1장, 학습 인증샷 1장
오늘자 날짜 + 공부 시작, 종료 시각 인증 사진