본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다. (https://fastcampus.info/4oKQD6b)
이번에는 구글의 클라우드 기반 머신러닝 플랫폼인 GCP AI Platform, 현재는 Vertex AI의 주요 기능과 특징에 대해 스터디를 해보았습니다. 통합 AI 플랫폼의 구조이면서 개발부터 배포까지 4단계를 핵심 컴포넌트로 지원합니다. 하나하나 정리해 보겠습니다.
먼저 AI 노트북 & Training 기능은 주피터 노트북 환경을 클라우드 환경 내에서 바로 실행해서 코드를 작성하고, 고성능 컴퓨팅 자원을 사용할수 있어 실험을 할 수 있다는 것이 특징입니다. 그리고 Prediction Service는 훈련된 모델을 클라우드상에 배포하여 대규모 트래픽을 처리할수 있는 기능이라고 합니다. 또한 kubeflow pipeline을 안에서도 돌릴수 있다고 하며, 데이터 전처리-학습-배포의 워크플로우를 자동화 할 수 있다는 내용도 알게 되었습니다.
그리고 제일 신기했던게 머신러닝 모델이 왜 이런 결과를 냈는지를 설명해주는 Explainable AI 기능도 있다고 해서 매우 신기했습니다. 처음보는 기능이였습니다. 그리고 다른 것과 차별화된 기능들이 있는데, 별도의 파이썬 코드 없이 SQL 쿼리 만으로 머신러닝 모델을 만들고 예측할수 있어 데이터 접근성을 획기적으로 높일수 있는 BigqueryML, 그리고 Feature를 중앙 저장소에 저장할수 있으며, 학습-서빙간 데이터가 불일치 할 수 이는 문제들을 해결할 수 있습니다. 또한 마지막으로 GKE, 구글 쿠버네티스 엔진을 기반으로 자원관리하여, 필요에 따라 GPU등을 오토스케일링하여 비용 관리도 할 수 있습니다.
신기했던건 이제 보통 AI 모델 안은 블랙박스라 자세히 파악할 수 없는데, 이렇게 클라우드 플랫폼상에서 관리를 하는 느낌으로 활용을 하여 직접 모델을 구축 안하고, 여러가지 정보, 데이터, 정확도등을 확인할 수 있어 매우 유용하고, 회사에서 마이그레이션할떄 잘 사용해 봐야 겠다는 생각이 들었습니다.



