My Dev & Engineering Repository

⚠️ 본 내용은 PyTorch Korea의 공식 문서에 기반하여 공부한 내용을 적은것이니 양해바랍니다!

변형(Transform)

파이토치(PyTorch) 기본 익히기|| 빠른 시작|| 텐서(Tensor)|| Dataset과 Dataloader|| 변형(Transform)|| 신경망 모델 구성하기|| Autograd|| 최적화(Optimization)|| 모델 저장하고 불러오기 데이터가 항상 머신러닝 알

tutorials.pytorch.kr

Transform (변형)

데이터 변형(Transform)은 데이터 전처리 및 데이터 증강(data augmentation)을 위해 자주 사용됩니다.

데이터가 항상 머신러닝 알고리즘 학습에 필요한 최종 처리가 된 형태로 제공되지는 않습니다.
변형(transform) 을 해서 데이터를 조작하고 학습에 적합하게 만듭니다.
모든 TorchVision 데이터셋들은 변형 로직을 갖는, 호출 가능한 객체(callable)를 받는 매개변수 두개 (특징(feature)을 변경하기 위한 transform 과 정답(label)을 변경하기 위한 target_transform)를 갖습니다.
torchvision.transforms 모듈은 이미지 데이터에 대한 다양한 변형 기능을 제공합니다.

Transforming and augmenting images — Torchvision 0.19 documentation

Shortcuts

pytorch.org

변형은 이미지 데이터를 텐서로 변환하거나, 정규화하거나, 회전, 자르기 등의 작업을 수행할 수 있습니다.
이러한 변형은 데이터셋을 로드할 때 적용할 수 있습니다.

Example (Fashion-MNIST)

FashionMNIST 특징(feature)은 PIL Image 형식이며, 정답(label)은 정수(integer)입니다.
학습을 하려면 정규화(normalize)된 텐서 형태의 특징(feature)과 원-핫(one-hot)으로 부호화(encode)된 텐서 형태의 정답(label)이 필요합니다.
이러한 변형(transformation)을 하기 위해 ToTensor와 Lambda를 사용합니다.
잠깐 Fashing-MNIST 데이터셋에 데하여 설명을 해보면, 60,000개의 학습 이미지와 10,000개의 테스트 이미지로 구성되어 있습니다.
각 이미지는 28x28 크기의 흑백(grayscale) 이미지이며, 10개의 클래스로 분류됩니다.

import torch
from torchvision import datasets
from torchvision.transforms import ToTensor, Lambda

# FashionMNIST 데이터셋 불러오기
ds = datasets.FashionMNIST(
    root="data",  # 데이터셋이 저장될 경로
    train=True,  # 학습용 데이터셋을 불러옵니다 (train=False로 설정하면 테스트 데이터셋을 불러옵니다)
    download=True,  # 경로에 데이터셋이 없을 경우 인터넷에서 다운로드합니다
    transform=ToTensor(),  # 이미지를 텐서로 변환합니다
    target_transform=Lambda(lambda y: torch.zeros(10, dtype=torch.float).scatter_(0, torch.tensor(y), value=1))  # 레이블을 원-핫 인코딩으로 변환합니다
)

FashionMNIST 데이터셋을 불러와서 이미지를 텐서로 변환하고, 레이블을 원-핫 인코딩으로 변환하여 데이터셋을 준비합니다.
이 데이터셋은 이후 모델 학습에 사용될 수 있습니다.
DataLoader를 통해 배치 단위로 데이터를 불러올 수 있으며, 변형된 이미지와 레이블을 모델에 전달할 수 있습니다.

ToTensor()

ToTensor는 PIL Image나 NumPy ndarray 를 FloatTensor로 변환하고, 이미지의 픽셀의 크기(intensity) 값을 [0., 1.] 범위로 비례하여 조정(scale)합니다.
그후, (H, W) 형식의 이미지를 (C, H, W) 형식으로 변환합니다.

여기서 C, H, W는 각각 채널(Channel), 높이(Height), 너비(Width)를 나타냅니다.

Lambda 변형 (Transform)

Lambda 변형은 사용자 정의 람다(lambda) 함수를 적용합니다. 여기에서는 정수를 원-핫으로 부호화된 텐서로 바꾸는 함수를 정의합니다.
이 함수는 먼저 (데이터셋 정답의 개수인) 크기 10짜리 영 텐서(zero tensor)를 만들고, scatter 를 호출하여 주어진 정답 y 에 해당하는 인덱스에 value=1 을 할당합니다.

torch.Tensor.scatter_ — PyTorch 2.4 documentation

Shortcuts

pytorch.org

target_transform = Lambda(lambda y: torch.zeros(
    10, dtype=torch.float).scatter_(dim=0, index=torch.tensor(y), value=1))

이 변형은 레이블을 원-핫 인코딩 벡터로 변환합니다.
원-핫 인코딩은 클래스 레이블을 이진 벡터로 변환하여, 해당 클래스에만 1을 할당하고 나머지 클래스에는 0을 할당하는 방법입니다.

예를 들어, 원본 레이블이 3일 경우, 변환된 원-핫 인코딩 벡터는 다음과 같습니다:
원본 레이블: 3원-핫 인코딩 벡터: [0, 0, 0, 1, 0, 0, 0, 0, 0, 0]

One-Hot Encoding 변환 과정

Lambda(lambda y: torch.zeros(10, dtype=torch.float).scatter_(0, torch.tensor(y), value=1))

torch.zeros(10, dtype=torch.float): 길이가 10인 0으로 채워진 텐서를 생성합니다.
이는 10개의 클래스 각각에 대해 하나의 원-핫 인코딩 벡터를 나타냅니다.
scatter_(0, torch.tensor(y), value=1): 인덱스 y에 해당하는 위치에 1을 설정합니다.
y는 원본 레이블이며, 이는 0부터 9까지의 값을 가집니다.

더 자세한 내용을 보고 싶으시면 아래 링크에 들어가서 공식 문서를 참고하세요!

torchvision.transforms 관련 PyTorch 공식 문서

Transforming and augmenting images — Torchvision 0.19 documentation

Shortcuts

pytorch.org

저작자표시 비영리 동일조건 (새창열림)

'🔥 PyTorch' 카테고리의 다른 글

[PyTorch] 모델 매개변수 최적화(Optimization) 하기 (0)	2024.07.30
[PyTorch] Torch.Autograd를 이용한 자동 미분 (0)	2024.07.30
[PyTorch] Neural Network Model (신경망 모델) 구성하기 (0)	2024.07.26
[PyTorch] Dataset & DataLoader with CIFAR-10 (0)	2024.07.26
[PyTorch] PyTorch Intro & Tensor (텐서) (0)	2024.07.26

Notice

Transform (변형)

Example (Fashion-MNIST)

ToTensor()

Lambda 변형 (Transform)

One-Hot Encoding 변환 과정

'🔥 PyTorch' 카테고리의 다른 글

티스토리툴바

SUBSCRIBE

Notice

Transform (변형)

Example (Fashion-MNIST)

ToTensor()

Lambda 변형 (Transform)

One-Hot Encoding 변환 과정

'🔥 PyTorch' 카테고리의 다른 글

티스토리툴바