[딥러닝] Preprocess 준비IT/AI2022. 9. 14. 11:20
Table of Contents
반응형
로컬 데이터를 불러와 전처리시 필요한 내용입니다.
Load Packages
import os
from glob import glob
import numpy as np
import tensorflow as tf
from PIL import Image
import matplotlib.pyplot as plt
%matplotlib inline
# 현재 경로를 알려줍니다.
os.getcwd()
# 경로를 넣으면 경로의 파일명만 목록 형식으로 보여줍니다.
os.listdir()
os.listdir('dataset/mnist_png/training/')
# 경로가 포함된 모든 파일들을 목록 형식으로 보여줍니다.
# 원하는 포맷의 파일만을 가져올 수 있습니다.(png, txt 등)
glob('dataset/mnist_png/training/*.png')
데이터 분석
label_nums = os.listdir('dataset/mnist_png/training/')
> ['0', '1', '2', '3', '4', '5', '6', '7', '8', '9']
# Label 데이터 갯수 확인
len(label_nums)
> 10
데이터 별 갯수 비교
nums_dataset = []
for lbl_n in label_nums:
data_per_class = os.listdir('../dataset/mnist_png/training/' + lbl_n)
nums_dataset.append(len(data_per_class))
> [5923, 6742, 5958, 6131, 5842, 5421, 5918, 6265, 5851, 5949]
TensorFlow로 열기
gfile = tf.io.read_file(path)
image = tf.io.decode_image(gfile)
데이터 이미지 사이즈 알기
from tqdm import tqdm_notebook
heights = []
widths = []
for path in tqdm_notebook(data_paths):
image_pil = Image.open(path)
image = np.array(image_pil)
h, w = image.shape
heights.append(h)
widths.append(w)
반응형
'IT > AI' 카테고리의 다른 글
최고의 무료 AI 이미지 생성기 살펴보기 (0) | 2024.01.08 |
---|---|
생성형 AI(Generative AI)의 미래 (0) | 2024.01.02 |
[딥러닝] 교육자료 (0) | 2022.09.14 |
[PyTorch] Evaluating 및 Predicting (0) | 2022.09.13 |
[PyTorch] Optimizer 및 Training (0) | 2022.09.13 |
@고지니어스 :: 규니의 개발 블로그
IT 기술과 개발 내용을 포스팅하는 블로그
포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!