컴퓨터 비전 (7) 썸네일형 리스트형 [컴퓨터 비전] YOLO 1. 객체 탐지(Object Detection)컴퓨터 비전과 이미지 처리와 관련된 컴퓨터 기술로써, 디지털 이미지와 비디오로 특정한 계열의 시멘틱 객체 인스턴스를 감지하는 일보행자 검출, 동물 사물 검출 등이 포함 2. 컴퓨터 비전의 Task 비교Image classification: 이미지에 있는 객체 범주 목록 생성Single-Object Localization: 이미지에 있는 객체 범주의 한 인스턴스의 위치와 배율을 나타내는 Bounding Box를 생성Object Detection: 각 객체 범주의 모든 인스턴스의 위치와 배율을 나타내는 경계 상자와 함께 이미지에 있는 객체 목록을 생성 3. One-Stage 모델Resion Proposal과 Detection이 한 번에 수행YOLO(You Onl.. [컴퓨터 비전] VGG19을 활용한 균열 vs 정상 벽 분류하기 📌 VGG19(Visual Geometry Group 19)2014년 옥스포드 대학교 연구팀이 개발한 모델 중 하나로, 대회에서 높은 성능을 보여주며 유명해졌다.주로 이미지 분류, 물체 검출, 이미지 추출 등의 작업에 사용한다.19개의 층을 가지고 있어서 VGG19라고 부르며, 구조는 간단하지만 깊이가 깊어 이미지 분류 작업에서 우수한 성능을 발휘한다.총 16개의 컨볼루션 층이 있으며, 모든 컨볼루션 필터의 크기는 3*3이다.마지막에는 세 개의 FC 레이어가 있고, softmax 함수로 연결되어 1000개의 클래스를 예측한다. ✔️ VGG19에 대한 자세한 설명2024.09.03 - [컴퓨터 비전] - [컴퓨터 비전] VGG19을 활용한 산타클로스 vs 일반인 분류하기 [컴퓨터 비전] VGG19을 .. [컴퓨터 비전] ResNet, DenseNet, EfficientNet을 활용한 재활용품 이미지 분류하기 📌 resnet(Residual Network)논문 Deep Residual Learning for Image RecognitionDeeper neural networks are more difficult to train. We present a residual learning framework to ease the training of networks that are substantially deeper than those used previously. We explicitly reformulate the layers as learning residual functions witharxiv.orgResNet은 딥러닝에서 이미지 분류, 객체 탐지 등의 작업에서 뛰어난 성능을 보이는 신경망 아키텍처이다... [컴퓨터 비전] VGG19을 활용한 산타클로스 vs 일반인 분류하기 📌 VGG19딥러닝에서 널리 사용되는 컨볼루션 신경망(CNN) 아키텍처 중 하나로, 이미지 분류와 같은 컴퓨터 비전 작업에서 뛰어난 성능을 발휘하며, 대표적으로 ImageNet 대회에서 사용되어 높은 평가를 받았다.레이어 구성:VGG19는 총 19개의 가중치(weight) 레이어를 가지고 있으며, 여기에는 16개의 컨볼루션 레이어와 3개의 완전 연결(fully connected) 레이어가 포함된다. 이외에 활성화 함수(ReLU), 맥스풀링(Max Pooling), 소프트맥스(Softmax) 레이어가 포함된다.이 구조에서 숫자 19는 네트워크가 포함하는 가중치가 있는 레이어의 총 개수를 나타낸다.컨볼루션 레이어:VGG19는 매우 작은 3x3 크기의 컨볼루션 필터를 사용한다. 이러한 작은 필터는 깊은 구조.. [컴퓨터 비전] AlexNet을 활용한 안경착용 vs 안경미착용 분류하기 ✔️ AlexNet에 대한 자세한 설명2024.08.26 - [컴퓨터 비전] - [컴퓨터 비전] AlexNet을 활용한 깔끔한 방 vs 지저분한 방 분류하기 [컴퓨터 비전] AlexNet을 활용한 깔끔한 방 vs 지저분한 방 분류하기import os # 운영 체제와 상호작용하기 위함, 파일 경로나 폴더를 다룰 때 사용import glob # 특정 패턴에 맞는 파일 경로들을 찾기 위함import matplotlib.pyplot as plt # 데이터 시각화import torch # 텐서 연산 및michelle5054.tistory.com [컴퓨터 비전] AlexNet을 활용한 깔끔한 방 vs 지저분한 방 분류하기 import os # 운영 체제와 상호작용하기 위함, 파일 경로나 폴더를 다룰 때 사용import glob # 특정 패턴에 맞는 파일 경로들을 찾기 위함import matplotlib.pyplot as plt # 데이터 시각화import torch # 텐서 연산 및 신경망 구축을 위한 함수들 포함import torch.nn as nn # 신경망 모듈, 모델의 각 층을 정의할 때import torch.optim as optim # 최적화 알고리즘import torchvision.transforms as transforms # 이미지 데이터에 대한 전처리 및 변형import torchvision.models as models # 사전 학습된 모델 제공(VGG, Re.. 컴퓨터 비전 1. 컴퓨터 비전인공지능(AI)의 한 분야로, 컴퓨터와 시스템을 통해 디지털 이미지, 비디오 및 기타 시각적 입력에서 의미 있는 정보를 추출한 다음 이러한 정보를 바탕으로 작업을 실행하고 추천할 수 있게 함AI -> 생각컴퓨터 비전 -> 보기, 관찰 2. 컴퓨터 비전과 데이터셋컴퓨터 비전의 모델은 데이터의 모음(일반적으로 이미지, 비디오, 시각적 정보)을 학습데이터셋은 모델의 성능을 결정하는데 중요(양과 품질) -> 데이터셋의 크기는 모델이 학습 중에 본 예제의 수를 나타내기 때문데이터셋의 품질은 주석이 잘 못 지정되거나 레이블이 잘 못 저장된 경우 모델의 성능에 부정적 영향을 줄 수 있음다양한 객체 변형의 존재, 조명 조건, 배경 등을 포함한 데이터셋의 다양성도 모델의 견고성을 보장하는 데 중요한 역할.. 이전 1 다음