참고자료 ➡️ https://www.boostcourse.org/ai111/lecture/1108319
Key Components of Deep Learning
- The data that the model can learn from
- The model how to transform the data
- The loss function that quantifies the badness of the model
- The algorithm to adjust the parameters to minimize the loss
논문을 읽을 때 이 4가지에 주의해서 보면 조금 더 이해하기 쉬움!
Data
→ Data depend on the type of the problem to solve
- Classification
- Semantic Segmentation
- Detection
- Pose Estimation
- Visual QnA
Model
- AlexNet, GoogLeNet, Resnet, DenseNet, LSTM, Deep AutoEncoders, GAN 등
- 같은 데이터, Task라고 하더라도 모델의 성질에 따라서 결과가 달라질 수 있음
Loss
→ The loss function is a proxy of what we want to achieve
- 딥러닝 : 어떤 식으로든 뉴럴 네트워크 형태를 갖게 됨
- 여기서 중요한 점은 Loss function이라는 것은 우리가 이루고자 하는 것의 proxy(근사치)에 불과함
- 회귀 문제를 풀 때 데이터에 노이즈가 있으면
- 다른 사람들이 회귀문제를 풀 때 MSE 사용하고, 분류 문제를 풀 때 CrossEntropy를 사용한다고 해서 항상 이렇게 풀어야 하는 것은 아님
- 이걸 왜 사용하고, 이 Loss가 줄어드는 것이 우리가 진짜 풀고자 하는 문제를 어떻게 푸는지 이해하는 것이 필요
Optimize
- 최적화 : 데이터가 정해져 있고, 모델과 Loss Function이 정해져 있을 때 네트워크를 어떻게 줄일 것인지에 대한 개념
- 일반적으로 우리가 활용하는 것은 전부 First Order Method
- 뉴럴 네트워크의 파라미터를 Loss Function에 대해서 1차 미분한 정보를 활용할 것
- 1차 미분한 정보를 그냥 활용하는 게 SGD(=확률적 경사하강법)
- Loss Function을 단순히 줄이는 게 목적이 아니라 이 모델이 학습되지 않은 데이터에서 잘 동작하는 것이 목표
728x90
반응형
'딥러닝' 카테고리의 다른 글
U-Net과 Transformer 비교 + 관련 개념 정리 (0) | 2024.07.30 |
---|---|
Neural Networks - MLP (0) | 2024.07.28 |
딥러닝 Historical Review - 고려대학교 최성준 교수님 (0) | 2024.04.11 |
데이터의 분리(Splitting Data) (0) | 2024.04.09 |
판다스(Pandas), 넘파이(Numpy), 맷플롭립(Matplotlib) 간단 비교 (0) | 2024.04.09 |