본문 바로가기

분류 전체보기

(108)
[패스트캠퍼스 Upstage AI Lab 2기 부트캠프] #08_미니 프로젝트 - Upstage 경진대회 #2 # 01. 프로젝트 소개 : Document Type ClassificationTask : ClassificationEvaluation Metric : Macro F1 score 프로젝트 기간 : April 11th, 2024 - April 23rd, 2024 (19:00) Given Dataset : 17 classes of document imagesTrain Data : 1570Test Data : 3140  # 02. Project Process  # 03. EDAAnalysis on label distribution of train dataAnalysis on size/hue distribution of train and test dataAnalysi..
Hydra Hydra의 필요성 파라미터가 너무 많아지면서 코드 내부에 직접 작성하는 것이 불편하게 됨 -> Hydra는 파라미터 관리를 위해 별도의 yaml(yet another markup language) 파일로 관리 yaml 포맷은 key-value 구성, 들여쓰기 두 칸으로 구조 구분 OmegaConf 를 발전시킨 것이라 변수 접근, 변수 참조 등의 기능을 사용할 수 있음 (${variable}) Hydra 만의 특징 yaml 파일을 수정하지 않고 config 값을 터미널에서 추가 및 변경 가능 여러 설정 파일들을 하나의 설정 파일처럼 유기적 구성 가능 서로 다른 설정 파일 실험 조합 가능 Hydra를 위한 yaml 작성 들여쓰기 2칸 key : value 형식 list는 - 로 나열 # 주석 true, T..
Pytorch Lightning PyTorch에 대한 high-level 인터페이스 코드 템플릿으로써 기능 -> 더 간결, 정돈 코드 추상화 및 하드웨어 호출 자동화 기존의 PyTorch에서는 model, optimizer, training loop 등을 전부 따로 구현해야 했지만 lightning module 안에 한꺼번에 구현되어 있음. .to(device) 안 해도 됨 (자동으로 하드웨어 호출) 다양한 콜백 함수와 로깅 early stopping 등의 콜백 함수 로깅 -> tensorboard, wandb 등과 연동 가능 16-bit precision - 계산속도 향상, 메모리 사용량 감소 quantization - 너무 큰 모델의 경우 모두 로드해서 쓰기 어렵기 때문에 모델 크기를 줄여서 GPU에 올려줌 Lightning Mod..
[패스트캠퍼스 Upstage AI Lab 2기 부트캠프] #06_미니 프로젝트 - Upstage 경진대회 #1 Upstage AI Lab은 크게 두 단계로 나뉘는데, 초반은 패스트캠퍼스 과정, 두번째는 Upstage 과정이다.2월 27일부터 시작된 Upstage 과정은 ML Advanced, Image Classification, NLP, 그리고 선택주제로 진행되는 AI실전대회까지 총 4번의 경진대회를 진행하게 된다.그 중 첫번째인 ML Advanced 경진대회가 진행되었다. # 01. 프로젝트 소개 : House Price Prediction Task : 서울시 아파트 실거래가 예측 (Regression) Evaluation Metric : RMSE (Root Mean Squared Error) 프로젝트 기간 : 2024년 3월 20일 (10am) - 2024년 4월 2일 (1pm)  Given Dataset ..
Upstage AI Lab 2기 [Day078] - [Day080] Computer Vision Basic Upstage AI Lab 2기 2024년 4월 3일 (수) Day_078 - 2024년 4월 5일 (금) Day_080 컴퓨터 비전이란? Images are fundamentally tensor 컴퓨터가 이해할 수 있는 형태로 데이터화 된 이미지 CV 는 input 이 이미지, CG는 output이 이미지 (점점 교집합이 넓어지고는 있음) Low-level (pixelwise) → Mid-level → High-level (이미지 전반) Low-level : 바로 인접한 픽셀들만 고려 (혹은 아예 고려하지 않기도 e.g. Color Jitter) Image Processing : Resize, Color Jitter Feature Extraction : Edge Detection : 급격한 픽셀값의 변..
Upstage AI Lab 2기 선형대수 스터디 #04-3 (2024_03_24) Study 교재 : http://www.boostcourse.org/ai251 eigenvalue decomposition & singular value decomposition 요약
Upstage AI Lab 2기 선형대수 스터디 #04-2 (2024_03_24) Study 교재 : http://www.boostcourse.org/ai251 CH5. 특이값 분해 part1. part 2. part3.
Upstage AI Lab 2기 [Day069] ML Advanced - CH04 ML 기본모델 ~ CH05 ML 심화모델 Upstage AI Lab 2기 2024년 3월 19일 (목) Day_069 오늘의 todo [ ] 파생변수 선택 (실습) 마무리 [ ] 파생변수 선택 (이론) 정리 [o] 머신러닝 기본 모델 (이론) [o] 머신러닝 심화 모델 (이론) CH04. ML 기본모델(이론) - Linear regression, KNN, Decision Tree, Random Forest 선택하는 모델에 따라 전처리가 달라질 수도 있고, 학습 및 평가의 결과에 따라 모델이 달라질 수 있음. 이런 것들을 고려하여 모델을 선택하는 것이 중요 목적 - 분류 or 회귀 선형모델 / 비선형모델(트리모델, KNN 등) 선형회귀 Linear regression 해석력 - 금융 등 해석력이 중요한 분야들이 있음 - 선형회귀를 이용해 분석하는..