본문 바로가기

Upstage AI Lab 2기

(72)
Upstage AI Lab 2기 [Day015-022] EDA 조별 프로젝트 (데이터 개요) 데이터셋 : Diabetes Health Indicators Dataset 데이터 출처 : https://www.kaggle.com/datasets/alexteboul/diabetes-health-indicators-dataset/data 데이터셋 크기 : 총 229,474명에 대한 21개 feature (no diabetes : 194,377 / diabetes : 35,097) no diabetes diabetes total sample size 194,377 35,097 229,474 84.71% 15.29% 100% 21 features dependent variable 'Diabetes_binary' independent variables binary 'HighBP' 'HighChol' 'Cho..
Upstage AI Lab 2기 [Day015-022] EDA 조별 프로젝트 (1) 기초통계 2024년 1월 4일 (목) Day_017 혜윤 작업 1. histplot for BMI plt.figure(figsize=(8,6)) sns.histplot(data=df_diabetes_binary, x='BMI', bins=15) plt.title('BMI Distribution of All Subjects', pad=20) plt.show() plt.figure(figsize=(8,6)) sns.histplot(data=df_diabetes_binary, x='BMI', bins=15, hue='Diabetes_bin_cat') plt.title('BMI Distribution of Diabetic/Non-Diabetic', pad=20) plt.show() plt.figure(figsize=(8..
Upstage AI Lab 2기 [Day015-022] EDA 조별 프로젝트 Upstage AI Lab 2기 2024년 1월 2일 (화) Day_015 ~ 1월 11일 (목) Day_022 EDA 조별 프로젝트 1. 데이터셋 선정 https://www.kaggle.com/datasets/alexteboul/diabetes-health-indicators-dataset/data 더보기 - Diabetes_012 : 0 = no diabetes 1 = prediabetes 2 = diabetes - HighBP : 0 = no high BP 1 = high BP - HighChol : 0 = no high cholesterol 1 = high cholesterol - CholCheck : 0 = no cholesterol check in 5 years 1 = yes cholester..
Upstage AI Lab 2기 [Day014] (2) EDA 실습 Upstage AI Lab 2기 2023년 12월 29일 (금) Day_014 Day_014 실시간 강의 (오후) : EDA(Exploratory Data Analysis) (패스트캠퍼스 김용담 강사님) 0) import libraries 더보기 import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns 1) load data [데이터 링크] https://www.kaggle.com/c/instacart-market-basket-analysis/data path = r'./data/' aisles = pd.read_csv(path + 'aisles.csv') departments = pd.read_..
Upstage AI Lab 2기 [Day014] (1) Seaborn_기초 Upstage AI Lab 2기 2023년 12월 29일 (금) Day_014 Day_014 실시간 강의 (오전) : (패스트캠퍼스 김용담 강사님) 시각화를 편하게 쓸 수 있도록 만들어진 라이브러리 더보기 특징적인 플롯 jointplot - density와 scatterplot이 합쳐진 형태 pairplot - pairwise 교차해서 graph clustermap - 계층정보 같이 표시 업데이트 느리고 만들어진지 얼마 안 된 라이브러리 version up 되면 꼭 체크해야 될 것들이 있는 라이브러리임 (matplotlib은 자유도가 높은 대신 난이도도 높음 -> 고수는 ppt처럼 쓸 수도 있음) 주로 pairwise보다는 개별 feature 단위로 볼 일이 많음. 0) getting started wi..
Upstage AI Lab 2기 [Day012] (2) pandas_기초_1 Upstage AI Lab 2기 2023년 12월 27일 (수) Day_012 Day_012 실시간 강의 (오후) : (패스트캠퍼스 김용담 강사님) !pip install pandas == 1.5.3 import pandas as pd 1) Pandas DataFrame # df = pd.DataFrame(data = , # columns =, # index =) df.index df.columns df.values df['컬럼명'] 더보기 # 주의 : [ ] 안에는 컬럼명만 됨. index는 안 됨. # pandas 도 broadcasting 됨 df['X1']+2 df['X1']**2 2) DataFrame methods 기초 df.head() df.info() df.describe() df.sort..
Upstage AI Lab 2기 [Day012] (1) numpy_기초 Upstage AI Lab 2기 2023년 12월 27일 (수) Day_012 Day_012 실시간 강의 (오전) : (패스트캠퍼스 김용담 강사님) Intro) Why NumPy? 더보기 https://numpy.org/ numerical computing for Python 수많은 라이브러리들의 기초가 됨. eg. SciPy, scikit-learn, TensorFlow, PyTorch 등 python은 실수연산에 약함 AI 에서는 float 연산을 많이 하기 때문에 python만으로 연산시 numerical error가 굉장히 많이 뜸. ∴ Python에서 실수 연산을 할 수 있도록 C++로 만들어준 라이브러리 note. padas 1.x vs 2.x padas 1.x - numpy based pad..
Upstage AI Lab 2기 [Day010] (1) Flask 기초 Upstage AI Lab 2기 2023년 12월 22일 (금) Day_010 Day_010 실시간 강의 (오전) : 파이썬 AI/데이터분석 과정 (패스트캠퍼스 김인섭 강사님) cmd 창에서 >python app.py 로 실행 기본 format from flask import Flask, render_template, jsonify app = Flask(__name__) @app.route('/') #def function(): # return render_template('index.html', feeds=data['feeds']) if __name__ == '__main__': app.run(debug=True) from flask import Flask, render_template, jsonify..