전체 글 (108) 썸네일형 리스트형 Upstage AI Lab 2기 [Day026] 실시간 강의 - 통계 (1) 통계 톺아보기 Upstage AI Lab 2기 2024년 1월 17일 (수) Day_026 Day_026 실시간 강의(1) : ML vs. Stats Part1. 통계 톺아보기 (안창배 강사님) 통계학이 발달한 시점을 보면 19세기 말 ~ 20세기 초 -> 지금과 차이가 큼 (그 당시에는 분포표도 특허가 있었다?!) 왜도, 첨도 배우는 것도 이 시점부터 이어진 것, 오늘날은 왜도 첨도 계산해서 쓰는 일 잘 없음. 적률법 (Method of moments) 1차 평균, 2차 분산, 3차 왜도, 4차 첨도 (??? 자세한건 나중에 공부하기) In statistics, the method of moments is a method of estimation of population parameters. The same prin.. Upstage AI Lab 2기 [Day026] 온라인 강의 - 기초통계 (2) Upstage AI Lab 2기 2024년 1월 17일 (수) Day_026 Day_026 온라인 강의 : 기초통계 더보기 나의 커리어 치트키 데이터 분석 유치원 Part.3 통계로 데이터 분석 능숙해지기 Chapter.04 통계 실험과 유의성검정 CH04_01. 가설검정(1) - 가설검정이란 P값이란 0:08:46 01/17 (Wed) 1:19:02 CH04_02. 가설검정(2) - 단측검정 양측검정 0:06:00 CH04_03. 가설검정(3) - 검정에서 조심해야 할 두 가지 실수 0:07:05 CH04_04. t 검정 0:04:18 CH04_05. Project1 - 실제 데이터로 가설 설정, 검정 수행, 결과 해석하기 0:16:03 CH04_06.분산분석 0:08:31 CH04_07.실제 데이터로.. Upstage AI Lab 2기 [Day024] git-협업 Upstage AI Lab 2기 2024년 1월 15일 (월) Day_024 Day_024 실시간 강의 : git (패스트캠퍼스 최우영 강사님) 1. Create New repo 'branch-practice' (README.md, MIT) 1-1. .gitignore(OS, python, vim) (https://www.toptal.com/developers/gitignore/) 2. clone repo (~/Documents/dev/) 3. Create new file 'main.py' 4. add, commit, push $ git clone (githuburl) hyj89@BOOK-UMAV30Q2HQ MINGW64 ~/Documents/dev $ git clone https://github.com.. Upstage AI Lab 2기 [Day015-022] EDA 조별 프로젝트 (5) 설명변수 조합 f1-score 문제 때문에 binary 5050 로 실험 no diabetes diabetes total sample size 33960 35097 69,057 49.18% 50.82% 100% 1. 전처리 : 'MentHlth', 'PhysHlth' 데이터 유효하지 않아 제거 BMI categorize (① 'obese', 'overweight', 'healthy', 'underweight' / ② 'obese'&'overweight', 'healthy'&'underweight' / ③ 'obese', 'not obese') scaling : StandardScaler - 'Age', 'GenHlth' MinMaxScale - 'Education', 'Income' 더보기 obese_order_lis.. Upstage AI Lab 2기 [Day015-022] EDA 조별 프로젝트 (4) 가설 설정 기초 통계량을 바탕으로 두가지 방향의 가설설정이 가능함 1. 당뇨병 예측에 필요한 변수는 [ ], [ ], [ ] 일 것이다. 2. 당뇨병 설문을 위해 [ ], [ ], [ ] 변수는 [ ] 변수만으로 충분히 설명된다. 단일 변수 검증 dependent : 'Diabetes_binary' chi-squared(categorical independent variable) : 'Diabetes_binary'와의 correlation chi-squared test p-value binary 'HighBP' 0.254318 0.0 'HighChol' 0.194944 0.0 'CholCheck' 0.072523 0.0 'Smoker' 0.045504 0.0 'Stroke' 0.099193 0.0 'HeartDis.. 통계학 복습 KDC 머신러닝&AI 첫걸음 시작하기 (2022년 1월 5일~2022년2월 10일) 자료의 종류 수치형 자료 (양적 자료) : 연속형 / 이산형 범주형 자료 (질적 자료) : 순위형 / 명목형 Independent Variable Categorical Continuous Dependent Variable Categorical (or Binary) Categorical Data Analysis (Chi-Squared) Logistic Regression Continuous ANOVA Regression 표본집단의 평균 {bar{x}} / 분산 s 2 공분산 : 두 확률변수 X, Y의 (선형적) 상호관계 X, Y 독립 -> cov(X, Y) = 0 상관계수 (공분산을 단위화) 주의 : 공분산 또는 상관계수가.. [패스트캠퍼스 Upstage AI Lab 2기 부트캠프] #01_미니 프로젝트 (1) 크롤링 실습 #00_1개월차후기 '네? 방금 뭐가 지나간거죠?' 하는 마음으로 쏜살같이 흘러가버린 4주였다. 부트캠프를 지원하기 직전까지 자료구조를 공부한다고 (python도 제대로 못 쓰면서) java를 공부하고 있었다. 부트캠프 지원시 코딩테스트를 봐야한대서 부랴부랴 java랑 python을 왔다갔다 하면서 공부를 했는데 될 턱이 있나. 동시에 프랑스어와 스페인어 처음 배우면서 DELE를 준비해야하는 상황같았다. 부트캠프 시작 직전까지도 전공 관련 원고작성 의뢰랑 번역업무를 처리하다 보니 아직 python을 위한 뇌가 활성화가 되지 않은 채 부트캠프를 시작해버렸다. numpy 명령어였는지, pandas 명령어였는지 헷갈려 죽겠는 와중에 java의 여파로 줄마다 ;를 찍는 습관이 남은 채 그렇게 정신없이 2주가 지.. Upstage AI Lab 2기 [Day015-022] EDA 조별 프로젝트 (데이터 개요) 데이터셋 : Diabetes Health Indicators Dataset 데이터 출처 : https://www.kaggle.com/datasets/alexteboul/diabetes-health-indicators-dataset/data 데이터셋 크기 : 총 229,474명에 대한 21개 feature (no diabetes : 194,377 / diabetes : 35,097) no diabetes diabetes total sample size 194,377 35,097 229,474 84.71% 15.29% 100% 21 features dependent variable 'Diabetes_binary' independent variables binary 'HighBP' 'HighChol' 'Cho.. 이전 1 ··· 7 8 9 10 11 12 13 14 다음