본문 바로가기

Study

(12)
2장. 머신러닝 프로젝트 처음부터 끝까지(2) 이전 project 과정 2장. 머신러닝 프로젝트 처음부터 끝까지(1) Project 진행 과정을 익힐 때는 실제 data를 사용하여 익히는 것이 좋다. 실제 data를 구하기 좋은 사이트 유명한 공개 데이터 저장소 US lrvine 머신러닝 저장소(http://archive.ics.uci.edu/ml/) Kaggle datasets(http leehyeeee.tistory.com 4. 데이터 준비 데이터 준비를 수동이 아니라 함수를 만들어 자동화하는 이유 데이터 변환이 쉽고 어떤 조합이 좋은지 확인하는데 편리합니다. 변환 라이브러리를 점차 구축하게 됨 새 데이터 주입 전에 함수 사용 가능 housing = strat_train_set.drop("median_house_value", axis=1) hou..
2장. 머신러닝 프로젝트 처음부터 끝까지(1) Project 진행 과정을 익힐 때는 실제 data를 사용하여 익히는 것이 좋다. 실제 data를 구하기 좋은 사이트 유명한 공개 데이터 저장소 US lrvine 머신러닝 저장소(http://archive.ics.uci.edu/ml/) Kaggle datasets(http://www.kaggle.com/datasets) Amazon AWS datasets(http://aws.amazon.com/ko/datasets) 메타 포털(공개 데이터 저장소가 나열되어 있습니다) http://dataportals.org/ http://opendatamonitor.eu/ http://quandl.com 인기 있는 공개 데이터 저장소가 나열되어 있는 다른 페이지 위키백과 머신러닝 데이터셋 목록(https://goo.gl..
통계적 학습 📌 통계적 학습 (Statistical learning) 통계적 학습은 통계와 함수적 분석으로부터 그려진 머신러닝을 위한 뼈대로서, 데이터에 기반을 둔 예측 가능한 함수를 찾는 문제를 다룹니다. 본격적인 내용에 앞서 변수와 f 추정에 대한 기본적인 내용입니다. X는 예측변수, 독립변수, 변수(predictors, independent variables, variables) 등의 이름으로 불리고, Y는 반응변수, 종속변수(response or dependent variable) 등으로 불립니다. X : n×p matrix, xij : the value of the jth variable for the ith observation 우리는 반응변수 Y 와 p개의 예측변수, X1, X2, … , Xp를 관찰합니..
1장. 한 눈에 보는 머신러닝 핸즈온 머신러닝의 첫 챕터에서는 머신러닝이 무엇인지 살펴본 뒤, 머신러닝 시스템의 종류와 머신러닝 과정에서 주의해야할 점들을 알려줍니다! 지도학습, 비지도 학습의 구분과 과대적합, 과소적합, 이상치 등의 주의점들을 알아가는 것이 중요하겠습니다! 📌 머신러닝(Machine Learning) 💡 the science of programming computers so they can learn from data. 💡 field of study that gives computers the ability to learn without being explicitly programmed. ex) OCR, spam filter 왜 머신러닝을 사용할까? 머신러닝은 전통 프로그래밍과 비교해 다음과 많은 이점들이 있는데요...