본문 바로가기

Project/My Project

(2)
[데이콘] 모델 튜닝 챌린지 : RF 하이퍼파라미터 최적화 경진대회 프로젝트 소개데이콘 유저 데이터로 유저의 로그인 여부를 예측하는 프로젝트!이때 RandomForest 만으로 하이퍼 파라미터를 최적화시켜 성능을 높여야 하는 프로젝트 새로 배운 점하이퍼 파라미터 최적화 방법프로젝트 특성상 하이퍼 파라미터 최적화가 주가 되는 프로젝트였다.그동안은 그리드 서치만 알고 사용해왔는데,이번에 하이퍼 파라미터 최적화 방법에 대해 더 검색해보면서 AutoML을 새로 배우게 되었다! optuna, pycaret, h2o 등의 방법이 있는 것 같고어떤 블로거에 따르면 최근에는 optuna가 많이 쓰인다고 한다.  랜덤포레스트의 하이퍼 파라미터랜덤포레스트를 사용해본 적은 많지만 하이퍼 파라미터에 대해 열심히 살펴본 적은 처음이다어떤 하이퍼 파라미터가 있는지, 어떤 의미인지 다시 한번 공부..
로드킬 예방을 위한 생태통로 설치 및 수정 제안 첫 팀 프로젝트를 진행해봤다! 프로젝트 소개 로드킬 데이터, 생태통로 데이터, 도로 데이터, 종 분포 데이터를 활용하여 생태통로가 없어서 로드킬이 발생하는 곳과 생태통로가 있지만 로드킬이 발생하는 곳을 찾아내 생태통로 추가 설치 및 수정을 제안하는 프로젝트. 새로 배운 점 1. 지리 데이터 분석 주제 특성 상, 그리고 팀원 분이 지리 데이터 전공이셔서 처음으로 지리 데이터를 다뤄보게 되었다. 인터넷에 지리 데이터에 대한 정보가 적어 시간이 많이 걸렸지만 결국에는 성공! - 지역을 그리드 단위로 나누어 분석하기 - moran I, 자기상관분석으로 핫플레이스와 로우플레이스 찾기 위의 과정을 해보면서 지리 데이터 분석과 시각화가 데이터 분석에 있어 유용하겠다고 생각했다. 2. DBSCAN 밀도 기반 클러스터링..