Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- Brightics 서포터즈
- 브라이틱스 스태킹
- Random Forest
- 비전공자를 위한 데이터 분석
- 브라이틱스 AI
- 데이터 분석
- 삼성 SDS
- 파이썬 SQL 연동
- 파이썬 내장 그래프
- michigan university deep learning for computer vision
- Deep Learning for Computer Vision
- Python
- 범주형 변수 처리
- 브라이틱스 프로젝트
- 삼성 SDS 서포터즈
- 분석 툴
- Brightics studio
- 브라이틱스 분석
- pymysql
- Brightics AI
- 서포터즈 촬영
- Brigthics Studio
- Activation Function
- Brightics EDA
- 딥러닝
- 데이터 분석 플랫폼
- 머신러닝
- paper review
- 브라이틱스 서포터즈
- 검증 평가 지표
Archives
- Today
- Total
목록NONE 범주 (1)
하마가 분석하마

범주형 변수를 다룰 때 고려해야 할 것 중 하나는 새로운 혹은 희귀한 범주이다. 이러한 범주는 학습 데이터에는 나타나지 않고 평가 데이터에서 새로 나타날 수 있다. 이 경우 평가 시에 모델이 오류를 발생할 것이다. 이를 방지하기 위해 새로운 범주를 추가할 수 있다. 이 새로운 범주를 '희귀(rare) 범주'라고 한다. 희귀 범주는 자주 나타나지 않고, 여러 범주를 포함할 수 있다. 학습 데이터에 없었던 새로운 범주가 나타났을 때 처리하는 다른 방법은 nearest neighbor 모델을 사용하여 기존 범주 중 가장 비슷한 범주를 예측하는 것이다. 이 경우, 새로운 범주가 기존 범주 중 하나의 값으로 대체된다. 앞선 파트의 결측치 대체 부분에서 필자의 경험을 서술해 놓았다. 새로운 범주를 다룰 때 이러한 ..
Machine learning class
2021. 3. 1. 21:14