일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 브라이틱스 스태킹
- 브라이틱스 서포터즈
- 브라이틱스 분석
- 파이썬 내장 그래프
- Random Forest
- paper review
- michigan university deep learning for computer vision
- Python
- Brightics AI
- 검증 평가 지표
- Brigthics Studio
- 머신러닝
- Activation Function
- 삼성 SDS
- 파이썬 SQL 연동
- 딥러닝
- 데이터 분석
- 분석 툴
- 데이터 분석 플랫폼
- 브라이틱스 AI
- Brightics 서포터즈
- 브라이틱스 프로젝트
- 서포터즈 촬영
- Brightics EDA
- 삼성 SDS 서포터즈
- Deep Learning for Computer Vision
- 비전공자를 위한 데이터 분석
- pymysql
- Brightics studio
- 범주형 변수 처리
- Today
- Total
목록분류 전체보기 (66)
하마가 분석하마

split() split() split() 메소드는 문자열을 쪼개 주는 메소드입니다. 먼저 가볍게 두 개의 변수에 원하는 입력값을 할당하는 법부터 보겠습니다. 먼저 input() 함수를 두 번 사용해서 변수 두 개에 할당할 수도 있습니다. ## input()을 두 개 사용하기 word1 = input() word2 = input() print(word1) print(word2) 다른 방법으로 input()과 split()을 함께 사용하여 한 번에 입력할 수도 있습니다. ## split()을 input()과 함께 사용하여 변수 할당하기 word1, word2 = input().split() print(word1) print(word2) split() 메소드의 괄호 안에 아무것도 들어있지 않다면 이는 공백을..

안녕하세요. Brightics 서포터즈 노승찬입니다. 이번 주는 미니 프로젝트의 마지막 주차로 모델링을 진행해 보겠습니다. Brightics Studio를 사용한 모델링은 처음인데요! 하나씩 사용해보면서 알아보도록 하겠습니다! Brightics Studio를 활용한 미니 프로젝트 3주 차입니다. 1주 차부터 포스팅을 읽어보신 분들도 한 주에 하나씩 글이 올라오다 보니 프로젝트의 목적이 무엇이었는지 기억이 안 나시는 분들도 계시리라 생각합니다. 미니 프로젝트의 목적은 '은행의 제품에 대한 고객의 구매 여부를 예측하는 분류 모델을 구축하는 것'입니다. 그럼 이어서 시작해보도록 하겠습니다. 지금까지 내용 요약 (미니맵) 데이터 분할 저희의 목적은 글로벌한 예측입니다. 즉, 새로운 데이터가 들어왔을 때 (여기서..

안녕하세요. Brightics 서포터즈 노승찬입니다. 3주 동안 미니 프로젝트를 진행한다고 말씀드렸는데요. 2주 차는 이진 범주를 가진 변수들을 더 살펴보고, 연속형 변수들의 이상치 여부를 파악해 보겠습니다. 마지막으로 feature engineering을 진행하며 포스팅을 마무리해보려 합니다! Brightics Studio를 활용한 미니 프로젝트 2주 차입니다. 프로젝트의 목표가 무엇인지 다시 한번 되새겨 보죠. 이번 미니 프로젝트의 목적은 은행의 제품에 대한 고객의 구매 여부를 예측하는 분류 모델을 구축하는 것입니다. 먼저 범주형 변수를 마저 보도록 하겠습니다. 1. EDA 2 통계량에서 확인했던 중요한 변수들의 그래프입니다. duration 변수에서 0과 1이 그나마 구분되는 것이 보입니다. 3개의..

공모전을 나가며 사용했던 방법들을 하나씩 정리해 나가기 위해 python 카테고리를 만들었습니다. 코드뿐만 아니라 파이썬을 사용하며 유용하다 느끼는 코드나 자주 까먹는 부분들에 대해서 정리를 해보겠습니다. 변수 변환 먼저 데이터를 불러오는 코드입니다. (데이터는 깃허브 링크에 따로 올려두겠습니다.) import os.path import pandas as pd DATA_PATH = 'data/' df = pd.read_csv(os.path.join(DATA_PATH, 'train.csv'), encoding='euc-kr', index_col = 0) df.head(3) 1. replace() 메소드 사용 변환하고자 하는 변수 (시리즈)에 메소드를 적용하여 변환하기 ## 시리즈.replace() df.g..

안녕하세요. Brightics 서포터즈 노승찬입니다. 앞의 두 포스팅을 통해 Brightics Studio가 무엇인지, 다운로드 방법, 데이터 불러오는 법, 간단한 시각화 등을 소개해 드렸습니다. 이번에는 3주에 걸친 미니 프로젝트를 진행할 예정입니다. kaggle에 있는 데이터를 가져와서 사용하였으며 데이터 링크도 함께 올려드릴게요! 이번 포스팅을 Brightics Studio를 활용한 미니 프로젝트입니다. [프로젝트 목표] 이번 프로젝트는 은행이 상품 판매 기회를 극대화하기 위해 대상 고객을 선택하는 방법을 찾기 위한 것입니다. 은행의 제품을 고객이 구매할지 여부를 예측하는 분류 모델을 구축하는 것이지요! 미니 프로젝트 1주 차는 데이터 확인 및 이해, 그리고 EDA로 이루어집니다. 1. 데이터 이해..

안녕하세요. Brightics 서포터즈 노승찬입니다. 지난 포스팅에서 Brightics AI와 Brightics Studio에 대해서 소개해 드렸는데요. Brightics Studio의 디테일한 기능들은 차츰 설명해 드리기로 하고 오늘은 간단한 체험만 해보려고 합니다. 다운로드를 받으신 후에 가볍게 체험을 하실 분들은 함께 올려드린 데이터를 사용하셔서 따라 해봐 주세요! 이번 포스팅은 Brightics Stuido 설치 이후, 간단한 체험으로 이루어집니다. [Brightics Stuido 체험] Brightics Studio를 활용한 간단한 체험에서 이전에 제가 했던 '직접 우편 판매를 위한 구매금액 예측' 프로젝트의 데이터를 사용해보려 합니다. 'retail-marketing' 데이터와 데이터에 관한 ..

[Ridge Regression] L2-norm regularization : 제곱 오차를 최소화하면서 회귀 계수 Beta의 L2-norm을 제한 [MSE Contour] MSE를 전개하면 이와 같다. MSE 식에서 판별식을 구해보자. MSE 식을 계산하여 판별식에 넣어보면 0보다 작다. 0보다 작다는 것은 '타원'의 형태를 의미한다. 즉, MSE는 타원의 형태를 가진다. 제약조건이 주어질 때 MSE 값의 변화에 따른 타원의 형태를 살펴보자. 최소제곱법은 제약조건이 주어질 때, 그 안에 들어올 수 없다. 따라서 Bias 값을 희생하며 MSE 값을 키워본다. 이 과정은 Variance를 줄이기 위해 행해지며 MSE의 판별식이 0보다 작기에 타원의 형태를 그리며 커진다. MSE 타원이 제약조건과 맞닿을 때 ..

안녕하세요. Brightics 서포터즈 노승찬입니다. 브라이틱스 서포터즈 2기로서 앞으로 Brightics AI를 활용한 다양한 포스팅을 진행할 예정입니다. 이번 기회로 새로운 분석 프로그램인 Brightics AI를 공부하고, 데이터 분석에 입문하시는 분들께 분석 툴 선택에 대한 고민을 덜어드리고 싶습니다. 첫 포스팅은 Brightics AI 소개와 체험판 다운로드, 간단한 실습으로 이루어집니다. [프로그램 소개] Brightics AI는 삼성 SDS에서 개발된 AI 기반 분석 플랫폼입니다. Brightics AI의 주요 특징을 알아보겠습니다. 1. 확장 가능한 데이터 아키텍처 기반의 고성능 기계 학습 분석 목적으로 병합, 예측, 진단할 수 있는 다양한 고성능 분석 함수를 제공합니다. 2. 자동 분석 ..