인공지능

    [인공지능][개념&실습] 트리의 앙상블(Ensemble)[2] - 엑스트라 트리(Random Forest)와 (+ 히스토그램 기반) 그레이디언트 부스팅

    결정 트리(Decision Tree)와 앙상블(Ensemble)에 대한 이론이 필요하신 분들은 아래 링크를 참조해주시기 바랍니다. [인공지능][개념] 분류(Classification) - 결정 트리(Decisioin Tree)와 가지치기(Pruning) : https://itstory1592.tistory.com/12 [인공지능][실습] 결정 트리(Decision Tree) 모델로 와인(Wine) 데이터셋을 분류하고 교차 검증(Cross Validation)과 그리드 서치(Grid Search)로 최적의 하이퍼 파라미터를 찾아보자! : https://itstory1592.tistory.com/13 [인공지능][개념&실습] 트리의 앙상블(Ensemble)[1] - 랜덤 포레스트(Random Forest) ..

    [인공지능][개념&실습] 트리의 앙상블(Ensemble)[1] - 랜덤 포레스트(Random Forest)

    결정 트리(Decistion Tree)와 가지치기(Pruning)에 대한 이론이 필요하신 분들은 아래 링크를 참조해주시기 바랍니다. [인공지능][개념] 분류(Classification) - 결정 트리(Decisioin Tree)와 가지치기(Pruning) : https://itstory1592.tistory.com/12 [인공지능][실습] 결정 트리(Decision Tree) 모델로 와인(Wine) 데이터셋을 분류하고 교차 검증(Cross Validation)과 그리드 서치(Grid Search)로 최적의 하이퍼 파라미터를 찾아보자! : https://itstory1592.tistory.com/13 앙상블 (Ensemble) 앙상블(Ensemble)은 통계역학에서, 어떤 계와 동등한 계의 모음을 말한다...

    [인공지능][실습] 결정 트리(Decision Tree) 모델로 와인(Wine) 데이터셋을 분류하고 교차 검증(Cross Validation)과 그리드 서치(Grid Search)로 최적의 하이퍼 파라미터를 찾아보자!

    결정 트리(Decistion Tree)와 가지치기(Pruning)에 대한 이론이 필요하신 분들은 아래 링크를 참조해주시기 바랍니다. [인공지능][개념] 분류(Classification) - 결정 트리(Decisioin Tree)와 가지치기(Pruning) : https://itstory1592.tistory.com/12 이번 글에서는 결정 트리(Decision Tree)와 가지치기(Pruning)를 사용하여 모델의 과대 적합(Overfitting)을 줄이면서 와인 데이터셋을 화이트 와인과 레드 와인으로 분류하는 모델을 구현해볼 예정이다. 더불어 교차 검증(Cross Validation)을 통해 테스트 데이터 한 묶음만 사용하는 것이 아닌, 훈련용 데이터의 모든 부분을 테스트 데이터로 활용하는 방법과, 그..

    [인공지능][개념] 분류(Classification) - 결정 트리(Decisioin Tree)와 가지치기(Pruning)

    의사 결정 트리 (Decision Tree) 의사 결정트리(Decision Tree)란 모델에게 질문을 던지고 YES or NO 를 판단하여 결과의 대상을 좁혀나가는 인공지능의 분류 기법 중 하나이다. (의사 결정트리 모델을 거꾸로 뒤집어 보면 나무와 비슷한 모양이 보이기 때문에 나무(Tree)라는 이름이 붙게 되었다.) 다소 복잡해 보일 수 있는 결정 트리를 하나하나 함께 살펴보도록 하자. 오른쪽 이미지는 실습에서 진행할 레드 와인(음성 클래스)과 화이트 와인(양성 클래스)을 맞추는 이진 분류(Binary Classification) 모델이다. 결정 트리 모델을 보면 '노드(Node)'라고 부르는 네모난 질문 박스가 보일 것이다. 설명을 위해 트리의 맨 최상위에 위치한 루트 노드(Root Node)를 ..

    [인공지능][실습] 로지스틱 회귀(Logistic Regression) - 붓꽃 데이터(Iris Data)를 사용하여 3종류의 꽃을 분류해보자

    로지스틱 회귀(Logistic Regression)에 대한 이론이 필요하신 분들은 아래 링크를 참조해주시기 바랍니다. [인공지능][개념] 로지스틱 회귀(Logistic Regression)는 무엇이며, 시그모이드(Sigmoid) 함수는 왜 사용하는 것일까? : https://itstory1592.tistory.com/8 [인공지능][실습] 로지스틱 회귀(Logistic Regression) - 나는 과연 타이타닉 침몰에서 살아남을 수 있었을까? : https://itstory1592.tistory.com/10 이번 시간에는 붓꽃 데이터(Iris Data)를 사용하여 로지스틱 회귀(Logistic Regression) 모델을 훈련하고, 꽃의 종류를 분류하는 실습을 진행해보도록 하자. 지난 글과는 다르게 이..

    [인공지능][실습] 로지스틱 회귀(Logistic Regression) - 나는 과연 타이타닉 침몰에서 살아남을 수 있었을까?

    로지스틱 회귀(Logistic Regression)에 대한 이론이 필요하신 분들은 아래 링크를 참조해주시기 바랍니다. [인공지능][개념] 로지스틱 회귀(Logistic Regression)는 무엇이며, 시그모이드(Sigmoid) 함수는 왜 사용하는 것일까? : https://itstory1592.tistory.com/8 이번 글에서는, 영화 타이타닉 사고가 일어났을 때의 상황을 가정하여 로지스틱 회귀(Logistic Regression)를 직접 실습해보려고 한다. '만약 그 자리에 내가 있었다면 살아남았을 수 있었을까?' 하는 의문점을 풀어주는 실습이 될 것이다. import pandas as pd import numpy as np #사이킷런의 로지스틱 회귀 라이브러리 from sklearn.linear..

    [인공지능][개념] 로지스틱 회귀(Logistic Regression)는 무엇이며, 시그모이드(Sigmoid) 함수는 왜 사용하는 것일까?

    로지스틱 회귀 (Logistic Regression) 로지스틱 회귀(Logistic Regression)는 사건(Event)이 발생할 가능성을 예측하는 데 사용하는 모델이다. 주로 특정 조건(환경)이 주어졌을 때, 사건이 일어는지, 일어나지 않는지에 대해 다루곤 한다. 위 그래프는 로지스틱 회귀를 그래프로 나타낸 것이다. X축에는 (조건을 모두 고려하였을 때의) 점수, Y축으로 결과가 나타나 있는데, 결과를 보면 알다시피 0과 1로만 이루어진 모습을 확인할 수 있을 것이다. 즉, 사건이 일어나고(1) 일어나지 않고(0)를 예측하는 것이 로지스틱 회귀 모델의 목표라는 뜻이다. 사례를 들어 더 구체화해보도록 하자. 화재가 발생했을 때, 산소가 X만큼 부족해지면 '사망한다 or 사망하지 않는다.' 교통사고가 ..

    [인공지능][실습] 다항회귀(Polynomial Regression)와 다중선형회귀(Mutiple Linear Regression)를 활용하여 생선의 무게를 예측해보자

    (아직 이론에 대한 글을 읽지 않았다면, 아래의 링크를 참고하는 것을 추천👍) [인공지능][개념] 다항회귀(Polynomial Regression)와 다중선형회귀(Mutiple Linear Regression) + 규제(Regularization)에 대해 알아보자 : itstory1592.tistory.com/6 다항회귀와 다중선형회귀를 통해 정확도를 높여보자! 지난 글에서 다항회귀 (Polynomial regression)과 다중선형회귀 (Multiple linear regression)에 대한 이론을 알아보았다. 이번에는 이론으로만 공부한 두 개념을 적용하여 선형회귀보다 조금이라도 더 정확히 생선의 무게를 맞출 수 있는 모델을 만들어보도록 하자. 지난 이론에서 설명하였듯이, 사실 생선 데이터의 분포를..

    [인공지능][개념] 다항회귀(Polynomial Regression)와 다중선형회귀(Mutiple Linear Regression) + 규제(Regularization)에 대해 알아보자

    다항회귀 (Polynomial Regression) 지난 글에서는 선형회귀 (Linear regression)에 대해 알아보고 실습까지 진행해보았다. 이번 시간에는 다항회귀와 다중선형회귀가 무엇인지와 이 둘의 차이에 대해 알아보도록 하자. (그 전에, 선형회귀에 대해 잘 모르겠다면 이전 글을 참고하는 것을 추천한다.) [인공지능] 선형회귀에 대해 알아보자(이론) : itstory1592.tistory.com/4 [인공지능] 선형회귀(Linear regression)를 이용하여 생선의 무게를 예측해보자 : itstory1592.tistory.com/5 [인공지능] 선형회귀(Linear Regression)에 대해 알아보자(이론) 선형회귀 (Linear Regression) 이번 글에서는, 선형회귀 (Lin..

    [인공지능][실습] 선형회귀(Linear regression)를 이용하여 생선의 무게를 예측해보자

    선형회귀 (Linear Regression)를 통해 생선의 무게를 구해보자! 지난 글에서 배운 선형회귀 (Linear Regression)를 이용하여 직접 생선의 길이로 무게를 예측하는 모델을 구현해보자. [인공지능] 선형회귀에 대해 알아보자(이론) : itstory1592.tistory.com/4 먼저, 생선 데이터를 준비해보자! import numpy as np #농어의 길이 perch_length = np.array( [8.4, 13.7, 15.0, 16.2, 17.4, 18.0, 18.7, 19.0, 19.6, 20.0, 21.0, 21.0, 21.0, 21.3, 22.0, 22.0, 22.0, 22.0, 22.0, 22.5, 22.5, 22.7, 23.0, 23.5, 24.0, 24.0, 24...