본문 바로가기

cs,코딩,알고리즘/생활코딩(머신러닝기초)

#2. Orange3 지도학습(2)

728x90

<이전>

-Numerical(숫자형)-Regression(회귀)

-Categorical(범주형)-Classification(분류)

 

 

 

아이리스 꽃의 종류를 분류하는 모델을 만들어보자!

-꽃의 형태에 따라 어떤 종류의 붓꽃인지 알아내기

-꽃받침(sepal), 꽃잎(petal)으로 아이리스의 종류를 분류한다

(클릭해서 생활코딩이 정리해놓은 iris관찰 시트로 이동하기)

여기서

-모양과 관련된 독립변수 4개: sepal length, sepal width, petal length, petal width

-종속변수 1개: iris

 

 4.2. 분류학습방법선발전

오렌지로 한번 해보자!

URL로 데이터를 가져오고

 column의 role설정->종속변수인 iris만 target으로, 나머지 독립변수는 feature로
1:0:0=>세토사일 확률이 1이고 버지니카인 확률과 다른 곷일 확률이 0이다 뭐 이정도로 이해하면 될 듯

각각의 학습방법을 통해 만들어진 모델들

모델 위젯 연결 시 빨간색 x표시는 오류가 나는 것으로 학습방법과 종속변수의 타입이 맞지 않아서 생기는 거라고 함(Linear Regression은 숫자형 모델을 취급하는데 아이리스 종속변수는 범주형 데이터. 따라서 오류 발생)

 

여러 모델들의 예측 결과-전체 데이터 중에 몇 건의 데이터를 맞췄는가에 대한 지표이고 1에 가까울 수록 좋은 것임=> 1일 경우 모델이 좋을 수도 있지만 학습데이터와 테스트데이터가 같을 때 나타나는 현상이기도 함

여러 모델들의 예측 결과

=>범주형처럼 분류형도 비교하면 됨

 

숫자형 번주에서 모델의 정확도를 판단하는 지표가 RMSE였다면, 범주형 자료에서의 모델 정확도를 판단하는 지표는 CA라고함

4.3. 모델비교

학습시키는 방법들을 일일이 다 배워서 적용시키는것도 좋지만 비경제적.

자료를 찾아내서 참고하는 감각이 중요하다고하심.

https://bit.ly/_slc_

 

코딩에서도 필요한거 검색해서 긁어쓰라는거랑 비슷한 느낌이고만

딥러닝 머신러닝에 대해 완전완전 문외한이었는데 그래도 어떤 원리로 굴러가는지 그 틀을 머리속에 넣은 것 같다

게다가 orange3를 통해 좀 더 가시적으로 보고 이해할 수 있었다. 복잡한 코딩 식이 아닌 선으로만 이어져있어서 어떤 흐름으로 봐야하는지도 알게 된 것 같다. 

 

 

무엇보다

공부를 하는게, 수업을 듣는게 목적인가?라는 의문을 심어주었다. 수업의 내용은 상당히 간단하고 이해하기 쉽고 부담되지 않았다. 이전에 열심히 들었던 다른 수업에 비하면 부담도 덜된다. 그러면서 자연스레 활용할 수 있는 방안도 찾으려고 하는 것 같다. 그래서 공부를 충분히 하다보면 언젠가는 활용할 수 있지 않을까?하는 생각이 들었다.

 

마지막에 생활코딩님이 수업을 마치시면서 

공부는 활용이 아니고, 활용은 공부보다 쉽지 않다고,

마음의 무의식은 활용이 공부보다 쉽지 않을 것을 알고 있다고 했다.

그렇기에 공부만 하면 잘 될 것이라는 속삭임에서 빠! 져! 나! 와! 야 한다고 하셨다.

공부를 멈추고 주변의 문제를 찾아 해결하고 반복하다 보면 해결할 문제를 극복할 공부를 스스로 알게 되기에,

공부를 해야하는 것이 아니라 하고 싶은 것이 되야 한다고 하셨다.

 

오렌지3 지도학습 수업을 통해 오렌지 3로 지도학습이 모델을 평가하고 선택하는 방법을 배웠다.

나아가 수업을 마치며 던져주시는 메세지를 들으며 마냥 기술만을 공부해선 안된다는 생각을 다시금 하게 되었다.

"공부를 멈추고 주변의 문제를 찾아 해결하고 반복하다 보면, 극복해야하는 공부와 기술을 스스로 알게 된다."