통계과 시각화
boxplot
아무리 어렵고 복잡하더라고 평균, 중앙값, 최빈값등(대푯값)으로 데이터의 성격을 지정하고자해)
이때 정보를 시각화 하는게 boxplot
scatter plot
판매량과 상관이 있는 열을 찾기 위해서는 판매량과 함게 변하는 데이터를 찾아야해. 서로 변하는 정도에 따른 상관을 알려주는게 scatterplot
산점도
독립변수와 종속변수의 관계를 그래프로 보여주는 산점도=>이것을 통해 독립변수에 따른 종속변수를 예측할 수 있게 된다
경영통계에서 배운 거 복습하는 느낌이었다.(안다고 쉽게 보지 말 것!) 결국 데이터를 가지고 의미있는 통찰력을 얻는 과목이 통계구나를 또 새삼스럽게 느꼈다. 계산하는거 무섭다고 겁냈었는데 피할 수 없게 된 거 같다 겁내지,,말아야지..!..
머신러닝(오렌지3로 머신러닝을 다루는 방법)
원인과 결과를 기계가 스스로 파악할 수 있게 해주는 방법이 없을까?
원인과 결과를 기게에게 학습시켜서 그 둘의 관계를 공식으로 만들어낼 수 있게끔.
=>지도학습의 회귀라는 도구를 사용해서 온도를 입력하면 판매량이 출력되는 공식을 만들고자
(이전 것 정리: 우선 과거의 데이터가 있어야 하고 그 데이터를 독립, 종속변수로 나눌 줄 알아야 하고 그 변수들을 컴퓨터에게 학습시키면 그 관계를 설명할 수 있는 공식을 만들어. 그 공식을 모델이라고 함. 좋은 모델링 되려면 데이터가 많을 수록 정확해진다.)
.
보이고 싶지 않은 열은 skip, 그냥 보이게만 둘 열은 meta, 예측하고자 하는 열(종속변수)은 target, 독립변수는 feature로 지정
즉 feature조 지정한 특징들을 학습시켜서 우리가 원하는 target을 구하는 것!
그러면 어떻게 학습시켜야할까??
우리가 나타내는 변수들은 관계가 있어서 '선'(linear) 의 형태로 나타날 거임. linear regretion을 통해 모델을 만들어야해.
이후 prediction으로 미래 날씨에 따른 판매량을 예측해.
이때 linear regretion으로 얻은 모델을 입력하고 미래의 종속변수를 예측할 수 있는 독립변수를 입력해.
우오어......신기하다.. 눈에 너무 잘보여서 하기도 쉬웠고 재미있었다. 오렌지3 지도학습까지 듣고 좀 더 깊게 유튜브로도 알아봐야겠다는 생각도 든다. 코딩을 안해서 그런가ㅋㅋㅋㅋㅋ정말 편하게 봤다..ㅋㅋㅋㅋ
'cs,코딩,알고리즘 > 생활코딩(머신러닝기초)' 카테고리의 다른 글
#1. Orange3 지도학습(1) (0) | 2021.08.23 |
---|---|
코딩애플-텐서플로우 딥러닝 기초(1) (0) | 2021.08.19 |
#1. Orange3 1,2일차 - OT및 설치와 기본 사용법, 표 다루기 (0) | 2021.08.02 |
#5. 머신러닝 야학_5일차(비지도학습, 강화학습) (0) | 2021.07.24 |
#4. 머신러닝 야학_4일차(지도학습) (0) | 2021.07.21 |