본문 바로가기

데이터마이닝

(2)
#2. Orange3 3,4일차 - 통계와 시각화&머신러닝 통계과 시각화 boxplot 아무리 어렵고 복잡하더라고 평균, 중앙값, 최빈값등(대푯값)으로 데이터의 성격을 지정하고자해) 이때 정보를 시각화 하는게 boxplot scatter plot 판매량과 상관이 있는 열을 찾기 위해서는 판매량과 함게 변하는 데이터를 찾아야해. 서로 변하는 정도에 따른 상관을 알려주는게 scatterplot 산점도 독립변수와 종속변수의 관계를 그래프로 보여주는 산점도=>이것을 통해 독립변수에 따른 종속변수를 예측할 수 있게 된다 경영통계에서 배운 거 복습하는 느낌이었다.(안다고 쉽게 보지 말 것!) 결국 데이터를 가지고 의미있는 통찰력을 얻는 과목이 통계구나를 또 새삼스럽게 느꼈다. 계산하는거 무섭다고 겁냈었는데 피할 수 없게 된 거 같다 겁내지,,말아야지..!.. 머신러닝(오렌..
#1. Orange3 1,2일차 - OT및 설치와 기본 사용법, 표 다루기 OT 오렌지는 코드 없이도 드래그 앤 드롭으로 표 분석, 시각화, 머신러닝이 가능한 통계, 데이터 마이닝 분야에서 사용하는 도구 => 즉 표를 다루는 도구(데이터를 보고 통찰력을 주는 도구랄까) 시나리오와 전략 레몬에이드가 얼마나 팔리는지 예측하기 어려운 상황에서 일기예보에 따른 필요한 레몬의 갯수를 예측하고 싶아고 하자.(레몬에이드 선생 생활토딩,, 모든 예시가 레몬에이드,,ㅋㅋㅋㅋ 쉬운 예시 감사하다구용..ㅎㅎㅎㅋㅋㅋㅋ) orange는 입력, 처리, 출력의 원리를 알고 표에서 원하는 행을 검색하고 원하지 않은 열을 감추고 열의 값을 계산해서 새로운 행을 동적으로 만드는 방법/ 표를 시각화 해서 데이트의 특성을 파악하고 그 특성을 통해 미래를 예측하게끔하는 원리. 이 것을 기계에게 가르쳐보자( 설치 약..