본문 바로가기

cs,코딩,알고리즘/생활코딩(머신러닝기초)

#1. Orange3 1,2일차 - OT및 설치와 기본 사용법, 표 다루기

728x90

OT

오렌지는 코드 없이도 드래그 앤 드롭으로 표 분석, 시각화, 머신러닝이 가능한 통계, 데이터 마이닝 분야에서 사용하는 도구

=> 즉 표를 다루는 도구(데이터를 보고 통찰력을 주는 도구랄까)

시나리오와 전략

레몬에이드가 얼마나 팔리는지 예측하기 어려운 상황에서 일기예보에 따른 필요한 레몬의 갯수를 예측하고 싶아고 하자.(레몬에이드 선생 생활토딩,, 모든 예시가 레몬에이드,,ㅋㅋㅋㅋ 쉬운 예시 감사하다구용..ㅎㅎㅎㅋㅋㅋㅋ)

orange는 입력, 처리, 출력의 원리를 알고 표에서 원하는 행을 검색하고 원하지 않은 열을 감추고 열의 값을 계산해서 새로운 행을 동적으로 만드는 방법/ 표를 시각화 해서 데이트의 특성을 파악하고 그 특성을 통해 미래를 예측하게끔하는 원리. 이 것을 기계에게 가르쳐보자(

잊지 말쟈..!...

설치

 

어머 로고부터 귀엽당헤헤

약간 설치에 ptsd가 있는거 같다..(그냥 뭐 그렇다구..)설치할 때마다 마음이 불편해...

어머 아이콘들마저 귀엽당....

기본 사용법

요거를 일단 오렌지에 옮겨보자!!

input(orange3로 들어오는 input)

  데이터가 안올라와서 오픈튜토리얼스에서 찾아봤는데 다른 분들도 이런 일이 있었다부다. 주소에서 마지막 /edit#gid=0를 제외한 링크를 입력했더니 자료를 인식해준다고 올려주셔서 그렇게 햇더니 해ㅡ결. 왜지?.?.

잘 살펴보면 첫번째 행을 보고 데이터 형식을 알아서 인식해서 세팅까지 해줬다. 날짜는 datatime, 온도, 판매량은 숫자니깐 numeric, 요일은 text

 

output(data table로)

마냥 신기....

 

처리과정

처리과정을 보기 위해서 필터링(select rows)를 사용하면: conditions에 판매량 44미만인 거로 조건 설정->data table보면 그렇게 나와있음

우오어...또신기...

추가

위젯들 간의 고나계를 살펴보고 싶으면 더블클릭->여기서 matching Data는 선택된 데이터를 데이터 테이블로 가져온다는 것/

unmatched Data는 필터링 되지 않은 데이터를 보여주는 것

온ㄹ은 그냥 놀람의 연속,,인듯ㅋㅋㅋㅋㅋㅋ

 

 

 

 

대충 file로 input을 받고 select rows로 처리하고 data table로 output을 보이는구나 정도?

오늘 수업은 놀람의 연속이었다..ㅋㅋㅋ 그냥 마냥 신기하고 신났다ㅋㅋㅋ

 

 

표다루기

아까했던 데이터 표에서 매출을 알고 싶을 때에는

feature Constructor로 정의해주고 삽입한 후 data table로 output을 보면 그대로 실현!

또 신기...

모든 상황에서 input, 처리과정, output을 시각화해서 가시적으로 볼 수 있어서 편한 것 같다. 근데 이게 방대해지고 처리과정이 복잡해지면 거미줄이 될 거 같다?...ㅋㅋㅋ