본문 바로가기

생활코딩

(7)
#2. Orange3 지도학습(2) -Numerical(숫자형)-Regression(회귀) -Categorical(범주형)-Classification(분류) 아이리스 꽃의 종류를 분류하는 모델을 만들어보자! -꽃의 형태에 따라 어떤 종류의 붓꽃인지 알아내기 -꽃받침(sepal), 꽃잎(petal)으로 아이리스의 종류를 분류한다 여기서 -모양과 관련된 독립변수 4개: sepal length, sepal width, petal length, petal width -종속변수 1개: iris 4.2. 분류학습방법선발전 오렌지로 한번 해보자! URL로 데이터를 가져오고 각각의 학습방법을 통해 만들어진 모델들 여러 모델들의 예측 결과-전체 데이터 중에 몇 건의 데이터를 맞췄는가에 대한 지표이고 1에 가까울 수록 좋은 것임=> 1일 경우 모델이 좋을 ..
#1. Orange3 지도학습(1) 1. 앞부분 복습 과거 원인과 결과에 따른 데이터를 가지고 컴퓨터를 학습시키는 거는 지도학습.(이때 종속변수가 양적, 범주형(후보가 유한)이어야해) 많은 양의 독립변수와 종속변수 데이터를 컴퓨터에 학습시키면 컴퓨터는 모델을 만들어내. 그 모델에 미래 독립변수를 넣으면 예측해서 종속변수가 나오는 거임 추가로 종속변수가 양적이냐 범주형이냐에 따라 학습의 방법이 달라. 양적은 회귀의 방법을, 범주형은 분류의 방법으로. ->데이터에 따라 좋은 모델을 만들 수 있는 방법도 여러개고 학습방법에 따라서도 모델의 성능이 가지각색임. 2. 지도학습의 기본방법 Linear regression의 학습방법으로 모델을 만들고, 독립변수와 참고하고 싶은 (날짜만 있는) 데이터를 불러오면 됨 그리고 prediction을 이용해서 ..
#2. Orange3 3,4일차 - 통계와 시각화&머신러닝 통계과 시각화 boxplot 아무리 어렵고 복잡하더라고 평균, 중앙값, 최빈값등(대푯값)으로 데이터의 성격을 지정하고자해) 이때 정보를 시각화 하는게 boxplot scatter plot 판매량과 상관이 있는 열을 찾기 위해서는 판매량과 함게 변하는 데이터를 찾아야해. 서로 변하는 정도에 따른 상관을 알려주는게 scatterplot 산점도 독립변수와 종속변수의 관계를 그래프로 보여주는 산점도=>이것을 통해 독립변수에 따른 종속변수를 예측할 수 있게 된다 경영통계에서 배운 거 복습하는 느낌이었다.(안다고 쉽게 보지 말 것!) 결국 데이터를 가지고 의미있는 통찰력을 얻는 과목이 통계구나를 또 새삼스럽게 느꼈다. 계산하는거 무섭다고 겁냈었는데 피할 수 없게 된 거 같다 겁내지,,말아야지..!.. 머신러닝(오렌..
#1. Orange3 1,2일차 - OT및 설치와 기본 사용법, 표 다루기 OT 오렌지는 코드 없이도 드래그 앤 드롭으로 표 분석, 시각화, 머신러닝이 가능한 통계, 데이터 마이닝 분야에서 사용하는 도구 => 즉 표를 다루는 도구(데이터를 보고 통찰력을 주는 도구랄까) 시나리오와 전략 레몬에이드가 얼마나 팔리는지 예측하기 어려운 상황에서 일기예보에 따른 필요한 레몬의 갯수를 예측하고 싶아고 하자.(레몬에이드 선생 생활토딩,, 모든 예시가 레몬에이드,,ㅋㅋㅋㅋ 쉬운 예시 감사하다구용..ㅎㅎㅎㅋㅋㅋㅋ) orange는 입력, 처리, 출력의 원리를 알고 표에서 원하는 행을 검색하고 원하지 않은 열을 감추고 열의 값을 계산해서 새로운 행을 동적으로 만드는 방법/ 표를 시각화 해서 데이트의 특성을 파악하고 그 특성을 통해 미래를 예측하게끔하는 원리. 이 것을 기계에게 가르쳐보자( 설치 약..
#3. 머신러닝 야학_3일차(표) 직업의 시작(데이터로부터 시작되는) 데이터 자체가 현실은 아니지만, 현실을 데이터로 표현하고 있음.(현실을 데이터화하면, 복잡한 세상을 수치화하여 단순해진 데이터를 통해 패턴을 찾을 수 있을 것임) 그 수많은 데이터를 컴퓨터가 처리할 수 있게 되는게 그 처리 방법 중 하나가 머신러닝!! 데이터-데이터 과학: 데이터를 만들고 이용 데이터-데이터 공학: 데이터를 다루는 도구를 만들고 그 도구를 관리하는 일 표(data set) 데이터의 모임 독립변수와 종속변수 표 안에 데이터를 정렬해놓았으면 의미있는 정보를 뽑아야 한다. 일단 표 안에서 변수는 열(column)이다. 독립변수는 원인, 종속변수는 결과(고딩때부터 열심히...하던거..ㅋㅋㅋㅋ). 그 둘의 관계에는 인과관계, 상관관계가 존재 다만, 여기서 포인트..
#2. 머신러닝 야학_2일차(러닝 머신러닝) 7. 머신러닝 머신 Teachable Machine에서 생성한 모델을 이용해서 손톱을 깨물면 화면에 손톱을 내려놓으라는 글씨와 함께 음성이 나오고 깨물지 않으면 칭찬하는 앱을 만들어보자! http://ml-app.yah.ac/ 8. 나도 이제 프로그래머(애플리케이션 vs 프로그래밍) 애플리케이션 : 응용-> 어떤 부품을 사용해서 만드는 완제품 => 지금가지 우리가 했던 거(손톱)는 Teachable Machine모델과 같은 부품을 응용해서 만든 소프트웨어임 부품을 잘 활용하면, 원리를 몰라도 부품의 능력을 이용할 수 있다!! 프로그래밍 : 부품을 '시간'의 '순서'에 따라 동작 기계가 해야할 일을 기계가 알아듣는 방식으로 순서대로 적으면 된다. 기계는 그것을 보고 순서대로 시행할 것이다. 9. 모르면 마..
#1. 머신러닝 야학_1일차 1. 머신러닝이란 결정=비교+선택 (동일한 제품 A 2000원, B3000원이면 제품 A를 선택/ 집으로 가는 길 A1000m B500m이면 B를 선택) BUT 비교가 쉽지 않을 때에는?(A,B의 대소관계를 모르거나 비교해야할 특징이 많을 때) 인간의 고유한 영역으로 남아있던 선택을 기계에게 맡기고 싶어한다."하나를 가르치면 열을 안다." 공부를 하면 똑같은 문제 뿐만 아니라 비슷한 문제도 해결할 수 있는 능력을 기계에게 부여해서 스스로 결정할 수 있도록하는 기술을 기계학습, Machine Learning이라고 한다. 망원경이 생겼다고 눈이 필요없어지는 게 아닌 것 처럼, 자동차가 있다고 발이 쓸모 없어지는게 아닌것 처럼. 오히려 망원경은 눈을 더욱 멀리 볼 수 있게 해준다. 그래서 눈을 더욱 눈답게 눈..