본문 바로가기

cs,코딩,알고리즘/생활코딩(머신러닝기초)

(11)
#2. Orange3 지도학습(2) -Numerical(숫자형)-Regression(회귀) -Categorical(범주형)-Classification(분류) 아이리스 꽃의 종류를 분류하는 모델을 만들어보자! -꽃의 형태에 따라 어떤 종류의 붓꽃인지 알아내기 -꽃받침(sepal), 꽃잎(petal)으로 아이리스의 종류를 분류한다 여기서 -모양과 관련된 독립변수 4개: sepal length, sepal width, petal length, petal width -종속변수 1개: iris 4.2. 분류학습방법선발전 오렌지로 한번 해보자! URL로 데이터를 가져오고 각각의 학습방법을 통해 만들어진 모델들 여러 모델들의 예측 결과-전체 데이터 중에 몇 건의 데이터를 맞췄는가에 대한 지표이고 1에 가까울 수록 좋은 것임=> 1일 경우 모델이 좋을 ..
#1. Orange3 지도학습(1) 1. 앞부분 복습 과거 원인과 결과에 따른 데이터를 가지고 컴퓨터를 학습시키는 거는 지도학습.(이때 종속변수가 양적, 범주형(후보가 유한)이어야해) 많은 양의 독립변수와 종속변수 데이터를 컴퓨터에 학습시키면 컴퓨터는 모델을 만들어내. 그 모델에 미래 독립변수를 넣으면 예측해서 종속변수가 나오는 거임 추가로 종속변수가 양적이냐 범주형이냐에 따라 학습의 방법이 달라. 양적은 회귀의 방법을, 범주형은 분류의 방법으로. ->데이터에 따라 좋은 모델을 만들 수 있는 방법도 여러개고 학습방법에 따라서도 모델의 성능이 가지각색임. 2. 지도학습의 기본방법 Linear regression의 학습방법으로 모델을 만들고, 독립변수와 참고하고 싶은 (날짜만 있는) 데이터를 불러오면 됨 그리고 prediction을 이용해서 ..
코딩애플-텐서플로우 딥러닝 기초(1) 머신러닝 1. 머신러닝: 기계한테 학습시키는 모든 것 ex)스팸메일 몇만개를 검토해서 어떤 제목이 스팸인지 확인 2. 종류 : supervised learning/ unsupervised learning: 유사도로 분류(군집화)->영화추천, 옷추천의 알고리즘/ reinforce learning 3. 학습과정은 요로코롬==>가중치에 대한 변수를 찾게끔 시키는 것 w1,w2의 기준을 세우기 위해 데이터를 주면됨. 이때 오차값이 최소화되는 w값을 찾으면 됨 뇌를 본딴 뉴럴네트워크 (이러면 컴퓨터가 사람처럼 생각하겠찌?) 좀 더 정교한 예측을 위해 인간의 뇌 동작 방식을 따온게 뉴럴 네트워크.(뉴런이 연결된 형태마냥 중간에 사고과정을 더했다고 생각하면 편하다) 전통 머신러닝은 사람이 가이드를 제공했었음(뭐가 타..
#2. Orange3 3,4일차 - 통계와 시각화&머신러닝 통계과 시각화 boxplot 아무리 어렵고 복잡하더라고 평균, 중앙값, 최빈값등(대푯값)으로 데이터의 성격을 지정하고자해) 이때 정보를 시각화 하는게 boxplot scatter plot 판매량과 상관이 있는 열을 찾기 위해서는 판매량과 함게 변하는 데이터를 찾아야해. 서로 변하는 정도에 따른 상관을 알려주는게 scatterplot 산점도 독립변수와 종속변수의 관계를 그래프로 보여주는 산점도=>이것을 통해 독립변수에 따른 종속변수를 예측할 수 있게 된다 경영통계에서 배운 거 복습하는 느낌이었다.(안다고 쉽게 보지 말 것!) 결국 데이터를 가지고 의미있는 통찰력을 얻는 과목이 통계구나를 또 새삼스럽게 느꼈다. 계산하는거 무섭다고 겁냈었는데 피할 수 없게 된 거 같다 겁내지,,말아야지..!.. 머신러닝(오렌..
#1. Orange3 1,2일차 - OT및 설치와 기본 사용법, 표 다루기 OT 오렌지는 코드 없이도 드래그 앤 드롭으로 표 분석, 시각화, 머신러닝이 가능한 통계, 데이터 마이닝 분야에서 사용하는 도구 => 즉 표를 다루는 도구(데이터를 보고 통찰력을 주는 도구랄까) 시나리오와 전략 레몬에이드가 얼마나 팔리는지 예측하기 어려운 상황에서 일기예보에 따른 필요한 레몬의 갯수를 예측하고 싶아고 하자.(레몬에이드 선생 생활토딩,, 모든 예시가 레몬에이드,,ㅋㅋㅋㅋ 쉬운 예시 감사하다구용..ㅎㅎㅎㅋㅋㅋㅋ) orange는 입력, 처리, 출력의 원리를 알고 표에서 원하는 행을 검색하고 원하지 않은 열을 감추고 열의 값을 계산해서 새로운 행을 동적으로 만드는 방법/ 표를 시각화 해서 데이트의 특성을 파악하고 그 특성을 통해 미래를 예측하게끔하는 원리. 이 것을 기계에게 가르쳐보자( 설치 약..
#5. 머신러닝 야학_5일차(비지도학습, 강화학습) 비지도 학습 군집화(clustering) : 어떤 대상들을 구분해서 그룹을 만다는 것 (그룹: 어떤 대상이 어떤 그룹에 속하는지를 판단) => 군집화라는 도구에 1000만대의 관측히(행)를 입력하고 100개의 클러스터가 필요하다고 알려주면 각각의 클러스터가 서로 다른 갯수를 가지고 있는 클러스터 100개를 가져다 준다 =>비슷한 행을 찾아준다!! 연관(연관규칙학습, association rule learning) : 일명 장바구니 학습,, 고객의 장바구니에 담긴 상품을 바탕으로 관심을 가질만 한 상품을 추천 연관규칙은 서로 관련있는 특성(열)을 찾아주는 기법 지도학습과 비지도 학습 비지도학습은 탐험적이다. 데이터의 성격을 파악하는 것이 목적(독립변수와 종속변수의 구분은 중요하지 않다. 그냥 데이터만 있으..
#4. 머신러닝 야학_4일차(지도학습) 머신러닝 분류 지도학습 이해하기 과거의 데이터로부터 학습해서 결과 예측을 하게끔 도와준다(지금까지 했던 손톱, 레몬에이드 카페) => 충분히 많은 데이터, 독립변수와 종속변수의 관계가 명확해야 학습할 수 있는 모델이 만들어짐 과거의 독리변수와 종속변수의 관계를 컴퓨터에게 학습시키면 컴퓨터는 그 관계를 설명할 수 있는 공식을 만들어낸다 => 이 공식을 머신러닝에서는 '모델'이라고 부르고, 데이터가 많을 수록 모델은 더욱 정확해진다 ==>따라서 적은 지식과 노력으로 나의 공식을 만들 수 있어서 사용할 수 있음 지도학습의 종류 회귀(regression) 예측하고 싶은 종속변수가 숫자, 양적데이터일 때(레몬에이드 예제) 즉, 숫자를 예측하고 싶을 때->"지도학습의 회귀로 해결해주세요." 분류(classifica..
#3. 머신러닝 야학_3일차(표) 직업의 시작(데이터로부터 시작되는) 데이터 자체가 현실은 아니지만, 현실을 데이터로 표현하고 있음.(현실을 데이터화하면, 복잡한 세상을 수치화하여 단순해진 데이터를 통해 패턴을 찾을 수 있을 것임) 그 수많은 데이터를 컴퓨터가 처리할 수 있게 되는게 그 처리 방법 중 하나가 머신러닝!! 데이터-데이터 과학: 데이터를 만들고 이용 데이터-데이터 공학: 데이터를 다루는 도구를 만들고 그 도구를 관리하는 일 표(data set) 데이터의 모임 독립변수와 종속변수 표 안에 데이터를 정렬해놓았으면 의미있는 정보를 뽑아야 한다. 일단 표 안에서 변수는 열(column)이다. 독립변수는 원인, 종속변수는 결과(고딩때부터 열심히...하던거..ㅋㅋㅋㅋ). 그 둘의 관계에는 인과관계, 상관관계가 존재 다만, 여기서 포인트..