본문 바로가기

cs,코딩,알고리즘/네이버커넥트-인공지능기초다지기(2021)

1주차_Introduction

728x90

01.Welcome

항상 보는 머신러닝을 사용한 서비스 종류, 그리고 지도학습 겉핥기 정도를 얘기해준다.

생소했던 용어는 클릭스트림데이터.

02.What is Machine Learning?

정의

기계학습이란,  컴퓨터가 명시적(explicit) 프로그램이 없어도  스스로 학습할 수 있는 능력을 연구하는 학문 분야(밑에 체크판은 사무엘 머시기님이 체스 못하셔서 엄청난 학습을 통해..어쩌구
톰 미첼 아저씨가 정의

프로그램이 일정 수준의 작업 성능(P)을 가지고 작업(T)을 수행한다고 했을 때,  경험(E)이 증가함에 따라 작업(T)를 수행하는 성능(P)이 향상될 수 있다. 이 때 프로그램이 경험(E)으로부터 학습(learn)을 했다. (뭐라카노..)

=>체

 

https://jjrm.tistory.com/23?category=497311 

03. Supervised Learning(지도학습)

(정리)

여기싀 데이터 셋은 하나의 피처만 있다.

종양크기별 악성(Y) 5개과 양성(N ) 5개인 데이터셋. 이때 주인공의 종양 크기가 보라색위치에 있다면, 그 종양이 악성으로 분류된 가능성이 얼마나 될 지 예측해보는 것(종양의 크기로 악성, 양성인지를 분류)

-> 분류(classification)는 0과1, 악성 혹은 양성과 같은 불연속적인(descrete) 결과값을 예측하는 경우(이런 카테고리는 3개 이상의 경우도 존재한다)

쪽지시험도 있다..헤헿

04. Unsupervised Learning(비지도학습)

일단 지도학습과 가장 큰 차이점은 어떤 레이블도 갖고 있지 않거나, 모두 같은 레이블을 갖고 있거나, 또는 아예 레이블이 없다는 것. 그래서 우리에게 주어진 데이터 셋을 가지고 무엇을 할 지 각 데이터가 무엇인지 알 수 없다.

(정리) 우리는 변수의 영향을 알 필요가 없는 데이터로부터 구조를 도출할 수 있다. 

대신에 단지 우리에게 "여기 데이터가 있는데, 여기서  어떤 구조를 찾을 수 있습니까?"라고 물을 뿐

예시1-구글뉴스(클러스터링)

: 구글 뉴스가 하는 일은 웹에서 매일 수만, 수천 가지의 새로운 기사들을 조사하는 것.  그리고 그 기사들을 연관성이 있는 것끼리 묶는 것

->

 

짱신기한 예시2.2-음성인식(칵테일 파티 효과)

: 미국인 A와 스페인 사람 B가 동시에 여러 차례 녹음을 한 것을 바탕으로 B의 음성을 지웠다. 이것도 비지도 학습이라니!!(원리를 생각하면 맞긴 한데 신기했다)

https://en.wikipedia.org/wiki/Cocktail_party_effect

 

무려 시험도 봤다.. 하나 틀리긴 했는데,, 생각보다 양이 많네..하하.. 너무 힘빼면 안될 거 같다.. 하지만 화이팅