Machine learning/Education

생활코딩 Machine learning - 하

i독 2020. 12. 14. 01:16

1_ 비지도 학습의 군집화(Clustering)

 

군집화란 비슷한 것들을 찾아서 그룹을 만드는 것을 말한다. (흔히 공학에서 비슷한 것들을 묶는 그룹핑과 같은 개념)

 

군집화는 비지도 학습이며, 지도 학습에 분류라는 학습 방법이 있다.

이는 비슷하면서도 분명한 차이 점이 존재하는데,

 

군집화란 비슷한 것들을 모아서 지정하는 것이 목적이고,

분류란 무언가를 어떤 그룹에 위치 시키는 것이 목적이다.

 

아래의 그림과 같이 비슷한 행을 묶는 것이 Clustering이라 부른다.

표를 도식화하여 비슷한 위치에 있는 것들을 묶어 군집을 형성시킨다.

 

 

2. 비지도 학습의 연관 규칙 학습(Association rull learning)

일명 장바구니 학습이라 불리며 이전의 "추천"이라는 키워드가 붙은 기능들은 대부분 연관 규칙 학습을 사용하였다.

 

데이터의 관측치를 그룹핑 해주는 것이 군집화라면

데이터의 특성을 그룹핑 해주는 것은 연관규칙이라 말할 수 있다.

비지도 학습은 데이터의 성격을 파악하는 것이 목적이다.

이를 한 문장으로 정의 내리기는 어렵지만 군집화와 연관규칙만을 보았을 때는,

데이터의 성격을 파악하는 것이 비지도 학습이라 말할 수 있다.

 

데이터를 정리하여 표로 도식화한다. 그 후에 표를 보면서 데이터의 성격을 파악하는 것이 중요하다.

 

비지도 학습은 탐험으로, 지도 학습은 역사로 비유 할 수 있다.

3. 비지도 학습의 변환 학습(Transform learning)

 > en.wikipedia.org/wiki/Transfer_learning

 > transformlearning.csl.illinois.edu/

 

4. 강화 학습(Rainforcement learning)

강화학습의 핵심은 '일단 해보는 '

지도학습은 배움을 통해 성능을 향상시킨다고 보았을 , 강화학습은 경험을 통해 성능을 향상시킨다 있다.

 

 

행동의 결과가 자신에게 유리한 것이라면 상을 받고 불리한 것이면 벌을 받는다.

과정을 지속적으로 반복하게 된다면 많은 보상을 받을 있는 답을 찾을 있다는 아이디어이다.

 

게임을 여러 해서 실력을 키우는 행위랑 무척이나 비슷하다.

 

[게임의 실력을 향상 시키는 게이머의 모습]

 

게이머는 현재의 상태를 관찰하며 -> 관찰의 결과에 따라 게임을 조작하는 행동을 한다.

관찰과 행동을 하기 위해서는 판단이 필요로하다.

게임은 게이머에게 현재의 상태를 보여준다. 또한 현재의 점수를 알려준다.
더 많은 이동을 진행하였을 때는 점수를 얻고(상을 받는다), 장애물에 걸릴 때 마다 점수를 잃는다(벌을 받는다)
관찰의 결과에 따라 어떻게 행동해야 더 많은 점수를 얻고, 잃는 점수를 최대한 피하는 행동을 판단력을 통해 강화된다.
강화된 판단에 따른 행동은 게임의 결과를 변화시킨다.

위의 과정을 강화학습에서 사용되는 용어로 변환시키면 아래와 같다.

 

 - 게임 = 환경(environment)

 - 게이머 = 에이전트(agent)

 - 상태 = 스테이트(State)

 - 상/벌 = 보상(reward)

 - 행동 = 액션(action)

 

 

즉, 강화학습은 | 상태에 따라서 |  많은 보상을 받을 있는 행동을 | 에이전트가 있도록 | 정책을 만드는 것 | 이 목적이다. (게임의 인공지능 플레이 -> 알파고 / 자율주행기능 등)

 


해당 본문은 아래의 생활코딩의 Machine learning 을 공부하며 정리한 내용임을 밝힙니다.

모든 이미지와 글은 아래의 유투브 영상에서 캡쳐하였습니다.

www.youtube.com/watch?v=LPqmPfhnR1o&list=PLuHgQVnccGMDy5oF7G5WYxLF3NCYhB9H9&index=1

'Machine learning > Education' 카테고리의 다른 글

생활코딩 Machine learning - 중  (0) 2020.12.13
생활코딩 Machine learning - 상  (0) 2020.12.13