Developing Myself Everyday
article thumbnail

 안드로이드 개발자를 목표로 하고 있는 사람으로서 머신러닝을 공부하지 않는다는 것은 한계가 분명 명확할 것이라고 생각한다. 머신러닝을 완벽하게는 아니더라도 어떤게 있고 나중에 프로젝트를 진행할 때, 어떤 방식으로 머신러닝을 진행하야 하는지, 학습방식은 어떤 방식이 있는지에 대해 미리 알고 있는것은 나중에 나에게 그런 일이 주어졌을 때에 큰 힘이 될 것이다. 그래서 이제부터 머신러닝은 어떤것이고, 어떤 학습방식이 있는지에 대해서 알아보려고 한다.

 

 머신러닝에 대해서는 아래의 유튜브를 통해 학습하였다. 

 

 

 

머신러닝이란?


 머신러닝은 컴퓨터 시스템이 데이터로부터 학습하고 패턴을 식별하며 예측하는 방법이다. 기본적으로, 머신러닝은 명시적인 프로그래밍 없이 데이터를 분석하여 패턴과 통찰력을 발견하고 이를 기반으로 결정을 내리는 방식으로 작동한다. 머신러닝 모델은 데이터에서 학습하고, 특정 작업을 수행하거나 예측할 수 있는 일반화된 지식을 획득한다.

 

 머신러닝은 주로 다음과 같은 세 가지 주요 유형으로 나눌 수 있다.

 

 

이제부터 지도 학습에 대해 좀 더 자세히 알아보겠다.

 

 

지도 학습


 지도 학습은 입력 데이터와 해당하는 정답이 함께 제공될 때 사용된다. 모델은 입력 데이터와 정답 간의 관계를 학습하고, 새로운 입력에 대해 정확한 출력을 예측하도록 훈련된다. 에를 들어, 이메일을 스팸과 비스팸으로 분류하는 것이 지도 학습의 예이다.

 

X                       Y

Independent variable     Dependent variable

독립 변수(원인)             종속 변수(결과)

 

 만약 위와 같은 데이터가 존재한다고 생각해보자. 위의 데이터는 주택 면적과 해당 주택의 가격 데이터를 보여준다. 이 데이터에는 독립 변수, 즉 원인인 면적이, 그리고 그것에 해당하는 종속 변수, 즉 결과인 가격이 나타나 있다.
 위의 데이터를 가진 모델은 면적이 100인 주택이 주어진다면 275달러를 예측해서 결과값으로 나타낼 것이다. 이는 모델이 학습된 데이터로부터 주택 면적과 가격 간의 관계를 학습하고, 이를 기반으로 새로운 주택 면적에 대한 가격을 예측한 것이다.  

 

 

 이렇게 원인과 결과가 같이 주어질 때에는 지도 학습을 이용해 머신을 훈련시켜야 한다. 이런 지도 학습은 2가지로 분류할 수 있다. 바로 회귀와 분류이다.

 

Regression (회귀)


  회귀는 연속적인 값을 예측하는 작업이다. 예측하려는 대상이 연속형 변수인 경우 회귀를 사용한다. 위에서 예를 들었던 주택의 면적에 따른 가격을 예측 하는 방식이 회귀를 이용한 방식이라고 할 수 있다.

 회귀는 예측 결과가 숫자일 때 주로 사용하게 된다.

 

Classification (분류)


  분류는 주어진 입력 데이터를 몇 개의 클래스 중 하나로 분류하는 작업이다. 분류는 범주형 분수를 예측하는데 사용된다. 예를 들어, 이메일이 스팸인지 아닌지를 분류하는 모델을 만든다고 가정해본다. 이 때, 이메일의 내용과 해당 이메일이 스팸인지 아닌지를 나타내는 레이블을 사용하여 분류 모델을 학습시킬 수 있다. 예를 들어, 모델은 새로운 이메일이 스팸일 가능성이 0.8인지 아닌지를 예측할 수 있다. 이렇게 분류 모델은 이메일을 스팸 또는 비스팸 클래스 중 하나로 분류한다.

 

 

 

 

'인공지능 > Machine Learning' 카테고리의 다른 글

1-3. Gradient Descent (경사 하강법)  (0) 2023.05.09
1-2. 데이터 세트 분리  (0) 2023.05.09
1-1. Linear Regression  (0) 2023.05.09
profile

Developing Myself Everyday

@배준형

포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!