Study

[AI]정리

seomj 2021. 2. 7. 16:31

※공부하는 과정에서 자주 헷갈리거나 궁금한 내용들을 정리해놓은 글이며 개인 공부의 용도로 작성한 글입니다.


심층신경망과 다층퍼셉트론이 뭐가 다른가

다층 퍼셉트론(Multi-layer Perceptron) 은닉층이 1 이상인 퍼셉트론

은닉층이 2 이상인 신경망을 심층 신경망 (Deep Neural Network, DNN)

학습을 시키는 신경망이 심층 신경망일경우 심층 신경망을 학습시칸다고 하여 딥러닝(Deep Learning)

 

 

그렇다면 신경망과 퍼셉트론은 뭐가 다른가

수많은 퍼셉트론을 묶어놓은 일종의 다발, 신경망(neural network)

 

 

딥러닝과 머신러닝의 차이

일반적으로 프로그램은 사람이 "A라는 입력에 B라는 조건이 성립하면 X를 작동시켜라"와 같이 명시적으로 프로그램을 작성해 줘야 하는데, 머신러닝은 "A라는 입력이 들어왔을 때 결과가 X가 되는 조건 B를 찾도록"기계를 학습시킨다.

머신러닝은 입력값에 대응하는 결과값이 제대로 나오도록 하는 최적의 매개변수 값을 찾는 과정이며, 그때 학습의 결과물은 매개변수(가중치) 값이다.

머신 러닝은 기본적으로 알고리즘을 이용해 데이터를 분석하고, 분석을 통해 학습하며, 학습한 내용을 기반으로 판단이나 예측을 한다. 따라서 궁극적으로는 의사 결정 기준에 대한 구체적인 지침을 소프트웨어에 직접 코딩해 넣는 것이 아닌, 대량의 데이터와 알고리즘을 통해 컴퓨터 그 자체를 ‘학습’시켜 작업 수행 방법을 익히는 것을 목표로 한다.

머신 러닝은 알고리즘을 사용하여 데이터를 구문 분석하고 해당 데이터에서 학습하며, 학습한 내용에 따라 정보에 근거한 결정을 내린다.

 

 

딥 러닝은 알고리즘을 계층으로 구성하여 자체적으로 배우고 지능적인 결정을 내릴 수 있는 "인공 신경망"을 만든다.

 

 

딥러닝은 스스로 특징을 찾아내고 특징 학습을 한다는 점에서 특징을 별도로 입력해 주어야 하는 머신러닝과 차이점이 있다.

 

기본 머신 러닝 모델은 그 기능이 무엇이든 점진적으로 향상되는데, 여전히 약간의 안내가 필요하다. AI 알고리즘이 부정확한 예측을 반환하면 엔지니어가 개입하여 조정해야 한다. 딥 러닝 모델을 사용하면 알고리즘이 자체 신경망을 통해 예측의 정확성 여부를 스스로 판단할 수 있다.

 

->아직 잘 모르겠음... 공부하면서 더 알아갈 예정

 

 

파라미터와 하이퍼파마리터

파라미터는 모델 내부에 존재하는 매개변수이다.

파라미터는 학습의 대상으로, 학습 알고리즘을 통해 자동적으로 학습하게 된다.

"파라미터 최적화(Paramater Optimization)"의 파라미터가 바로 이 파라미터이다.

예) 회귀 모델에서의 계수, 딥러닝 모델에서의 가중치

 

하이퍼파라미터는 경험, 데이터의 특성 등에 근거해 사용자가 설정하는 값이다.

예)경사 하강법에서의 학습률(learning rate), k-NN 모델에서의 k값

 

 

딥러닝에 비선형 왜 필요한가

활성화 함수..?

선형 층을 깊게 쌓아도 여전히 하나의 선형 연산이기 때문에 층을 여러 개로 구성하는 장점이 없음

즉 층을 추가해도 가설 공간이 확장되지 않음

-> 찾아봐도 알듯 말듯.. 이해하지 못함... 머신러닝부터 다시 차근차근 공부해서 이해해야지..

 

 

로지스틱 회귀

로지스틱 회귀는 회귀 알고리즘이 아니라 분류 알고리즘

로지스틱 회귀는 선형 회귀의 분류 버전으로 중간층이 없고 하나의 유닛과 시그모이드 활성화 함수를 사용한 출력층만 있는 네트워크와 비슷함

 

로지스틱 회귀(Logistic Regression)는 회귀를 사용하여 데이터가 어떤 범주에 속할 확률을 0에서 1 사이의 값으로 예측하고 그 확률에 따라 가능성이 더 높은 범주에 속하는 것으로 분류해주는 지도 학습 알고리즘

 

-> 이 개념 또한 더 공부가 필요한 부분

 

 


출처

sungwookkang.com/1414

hleecaster.com/ml-perceptron-concept/

brunch.co.kr/@gdhan/2

brunch.co.kr/@gdhan/5

brunch.co.kr/@gdhan/7

blogs.nvidia.co.kr/2016/08/03/difference_ai_learning_machinelearning/

www.zendesk.kr/blog/machine-learning-and-deep-learning/

heekangpark.github.io/machine_learning/05-parameter-hyperparameter

chungwoldevelop.tistory.com/67

hleecaster.com/ml-logistic-regression-concept/