1. 역전파 알고리즘
: 인공신경망의 출력값이 원하는 출력과 다를경우, 가중치 갱신을 통해 오차를 최소화시키도록 반복 수행하여 신경망을 학습시키는 알고리즘
2. 자기조직화지도(Self-Organizing Map)
: 차원축소와 군집화를 동시에 수행하며, 고차원으로 표현된 데이터를 저차원으로 변환하여 보는 비지도 학습 기반 클러스터링 기법
3.파라미터
-파라미터: 모델 내부에서 확인이 가능한 변수로 데이터를 통해서 산출이 가능한값
-하이퍼 파라미터: 모델에서 외적인 요소로 데이터 분석을 통해 얻어지는 값이 아니라 사용자가 직접 설정해주는 값
4.주성분 회귀(Principal Component Regression)
: 독립변수들의 주성분들을 추출한 후 이 주성분들을 이용해서 회귀 모델을 만드는 기법
5. 가지치기와 정지규칙
-가지치기: 분류 오류를 크게할 위험이 높거나 부적절한 추론규칙을 가지고 있는 가지 또는 불필요한 가지를 제거하는 단계
-정지 규칙: 더 이상 분리가 일어나지 않고 현재의 마디가 끝마디가 되도록하는 규칙
6. 교호작용
: 독립변수 간의 상호 작용이 종속변수에 영향을 주는 현상 주로, 이원배치분산분석에서 발견
7.퍼셉트론
: 입력층과 출력층으로만 구성된 최초의 인공신경망
8.시그모이드 함수
: 인공뉴런의 활성함수로 실함수로써 유한한 영역을 가지는 집합이고 미분가능하며, 모든 점에서 음이 아닌 미분값을 가지고 단 하나의 변곡점을 가지는 함수, 편미분을 진행할수록 0으로 근접
9. 슬랙 변수
: SVM의 구성요소이며, 완벽한 분리가 불가능할 때 선형적으로 분류를 위해 허용된 오차를 위한 변수
10. 정상성
: 시점에 상관없이 시계열의 특성이 일정하다는 의미, 시계열분석을 위해서는 정상성을 만족해야함
11. 시계열모형
-자기회귀모형(AR): 현시점의 자료가 P시점 전의 유한개의 과거 자료로 설명될 수 있다는 의미
-이동평균모형(MA): 시간이 지날수록 관측치의 평균값이 지속적으로 증가하거나 감소하는 시계열 모형
-자기회귀누적이동평균모형(ARIMA): 기본적으로 비정상 시계열모형이기 때문에 차분이나 변환을 해야함
12.시계열의 구성요소
-추세요인( I ): 자료가 어떤 특정한 형태를 취함
-계절요인(S): 고정된 주기에 따라 자료가 변화할 경우
-순환요인(C): 알려지지 않은 주기를 가지고 자료가 변화
-불규칙요인(I): 추세, 계절, 순환 요인으로 설명할 수 없는 회귀 분석에서 오차에 해당하는 요인
13.전 확률의 정리
: 나중에 주어지는 사건 A의 확률을 구할 때, 그 사건의 원인을 여러가지로 나누어서, 각원인에 대한 조건부 확률과 그 원인이 되는 확률의 곱에 의한 가중합으로 구할수있다는 법칙
14.베이즈 정리
: 어떤 사건에 대해 관측 전(사전 확률)원인에 대한 가능성과 관측후(사후확률)의 원인 가능성 사이의 관계를 설명하는 확률이론
15.딥러닝
- DNN알고리즘: 은닉층을 심층 구성한 신경망으로 학습하는 알고리즘 구조// 입력층, 은닉층, 출력층으로 구성
- CNN알고리즘: 시각적 이미지를 분석하는 데 사용되는 심층신경망으로 합성곱 신경망이라고도함
- RNN알고리즘: 은닉층에서 재귀적인 신경망을 갖고있는 알고리즘, 음성신호, 시계열데이터분석에 적합
'R' 카테고리의 다른 글
[빅분기 실기] 작업형 2번문제 EDA(데이터 뜯어보기) (2) | 2021.06.11 |
---|---|
[빅분기 실기] pROC, ROCR의 차이점 (0) | 2021.06.11 |
[빅분기 실기대비] 단답형 예상 개념 ③ (0) | 2021.06.10 |
상관분석(그래프) with mtcars (0) | 2021.06.09 |
R CONSOLE창 에러메시지 영어로 뜨게하는법 (0) | 2021.06.07 |