일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 분산분석
- 분포
- pca
- 가설검정
- 다중공선성
- 딕셔너리
- p-value
- 교차검증
- list
- distribution
- merge
- SQL on 하둡
- cross validation
- DataFrame
- 밀도기반
- 하둡
- dict
- 유사도
- SPLIT
- 결정계수
- hive
- Sawzall
- pig
- join
- Python
- k-means
- DBSCAN
- T-검정
- 병렬 쿼리 시스템
- 데이터프레임
- Today
- Total
one of a kind scene
[ADP 대비] 5장_4절 정형 데이터 마이닝_인공신경망 분석 본문
인공신경망 분석
본문1 크기로 주제 내 소주제에 대한 간단한 정의를 써준다
1. 인공신경망 주요 연구 이슈
• 연결강도(weight)를 조정하는 학습규칙과 퍼셉트론(Perceptron)이라는 인공세포 개발됨
• 비선형성의 한계점 발생 : XOR(Exclusive OR)문제를 풀지 못하는 한계 발생
• 역전파알고리즘(Backpropagation)을 활용하여 비선형성을 극복
→ 비선형성을 극복한다계층 퍼셉트론으로 새로운 인공신경망 모형 등장
2. 활성 함수(activation function) = 전이함수
3. 신경망 모형 구축시 고려사항
① 입력변수
• 신경망 모형은 그 복잡성으로 인하여 입력 자료의 선택에 매우 민감
• 연속형 변수 : 평균을 중심으로 대칭이 아니면 좋지 않은 결과를 도출할 수 있음
(예)
- 고객의 소득(대부분 평균미만이고 특정 고객의 소득이 매우 큼) → 로그변환
- 범주화를 통해 각 범주의 빈도가 비슷하게 되도록 설정
• 범주형 변수 : 범주화 변수의 경우 가변수화(남녀 : 1, 0 또는 1, -1)하여 적용하고 가능하면 모든 범주형 변수는 같은 범위를 갖도록 가변수화 하는 것이 좋음
(변수별 신경망 모형에 적합 조건)
범주형 변수 | 모든 범주에서 일정 빈도 이상의 값을 갖고, 각 범주의 빈도가 일정 |
연속형 변수 | 입력변수 값들의 범위가 변수간의 큰 차이가 없을때 (따라서, 표준화 필요) |
② 가중치(Weight)의 초기값과 다중 최소값 문제
• 역전파 알고리즘은 초기값에 따라 결과가 많이 달라짐 → 초기값 설정은 매우 중요한 문제
• 일반적으로 가중치의 초기값은 0 근처로 랜덤하게 선택
• 가중치가 0에 가까울수록 선형모형에 가깝고 가중치 값이 증가할수록 비선형모형이 됨
③ 과대 적합 문제 (Over Fitting)
• 신경망에서는 많은 가중치를 추정해야하므로 과대적합 문제가 빈번함
• 알고리즘 조기종료, 가중지 감소 기법(weight decay)으로 해결 가능
• 알고리즘 조기종료는 모형이 적합하는 과정에서 검증오차가 증가하기 시작하면 시행함
• 선형모형의 능형회귀(Ridge, L2 Penalty)와 유사한 가중치 감소라는 벌점화 기법을 활용