본문 바로가기

정규화2

[ML] 피처 스케일링과 정규화(Scikit-Learn) -목차- 1. 표준화(Standardization), 정규화(Normalization)란? 1.1 표준화 1.2 정규화 2. StandardScaler 3. MinMaxScaler 구현 코드 : Feature_Scaling 1. 표준화(Standardization), 정규화(Normalization)란? 머신러닝은 데이터를 가지고 학습한다. 그런데 데이터의 각 피처는 단위도 다르고 각 피처간 값의 범위도 꽤 차이가 있다. 각 피처의 단위가 다르고 범위가 다르면 제대로 값을 비교할 수 없다. 특히 선형 회귀 문제애서 매우 큰 값을 가지는 피처는 모델의 가중치가 편향 되거나 학습시간이 오래 걸리는 문제를 야기한다. 이러한 문제를 해결하기 위해 서로 다른 변수의 값 범위를 일정한 수준으로 맞추는 작업을 피처 .. 2022. 2. 21.
[DB] 정규화(Normalization) -목차- 1. 정규화(Normalization)란? 2. 제1 정규형 3. 제2 정규형 4. 제3 정규형 5. BCNF(Boyce-Codd) 정규형 6. 정규화에는 어떠한 장점이 있는가? 6.1 정규화의 단점은 없는가? 6.2 반정규화 1. 정규화(Normalization)란? 한 릴레이션에 여러 엔티티의 애트리뷰트들을 혼합하게 되면 정보가 중복 저장되며, 저장 공간을 낭비하게 된다. 또 중복된 정보로 인해 갱신 이상이 발생하게 된다. 동일한 정보를 한 릴레이션에는 변경하고, 나머지 릴레이션에서는 변경하지 않은 경우 어느 것이 정확한지 알 수 없게 되는 것이다. 이러한 문제를 해결하기 위해 정규화 과정을 거치는 것이다. 정규화의 목적 데이터의 중복을 없애면서 불필요한 데이터를 최소화시킨다. 무결성을 지키.. 2022. 2. 6.