통계 및 데이터 마이닝

그림1
군집, 예측, 분류, 연관성 등의 데이터 마이닝 모델링 기법과 통계 분석, 실험계획법, 시계열분석 등의 기능은 다양한 업무분야에 활용되어집니다.

예측분석

회귀분석 정보와 예측치 가시화

  • 과거 데이터를 바탕으로 미래 데이터의 연속적인 값을 예측하는 방법
  • 예측 오차 및 설명력(R-sqaure)을 바탕으로 예측 모델을 선정

 

 

다양한 예측 알고리즘 제공

ECMiner™ 예측 노드

분류 알고리즘
예측 기법 MLR (다변량 회귀분석)
PLS(부분 최소자승법)
PCR(주성분 회귀)
인공신경망 MLP(Multi-Layer Perceptron)
RBF(Radial basis function)
Support vector SVR

 

예측모델은 독립변수와 종속변수 사이의 함수 식을 찾아 종속변수의 값을 예측하는 모형을 만드는 데이터 마이닝 기법입니다. 예측모형을 통해 품질 예측, 수율 예측 등의 모델링에 활용될 수 있습니다.

분류분석

분류

 

  • 일정 규칙을 이용하여 이산적인 결과값(class)을 구분하는 방법
  • 분류 정확도(오분류율)를 기준으로 분류 기준 또는 방법을 결정

다양한 분류 알고리즘 제공

ECMiner™ 분류 노드

분류 알고리즘
분류 기법 KNN(k-최근접이웃분류)
Logistic regression
Score card
CART(의사결정나무)
Support vector SVC
인공신경망 MLP(Multi-Layer Perceptron)
RBF-DDA
판별분석 LDA
QDA

 

분류 모델(CART) 정보와 분류 트리 가시화

분류 모델이란 새로운 데이터를 특정 그룹으로 할당하기 위한 최적 분류 규칙(또는 함수,모형)을 유도하는 데이터 마이닝 기법입니다. 분류 모델을 통해 품질 등급 결정, 최적 조업 조건 도출 등의 활용이 가능합니다.

연관규칙분석

  • 상품을 구매하는 등의 일련의 거래나 사건들의 연관성을 도출하는 방법
  • 향상도를 바탕으로 의미 있는 규칙을 선별
    *향상도 : 연관 규칙을 구성하는 항목(조건과 결과)간의 상관관계를 나타내는 척도

연관 규칙 분석 알고리즘과 네트워크 연계

ECMiner™ 연관 규칙 노드

분류 알고리즘
연관규칙 Apriori rule(연관 규칙)
순차연관성

 

연관규칙 분석이란 데이터 속에 내재된 다양한 패턴을 찾기 위한 데이터 마이닝 기법으로, 데이터 안에 존재하는 항목들 간의 종속관계를 찾아낼 수 있습니다. 주로 시장 바구니 분석에 활용되며, 제품 불량에 따른 공정 패턴 발견에도 응용될 수 있습니다.

 군집 분석

군집화

  • 비슷한 속성을 지니는 데이터를 그룹화하는 방법으로 데이터 간의 거리를 기반으로 군집 형성
  • 군집 내 거리/ 군집 간 거리를 바탕으로 군집 개수 결정

다양한 군집화 알고리즘 제공

ECMiner™ 군집화 알고리즘

분류 알고리즘
군집화 Hierarchical(계층군집화)
K-means(비계층군집화)
인공신경망 SOM(Self Organizing Map)

 

군집 모델 정보와 3D차트를 통한 가시화

군집화란 데이터의 여러 속성을 비교하여 유사한 특성을 갖는 개체나 항목들이 함께 그룹이 되도록 군집으로 집단화하는 데이터 마이닝 기법을 말합니다. 군집화는 유사 운전 조건 군집화를 통해 군집 별 품질을 비교할 때 활용됩니다.