본문 바로가기
자료처리

Orange Data Mining을 이용한 주성분 분석과 군집분석

by Prof. Sung-Deuk Choi 2024. 7. 1.

Orange는 파이썬에 기반한 무료 기계학습 소프트웨어입니다. 

 

 

Orange Data Mining

Orange Data Mining Toolbox

orangedatamining.com

 

엑셀이나 CSV 파일을 불러와서 위젯을 하나씩 연결해서 그래프도 그리고 결과물도 저장할 수 있습니다. Drag and drop 방식이라서 기존에 SAS를 사용하지 않았더라도 마인드 맵을 사용한 학생은 아주 쉽게 다양한 기계학습을 수행할 수 있습니다. R이나 파이썬 코드를 작성하기 어려운 학생들도 아주 쉽게 기계학습을 할 수 있습니다.

 

아래는 실행화면이고, CSV 파일을 불러와서 어떤 순서로 모델이 실행되는지 설명을 추가했습니다. 예전에 작성했던 PAH 논문 자료로 주성분 분석과 군집분석을 수행했습니다. 

 

 

주성분 분석의 점수 그림(score plot)과 군집분석의 덴드로그램(dendrogram)입니다. 필요하면 주성분 분석 결과는 엑셀이나 다른 소프트웨어로 다시 그려도 될 것 같습니다.  

 

두 통계기법의 구체적인 설명 페이지입니다.

https://orangedatamining.com/widget-catalog/unsupervised/PCA/

https://orangedatamining.com/widget-catalog/unsupervised/hierarchicalclustering/

 

파이썬 코드입니다. 

Projection (projection) — Orange Data Mining Library 3 documentation (orange3.readthedocs.io)

'자료처리' 카테고리의 다른 글

Python 주성분 분석  (0) 2024.07.01
R 주성분 분석  (0) 2024.07.01
SigmaPlot 주성분 분석  (0) 2024.07.01
OriginPro 주성분 분석  (0) 2024.07.01
MATLAB 주성분 분석  (0) 2024.07.01

댓글