박사과정 중에 해양 수괴(water mass)에 대한 기여도를 파악하고 이산화탄소 흡수에 관한 3차원 자료 해석을 위해서 MATLAB 패키지인 OMP analysis를 사용했습니다. 예전 자료를 확인했더니, 2002년 월드컵이 한창이던 때에 MATLAB과 Surfer로 작업을 많이 했습니다.
OMP Analysis - File Exchange - MATLAB Central (mathworks.com)
MATLAB은 대표적인 공학 소프트웨어로서 수치해석에 특화되어 있습니다. 이공계생이라면 기본적으로 많이 사용하고 있고, MATLAB에 익숙한 학생이라면 R을 쉽게 사용할 수 있습니다. 반대도 마찬가지입니다.
예전에는 MATLAB을 혼자 배우기 어렵다는 생각이 많았는데, 요즘은 MATLAB을 혼자 배우기 너무 좋아졌습니다. 프로그램도 사용하기 편하게 많이 개선되었고, 온라인 도움말과 강의가 많습니다. R에 비해 MATLAB은 유료(UNIST 라이선스가 있어서 교내외에서 사용 가능)이고 매우 무거운 프로그램입니다. 그러나 R보다 GUI 환경이 잘 되어 있어서 기계학습(머신러닝)을 하기 편합니다.
아래 도움말에서 기계학습 전반적인 내용을 파악할 수 있습니다. 회귀학습기(Regression Learner)를 사용해서 오염물질 농도를 예측할 수 있습니다.
아래 블로그도 도움이 많이 됩니다.
https://blog.naver.com/PostList.nhn?blogId=matlablove&from=postList&categoryNo=29
울산의 기준성대기오염물질 농도를 이용해서 PM2.5 농도를 학습시켰습니다.
PM10 자료까지 포함해서 학습을 시켰기 때문에 당연히 좋은 결과가 나왔습니다.
위에서는 Bagged Trees 기법을 사용했는데, 다양한 기법을 모두 이용해서 한 번에 결과가 나오게 할 수도 있습니다. 아래 그림과 여러 인공신경망 기법을 순차적으로 적용할 수도 있습니다. 인공신경망보다는 Tree 앙상블 결과가 더 좋았습니다.
MATLAB으로 전반적으로 기계학습에 대해 접하고 나서, R로 기계학습을 하는 것이 훨씬 수월할 것 같습니다.
'자료처리' 카테고리의 다른 글
파이썬 & 아나콘다(주피터 노트북) 설치 (0) | 2022.02.12 |
---|---|
코랩에서 R 사용하기 (클라우드) (0) | 2022.02.11 |
엑셀파일 합치기 (0) | 2021.10.31 |
PMF 모델 결과해석 주의 사항 (0) | 2021.06.28 |
HYSPLIT (역궤적 프로그램) PC 버전 설치하기 (0) | 2021.05.17 |
댓글