본문 바로가기

전체 글387

jamovi 통계 소프트웨어 주성분 분석 이번에는 JASP와 비슷하게 R에 기반만 jamovi로 주성분 분석을 해보겠습니다. jamovi는 웹브라우저에서 구동되는 클라우드 버전과 PC 설치 버전이 있습니다. jamovi - open statistical software for the desktop and cloud 아래는 클라우드 버전 화면입니다. PC 버전과 거의 같습니다.왼쪽 스프레드 시트로 입력자료를 불러오고, 상단 메뉴의 통계 기법을 선택하여 여러 옵션을 클릭하면 오른쪽 작업창에 거의 실시간으로 통계결과가 표출됩니다. 그러나 통계 메뉴가 너무 단촐합니다.  우측 상단에 보이는 모듈 추가 메뉴를 클릭해서  snowCluster 모듈을 추가했습니다. 저자가 한국인이네요. 여러 통계기법이 추가되었습니다. 그러나 여전히 다양한 기계학습 차원에서.. 2024. 7. 1.
JASP 통계 소프트웨어 주성분 분석 JASP는 R에 기반한 무료 통계 소프트웨어입니다. 자료 입력 화면입니다. SPSS와 거의 동일하게 쉽게 자료를 스프레스시트 형식으로 표출합니다.  주성분 분석 메뉴도 SPSS와 같이 요인분석 아래에 있습니다. 아래 구체적인 메뉴를 보면 회전 방식을 선택할 수 있습니다. 다른 통계 소프트웨어(SAS, MATLAB, R 기본 패키지 등)에는 PCA의 경우, 회전 옵션이 없습니다. 이미 주성분들이 서로 직교하기 때문입니다. 그러나 SPSS로 주성분 분석을 할 때는 보통 직교회전의 Varimax를 선택합니다. JASP에서도 SPSS와 동일한 옵션을 제공합니다.  JASP의 단점은 점수(score)를 따로 저장하는 옵션이 없다는 것입니다. 당장 논문에 필요한 점수그림(score plot)을 그릴 수 없는 상황입.. 2024. 7. 1.
SAS Studio 통계 소프트웨어 주성분 분석 SPSS와 R의 중간 정도 수준(코드 + GUI)으로 통계처리를 하고 싶다면 SAS를 사용하는 것이 적당합니다. 아래 링크에서 무료로 가입(SAS Profile 클릭)해서 온라인으로 SAS를 사용할 수 있습니다. SAS OnDemand for Academics SAS Profile을 만든 후에 Sign In을 하면 아래 화면이 나옵니다. Launch를 클릭하면 SAS가 실행됩니다. 실행화면 상단입니다. 우측에 SAS 프로그래머를 선택하면 코드 위주로 통계처리를 하는 것이고(R, 파이썬과 유사), 시각적 프로그래머를 선택하면 드래그 앤 드롭을 사용해서 코드를 몰라도 통계처리를 할 수 있습니다.   PCA 입력자료를 온라인에 저장하고, 입력 파일을 제대로 인식했는지 확인할 수 있습니다. SAS 프로그래머를 .. 2024. 6. 30.
주요 통계 소프트웨어 주성분 분석(PCA) 방법 소개 다양한 통계 소프트웨어를 이용해서 PCA 방법을 정리했고, 앞으로 이어지는 글을 통해서 결과를 제시할 예정입니다. 주성분 분석(PCA)은 2000년대 초반부터 국내 잔류성유기오염물질(POPs) 연구에 널리 사용되기 시작했습니다. 다이옥신과 PCBs 등은 많은 동질체(congener)가 있기 때문에 시료별 오염특성을 파악하고 비교하기 위해서는 다변량 통계기법을 사용해야 합니다. PAHs도 마찬가지입니다. 예를 들어, 시료 하나만 분석해도 10~20개 성분(변수) 자료가 산출되므로, 이런 많은 변수를 2~3개 주성분으로 축약하여 더 쉽게 오염특성을 평가할 수 있습니다.  제가 처음 PCA를 접한 것은 석사 과정(1999~2000) 중이었습니다. 당시 포항공대에서 산업공학을 전공하시던 분을 모시고 PCA 강의.. 2024. 6. 28.
한국연구재단 기초연구과제 현황에 대한 생각 어제 교내 언론 스크랩에 나온 한국연구재단 기초연구지원사업  관련 기사입니다.   “해외 교수 마다하고 30대에 들어왔는데, 연구비 0원"... 성장 체계 흔들리는 이공계 | 한국일보 (hankookilbo.com) "해외 교수 마다하고 한국 온 30대 공대 교수, 연구비 0원" | 한국일보수도권 소재 한 이공계 대학의 박성찬(가명) 교수는 얼마 전까지 해외 유명 대학 교수였다. 외국에서 일하다 30대의 젊은 나이에 큰맘 먹고 한www.hankookilbo.com 실체도 없는 연구비 카르텔을 잡겠다고 칼을 휘두른 결과입니다. 연구재단과제에 크게 의존하는 기초과학연구자들이 큰 타격을 입었습니다. 우리 연구실은 연구재단 중견과제를 수행 중이어서 이번 과제 선정과는 무관하지만 몇 년 후에 연구재단과제를 수주하.. 2024. 6. 26.
결정계수와 상관계수 구별 여전히 결정계수와 상관계수를 정확하게 구별하지 않고 논문이나 보고서를 작성하는 학생들이 있습니다.  결정계수: coefficient of determination, R2 (회귀식, 회귀모델 설명력)상관계수: correlation coefficient, r (양의 상관성, 음의 상관성, Pearson/Spearman 상관분석 결과)측정값과 예측값의 산포도 위에 회귀식과 결정계수 R2를 제시했다면, 상관성이 크다고 하는 것보다는 결정계수가 크다(모델의 설명력이 XX%이다)고 기술하는 것이 적절합니다. 같은 자료에 대해서 상관계수 r 값을 제시했다면, 측정값과 예측값의 상관성이 크다고 할 수 있습니다.  ChatGPT로 정리한 내용입니다. 2024. 6. 22.
Time to say good bye, 알툴즈 알툴즈를 설치하면 광고가 계속 나오지만 무료로 다양한 소프트웨어를 사용할 수 있어서 좋았습니다.  아래 그림에는 없지만 마인드맵 소프트웨어인 알맵과 홈페이지 운영하면서 알 FTP도 많이 사용했습니다.  그런데 알캡처만 제외하고 공공기관에서 무료 버전을 사용할 수 없습니다. 저작권 관련하여 업체에서 적극 대응 중인 것 같습니다. 같은 노트북을 사용해도 집에서는 합법, 학교에서는 불법이 됩니다. 그래서 노트북에서도 알캡처만 제외하고 다른 알툴즈를 모두 삭제했습니다.  알캡처 ▶ 픽픽  픽픽(PicPick) - 올인원 그래픽 디자인 도구 (화면 캡처 및 녹화, 이미지 편집, 색상 추출, 눈금자,픽픽(PicPick) - 올인원 그래픽 디자인 도구 (화면 캡처 및 녹화, 이미지 편집, 색상 추출, 눈금자, 각도기.. 2024. 6. 19.
중국 6개 권역과 성의 위치 대기오염물질의 장거리 이동을 연구할 때 구체적인 중국의 권역과 성의 위치를 알아야 합니다. 논문에 이런 구체적인 정보를 제시하지 않고 그냥 중국의 동북부라고만 하면 중국의 권역인 동북지역(랴오닝성, 지린성, 헤이룽장성)과 화북지역(베이징, 텐진, 허베이성, 산시성, 네이멍구자치구) 중에서 어디를 언급하는 것인지 혼란이 생깁니다. 또한, 중국의 남부라고만 하면, 중남지역(광둥성, 마카오, 홍콩, 후난성 등)인지 화동지역(산둥성, 장쑤성, 상하이, 저장성 등)인지 알 수 없습니다.   ArcGIS로 중국 그림을 그릴 때 성까지 나오는 shp 파일을 사용하라고 하는 이유입니다. ArcGIS 10.X 국가별(중국 예시) 행정구역도 추가하기 (tistory.com) 권역과 성의 영문명은 다음과 같습니다.  더 구.. 2024. 6. 15.
6월 15일 오후, 울산 미세먼지 농도 전국 최고 어제는 오전에 울산의 미세먼지(PM2.5) 농도가 전국에서 가장 높았는데, 오늘은 오후에 농도가 높았습니다. 어제와는 확연히 다르게 하늘이 뿌옇습니다. 보통 울산에서 미세먼지 농도가 높으면 거의 모든 측정소에 농도가 높습니다. 그런데 아래 그림에서와 같이 동구 미세먼지 농도는 25 μg/m3인데, 서쪽에 있는 범서읍에서는 59 μg/m3입니다. 지역 내에서 이렇게 농도 차이가 나는 경우를 별로 못 봤습니다. 비철금속산단과 석유화학산단에서 직접 배출 및 2차 생성된 먼지가 주로 태화강 이남 지역으로 이동한 것인지 파악해 봐야할 것 같습니다. 단기적인 대기오염 현상에 대해 너무 민감하게 받아들일 필요는 없습니다. 그러나 왜 이런 현상이 발생했는지, 시공간적으로 어떤 양상으로 대기오염 현상이 변하고 있는지 연.. 2024. 6. 15.
6월 14일 오전, 울산 미세먼지 농도 전국 최고 현재(2024년 6월 14일 오전 11시) 울산이 전국에서 PM2.5 농도가 가장 높습니다. 울산에서 여름에 고농도 미세먼지가 수시로 발생합니다.  현재 기온은 32도입니다. 여름철 고농도 현상은 대기정체, 2차 생성, 지역(산단) 배출 영향 등으로 발생합니다.    제 사무실에서 찍은 사진입니다. 하늘이 약간 뿌옇게 보이기는 하지만 울주군에서는 이 정도로 높은 농도는 아닌 것 같습니다.   대기모델 예보결과에서는 특별히 울산에서 고농도를 보이지 않습니다. 모델이 현재 대구와 울산의 고농도 현상을 예측하지 못했다는 것을 의미합니다. 2024. 6. 14.