통계예언학과 정기 보고서 - 통계예언학을 이용한 기상예측모델 연구


통계예언학을 이용한 기상예측모델 연구
A Study for Weather Research and Forecasting Model Using Prophecy-statistics


저널정보

SCP재단
연구부 정기 보고서 제132권 제9호

2024.12 | 220~228 (9 page)

DOI: 13.2459/SCP.████.██

저자정보

안예정(제05K기지 통계예언학과)
김서정(제05K기지 통계예언학과)
오주석(제27K기지 기상학과)

220

연구부 정기 보고서 제132권 제9호 2024.12. pp. 220~228




통계예언학을 이용한 기상예측모델 연구1
안예정2 · 김서정2 · 오주석3


요   약

SCP-312-KO, SCP-315-KO 등 통계예언학과를 필두로 한 예언성변칙개체에 대한 연구가 관심을 받는 가운데, 지구온난화 등 비변칙적 기후변화에 대비하기 위한 기존 기상예측모델의 개선에 통계예언학적 방법을 도입한다면 점차 불안정해지는 기후 변화에 초점을 맞춘 새로운 모델을 기대할 수 있을 것이다. 본 연구에서는 재단 내 보유 중인 예언성변칙개체의 예언의 수집과 매개변수화 및 통계적 분석을 통해 기후 변화와 관련된 예언을 추출해 기상예측모델을 개선하는 것을 목표로 하여, 새로운 분야인 기후예언학의 발전가능성 및 한계점까지 논의하고자 한다. 연구에 적용된 변칙적 예언 모델은 총 8개이며, 각 예언에 따른 모델별 편차는 다양하게 나타났으나 모든 모델의 1년 이내의 근미래와 50년 이후의 미래의 결과에서는 편차가 상대적으로 작게 나타났다. 이는 대조군인 기존 기상예측모델과는 큰 차이가 나기 때문에 먼 미래에 일어날 기후변화 예측에 대한 추가 연구가 요구된다.

주제어: 미래기후변화, 기상예측모델, 통계예언학, 예언성변칙개체

I. 서론

 최근 비변칙적 기후변화의 현실화로 인하여 폭염, 폭우, 폭설 등의 이상 기후현상이 빈번해지고, 이로 인한 피해는 점점 더 심각해지고 있다. SCP재단의 매년 격리비용 및 직원 복지비용은 4% 가량 증가하고 있는 추세로, 추가 연구에 따르면 이는 더욱 가파른 상승세를 보일 전망이다(SCP재단, 2017). 한국사령부 내 고밀도 격리시설의 노후화에 따른 쇠퇴 가속과 지속적인 개발은 불투수층과 균열 피로를 증가시켜 이상 기후현상에 의한 취약지를 증가시킬 것이다.

 60년대~90년대에 주로 지어진 주요 기지(제01K기지, 제02K기지 등)를 중심으로 하여 시행한 이상 기후현상에 따른 건물의 노후화 및 실시간 리스크 분석에 의하면 1년 중 홍수 또는 폭설 발생 시 건물에 가해지는 스트레스는 평소에 비해 40% 가량 높은 것으로 파악된다(김상희 외, 2019).
 제27K기지 기상학과에서는 이러한 기지 노후화와 연계된 기후 변화에 대비하기 위하여 기존의 기상모델을 인공지능징집병 등 최신 기법을 활용하여 계속해서 발전시켜왔으나, 최신 연구에서는 2018년 제작된 모델인 WRF-F2018AIC를 통하여 이후 5개년의 기상



1. 본 연구는 2024년도 SCP재단 한국사령부 연말 정기 보고서로 SCP재단의 지원을 받아 작성되었음.
2. SCP재단 한국사령부 제05K기지 연구부 통계예언학과
3. SCP재단 한국사령부 제27K기지 연구부 기상학과

221

연구부 정기 보고서 제132권 제9호 2024.12. pp. 220~228


데이터(강우량, 최고/최저 온도, 강설량, 미세먼지 농도, RNA 바이러스 농도, 프랑스 빵 농도, 강혈량의 7가지 데이터)를 예측하였으나, 민간 모델을 활용하여 만든 이전 모델인 WRF-F2014가 2014년부터 2018년까지의 데이터를 예측한 것에 대비하여 약 7%의 오차가 증가한 것을 확인하였다(오주석, 2023). 이는 비변칙적 기후변화의 폭증으로 인한 것으로, 기상현상의 카오스적 특성 즉 예측 불가능성에 의하여 일어난 결과로 분석되었다.
 앞서 언급한 바와 같이 증가하는 비변칙적 예측 불가능성에 의하여 기상 예측이 점점 더 어려워지는 반면에, 이상 기후현상으로 인한 기지의 노후화와 그 피해는 더욱 커지고 있다. 이를 더욱 정확하게 예상하고 피해를 추산하며 미리 대비하기 위하여, 기상 예측에 반(anti)-카오스 논리 개체, 즉 예언성변칙개체를 활용하여 기상예측모델의 정확도를 높이고자 한다.
 따라서 이 연구는 다음과 같은 연구의 목적을 설정하고자 한다. 첫째, 예언성변칙개체의 예언 샘플을 획득하여 이를 음절 단위로 분리하고, 매개변수화하여 기후 변화와의 상관관계를 분석한다. 둘째, 이렇게 얻어낸 개체별 매개변수의 값을 통한 기상예측모델을 산정하고, 과거의 데이터를 통하여 상관관계의 유효성을 검증한다. 셋째, 통계적으로 유효한 모델에 대하여 미래의 기후변화를 예측하고 향후 발전과제에 대하여 논의하고자 한다. 본 연구를 통하여 통계예언학과 기상예측의 융합인 '기후예언학'의 발전을 기대할 수 있다고 시사되며 그 발전가능성과 한계점까지도 논하고자 한다.

II. 이론적 고찰 및 선행연구 검토

1. 예언의 매개변수화

 예언이란 글, 말 등 언어적 매체부터 폭넓게는 행동, 색깔, 개수, 밝기, 전자기 및 전파 신호, 열에너지 등 변화하여 전달과 해석이 가능한 모든 매체를 통하여 미래의 일을 전하는 것을 이른다. 이 때 엔트로피 및 카오스에 따른 물리법칙은 무시되며, 정상성에 위배하여 필연성을 지니게 되는 특징이 있다. 현재 SCP재단은 SCP로 등록하여 격리 중인 개체부터 변칙 개체로 관리하는 개체까지 예언을 할 수 있다고 판단되는 3천 개 이상의 개체를 보유 또는 관찰 중이다.

Fig1

<그림 1> 예언성변칙개체의 예시. 시각재해적 부분 편집됨.




222

연구부 정기 보고서 제132권 제9호 2024.12. pp. 220~228



 이러한 예언을 능동적으로 실행하는 개체들은 그 정확성과 해석 여부에 관계없이 전부 예언성변칙개체라고 불리우며, 또 다른 최신연구에서는 예언성변칙개체를 속성에 따라 분류하는 연구를 진행하고 있다(김서정 외, 2021). 예언성변칙개체 자체 속성의 분류뿐만 아니라, 통계예언학적 방법이 발달함에 따라 예언의 속성을 파악하는 것이 중요한 임무로 자리잡고 있다.
 예언의 주된 연구 방법으로는 매개변수화가 있으며, 인공지능징집병에 탑재된 언어모델을 통한 분석으로 2000만개 이상의 매개변수로 1980년부터 2000년까지의 예언을 처리한 데이터베이스가 통계예언학과의 연구에 의하여 개발되었다.(안예정, 2002) 이를 통하여 새로운 예언의 관측 시 그 정확성과 기존 예언과의 상관관계를 실시간으로 밝히는 시스템이 개발되었지만(이승수, 2021) 오차로 인해 추가연구 및 데이터베이스의 개선이 필요한 상황이다.

2. 변칙적 기상관측 모델

Fig2

<그림 2> 현재 가동중인 WRF-F2018AIC의 모습.

 재단 내 운용중인 3세대 이상의 인공지능징집병(AIC)은 모두 변칙적인 '창발성 알고리즘'을 사용하여 학습되었으며, 이는 가상(virtual)특이점에 도달하여 뛰어난 학습능력을 가지어 연구원으로 하여금 새로운 알고리즘의 개발을 도울 수 있게 한다(Max et al, 1998).
 제27K기지 기상학과에서는 기지 내 운용중인 3.5세대 AIC를 통하여 기상 데이터를 학습한 모델 "WRF-F2018AIC"를 개발하였으며, 1920년부터 1980년까지의 데이터 학습을 통하여 학습 데이터로부터 20년 뒤인 2000년의 기후 및 기상 이변을 정확도 89.7%, 신뢰도 99%로 예측하는 결과를 보여주었다(오주석 외, 2018). 그러나 기후 변화가 급가속된 뒤로는 1920년부터 2018년까지의 데이터 학습에도 불구하고 20년 뒤의 기후 예측에 대한 신뢰도가 약 3%p 하락하며 큰 오차를 보였다. 근미래의 결과에 대해서는 최근 20년 간 만들어진 모델 중에서는 가장 높은 신뢰도를 보이기 때문에 신형 모델의 개발이 지연되었지만, 거듭되는 기상 이변으로 먼 미래의 기후변화 예측이 중요해진 만큼 새로운 모델 개발의 필요성이 대두되고 있다.

III. 예언 가공 및 기상예측 모델링

1. 예언 샘플의 추출 및 전처리 과정

 샘플로 쓰일 예언을 제공할 예언성변칙개체의 정 기준은 다음과 같이 정의하였다. 첫째, 실시간 소통(피드백)이 가능하다. 둘째, 언어적 요소로 완전히 해석가능한 예언을 출력한다.




223

연구부 정기 보고서 제132권 제9호 2024.12. pp. 220~228


 기준에 따라 선정된 8가지의 변칙개체의 목록은 다음과 같다.

1. 변칙 물체 2991-KO: 포춘 쿠키가 들어 있는 비닐봉지. 쿠키를 먹을 때마다 새로운 쿠키가 봉지 안에 생겨나며 먹는 이의 가까운 미래를 점쳐준다. 예언의 정확도는 높다.

2. PoI-29131-KO: 고깔을 쓰고 있는 80대 남성. 질문 시 수수께끼로 이루어진 답변을 한다. 예언의 정확도는 약 50%이지만 질문에 대한 피드백 비율이 유의미하게 높다.

3: 변칙 개체 20133-KO: 사람과 대화가 가능한 변칙적 바다코끼리로, 질문자가 물어본 날짜에 먹을 메뉴를 예언한다. 먼 미래까지 예측할 수 있으며, 정확도는 약 70%이다.

4: 변칙 물체 9752-KO: 시간대에 관계없이 미래에 관한 질문에 따라 실시간으로 색깔이 변화하는 조각상으로, 그 답이 부정과 긍정일 경우 정확도가 80% 가량으로 높으나 복합적인 답변에 대해서는 현재 해독이 완전히 완료되지 않아 의사불통학부의 연구가 진행 중에 있다.

5: 변칙 물체 11024-KO: 10cm 크기의 작은 오르골이다. 뚜껑을 열기 전 질문을 하고 오르골을 연주할 경우 일련의 암호화된 음율이 흘러나오며 암호학부에 의하여 60% 가량 해독되었다. 예언의 정확도는

약 50%이다.

6: PoI-10214-KO: 항상 1세의 갓난아기 모습을 유지하는 인간 남성. 정상적인 언어 소통은 불가능하지만 몸짓을 통하여 소통 가능하며 예언의 정확도는 50% 이하이다.

7: WoI-14116: 난수 생성 사이트로, 사용자의 입력을 감지하여 난수를 생성한다. 이 과정 중 질문과 같이 일련의 문자열에 대한 대답이 가능한 것으로 해독되었다. 예언의 정확도는 30% 가량이다.

8. SCP-█████: 외부은하에서 지속적으로 지구에 대한 관측결과를 보내오는 전파. 주로 미국 루이지애나 주 가정집에서 일어나게 될 가십거리들에 대한 이야기를 전달한다. 예언 빈도는 약 30%이고, 정확도는 매우 높으나 상호작용이 불가능하다.

 선정된 대상들이 다양한 특성과 입출력 형태를 갖추고 있기 때문에, 데이터의 전처리 과정을 진행하였다. 첫째로, 상호작용 가능한 대상에 대하여 각각 100,000개의 선정된 질문과 그 답변을 수합하였으며, 상호작용이 불가능할 경우 모든 답변을 예언과 비예언으로 분리하여 수합하였다. 둘째로, 기존에 대형 언어 모델로써 학습된 2.5세대 인공지능징집병을 통하여 대상별로 모든 답변을 매개변수화하였다.




224

연구부 정기 보고서 제132권 제9호 2024.12. pp. 220~228



2. 데이터 분석 및 기상 예측 모델 생성

 데이터의 후처리 및 분석은 1920년부터 2024년까지의 기상 데이터(SCP재단 기상학과, 2024)와 기존 예언의 데이터베이스(안예정, 2002)를 통하여 진행하였다. 기존 예언과의 다중회귀분석을 통하여 데이터의 신뢰도와 적절한 가중치를 부여할 수 있었으며, 새롭게 매개변수화된 데이터셋과 기상 데이터 간의 비선형적 관계식을 인공지능징집병을 통하여 학습시켜 얻어낼 수 있었다.
 이렇게 생성된 8개의 모델이 출력하는 결과의 예시는 다음과 같다. 입력값은 "2025년 1월 1일 오전 12시 서울특별시 종로구 날씨 예측"이다.
 <표 1>에 나타난 결과와 같이 각 모델은 서로 다른 텍스트로써 결과치를 내보냈으나, 기상 데이터로의

피팅을 완료한 뒤로는 동일한 결과를 내보였다. 이는 비교적 에측하기 쉬운 근미래의 국소적 날씨는 모든 모델이 잘 예측할 수 있음을 시사한다.
 기존의 기상예측 모델인 WRF-F2018AIC 모델과 비교하기 위하여 기상 데이터의 학습 범위를 2019년까지로 조정하여 테스트하였으며, 2021년부터 2024년까지 4년 간의 기상이변과 기후 변화를 예측하였다. 실제로 나타난 결과와 그 차이값을 계산하였으며, 날씨의 차이를 수치화하는 데에는 의사불통학부 김서휘(2019)의 선행연구에 따라 무차원량인 유사도를 통해 적용하였다.
 실제 기상 현상의 유사도를 1이라고 하였을 때 나머지 모델의 유사도를 로그 스케일로 나타낸 결과는 다음과 같다.


번호 데이터 학습 직후 결과 기상모델 처리 후 결과
1번 모델1 미끄러짐에 주의하라. 진눈깨비
2번 모델2 아침에는 액체, 점심에는 고체인 것은? 진눈깨비
3번 모델3 크림빵 진눈깨비
4번 모델4 위쪽은 파란색, 아래쪽은 초록색 배경에 노란색 점박이 무늬 진눈깨비
5번 모델5 도#-솔-미-파#-라#-미 진눈깨비
6번 모델6 두 손을 3초간 휘젓고 땅을 오른손으로 내리치는 모습 진눈깨비
7번 모델7 391309040912091039 진눈깨비
8번 모델8 벽난로에 앉아 있다가 고양이 꼬리를 태워먹었대. 진눈깨비

<표 1> 각 기상예측모델 출력값의 예시





225

연구부 정기 보고서 제132권 제9호 2024.12. pp. 220~228


Fig3

<그림 3> 실측자료, 2018년형 모델, 모델 1~모델 4의 비교.

커서를 올려 확대 가능.

Fig4

<그림 4> 실측자료, 2018년형 모델, 모델 5~모델 8의 비교.

 <그림 3>과 <그림 4>에서 나타난 모델의 성능 테스트 결과를 통하여 다음과 같은 결과를 도출하였다.

 모델의 원형인 변칙 개체 1~4는 변칙 개체 5~8보다 더 높은 예언 적중률을 가지고 있으며 이로 인해 모델 1~4가 모델 5~8보다 높은 유사도를 보인 것으로 판단된다.(유사도와 정확도가 완전히 선형비례하지 않는 점에 유의하라.)
 또한 변칙 개체가 출력할 수 있는 예언의 종류가 많을수록 노이즈가 큰 불안정한 그래프 형태를 보였으며, 인간형 예언성변칙개체와 그렇지 않은 개체 간의 유의미한 차이는 발견되지 않았다.

IV. 모델 적용

 동일한 방법으로, 1920년부터 2024년의 기상 데이터를 통하여 학습된 모델을 통해 2025년부터 2075년까지의 기상 예측을 진행하였다. 2075년까지의 기상 데이터와 같이 실존하지 않는 데이터를 참값으로서 대조하는 것은 불가능하기 때문에 다음과 같은 방법을 사용하였다.
 1920년부터 2024년까지의 기상 데이터와 다양한 관측으로부터 시사되는 기후변화의 추세를 통하여 가상의 기상관측값인 일종의 '가이드라인'을 만들고 가이드라인과 각 모델 간의 유사도가 얼마나 나타나는지 분석하였다. 그러나 이렇게 만들어지는 가이드라인은 매우 추상적이기 때문에 모든 데이터에 대한 유사도 분석이 불가능하여 1년치 예측 데이터에 대한 평균 유사도를 나타내었다.





226

연구부 정기 보고서 제132권 제9호 2024.12. pp. 220~228



Fig5

<그림 5> 2075년까지의 가상의 기상 데이터와 기존 모델, 신규 8개 모델 간의 유사도 비교

 근미래의 예측에 대하여 기존 데이터와의 유사도 테스트 과정과 비슷한 결과가 도출되었으며, 2040년 전후로 가상의 데이터와의 유사도가 급격하게 하락하는 결과가 도출되었다. 예언성변칙개체의 예언이 유효한 기간은 개체에 따라 다르고 항상 최대값을 가지며, 그 최대값은 알 수 없다는 이론이 선행연구에 의하여 연구되었으나(Wright et al. 1966), 이것이 나타내는 바와 <그림 5>의 연관성에 대해서는 추가적인 연구가 필요하다.
 모델 간의 유사도 분석을 통하여 모델 간 출력값 간의 상관관계를 분석하였다. 근미래 분석에 대해 가장 뛰어난 유사도를 보인 1번 모델을 기준으로 하였으며, 그 결과는 다음과 같다.



번호 유사도
2번 모델 0.902
3번 모델 0.879
4번 모델 0.880
5번 모델 0.720
6번 모델 0.719
7번 모델 0.703
8번 모델 0.691

<표 2> 1번 모델과 나머지 모델 간의 유사도 비교(단위: 1)





227

연구부 정기 보고서 제132권 제9호 2024.12. pp. 220~228


 <표 2>의 결과는 모델 1에 대한 나머지 모델의 유사도가 유의미하게 높다는 것을 시사한다. 이를 통해 모델 1~8의 2075년까지 기상 데이터에 대한 출력값이 일정한 경향성을 띄고 있다고 할 수 있으며, 이것이 미래에 일어날 어떤 재난이나 심각한 이상 기후현상을 나타내는지에 대해서는 추가 연구가 필요하다.
 앞서 시행한 모델 유사도 테스트와 비슷하게, 입력값 샘플을 통한 정성적인 비교를 진행하였다. 가상의 가이드라인과 비교하여 1년 동안의 평균 기후 변화를 계산한 앞선 결과와 달리, 대부분의 날씨 예측에 대하여 모델들은 서로 다른 결과값을 출력하였으며, 이는 먼 미래의 국소적 기상예측이 기후와 관련없는 예언을 통한 방법에 한계가 있다고 사료된다.

 서로 상관관계가 낮은 결과를 도출한 대부분의 국소적 샘플 추출과 다르게, 2070년 이후로는 8개의 모델이 대부분 비슷한 결과를 출력하였다. 주로 폭설, 기온 저하와 같이 겨울에 주로 나타나는 이상 현상을 예측하였으며, 이를 자세히 파악하기 위해서는 기상학과와 연계된 추가 연구가 필요하다. 연도별 유사도 비교에서도 2040년 전후로 모델 1과의 유사도가 점차 상승하여, 2075년에는 근미래 예측 유사도와 비슷한 값까지 상승하였다. 다음은 샘플 입력값인 "2075년 1월 1일 서울 종로구 날씨"에 대한 각 모델의 출력값이다.


번호 데이터 학습 직후 결과 기상모델 처리 후 결과
1번 모델9 살아있음에 감사하라. 폭설
2번 모델10 아침에는 시체, 점심에는 시체인 것은? 폭설
3번 모델11 빙수 폭설
4번 모델12 파란색과 보라색의 그라데이션 폭설
5번 모델13 라-라-라-라-라-라-라-라 폭설
6번 모델14 눈을 가린 모습 폭설
7번 모델15 -2147483647 폭설
8번 모델16 너한테 이제 해줄 말은 없겠네. 폭설

<표 3> 2075년 날씨 예측 출력값





228

연구부 정기 보고서 제132권 제9호 2024.12. pp. 220~228



V. 결론 및 제언

1. 기상예측모델 시뮬레이션 결과와 한계

 연구를 통해 예언성변칙개체가 도출한 예언을 수합하고 기상 데이터와의 연관성을 추정하여 기상예측모델을 생성하고, 의사불통학적 무차원 계수인 유사도를 통하여 성능을 비교하였다. 또한 근미래부터 원미래까지의 기상 데이터를 예측한 결과를 분석하였으며, 그 결과 기존 모델과 근미래 예측 성능이 근소하게 차이나지만, 원미래 예측은 그 유사도가 매우 낮았다. 유사도가 낮게 측정된 원미래 예측에 대하여 모델 간의 분석을 재실시하였으며, 이를 통해 모델 간의 원미래 분석 상관관계는 유의미하게 높다는 것을 도출하였다.
 그러나 선행연구에서 소개하였듯 예언을 매개변수화하여 분석한 데이터베이스가 과거 연구에 의존하여 불확실성을 띠고 있으며, 예언성변칙개체의 예언이 유효한 기한이 정해져 있기 때문에 추가적인 분석이 필요하다. 이것을 개선하기 위해서, 새로운 기술을 적용한 예언의 고차원적 매개변수화와 정밀한 데이터베이스의 분석을 추가 연구로 진행할 수 있다.

2. 통계예언학적 방법론의 적용의의

 본 연구는 예언의 통계적 활용도와 통계예언학의 구체적인 모델링을 통한 공학적 접근의 실현가능성을 보여주었다. 특히 예언과 상동하게 예측의 영역인 기상관측에 예언의 통계적 접근을 모사할 수 있다고 판단하였다. 또한 본 연구는 기상과 기후에 대하여 직접적으로 발화하지 않는 예언에 대하여, 매개변수화를 통해 이것이 기상 데이터와 연관성이 있다는 것을 증명하였음에 그 의의가 있다.

 결론적으로 나아가 "기후예언학"이라는 새로운 분야의 명명을 제안하는 바이며, 기상학과 외에도 앞으로 통계예언학과 여타 분야 간의 활발한 학문적 교류와 융합적인 신규 연구 분야의 개척을 기대하고자 한다.

VI. 참고문헌

SCP재단, 2017, "SCP재단 한국사령부 2017년 연간 통계자료".

김상희 외, 2019, "한국사령부 격리시설 실시간 리스크 분석 - 제01K기지와 제02K기지를 중심으로", SCP재단 한국사령부 방재부.

오주석, 2023, "WRF-F2014, WRF-F2018AIC 기상예측모델 간 비교", SCP재단 한국사령부 기상학과.

김서정 외, 2021, "예언성변칙개체의 구분과 그 의의", SCP재단 한국사령부 통계예언학과.

안예정, 2002, "예언의 매개변수화 및 데이터베이스 구축 연구", SCP재단 한국사령부 통계예언학과

이승수, 2021, "실시간 예언 상관관계 분석 시스템의 개발", SCP재단 한국사령부 통계예언학과

Max F. et al., 1998, "Third-Generation Artificially Intelligent Conscript", SCP Foundation, Department of Artificial Intelligence.

오주석 외, 2018, "인공지능징집병(AIC)를 이용한 신세대 WRF-F2018AIC 기상예측모델 개발", SCP재단 한국사령부 기상학과.

SCP재단 기상학과, 2024, "SCP재단 한국사령부 연간 기상관측 통계자료".

김서휘, 2019, "예측적 데이터 간의 언어유사도 연구 - 날씨를 중심으로", SCP재단 한국사령부 의사불통학부.

Wright W. P., 1966, "Incompleteness in Prophecy", SCP Foundation, Department of Prophecy.








🈲: SCP 재단의 모든 컨텐츠는 15세 미만의 어린이 혹은 청소년이 시청하기에 부적절합니다.
따로 명시하지 않는 한 이 사이트의 모든 콘텐츠는 크리에이티브 커먼즈 저작자표시-동일조건변경허락 3.0 라이선스를 따릅니다.