Article

Ocean and Polar Research. 30 December 2024. 183-195
https://doi.org/10.4217/OPR.2024020

ABSTRACT


MAIN

  • 1. 서 론

  • 2. 자료 및 방법

  •   목표 및 입력자료

  •   인공신경망 모델 수립

  • 3. 결 과

  •   학습 검증 결과

  •   정선 관측과의 비교 결과

  • 4. 토 의

  •   특징 중요도 평가

  •   여름철 공간분포 비교

  • 5. 요약 및 결론

1. 서 론

연안역의 3차원 수온구조는 해양의 중요한 물리적 특성으로, 다양한 규모의 해양 현상을 관측할 수 있는 주요 정보를 포함하고 있다. 양질의 수온 자료는 해양 뿐만 아니라, 해양-대기 상호작용 분석에서도 중요한 역할을 한다. 수온은 해양과 대기 간의 운동량과 에너지의 교환을 추정하는데 유용한 데이터를 제공하며(O'Carroll et al. 2019), 몬순과 같은 바람장의 변화 및 전지구적 규모의 순환 분석에 활용된다(김 등 2011). 수온의 변동으로 인한 대기의 변화는 날씨에 영향을 주고, 이에 다시 영향을 받는 3차원 해양 수온구조는 어업 및 양식업 등의 인간 활동에 중요한 인자로써 밀접하게 연관되어 있다(Aparna et al. 2018). 따라서 정확도 높은 3차원 수온장을 추정하는 것은 학술 연구뿐만 아니라 인간 활동에도 큰 도움이 될 수 있어 해양과학의 중요한 숙제 중 하나이다.

해양과학자들은 이러한 3차원 수온장의 변동을 예측하기위해 해양 수치모델을 사용해왔다. 수치모델은 상호작용하는 여러 물리·화학적 요소들의 지배방정식을 활용해 3차원 수온장을 예측한다. 하지만, 현실적인 제약들로 인해 근사과정, 모수화 등이 수행되며, 이 과정에서 초기 및 경계 조건에 따라 예측값의 오차가 크게 달라진다. 오차를 줄이기 위한 방법으로 시간 및 공간 해상도를 높이거나 자료동화 기법을 사용하기도 하지만 많은 컴퓨팅 리소스와 계산시간이 필요하다는 한계를 갖고 있다(Bolton and Zanna 2019; Aparna et al. 2018).

최근 들어, 이러한 제약이 상대적으로 적은 인공신경망(Artificial Neural Network, ANN) 모델을 이용한 해양 환경 예측 연구가 많이 진행되고 있다(e.g., 이 등 2021; 주 등 2022; Lee et al. 2022; Chae et al. 2024). 인공신경망은 입력자료와 목표자료 사이의 비선형적 관계를 스스로 학습하여 최적의 가중치를 설정한다. 또한 높은 해상도의 모델을 학습시킬 경우, 학습에 소요되는 시간은 선형으로 증가하지만, 모델을 적용할 때에는 저장된 가중치로부터 빠르게 예측값을 얻을 수 있다(Xiao et al. 2019; Aparna et al. 2018).

3차원 수온 구조를 추정하는 본 연구는 선행 연구들이 대양에서 수행되었던 것과 달리(Su et al. 2021; Nardelli 2020; Lu et al. 2019), 황해와 한반도의 남쪽을 포함하는 동중국해의 북부, 즉 연안역에 초점을 맞춘다. 이 영역은 동중국해에서 유입되어 제주 인근을 거쳐 동해로 흐르는 대마난류의 영향을 받아 수온이 변동하고, 겨울철 수온은 인근 해역에 비해 상대적으로 높게 유지된다(승 1992; 민과 김 2006; 김 등 2011). 황해 남부 연안의 일부 해역은 강한 조석혼합에 의해 연직적으로 균일한 수온과 밀도를 띄게 되며, 그 외해에는 수평적으로 온도차가 크게 나타나는 조석 전선이 형성된다(승 1992; 김 등 2005). 연구영역의 수온은 계절적으로 봄과 여름철에는 대마난류의 영향으로 표층 수온이 상승하며, 겨울에는 북서풍의 영향을 받아 표층 수온이 하강하고, 해수의 혼합이 증가하는 변동성을 보인다(나 등 1990; 김 등 2011).

다양한 변동성을 보이는 연안역의 3차원 수온장 예측을 위해 본 연구에서는 다양한 시공간자료를 사용한다. 따라서 이를 효과적으로 학습하기 위해 인공신경망 기법 중 시간 및 공간 상관성을 모두 고려하는 Convolutional Long Short-Term Memory (ConvLSTM) 모델을 적용하였다. 해당 모델은 시간적인 정보를 학습할 수 있는 LSTM과 공간적 정보를 학습할 수 있는 Convolutional Neural Networks (CNN)의 결합으로 구성된다(Shi et al. 2015). 학습이 완료된 후, 관측자료와 본 모델의 결과가 비교 검증되며, 추가적으로 인공신경망 모델의 범용성을 확인하기 위하여 수치모델 재분석장과의 예측 성능을 비교한다. 최종적으로 한반도 남부 연안역의 3차원 수온구조 예측에 인경신경망 모델의 활용가능성을 제시하고자 한다.

2. 자료 및 방법

목표 및 입력자료

인공신경망의 학습은 입력자료들과 목표자료인 연직 수온 자료 간의 비선형 관계를 찾아내는 방향으로 진행되며, 학습이 완료된 모델 가중치에 입력자료를 적용하면 결과값을 출력한다. 본 연구에서는 3차원 수온 추정을 위해 목표자료로 활용될 관측된 연직 수온 자료를 여러 기관에서 수집, 가공하였다. 자료의 공간범위는 123.5°–129.5°E, 31°–36°N, 시간범위는 2000년부터 2022년까지 총 23개 년도이다(Fig. 1). 이를 상세히 기술하면, 국립해양조사원과(비공개 자료) 한국해양자료센터(NIFS; https://www.nifs.go.kr/kodc/soo_list.kodc) 내 국립수산과학원 정선관측자료를 상기한 23개년도에 대해 수집한 후, 연구의 공간 범위 내 수온 자료를 사용하였다. Japan Oceanographic Data Center (JODC; https://www.jodc.go.jp/vpage/scalar.html)에서는 2000년부터 2020년까지, Argo floats (https://data-argo.ifremer.fr/geo/pacific_ocean)는 2016년부터 2022년까지의 수온 관측자료를 수집한 후 연구 공간범위 내의 자료를 사용하였다(Fig. 2). 수집된 연직 수온 자료들은 기관별로 상이한 수심 정보를 가지고 있다. 따라서 국립수산과학원에서 표준 수심으로 사용하고 있는 수층 중 400 m 이하의 수층(10, 20, 30, 50, 75, 100, 125, 150, 200, 250, 300, 400 m)으로 내삽하여 표준화하였다. 수심 표준화 후, 최대 수심이 30 m 이상인 관측점들의 연직 수온자료를 최종 목표자료로 사용하였다.

https://cdn.apub.kr/journalsite/sites/opr/2024-046-04/N0080460407/images/opr_46_04_07_F1.jpg
Fig. 1.

Study area (123.5°–129.5°E, 31°–36°N) and spatial distribution of observed profile data. Color dots represent observations distinguished by institution or project (Blue: Korea Hydrographic and Oceanographic Agency; KHOA, yellow: National Institute of Fisheries Science; NIFS, green: Argo float, red: Japan Oceanographic Data Center; JODC). The dotted contour lines indicate the 100 m depth line

https://cdn.apub.kr/journalsite/sites/opr/2024-046-04/N0080460407/images/opr_46_04_07_F2.jpg
Fig. 2.

Temporal distribution of observed profile data. Colors are distinguished by institution or project, with abbreviations as shown in Fig. 1

학습자료 중 입력자료는 연직 수온 구조에 영향을 미치거나, 구조를 대변할 수 있는 변수들로 구성되며(Table 1), 시간정보가 포함되는 자료는 목표자료와 동일하게 2000년부터 2022년까지 수집되었다. 가장 기본이 되는 표층 수온자료는 Group for High Resolution Sea Surface Temperature 프로젝트로 생성되는 Operational Sea Surface Temperature and Sea Ice Analysis (SST_GLO_SST_ L4_NRT_OBSERVATIONS_010_001)와 Reprocessed (SST_GLO_SST_L4_REP_OBSERVATIONS_010_011) (이하 OSTIA)를 사용했다. 표층 염분자료는 해양수치모델인 Copernicus Marine Environment Monitoring Service (CMEMS)에서 생산된 재분석 자료인 GLORYS12V1 (GLOBAL_MULTIYEAR_PHY_001_030)을 사용했다. 해수면 및 해류정보는 위성 해양 관측 데이터를 AVISO에서 수집 및 가공, Copernicus Marine Service를 통해 제공되는 자료(SEALEVEL_GLO_PHY_L4_MY_008_047)를 사용하였다.

Table 1.

Summary of input data

Product Institution Temporal Resolution Spatial
Resolution
Variables*
OSTIA UK Met Office Daily 1/20° SST
GLORYS12V1 CMEMS Daily 1/12° SSS
AVISO CNES Daily 1/4° ADT, SLA, Ug, Vg, Uga, Vga
ERA5 ECMWF Hourly 1/4° MSLP, TSSe, TSSn, L, S, U10, V10, Rlw, Rsw
GEBCO GEBCO Consortium - 1/240° Elevation
Nao.99Jb NAO - 1/12° Tide
WOA23 NOAA Monthly 1/4° Tan, Tma

* SST : Sea surface temperature

   SSS : Sea surface salinity

   ADT : Absolute Dynamic Topography

   SLA : Sea Level Anomaly

   Ug : Absolute geostrophic velocity (zonal component)

   Vg : Absolute geostrophic velocity (meridian component)

   Uga : Geostrophic velocity anomalies (zonal component)

   Vga : Geostrophic velocity anomalies (meridian component)

   TSSe: Mean eastward turbulent surface stress

   TSSn : Mean northward turbulent surface stress

   S : Mean surface sensible heat flux

   L : Mean latent heat flux

   U10 : East-westward component of the 10 m wind

   V10 : North-southward component of the 10 m wind

   Tan : Objectively analyzed mean fields for seawater temperature

   Tma : The objectively analyzed value for the given time period minus the objectively analyzed annual mean value for seawater temperature

   Rlw : Mean surface net long wave radiation flux

   Rsw : Mean surface net short wave radiation flux

   MSLP : Mean sea level pressure

표층에 가까울수록 연직 수온구조는 해양과 대기 간의 상호작용의 영향을 받는다(O'Carroll et al. 2019). 이를 반영하기 위해 기상수치모델인 European Centre for Medium Range Weather Forecasts (ECMWF)에서 생산된 재분석 자료, ERA5에서 10 m 풍속, 해면기압, 열교환 등의 변수들을 사용했다.

해당 연구해역 내에는 여름철 연안에서 조석혼합에 의한 조석전선이 강하게 발생하는 영역이 있다. 따라서 조석의 효과를 반영하기 위해 National Astronomical Observatory of Japan에서 제공하는 NAO.99Jb 모델의 자료(Matsumoto et al., 2000)를 사용했다. 이 모델은 9개의 반일주조와 7개의 일주조에 대한 조석 조화상수 값을 제공하고 있어 이를 연구 영역 및 기간에 맞게 조화합성, 가공하여 사용하였다. 우선 모든 연구 기간에 대하여 1시간 간격으로 조위를 합성한 후, 대소조의 효과를 부여하기 위해 조위를 제곱한 후 일 내 최댓값을 사용하여 1일 해상도로 재구성하였다.

추가적으로, 연직 수온 구조의 뼈대가 되어줄 기후치를 적용하기 위해 World Ocean Atlas 23 (WOA23; https://www.ncei.noaa.gov/access/world-ocean-atlas-2023/)에서 제공하는 월평균 연직 수온과 연평균을 제거한 편차(anomaly) 자료를 사용했다. 이 자료의 연직 해상도는 목표자료와 동일한 12개 수층으로 하였다. 마지막으로, 대양에 비해 복잡한 지형 구조를 갖는 연안의 특성을 학습에 입력하기 위해 General Bathymetric Chart of the Oceans (GEBCO)의 수심자료(https://download.gebco.net/)를 이용했다.

수집된 모든 자료는 일일 해상도를 갖게 하기 위해 일간격보다 고해상도의 자료는 일일 평균을, 저해상도의 자료는 일 간격으로 내삽을 수행하였고, 1/12°의 공간 해상도를 갖도록 내삽 또는 외삽을 함으로써 전체 자료를 표준화(standardization)하였다. 또한, 안정적이고 빠른 학습과정을 위해 각 입력 자료는 평균이 0, 표준편차가 1에 준하도록 스케일링 하였다.

인공신경망 모델 수립

시공간 입력자료로 1개의 연직 수온자료를 추정하는 모델의 구조와 모델의 학습과정에서 모델의 구조와 동작방식을 제어하는 데 사용자가 직접 설정해주는 초모수(hyperparameter)는 Fig. 3Table 2에 각각 제시된다. 모델 구조 중 가장 다차원을 다루는 ConvLSTM 레이어는 시공간의 3차원의 자료를 입력 받으며, 3차원 자료의 구성은 [row, timestep, 경도, 위도, 변수]이다. Row는 학습에 사용된 데이터의 개수, 즉, 연직 수온 자료의 개수를 의미한다. Timestep은 하나의 연직 수온 자료를 추정하기 위해 사용되는 입력자료의 시계열 길이를 의미하며, 본 연구에서는 시간차원을 갖는 자료들에 대해 7일의 연속된 정보를 입력하였다. 경도와 위도는 공간정보를 학습하기 위해 개별 목표자료를 중심으로 7 × 7 (즉 ±3/12°)의 공간성을 입력하였다. 마지막 차원은 입력 레이어에서는 Table 1에 제시된 각기 다른 변수 공간을 의미하며, 입력 레이어를 지난 후에는 특징(feature)으로 명명된다.

https://cdn.apub.kr/journalsite/sites/opr/2024-046-04/N0080460407/images/opr_46_04_07_F3.jpg
Fig. 3.

Model structure for estimation of temperature profile

Table 2.

Model setting and hyperparameters.

Category Setting Category Setting
Learning rate 0.003 Activation function ConvLSTM softsign
Optimizer Adam 2-D dataset gelu
Batch size 840 Conv2D gelu
Data set Training 60% FC-DNN softsign
Validation 20% Number of ensemble members 12
Test 20% Loss function Masked mean-squared error

공간정보를 학습하는 Conv2D 레이어는 2차원 자료인 GEBCO와 ConvLSTM 레이어를 통과한 정보를 [row, 경도, 위도, 변수]의 형태로 입력 받는다. Conv2D 레이어는 내부의 공간정보를 압축하여 특징을 추출하며, 종래에는 공간 축이 사라지고 특징 축만 남아 [row, 변수]의 구성을 갖게 된다. 이는 다시 특징 축만으로 구성된 WOA23자료와 합쳐져 Fully-connected dense (FC-DNN) 레이어를 통과한 후, 12개 수층의 연직 수온 자료를 만들어낸다.

인공신경망 모델 각 레이어에 비선형성을 구현해주는 활성화 함수는 HyperOpt 라이브러리를 활용하여 최적화하였다. 레이어별로 활성화 함수는 ComvLSTM 및 FC-DNN 레이어에 softsign이, 2차원 자료의 입력 및 Conv2d 레이어에는 gelu가 선정되었다. 추가적으로, 연구영역은 다양한 수심구조를 가지고 있기에 이를 동시에 학습하기 위한 방안으로 손실함수에 마스킹(masking) 기법을 적용하였고, 학습을 빠르고 안정적이게 하는 optimizer는 Adam 방식을 사용했다.

학습이 1회 수행되는 단위인 epoch 수를 결정함에 있어 과적합(overfitting)이 일어날 가능성을 염두해야 한다. 본 연구에서는 총 epoch 수를 early stopping 기법을 사용하여 제어했다. Early stopping은 모델이 과적합되는 것을 방지하기 위해 학습을 중단하는 기법으로 학습 도중 검증 데이터(validation set)의 성능을 모니터링하여 더 이상 개선되지 않는다고 판단되면 학습을 멈추는 것을 말한다. Early stopping을 적용할 때 사용되는 중요한 매개변수로 patience가 있다. 설정한 patience 값만큼 추가적으로 epoch가 진행되었을 때, 검증 성능이 개선되지 않으면 early stopping이 발동, 모델 학습을 중단하는 것이다. 본 연구에서는 patience 값을 손실함수 곡선이 감소하는 속도와 안정화되는 것을 감안하고 200으로 설정하여 학습을 진행하였다.

위에서 세가지 차원 형태로 만들어진 각 데이터셋은 모두 학습에 사용되는 train set, 모델 개선에 사용되는 validation set, 모델의 성능평가에 사용되는 test set의 세 가지로 나뉜다. Test set은 연도별로 목표자료의 기관 분포를 비교하고, 세 기관 이상에서의 관측이 수행된 ‘13, ‘15, ‘18, ‘20년을 선정하였으며(Fig. 2), 이 4개년도의 자료는 전체 데이터의 약 20%을 차지한다. 모델은 독립적으로 12번 수행되어 앙상블 평균이 수행된다. 각 앙상블 모델 멤버들은 test set을 제외한 80% 중에서 무작위로 3:1 비율로 train set과 validation set이 설정되어 학습된다.

3. 결 과

학습 검증 결과

최적화된 3차원 수온 추정 모델의 성과는 Table 3, Fig. 4에 요약되었다. 인공신경망 모델 검증 결과는 학습에 사용되지 않은 test set에 대하여 제시되었으며, 자료동화된 범용 수치모델인 HYCOM (HYbrid Coordinate Ocean Model)과 GLORYS의 성과 또한 test set과 같은 연도에 대해 계산되었다. 모델의 성과는 수층별 및 전 수층 평균 RMSE와 bias (mean error)로 제시되었다. 검증 결과, 인공신경망 모델은 전 층 평균 RMSE가 1.1°C로 계산되어 재분석 수치모델인 HYCOM과 GLORYS보다 각각 0.1°C, 0.2°C 높은 성과를 내었으며, 절대 편향의 전 층 평균 또한 성능이 소폭 개선됨을 보였다.

Table 3.

Root mean squared error and bias of three models (unit: °C)

Depth Obs. (std.) RMSE Depth Bias
ANN HYCOM GLORYS ANN HYCOM GLORYS
10 5.4 1.1 1.2 1.7 10 0.1 0.3 0.2
20 4.8 1.6 1.9 2.3 20 0.2 -0.2 0.1
30 4.4 1.5 2.1 2.6 30 0.1 -0.3 -0.2
50 4.0 1.4 1.9 2.3 50 0.2 -0.2 -0.7
75 3.6 1.2 1.5 1.7 75 0.0 0.0 -0.8
100 2.1 1.0 1.3 1.0 100 0.1 0.0 -0.1
125 2.0 1.1 0.7 0.7 125 -0.2 0.1 0.2
150 1.6 0.8 0.6 0.7 150 0.1 0.2 0.2
200 1.4 0.9 0.8 0.7 200 0.1 -0.2 0.3
250 0.9 0.9 0.8 0.8 250 0.1 -0.2 0.3
300 0.8 0.8 0.8 0.8 300 -0.1 0.0 0.1
400 1.1 0.8 0.6 0.6 400 -0.1 0.2 0.3
Mean ≤100 4.1 1.3 1.7 1.9 Abs. mean ≤100 0.1 0.2 0.4
≥125 1.3 0.9 0.7 0.7 ≥125 0.1 0.2 0.2
All 2.7 1.1 1.2 1.3 All 0.1 0.2 0.3

https://cdn.apub.kr/journalsite/sites/opr/2024-046-04/N0080460407/images/opr_46_04_07_F4.jpg
Fig. 4.

Evaluation of three models. (left) RMSE and (right) bias for the evaluation. The blue, red, and green lines depict the performance of the Artificial Neural Network model, HYCOM and GLORYS, respectively

모델 성과를 100 m를 기준으로 상, 하층으로 나누어 보았을 때, 100 m 이하의 수심에서 인공신경망 모델의 RMSE 값이 두 수치모델보다 낮은 것과, bias 편향은 또한 안정적인 0에 가까운 것을 확인할 수 있다. 이러한 결과는 인공신경망 모델의 학습과 수치모델의 연산 방법 간의 차이에 의해 발생하는 것으로 사료된다. 상층인 100 m 이하에서는 인공신경망 학습이 수행될 수 있는 충분한 연직 수온 관측 자료가 존재한다. 따라서, 전지구를 대상으로(general) 연산되는 두 수치모델보다 해당 해역에서의 관측자료에 집중하는(specific) 인공신경망 모델의 성과가 우수하게 나타난다.

반면 12500 m 보다 깊은이하의 수심에서는 거의 모든 수층에서 인공신경망 모델의 RMSE가이 세 모델 중 가장 나쁜 성과를 보이고 있다. 해당 결과의 원인을 분석한 결과, 깊은 수심을 갖는 자료의 개수와 분포에서 기인함을 알 수 있었다. 연구에 사용된 연직 관측 자료는 총 13,566이며, 그 중 125 m보다 깊은 해역에 위치하는 데이터는 총 3,346개로 전체 데이터의 약 25%를 차지한다. 이러한 적은 자료의 하층 정보 개수는 얕은상층 수심의 자료에 비해과 동시에 학습될 때에 학습이 충분히 되지 않을 수 있으며, 표층에 비해 적은 변동성을 갖는 저층의 수온에 대해 학습 중 가중치 갱신 과정 중요도가이 간과될 수 있다. 즉, 인공신경망 학습이 충분히 이루어지지 않을 수 있다. 반면 수치모델은 해양물리 과정을 지배방정식으로 풀어냄으로써 일반적인 해황을 충분히 모의할 수 있다.

자료의 분포 면에서 검토하면, 우리의 연구자료는 연구해역 내 수심 차이, 즉 공간에 대한 불균형과 동시에 시간에 따른 불균형 또한 갖고 있다. 수심과 자료 출처가 표현된 Fig. 1Fig. 2를 참고하면, 100 m보다 깊은 외해의 자료는 JODC의 자료가 주가 된다는 것과 이 자료들의 시공간 불균형도를 짐작할 수 있다. 이러한 목표자료의 시공간 불균형 분포와 적은 자료의 개수는 해역에 일반적인(general) 수온 구조를 만들어내는 것이 아닌 학습자료에 특정된(specific) 과적합을 일으키게 될 것이다.

정선 관측과의 비교 결과

연구에서 사용된 자료 중 국립수산과학원의 정선관측은 연안에서의 주요 수온 구조의 정보를 담고 있다(Fig. 5). 본 절에서는 개발된 모델이 우리나라 서남해역에서 나타나는 특징적인 수온구조를 잘 모사하고 있는지 살펴보고자 연직 수온 섹션과의 비교를 수행했다. 앞선 검증 결과, 본 연구에서 설계된 인공신경망 모델은 두 수치모델과 비교하였을 때, 수온 예측 성능이 더 높았다. 이를 정선별, 시기별로 나누어 비교한 결과를 Table 4에 제시하였다. 317을 제외하면 모든 정선의 과반 이상의 케이스에서 인공신경망 모델의 모의 성능이 다른 두 수치모델보다 우수했다. 317은 연구영역의 가장 남쪽, 동중국해에 위치한 정선으로, 이 인근의 해역은 하계에 고온 고염의 대마난류가 지나며, 중국의 양자강에 의한 담수유입의 영향을 받는다. 위와 같은 이유로 해당 정선은 다른 곳과 달리 다양한 형태의 연직 수온구조가 존재할 것이며(윤과 최 2012), 이 변칙적인 패턴을 인공신경망 모델이 충분히 학습하지 못한 결과로 여겨진다.

https://cdn.apub.kr/journalsite/sites/opr/2024-046-04/N0080460407/images/opr_46_04_07_F5.jpg
Fig. 5.

Bathymetry and section line numbers from NIFS. Blue "S" marks the starting points, and red "E" marks the endpoints of the section lines, as depicted in Fig. 6

Table 4.

Statistics of successful ANN model cases in comparison by observation section line

Line Total observations Successful ANN models Success Rate
203 53 44 0.83
204 46 41 0.89
205 53 30 0.57
206 50 44 0.83
207 47 31 0.66
310 54 30 0.56
311 53 33 0.62
312 54 39 0.72
313 55 42 0.76
314 58 45 0.78
315 30 20 0.67
316 26 19 0.73
317 29 12 0.41
400 61 43 0.70
Total 669 473 0.71

검토된 연직 섹션 내에서 특징적인 차이가 나타나는 네 가지 케이스를 Fig. 6에 도시하였다. 제시된 케이스는 인공신경망 학습에 사용되지 않는 test set 안에서 선정되었다. 그림 내 S, E는 정선의 시작점과 끝점, 즉 작은 정점번호(본 해역 내에서 동, 또는 북쪽)부터 큰 정점번호(서, 또는 남쪽)까지의 선을 의미한다. 인공신경망 모델의 RMSE가 두 수치모델에 비해 낮은 경우, 성능이 우수한 상위 케이스들을 검토한 결과, 수온의 연직 및 수평 구배가 크게 나타나는 시기인 것으로 분석되었다(Fig. 6a–c). 해당 케이스들은 서해 저층 냉수의 영향을 받는 서해남부에 위치한 311, 313, 314 정선으로, 이러한 냉수대의 출현은 Fig. 6a–c의 관측자료에 잘 나타난다. 그리고 이 연직 공간분포는 세 개의 모델 중 인공신경망이 가장 잘 모의하고 있다. 수치모델은 안정성을 위해 자료동화를 포함한 연산 과정 중에 자료의 평활화가 수행된다(Lahoz and Schneider 2014). 뿐만 아니라 자료동화에 사용되는 인공위성 표층 관측 수온자료는 가공 과정 중에 급격한 수평 수온 구배를 오측으로 취급하여 조석전선이 나타나는 구역에 warm bias가 만들어진다(Kwon et al. 2020). 그 결과, 참값에 최적화하는 인공신경망 모델과 달리 수치모델에서는 냉수대 이벤트에 더 큰 오차가 발생시키는 것으로 사료된다.

https://cdn.apub.kr/journalsite/sites/opr/2024-046-04/N0080460407/images/opr_46_04_07_F6.jpg
Fig. 6.

(Top subpanels) Vertical temperature sections along (a) Line-314, (b) Line-313, (c) Line-311, and (d) Line-205 from observation data compared to those produced by ANN, HYCOM, and GLORYS. (Bottom subpanels) Differences between observation and models. Locations of the four observation lines are in Fig. 5. (a) Profiles observed in October 2013, (b) April 2015, (c) August 2015, and (d) August 2018

반면 Fig. 6d는 인공신경망 모델의 한계를 보여주는 사례이다. 인공신경망 모델이 나쁜 성능을 보이는 하위 케이스들을 검토한 결과, 일반적으로 태풍의 영향이 존재하는 시기 및 해역인 것으로 나타났다. 지배방정식에 의해 계산되는 수치모델과 달리 인공신경망 모델은 주어진 자료 내에서 학습을 수행한다. 그리고 이는 태풍과 같이 이벤트성 자료의 학습보다는 다수를 차지하는 평시의 수온구조 상태에 집중하는 결과를 낳는다. 이러한 사유로 모델이 태풍 직후 변칙적인 수면하 상황을 인지하지 못하고 일반적인 표층 입력자료 상황에서의 결과값을 내놓아 큰 오차를 만들게 된다.

4. 토 의

특징 중요도 평가

모델 오차 분석은 ANN 모델 최적화 과정 중 중요한 단계이다. 이 과정은 변수, 모델구조, 초모수 등 모델의 잠재적인 개선사항에 대한 통찰을 제시한다. 또한 모델 학습이 완료된 후에 수행되는 분석은 연구의 한계점 및 변수에 대한 이해를 제공한다. 대한민국 남해역에서 3차원 해수 온도를 추정하는데 핵심 요소를 파악하고자 아래 수식을 활용, 특징 중요도 평가(feature importance test, FI test)를 수행하였다.

FI=econsistent-eoriginal=L(y,f(X¯))-L(y,f(X))

위 수식은 최적화가 완료된 인공신경망 모델의 수온 추정치(f(X))와, 변수별로 자료에 평균을 취함으로써 변동성을 제거한 입력자료를 모델에 적용했을 경우의 수온 추정치(f(X¯))간의 RMSE (L(y,f(X))) 차이를 의미한다. 입력변수 중 중요도가 높은 변수는 학습 중에 더 많은 가중치를 얻게 되며, 작은 내부 값 변동에도 큰 결과 차이를 만들게 된다. 즉, 이 수식에서 특정 변수의 중요도가 높을수록 변동성이 제거 및 적용된 수온추정치는 더 큰 오차를 보여 FI가 증가함을 알 수 있다.

테스트 셋 연도의 자료들에 대해 19개 입력 변수를 FI 테스트한 결과, 상위를 차지한 5개 변수는 순서대로 절대 동적 해면 높이, 해수면온도, 해수면이상, 기후학적 온도 이상평균 및 평균으로 나타났다(Fig. 7). 0.78, 0.24 °C의 평균 FI를 갖는 절대 동적 해면 높이와 해수면 이상은 수면하의 수온이 상승할 경우에 높은 고도를, 반대로 수온이 하강할 경우에 낮은 고도를 보이는 특징이 있어 수온을 추정하는데 중요한 요소가 되었다. 0.71°C의 FI를 보이는 해수면온도의 경우, 표층 인근의 수심에서 높은 FI를 보이는 것을 확인하였다(본 논문에 싣지 않음). 연직 수온 구조 추정의 뼈대가 되어줄 WOA23의 기후학적 온도 이상평균 및 평균은 각각 0.16, 0.07°C의 FI가 계산되었다. 그 외의 변수들은 모두 0.06 이하로 FI가 계산되었다.

https://cdn.apub.kr/journalsite/sites/opr/2024-046-04/N0080460407/images/opr_46_04_07_F7.jpg
Fig. 7.

Results of feature importance test for top 5 inputs. The black boxes indicate the mean of feature importance. The blue, green, red, and brown lines describe the seasonal average of winter, spring, summer, and fall, respectively. (absolute dynamic topography; ADT, sea surface temperature; SST, sea level anomaly; SLA, climatological temperature anomalous mean; Tan, climatological temperature mean; Tma)

여름철 공간분포 비교

계절별로 모델 성과를 검토한 결과, 여름철 50 m 이내의 수심에서는 1.5°C 이상의 RMSE를 보이는 것이 확인됐다. 여름은 네 계절 중 수온 추정 오차가 가장 크게 발생하는 계절로(본 논문에 싣지 않음), 평균적인 현상을 잘 모의하는 인공신경망 모델이 따뜻한 극 값을 잘 재현하지 못해 발생한 결과이다. 이러한 한계점에도 불구하고 본 연구에서 개발된 모델은 여름철의 대한민국 서남해역의 특징을 비교적 잘 모의하고 있는 것을 수온장의 평균을 도시함으로써 확인할 수 있었다(Fig. 8).

https://cdn.apub.kr/journalsite/sites/opr/2024-046-04/N0080460407/images/opr_46_04_07_F8.jpg
Fig. 8.

Temperature distribution along depth for three models (ANN, HYCOM, GLORYS) in the summertime (Jul., Aug., Sep.).

인공신경망, HYCOM, GLORYS가 테스트셋에 해당되는 연도의 여름철(7, 8, 9월)에 모의한 수온의 평균장을 비교한 결과, 국립해양조사원(2022)은 2000년부터 2020년까지의 여름철 50 m 수심 평균 수온 분포에서 목포 인근부터 제주 서부를 지나는 해역까지, 그리고 남해 연안에서 15°C 이하의 냉수대가 관측됨을 보였다. 이러한 수온 분포는 우리의 인공신경망 모델이 가장 잘 추정하고 있으며, 다른 두 수치모델은 유사한 패턴을 모의하고 있지만 상대적으로 더 높은 수온으로 예측하고 있어 냉수가 상대적으로 북쪽에 머무르고 있는 형태를 보인다.

5. 요약 및 결론

본 연구에서는 인공신경망 모델을 활용, 관측된 연직 수온 자료를 사용하여 3차원 해양 수온 구조를 추정하였다. 학습에 사용된 입력자료는 위성관측 표층수온 및 해수면고도 자료, World Ocean Atlas23의 월별 수온기후치, 수치모델의 표층 염분자료, ERA5의 기상 자료, 조석모델인 NAO.99Jb의 조석자료이다. 연구의 시간 및 공간 범위는 각각 2000년부터 2022년까지, 북위 31°–36°, 동경 123.5–129.5°의 동중국해 북부 연안역이다.

경험 법칙에 근거하여 인공신경망 모델의 최적화를 수행한 결과, 전층 평균 RMSE는 1.1°C, bias는 0.1°C의 효과적인 모형이 수립되었음을 확인하였다. 이 RMSE는 HYCOM의 1.2°C, GLORYS의 1.3°C보다 소폭 개선된 값으로 인공신경망 모형의 효용성이 추가적으로 증명되었다. 수온의 내부 변동성이 크며, 극 값이 나타나는 여름에 모델의 상층 오차가 상대적으로 크게 나타나는 한계점을 보이지만, 이 계절 또한 범용 모델보다 수온 공간 패턴을 잘 모의하고 있음을 확인했다.

기존의 인공신경망을 이용한 수온구조 예측은 대부분 원양에서 이루어졌다. 하지만 본연구에서는 원양에서 수행된 대부분의 사전 연구들과는 달리 수심이 다양하고, 조석에 의한 전선이 나타나는 등 다양한 수온 구조를 갖는 연안역에 초점을 맞춰 연구를 수행하였다는 것에 큰 의의를 갖는다.

Acknowledgements

본 연구는 해양수산과학기술진흥원의 「해양재난 대응을 위한 3차원 해수유동(조류, 해류) 관측기술 개발(RS-2021-KS211521)」 사업의 지원을 받아 수행되었습니다.

References

1

국립해양조사원 (2022) 우리바다 해양정보도. 국립해양조사원, 부산, 126 p

2

김성중, 우성호, 김백민, 허순도 (2011) 지난 130년 간 한반도 근해의 표층 수온 변화 경향. Ocean Polar Res 33(3):281-290. doi:10.4217/OPR.2011.33.3.281

10.4217/OPR.2011.33.3.281
3

김주일, 김진영, 최용규, 오현주, 추은경 (2005) 한국 남해 연안 전선 구조에 따른 멸치 알의 분포. 한국어류학회지 17(3):205-216

4

나정열, 한상규, 조규대 (1990) 한반도 근해의 해류와 해수 특성 - 남해연안수 확장과 수온변화 -. Korean J Fish Aquat Sci 23(4):267-279

5

민홍식, 김철호 (2006) 한국 연안 표층수온의 경년변동과 장기변화. Ocean Polar Res 28(4):415-423. doi:10.4217/OPR.2006.28.4.415

10.4217/OPR.2006.28.4.415
6

승영호 (1992) 한반도 주변의 수괴와 해수순환, 한국해양학회지 바다 27(4):324-331

7

윤동영, 최현우 (2012) 제주 남부해역 수온 수직구조의 공간분포 특성 파악. 한국지리정보학회지 15(4):162-174. doi:10.11108/kagis.2012.15.4.162

10.11108/kagis.2012.15.4.162
8

이은주, 김영택, 김송학, 주호정, 박재훈 (2021) 비주석 재귀신경망 앙상블 모델을 기반으로 한 조위관측소 해수위의 준실시간 이상값 탐지. 한국해양학회지 바다 26(4):307-326

9

주호정, 채정엽, 이은주, 김영택, 박재훈 (2022) 한국 남부 해역 SST의 계절 및 경년 변동이 단기 딥러닝 모델의 SST 예측에 미치는 영향. 한국해양학회지 바다 27(2):49-70

10

Aparna SG, D'Souza S, Arjun NB (2018) Prediction of daily sea surface temperature using artificial neural networks. Int J Remote Sens 39(12):4214-4231. doi:10.1080/01431161.2018.1454623

10.1080/01431161.2018.1454623
11

Bolton T, Zanna L (2019) Applications of deep learning to ocean data inference and subgrid parameterization. J Adv Model Earth Syst 11:376-399. doi:10.1029/2018MS001472

10.1029/2018MS001472
12

Chae JY, Jin HK, Chang IS, Kim YH, Park YG, Kim YT, Kang BS, Kim MS, Ju HJ, Park JH (2024) Prediction of sea surface current around the Korean peninsula using artificial neural networks. J Geophys Res: Machine Learning and Computation 1(4):e2024JH000168. doi:10.1029/2024JH000168

10.1029/2024JH000168
13

Kwon K, Choi B-J, Kim S-D, Lee S-H, Park K-A (2020) Assessment and improvement of global gridded sea surface temperature datasets in the Yellow Sea using in situ ocean buoy and research vessel observations. Remote Sens 12(5):759. doi:10.3390/rs12050759

10.3390/rs12050759
14

Lahoz WA, Schneider P (2014) Data assimilation: making sense of Earth Observation. Front Environ Sci 2:16. doi:10.3389/fenvs.2014.00016

10.3389/fenvs.2014.00016
15

Lee EJ, Kim K, Park JH (2022) Reconstruction of long-term sea-level data gaps of tide gauge records using a neural network operator. Front Mar Sci 9:1037697. doi:10.3389/fmars.2022.1037697

10.3389/fmars.2022.1037697
16

Lu W, Su H, Yang X, Yan X-H (2019) Subsurface temperature estimation from remote sensing data using a clustering-neural network method. Remote Sens Environ 229:213-222

10.1016/j.rse.2019.04.009
17

Matsumoto K, Takanezawa T, Ooe M (2000) Ocean tide models developed by assimilating TOPEX/POSEIDON altimeter data into hydrodynamical model: a global model and a regional model around Japan. J Oceanogr 56:567-581

10.1023/A:1011157212596
18

Nardelli BB (2020) A deep learning network to retrieve ocean hydrographic profiles from combined satellite and in situ measurements. Remote Sens 12:3151. doi:10.3390/rs12193151

10.3390/rs12193151
19

O'Carroll AG, Armstrong EM, Beggs HM, Bouali M, Casey KS, Corlett GK, Dash P, Donlon CJ, Gentemann CL, Høyer JL, Ignatov A, Kabobah K, Kachi M, Kurihara Y, Karagali I, Maturi E, Merchant CJ, Marullo S, Minnett PJ, Pennybacker M, Ramakrishnan B, Ramsankaran RAAJ, Santoleri R, Sunder S, Picart SS, Vazquez Cuervo J, Wimmer W (2019) Observational needs of sea surface temperature. Front Mar Sci 6:420. doi:10.3389/fmars.2019.00420

10.3389/fmars.2019.00420
20

Shi X, Chen Z, Wang H, Yeung D, Wong W, Woo W (2015). Convolutional LSTM network: a machine learning approach for precipitation nowcasting. NIPS'15: Proceedings of the 28th International Conference on Neural Information Processing Systems, Montréal, 8 Dec 2015, 1:802-810

21

Su H, Zhang T, Lin M, Lu W, Yan X (2021) Predicting subsurface thermohaline structure from remote sensing data based on long short-term memory neural networks. Remote Sens Environ 260:112465. doi:10.1016/j.rse.2021.112465

10.1016/j.rse.2021.112465
22

Xiao C, Chen N, Hu C, Wang K, Xu Z, Cai Y, Xu L, Chen Z, Gong J (2019) A spatiotemporal deep learning model for sea surface temperature field prediction using time-series satellite data. Environ Model Softw 120:104502. doi:10.1016/j.envsoft.2019.104502

10.1016/j.envsoft.2019.104502

국문 참고자료의 영문표기 English translation / Romanization of references originally written in Korean

1

KHOA (2022) Ocean information. Korea Hydrographic and Oceanographic Agency, Busan, 126 p

2

Kim S, Woo S, Kim B, Hur SD (2011) Trends in Sea Surface Temperature (SST) change near the Korean Peninsula for the past 130 years. Ocean Polar Res 33(3):281-290. doi:10.4217/OPR.2011.33.3.281

10.4217/OPR.2011.33.3.281
3

Kim JY, Choi Y, Oh H, Chu E (2005) Distribution of the Anchovy eggs association with coastal frontal structure in southern coastal waters of Korea. Koran J Ichthyol 17(3):205-216

4

Na J, Han S, Cho K (1990) A study on sea water and ocean current in the sea adjacent to Korea Peninsula - Expansion of coastal waters and its effect on temperature variations in the South Sea of Korea -. Korean J Fish Aquat Sci 23(4):267-279

5

Min HS, Kim C (2006) Interannual variability and long-term trend of coastal sea surface temperature in Korea. Ocean Polar Res 28(4):415-423. doi:10.4217/OPR.2006.28.4.415

10.4217/OPR.2006.28.4.415
6

Seung YH (1992) Water masses and circulations around Korean Peninsula. J Korean Soc Oceanogr 27(4):324-331

7

Yoon D, Choi H (2012) Spatial distribution characteristics of vertical temperature profile in the south sea of Jeju, Korea. Journal of the KAGIS 15(4):162-174. doi:10.11108/kagis.2012.15.4.162

10.11108/kagis.2012.15.4.162
8

Lee E, Kim Y, Kim S, Ju H, Park J (2021) A non-annotated recurrent neural network ensemble-based model for near-real time detection of erroneous sea level anomaly in coastal tide gauge observation. J Korean Soc Oceanogr 26(4):307-326

9

Ju H, Chae J, Lee E, Kim Y, Park J (2022) Impacts of seasonal and interannual variabilities of Sea Surface Temperature on its short-term deep-learning prediction model around the southern coast of Korea. J Korean Soc Oceanogr 27(2):49-70

페이지 상단으로 이동하기