본문 바로가기

Data-science/논문 읽기

[딥러닝 논문 리뷰] A Spatio-Temporal Spot-Forecasting Framework for Urban Traffic Prediction - 1

728x90

A Spatio-Temporal Spot-Forecasting Framework for Urban Traffic Prediction
https://arxiv.org/pdf/2003.13977v2.pdf

https://github.com/rdemedrano/crann_traffic

시공간 예측 모델의 특징

머신러닝 기반

  • 데이터 표본들이 모두 독립적으로 발생했다는 가정이 있는데, 사실 데이터 간에 상관관계는 매우 높아 문제가 있음

딥러닝 기반

  • 임의의 복잡한 함수를 근사시키는 능력, feature representation 학습하기 쉬운점
    • 위 두 특징들이 가정을 덜 가져가도되게하고 데이터상 상관관계를 허용한다.

RNN

  • 시계열 데이터 예측엔 강점을 가졌으나, 공간 데이터에 적용하긴 쉽지 않다. 따라서 RNN의 경우 공간정보 (convolution 이나 spatial matrices)들과 조합되어 이용된다.

CNN

  • spatio-temporal regression에서 cnn을 이용하고 이게 성능이 되게 좋다고 한다.

RNN+CNN

  • 대표적으로 sequence to sequence models (seq2seq) / encoder-decoder architectures.
  • attention mechanisms의 등장 → 시간, 공간, 시공간 모두 적용가능

교통량 예측

statistical models

  • ARIMA, KARIMA, SARIMA
  • 몇몇 가정을 포함하고 있어 실제 데이터에 항상 적합한 모델은 아니다.

general machine learning models

  • bayesian methods (베이지안 모델의 그래프 구조가 도로 네트워크 시각화에 적합하다고 한다.)
  • 다음 소개될 방법에 비해 더 좋은 성능을 내는 건 아님
  • tree models (해석가능, 현상에 대한 이해를 넓히기 위해선 좋은 선택)
    • 데이터 양이 많고 차원이 클때 오버피팅 되기 쉬운 문제점 존재
  • SVM (support vector machine), SVR (support vector regression)
    • 잘 작동한다. 하지만 모델에 커널이 핵심적인 역할을 하는데, 이 미리 정해놓은 커널이 flexible 하지 않다는 단점이 있음. (these methodologies must establish a kernel as a basis for constructing the model. This means that, for such an specific problem like the one we are working on, the use of a predetermined kernel (usually radial) might not be flexible enough.)

deep learning models

  • CNN 모듈들을 LSTM 위에 쌓는 구조 (혹은 반대로 쌓는 구조)가 최근 구조
  • 위 구조와 함께 시/공간 차원 모두에 attension mechanism을 쓸 경우 이점이 있다고 한다.
  • 단기간 예측모델 / 장기간 예측 모델 각각 존재
    • CNN LSTM 조합 모델
    • ConvLSTM

시계열 데이터 분해할 경우 성능 향상, 하지만 딥러닝에 적용하기 위해 어떻게 분해할지는 아직 다뤄지지 않음 (이 논문에서 다룰거다)

모델 해석 가능성

  • bidirectional LSTM
  • graph convolutional-LSTM

(In general, traffic interpretability research has focused in pointing out important road segments.)
→ 이 논문 모델의 경우 공간 차원 뿐만 아니라 시간 차원에 대해서도 이해할 수 있게 함