INGV - Volcanic Eruption Prediction Report less than 1 minute read

INGV - Volcanic Eruption Prediction

Volcanic Eruption Prediction Data

https://www.kaggle.com/competitions/predict-volcanic-eruptions-ingv-oe

Purpose & Contents

과학자들은 지진 신호에 의한 화산 떨림을 조사함으로써 분화 시간을 확인한다. 일부 화산에서는 화산이 폭발하기 전 이 현상이 심화된다. 데이터 분석을 통해 다름 화산이 언제 폭발할지 예측할 수 있다. 활화산에 배치된 센서에 의해 수집된 데이터 센스를 분석하고 화산 분출 직전의 지진 파형을 식별한다.

  • 데이터에서 주어진 신호기의 파형확인
  • 분출까지의 시간 시각화 (by histogram)
  • 분출까지의 시간 시각화 (by line)
  • Test data set에서의 신호기 데이터 누락

Conclusion

  • 데이터에서 주어진 신호기의 파형 확인
신호기 파형1

누락된 신호를 0으로 가정하면 아래와 같다.

신호기 파형2
TPS-mar-2021 Report 5 minute read

TPS-mar-2021 Report

TPS-mar-2021 Data

https://www.kaggle.com/competitions/tabular-playground-series-mar-2021

Purpose & Contents

Tabular Playground Series 는 Kaggle Data 경진 대회에 참가하는 초보자들을 위해 표 현태의 데이터를 제공합니다. 실제 데이터세트를 기반으로 하고 있으며 TPS-mar-2021 Report는 보험 청구 금액을 예측하기 위해 Category형 데이터 cat0 - cat18, 연속형 데이터 cont0 - cont18을 바탕으로 모델을 학습힌다.

Data

Data Summary

  • 총 학습 데이터 개수: 3000
  • 총 예측 데이터 개수: 20000
  • 총 결측치 수: 0 = 전체 데이터의 0%

Summary

  • XGBoost를 기반으로 한 학습에서 0.8836의 scores를 획득 (파라미터를 튜닝을 통해 성능을 향상시켰음.)
  • 의료 데이터에서는 Random Forest의 성능 향상이 두드러진다는 논문을 인용해 Random Forest 기반의 학습을 시행했으나 오히려 성능이 감소함
  • 모델의 학습... read more

Machine Learning - Perceptron 9 minute read
Perceptron