今の世界を知る "元の" データ集 / 統計分析、因果推論

アメリカ輸入額推定/中国からの一般機械(因果推論時系列)

トランプ新政権の貿易赤字の中でも、重要な分野であるアメリカの中国からの一般機械の輸入額を因果推論の時系列分析(pycaret)で予測をやってみた。

今回も主に参考にさせてもらった書籍は以下の2冊。

”元”データは、2014年から2024年12月末までのアメリカの月次輸入額(百万ドル)。12月の実データはまだ公開されていないので、過去データからの推定値を代入。

CSVファイルは以下からダウンロード可。

from pycaret.time_series import *

df = pd.read_csv("HS85china.csv")
df = df[['Date','Value']]

df["Date"] = pd.to_datetime(df["Date"])
df = df.set_index("Date")

exp_name = setup(data=df, fh=12, session_id=1)
  • まずは、ARIMAで試す。
arima = create_model("arima")
plot_model(plot="ts")
  • 2014年から2024年11月末までの実データ。
  • きれいな周期性と緩やかな上昇トレンドがあると思える。
  • やはりコロナ禍で2020年2月、3月は大きく落ちている(今回は特異値扱いしていない)
plot_model(plot="decomp")
  • SLT分解でも、周期性がみてとれる。
  • 2025年12月までの24ケ月予測をやってみる。
plot_model(estimator=arima, plot="forecast", data_kwargs={"fh":24})
  • 黒が実データ、青が予測
  • 良くフィットしているようにみえる。
  • 様々なモデルを探索。
best_model = compare_models()
  • auto_ARIMAが最適との結果なので、auto_ARIMAで再度やってみる
auto_arima = create_model("auto_arima")
plot_model(estimator=auto_arima, plot="forecast", data_kwargs={"fh":24})
  • 黒が実データ、青が予測、青枠は信頼区間。
  • 2024年12月予測額は11,171百万ドル、2025年1月予測は10,134百万ドル、2月は、周期性で落ちて7,926百万ドルとの予測。
  • 関税を課されるかどうか含め、12月以降の実データと比較してみたい。