時系列データセットまとめ
目次
様々な時系列データのレポジトリや所在をまとめてみました。
元々時系列分析に興味があってちょこちょこ分析してみたりしていたのですが、最近仕事でも時系列分析に関わることになりまして。
そこで時系列分析の様々なアルゴリズムの検証用&実データでの適用 &趣味 に向けて一念発起して集めてみました。
個人的な備忘録として使うつもりですが、もしご覧の皆様にも参考になる部分があれば幸いです。
※今後も良さげなデータを見つけ次第追記していく予定です。
時系列データセットまとめ
以下の書籍からかなり引用させていただきました。
リンク
説明欄に※がついているものは書籍からの引用です。
サイト | 説明 |
---|---|
UCI機械学習リポジトリ時系列データ集 | UCI機械学習レポジトリに所蔵されている時系列データセット※ |
UEA&UCR時系列分類レポジトリ | 時系列分類、時系列クラスタリング向けのデータセット※ |
Kaggle時系列データセット | KaggleのDatasetsの内、時系列データに絞り込んだもの |
Mcomp, M4comp2018 | Rパッケージ。Mコンテスト(時系列予測のコンペティション)のデータ※ |
tscompdata | Rパッケージ。様々な時系列コンペティションのデータ※ |
CRAN時系列パッケージ一覧 | Rパッケージ。Rパッケージに含まれる様々な時系列データがまとめられている※ |
CompEngine | 時系列データの”自己組織化データベース”。高度比較時系列解析機能を提供しており、手元の時系列データと似たデータを探すこともできる※ |
米国海洋大気庁国立環境情報センター | 気象関連のデータセット※ |
JAMSTECデータカタログ | 日本の海洋研究開発機構が採集した観測データやシミュレーションデータ |
セントルイス連邦準備銀行(FRED) | 様々な経済時系列データが得られるサイト※ |
米国労働省労働統計局 | アメリカの労働市場に関する時系列データ※ |
日本銀行時系列統計データ | 日本銀行が公表しているデータセット一覧 |
e-Stat | 日本政府統計のポータルサイト |
疾病予防管理センターのインフルエンザデータ | アメリカのインフルエンザ流行期の週ごとのインフルエンザ感染者数※ |
UCI機械学習リポジトリやKaggleのデータセットは定番ですね。
このような大規模なデータセットは大体絞り込みができるので、時系列データに絞り込んで上のリンクを埋め込んでみました。
UEA&UCR時系列分類レポジトリは時系列分類に特化している点がユニークですね。
ワインのスペクトル(化学成分を分析したグラフ)などは時系列ではありませんが、系列データの分類によってワインを分類するなど、タスクとしても面白いデータがそろってます。
CompEngineは規模もすごいです。
ユーザが手元のデータと似たデータを調べるために、手元のデータをアップロードするわけですが、ユーザが望めばそのデータをデータセットに追加することもできるようです。
まさに”自己組織化”ですね。
実データで言うとやはり経済関連や気象関連が中心になってきますね。
FREDは経済の様々なデータを取得できるのでよくお世話になっています。
こちらとか↓
Polarsでの時系列データ処理
更新履歴
2023/10/07作成