※ 以下、 MLリポジトリで作業を行うものとする
- 期単位でまとめられた DataPackage が存在すること
以下のようにスクリプトを実行すればインタラクティブにどの期の DataPackage をもとにするかや、どのモデルを対象に前処理をするかを選択できる。
$ python scripts/preparing.py
[?] Select file(s) to preprocess:
[X] 2021_2.csv
> [X] 2022_1.csv
Selected file(s):
2021_2.csv
2022_1.csv
[?] Select a preprocessing strategy:
> high_payout
placement
Selected strategy: high_payout
Processing races: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 45499/45499 [11:38<00:00, 65.15it/s]
Prepared data and log saved in data/prepared/20240622_084705