Skip to content

Latest commit

 

History

History
29 lines (21 loc) · 1.19 KB

create_prepared_data.md

File metadata and controls

29 lines (21 loc) · 1.19 KB

DataPackage の生成手順

※ 以下、 MLリポジトリで作業を行うものとする

前提条件

  • 期単位でまとめられた DataPackage が存在すること

CSVの生成

以下のようにスクリプトを実行すればインタラクティブにどの期の DataPackage をもとにするかや、どのモデルを対象に前処理をするかを選択できる。

$ python scripts/preparing.py
[?] Select file(s) to preprocess: 
   [X] 2021_2.csv
 > [X] 2022_1.csv

Selected file(s):
2021_2.csv
2022_1.csv
[?] Select a preprocessing strategy: 
 > high_payout
   placement

Selected strategy: high_payout
Processing races: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 45499/45499 [11:38<00:00, 65.15it/s]
Prepared data and log saved in data/prepared/20240622_084705