採用中ポジション一覧
カジュアル面談
採用中ポジション一覧
カジュアル面談
Dataflux Dataset for PyTorch
2025/8/6
16:14
2025/8/6
16:14
概要
小さいファイルが複数GCSに入っている時にlocalに直接持って来ずにDataLoaderを高速化できるライブラリ。textデータとかだと良さそう
こんな感じでかける
GCS Compose API
を使って、小さいobjectをconcatしたり、並列でlistingしたりしているらしい。
Xでポスト