code: サンプルコード本体esci-data: 本文で題材とするデータセットへの参照(Gitサブモジュール)output: 章別の出力例script: 章別の細かいサンプルコード(コマンドラインなど)tmp: 一時的なデータやモデルの保存先Dockerfile: サンプルコードの実行環境の設定*.py: 主要なサンプルコードdocker-compose.yaml: 実行環境やOpenSearchを立ち上げるための設定docker-compose.yaml.gpu.patch: その設定にあて、実行環境からGPUを利用するためのパッチrequirements.txt: サンプルコードで利用するライブラリの一覧
.gitmodules: Gitサブモジュールの設定README.md: このファイル
- 依存する
transformersのバージョンを5未満に固定しました。- ほかの依存コンポーネントが動作しなくなるのを確認したためです。
.parquetファイルを扱う際、engineを明示しました。これにより、pyarrowがインストールされていない場合にcode/ch01_data_preparation.pyの上げる例外が分かりやすくなると期待されます。- 1.0.0の例:
File "/code/ch01_data_preparation.py", line 80, in assert_counts assert (query_count, row_count) == (10407, 297883) ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ AssertionError - 1.0.1の例:
ImportError: Missing optional dependency 'pyarrow'. pyarrow is required for parquet support. Use pip or conda to install pyarrow.
- 1.0.0の例:
- 関連して、不要と思われる
fastparquet依存を削除しました。 - 環境によってはインストールされない挙動を確認したため、
pillow依存を明示しました。
- 出版時の状態