このリポジトリは、gpt-index(0.2.5)をOpenAI APIの代わりにHuggingfaceの日本語モデルを使って行った試みのスクリプトを共有するためのものです。
記事 https://note.com/oshizo/n/n137aaa2c29d4
pip install requirements.txt
を行ってgpt-index_trial.ipynb
を実行してください。
create_dataset.ipynb
を使ってtrain.csv
を作成し
Google Colab ProのA100でtrain_qa_refine.ipynb
を実行してください。
ベースモデルをmediumサイズに変更することで、T4でも学習が可能です。
学習環境の依存ライブラリはrequirements-train.txt
に記載しています。