tktkbohshi/FairseqTutorial

Fairseq初心者のための日本語チュートリアルです．

Jupyter Notebook

注意

このリポジトリでの作業中にダウンロードしたモデル・データは，二次配布になってしまうのでネット上にアップロードしないでください．

このレポジトリはまだ未完成です．
参考にする分には問題はないですが，動作させるためにはいくつかバグが残っています．
作業進捗状況

説明用資料のアップロード
説明用コードの追加
~~image captioningコードの完全な動作~~（多忙につき永久停止中）
~~各コードについての詳細な説明~~（多忙につき永久停止中）
tipsの追加

更新履歴

2023/05/08 tips追加

FairseqTutorial

Fairseq初心者のための日本語チュートリアルです． NTTが公開している対話システム用大規模言語モデルであるJapanese Dialog Transformerのファインチューニング，及びCNN+LSTMのレガシーな画像キャプション生成モデルの作成と学習を行います．このチュートリアルを通して

基本的なfairseq-cliの使い方
fairseqの大まかな仕組み
fairseqのカスタマイズ方法

の習得を目指します．

想定読者

pytorchでモデル実装・カスタムデータセットの作成を行ったことがある．
言語モデルの学習や自然言語処理そのものについて、自然言語処理100本ノック程度の知識・実装の理解がある
pytorchについてクラスやデコレータなどの応用的な知識がある

フォルダ構成

/materials: チュートリアルスライド(pdf形式)置き場
/work_dialog: Japanese Dialog Transformerのファインチューニングのハンズオンの作業ディレクトリ
/work_caption: 画像キャプション生成のハンズオンの作業ディレクトリ

使い方

$sh library_installation.shを実行して，必要なライブラリをインストールしてください．
その後，任意の作業ディレクトリに移動し，READMEに従ってください．

Contributor