/busho-index

Primary LanguageJupyter NotebookMIT LicenseMIT

busho-index

日本語データセットをチャンク分割し Azure AI Search のインデックスに登録するサンプル

Azure AI Search のキーワード検索をするために以下を行うサンプルです。

  • 戦国武将の Wikipedia ページをチャンクに分割
  • Azure AI Search のインデックスに登録

日本語データセットをチャンク分割し、Embeddings に変換して Azure AI Search のベクトルインデックスに登録するサンプル

フルテキスト検索、ベクトル検索、ハイブリッド検索、セマンティックハイブリッド検索を行うサンプル

Azure AI Search の様々な検索を行うために、以下を行うサンプルです。

  • 戦国武将の Wikipedia ページをチャンクに分割
  • チャンクごとに Embeddings を生成
  • Azure AI Search のベクトルインデックスに登録
  • 検索クエリーを発行

Azure AI Document Intelligence と LangChain を使用してセマンティックチャンキングを行うサンプル

Corrective RAG (CRAG) のサンプル