下記ライブラリを使用してPDFからテキストを抽出後、GPT4oでmarkdown形式に変換する。
- llama parse
- Firecrawl
- Unstructured
- pypdf
-
生活保護の被保護者調査(令和6年3月分概数)の結果
https://www.mhlw.go.jp/toukei/saikin/hw/hihogosya/m2024/dl/03-01.pdf -
産業、事業所規模別労働災害率及び死傷者1人平均労働損失日数 https://www.mhlw.go.jp/toukei/itiran/roudou/saigai/23/dl/2023toukeihyo.pdf