yagays/ja-timex

[Bug] 日付表現で半を含む際のto_datetime()の動作

Closed this issue · 2 comments

🐛 Bug

説明

日付表現に半や午後(PM)を含むとき、to_datetime()を実行すると、TIMEX3タグのvalueには反映されているようですが、日付型/時間型に半や午後の時刻が反映されません。
仕様でしょうか??
初issueなので何か間違えていたら申し訳ありません。よろしくお願いします。

現状挙動

timex_parser = TimexParser(reference=pendulum.now()) # 2022/8/27 18:00:00 
print(timex_parser.parse("20時半"))
print(timex_parser.parse("20時半")[0].to_datetime())
print()
print(timex_parser.parse("午後11時"))
print(timex_parser.parse("午後11時")[0].to_datetime())

出力

[<TIMEX3 tid="t0" type="TIME" value="T20-30-XX" text="20時半">]
2022-08-27T20:00:00+09:00

[<TIMEX3 tid="t0" type="TIME" value="T23-XX-XX" text="午後11時">]
2022-08-27T11:00:00+09:00

理想の挙動

出力

[<TIMEX3 tid="t0" type="TIME" value="T20-30-XX" text="20時半">]
2022-08-27T20:30:00+09:00

[<TIMEX3 tid="t0" type="TIME" value="T23-XX-XX" text="午後11時">]
2022-08-27T23:00:00+09:00

実行環境

  • ja-timexのバージョン : 0.2.6
  • Pythonのバージョン : 3.10.5
  • OSの情報: Windows10

@qwertyroiro レスポンスが遅れてしまい、すいません。バグ報告ありがとうございます。こちら修正しましたので、pip install -U ja-timex等でバージョンアップし、再度試してみてください。

ご対応ありがとうございます。期待通りに動作できました。
大変助かりました。