Vectorizing MNLI sentence segmentation and similarity computation

Question

forrestbao opened this issue 2 years ago · 1 comments

The code below does sentence segmentation one sentence each time. Please use a vectorized version that segments multiple sentences each time.

Also, we should have two versions for MNLI-based approaches: word-level like original BERT-score and sentence-level like BERT-score sentence.

Answer 1 · 2022-12-04T22:14:54.000Z

Please spend up to 1 hour to figure out why using MNLI based model to compute sentence similarity is so slow.