smilegate-ai/korean_unsmile_dataset

Pre-trained Model 관련 Issue

kayoooon1 opened this issue · 1 comments

제공해주신 코랩 파일에서 코드를 돌리던 중 pre-trained된 모델을 불러오는 부분에서 문제를 발견하였습니다. Model test에서 기학습된 모델을 불러오는 부분이며, 오류는 다음과 같습니다:
UserWarning: return_all_scores is now deprecated, use top_k=1 if you want similar functionnality

huggingface 모델코드( https://github.com/huggingface/transformers/blob/main/src/transformers/pipelines/text_classification.py )에 따르면 return_all_scores가 None이어야 하는데, 해당 모델에서는 어떠한 값을 가지는 것 같습니다.

이에 관련해 baseline 코드를 공유해주시거나, 오류를 해결해주실 수 있는지 여쭈어보기 위해 Issue를 open합니다.
감사합니다!

pipe = TextClassificationPipeline(
     model=model,
     tokenizer=tokenizer,
     device=0,     # cpu: -1, gpu: gpu number
     return_all_scores = None,
     top_k = 10,
     function_to_apply='sigmoid'
     )

Model Test 부분의 pipeline 형성 시 다음과 같이 코드를 수정하시면 원래 코랩에서 제공되었던 같은 결과물을 보실 수 있습니다!
해결되었으므로 close하겠습니다 😄