μ¬μ©λλ Datasetμ κ΅λ¦½κ΅μ΄μμ΄ μΌν 리뷰λ₯Ό κΈ°λ°μΌλ‘ ꡬμΆν 'μμ± κΈ°λ° κ°μ± λΆμ' λ§λμΉμ λλ€. μ΄ λνλ μμ± κΈ°λ° κ°μ± λΆμ(ABSA)μ μννλ λͺ¨λΈμ ꡬννλ κ³Όμ μ λλ€.
- μμ± λ²μ£Ό (μ: μ μΆ€ μ 체#μΈμ§λ)
- κ°μ± (κΈμ /λΆμ /μ€λ¦½)
μ°Έκ°νμ μ λ ₯λ λ¬Έμ₯μ λν΄ μμ μμ± λ²μ£Όμ κ°μ±μ μΆμΆνκ³ , μ λ΅ ννκ³Ό μμΈ‘λ ννμ λΉκ΅νμ¬ κ³μ°λ F1 μ μλ₯Ό ν΅ν΄ μΈκ³΅μ§λ₯ λͺ¨λΈμ μ±λ₯μ νκ°ν©λλ€.
docker build -t gcu_tphell:1.0 .
docker run --ipc host --gpus all -it --name hell gcu_tphell:1.0
μ λͺ λ Ήμ΄λ₯Ό ν°λ―Έλμ μ λ ₯νμ¬ docker μμ± λ° νμ±ννλ€.
dataset/task_ABSA/ ν΄λμμ nikluge-sa-2022-test.jsonl νμΌμ ννλ‘ μ½μ
λͺ¨λΈ λ€μ΄λ‘λ ν μμΆ ν΄μ νμ¬ saved_model ν΄λλ₯Ό All.sh μ κ°μ λλ ν 리μ μμΉμν¨λ€. https://drive.google.com/file/d/1s8qriUESwZzu4F9a0n_pMQ4D3xyQoh6r/view?usp=share_link
bash All.sh
μ μ€ν¬λ¦½νΈ μ€νμ
requirements.txt λ΄μ ν¨ν€μ§ μ€μΉ ν inference λ° μμλΈ μν
νμ΅ λ°μ΄ν°μ polarity: positive 94.7%, neutral 3.3%, negative 2.0%
νκ° λ°μ΄ν°μ polarity: positive 97.3%, neutral 1.8%, negative 0.9%
λ€μ΄λ² μΌν νκΈ° crawling data:
λν μ 곡 λ°μ΄ν°μ
κ³Ό λΉμ·ν μΉ΄ν
κ³ λ¦¬μ μν νκΈ°λ₯Ό λ€μ΄λ² μΌνμμ μ§μ ν¬λ‘€λ§.
λν μ 곡 λ°μ΄ν°μ λΌλ²¨λ§ κΈ°μ€μ λΆμνμ¬ μ΅λν λΉμ·ν κ²½ν₯μ±μ κ°μ§κ³ λΌλ²¨λ§μ μ§ν ν λ°μ΄ν°μ
μ μΆκ°
Gold data 120κ°:
κ΅λ¦½ κ΅μ΄μ 21λ
μμ± κΈ°λ° κ°μ± λΆμ λ§λμΉμμ λν μ 곡λ°μ΄ν°μ λ―Έν¬ν¨λ λ°μ΄ν° μ½ 120κ°
(μ΄λ€ 120κ° μ€ μΌλΆλ μ°μμΈ μ΄λ¦μ΄ &name&μΌλ‘ μΉνλ ννλ‘, train νΉμ dev λ°μ΄ν°μ
μ μ€λ³΅λμ΄μλ κ±Έλ‘ νμΈλ¨,
νμ§λ§ test λ°μ΄ν°μ
μλ λ¨ νκ°λ ν¬ν¨λμ§ μμ)
kykim/electra-kor-base: https://github.com/kiyoungkim1/LMkor
- κ΅λ΄ μ£Όμ μ»€λ¨Έμ€ λ¦¬λ·° 1μ΅κ° + λΈλ‘κ·Έ ν μΉμ¬μ΄νΈ 2000λ§κ° (75GB)
- λͺ¨λμ λ§λμΉ (18GB)
- μν€νΌλμμ λ무μν€ (6GB)
[βλ¬Έμ₯μμ μμ±μ μ°ΎμΌμμ€:β + sentence_form ]
μμ±#κ°μ²΄μμ β#βμ β βλ‘ λ°κΎΈκ³ [+ μ λ΅1 + μ λ΅2 ]
paust/pko-t5-large: https://huggingface.co/paust/pko-t5-base
νκ΅μ΄ λ°μ΄ν° (λ무μν€, μν€νΌλμ, λͺ¨λμ λ§λμΉ)λ₯Ό T5μ span corruption taskλ₯Ό μ¬μ©ν΄μ unsupervised learningν μ¬μ νμ΅ λͺ¨λΈ
[βλ¬Έμ₯μμ μμ±μ μ°ΎμΌμμ€:β + sentence_form + βμ΄ λ¬Έμ₯μ μμ±μ <extra_id_0> <extra_id_1> <extra_id_2> <extra_id_3><extra_id_4>μ΄λ€β]
ν ν°μ μ΄ 5κ°μ§λ‘ ν μ΄μ λ ν λ¬Έμ₯μμ μ΅λλ‘ μμ±ν μ μλ μ λ΅ λΌλ²¨μ 5κ°λ‘ μ€μ νμ¬ μΆκ°νμλ€. μ΄μ λ°λΌ T5λͺ¨λΈμμ μ λ΅μ΄ 2κ°μ§ μΌ κ²½μ° μλ μμμ κ°μ΄ μ λ ₯νμλ€.[+<extra_id_0>+μ λ΅1+<extra_id_1>+μ λ΅2+<extra_id_2>+<extra_id_3>+<extra_id_4>]
<extra_>
Voting ν΅ν΄ ACD (entity λΆλ₯) ν, μ΅μ’
μ μΌλ‘ ensembleλ ACDμ ASCλ₯Ό inferenceνμ¬ μ΅μ’
λ³ΈμΌλ‘ μ μΆ
(λ³Έ νμ μ΄λ² λνμ taskλ κ²°κ΅ entity classficiationdμμ λΉλ½μ΄ κ²°μ λ κ²μΌλ‘ νλ¨νλ€)
λμνλ μ λ΅λΌλ²¨μ μμ±#κ°μ²΄μμ β#βμ β βλ‘ λ°κΎΈκ³ [+ μ λ΅1 + μ λ΅2 ] νμμΌλ‘ λ£μλ€.