- λκΈμ μμ±νλ©΄, λΆλ₯ λͺ¨λΈμ΄ νμ€ ννμΈμ§λ₯Ό λ¨Όμ νλ³ν©λλ€.
- νμ€ ννμΌλ‘ λΆλ₯λ κ²½μ°, ν ν° λΆλ₯ λͺ¨λΈμ μ΄μ©ν΄ λ¬Έμ₯μ μ΄λ λΆλΆμ΄ νμ€ ννμΈμ§λ₯Ό μ°Ύμ μλ €μ€λλ€.
- μμ± λͺ¨λΈμ μ΄μ©ν΄, λ¬Έμ₯μ μνλ λ΄μ©μ μμ±νμ¬ μ¬μ©μμκ² μν λ°©ν₯μ μ μν΄ μ€λλ€.
- λ₯λ¬λμ μ΄μ©ν΄ λκΈμ νμ€ μ¬λΆλ₯Ό λΆλ₯νκ³ , νμ€ννμΌλ‘ νλ¨λ κ²½μ° μλ―Έλ₯Ό μ μ§ν λ¬Έμ₯μ μ¬μμ±ν©λλ€.
- μ΄ κ³Όμ μ ν΅ν΄ μ¬μ©μμ λ¬Έμ μμμ μΌμΌν€κ³ μλ°μ κ°μ μ μ λν©λλ€.
κΉμ€ν | λ₯μ¬ν | λ°μν | λ°μΉν | μ€μ λ―Ό |
---|---|---|---|---|
Classification model Classification API Data Collecting |
Generation Model Generation API Data Collecting |
Classification Model Data Guideline Data Collecting Data Checking |
Generation Model Database BackEnd FrontEnd Data Web Data Collecting |
Generation Model Data Collecting Data Checking |
- Backbone modelλ‘λ κ°μ₯ λμ F1 scoreλ₯Ό 보μ΄λ©΄μλ ν©λ¦¬μ μΈ μΆλ‘ μκ°μ λ³΄μΈ π€ beomi/KcElectra-base-v2022 λͺ¨λΈμ μ¬μ©νμ΅λλ€.
- F1 score 90.88
- RPS : 173
- Reward + Prompt modelμ μ΅μ’ μ±ννμ΅λλ€.
- νμ€ λ¬Έμ₯ λΆλ₯ λͺ¨λΈμ νμ΅μλ νκ΅μ΄ λ΄μ€κΈ°μ¬ λκΈμμ μμ§ν νμ€νν λ°μ΄ν°μ μΈ K-MHaSλ₯Ό μ¬μ©νμ΅λλ€.
- νμ€νν ν ν° λΆλ₯ λͺ¨λΈμ νμ΅μλ λ€μ΄λ² λ΄μ€μ μ νλΈ μμ λκΈμμ μμ§ν νκ΅μ΄ νμ€νν λ°μ΄ν°μ μΈ KOLDλ₯Ό μ¬μ©νμ΅λλ€.
- νμ€ννμ μ κ±°νλ μλ―Έλ₯Ό μ μ§ν λ¬Έμ₯ μ¬μμ± νμ΅μ μν΄, μ§μ μ¬μ©μμ μ°Έμ¬λ₯Ό λ°μ νμ€ νν - μν νν parallel dataset(μ΄ 3,133κ°)μ ꡬμΆνμ΅λλ€.
- νμ€ννμ APEACH, BEEP!, K-MHaS, KOLD λ°μ΄ν°μ μ νμ€ννμ μ¬μ©νμ΅λλ€.
- hate_purificate_parallel_dataset.csv νμΌλ‘ μ¬μ©ν μ μμ΅λλ€