/Shorter

점자형 선거 공보물의 제작 및 축약을 위한 프로그램

Primary LanguagePython

⠠⠨⠂⠃⠈⠝ (짧게) - 2023 DAB 경진대회 출품작

묵자형 선거 공보물의 점역에는 크게 세 가지 어려움이 있습니다.

① 점자형 선거 공보물도 묵자형 선거 공보물과 함께 빠른 시일 내에 제공되어야 합니다.
② 띄어쓰기, 오탈자 등의 오류가 없이 정확한 점역이 이루어져야 합니다.
③ 점역에는 묵자에 비해 3배 이상의 지면이 필요하나, 현재는 묵자형 선거 공보물의 두 배의 지면만이 제공됩니다.1

①의 시간이 문제가 되는 이유는, 점자 선거 공보물의 점역에는 많은 인력이 들고, 오랜 시간이 걸리기 때문입니다.
그렇기에 점역을 의무화하는 법안이 존재함에도 많은 공보물은 점역되지 않습니다.
선거철에는 점역 기관의 인원들은 초과 근무를 하거나, 66~400%의 추가 인력이 업무를 위해 추가 투입됩니다. 2
비장애인들에 대한 형평성에 어긋나기에, 묵자형 공보물이 점역만을 위해 더 일찍 제공될 수는 없습니다.
빠른 작업을 도와줄 수 있는 툴이 있으면 큰 도움이 될 것이라 생각했습니다.

②의 정확도가 문제가 되는 이유는, 현재 대부분의 점자 선거 공보물의 오류는 띄어쓰기나 오탈자이기 때문입니다.(76.4%)3
비장애인분들은 전후 맥락을 눈으로 보면서 오탈자 여부를 쉽게 확인할 수 있습니다.
그럴 수 없는 시각장애인분들에게는 오타 하나하나가 글 전체의 해석을 어렵고 피곤하게 만드는 요소입니다.

③의 지면 부족이 문제가 되는 이유는, 시각장애인분들에게 충분한 양의 자료가 제공되지 않고 있기 때문입니다.
시각장애인분들은 점자 공보물에 누락된 공약이 많고, 사이트 주소 등 의미없는 정보가 많다고 말합니다.
유사한 의미를 가지는 문장일 경우 글자수를 조금이라도 줄일 수 있다면 반드시 필요한 정보를 넣을 수 있을 것입니다.

혹자는 음성 낭독 자료로 충분하지 않은지 의문을 던질 것이라고 생각합니다.
그 대답은 실제 시각장애인분들의 면담 내용4으로 갈음합니다.

컴퓨터나 핸드폰 등 디지털 매체에 취약하신 시각장애인 분들은
아직까지 점자 활용도가 더 높기 때문에 없어서는 안 된다고 생각합니다.

음성 매체로 머릿속에 전달되는 정보랑, 손으로 직접 읽어서 머릿속에 전달되는 정보는
그 기억의 차이가 분명히 있기 때문에 필요하다고 생각합니다.

꼭 반드시 있어야 된다고 생각하는 이유는 요즘엔 여러가지 매체로 사실은 접할 수가 있잖아요.
우리도 선택해서 볼 수 있다는 게 좋을 것 같아요.

이러한 문제들을 종합적으로 해결할 수 있는 번역 툴을 제작해보았습니다.
해당 툴만을 이용해 만든 예시 요약본과 예시 점역본을 첨부합니다.
각각 example.txt와 example_braille.txt입니다.

Approach

image

How to use

  1. git clone 하기
$ git clone https://github.com/subin9/Shorter
  1. 필요한 모듈 설치하기
$ pip install -r requirments.txt
  1. 동일한 폴더 내에 점역할 pdf 파일 넣기

  2. 구글 바드 접속 후 F12 클릭 - Application 클릭 - Cookies 클릭 - accounts.google.com 클릭 - __Secure-1PSID 복사
    (참고: bardapi library)

  3. 파이썬 스크립트에서 --path <pdf 파일 이름> --psid <__Secure-1PSID> 입력

$ python demo.py --path <pdf file name> --psid <__Secure-1PSID>

Footnotes

  1. (국립국어원, 2021, 123.)

  2. (국립국어원, 2021, 127-128.)

  3. (국립국어원, 2021, 150.)

  4. (국립국어원, 2021, 135.)