μκ°μ₯μ νμμ μν λμμ κ°μ νλ©΄ μμ± ν΄μ€ μλΉμ€
Automatic Voice Commentary System for Online Video Lecture for Visually Impaired Students
- μ½λ‘λ λ°μ΄λ¬μ€μ νμ° λ°©μ§λ₯Ό μν΄ λλ€μμ κ΅μ‘κΈ°κ΄μμ λΉλλ©΄ κ°μ μμ€ν μ λμ νμμ
- λμμ κ°μλ λΉλλ©΄ κ°μ μμ€ν μ λ§μ λΆλΆμ μ°¨μ§νκ³ μμ
- κ·Έλ¬λ, μκ°μ₯μ νμλ€μ λμμ κ°μμ νλ©΄μ 무μμ΄ λμ€λμ§ μ μκ° μμ΄ κ°μ λ΄μ© μ΄ν΄λκ° λ¨μ΄μ§λ λ¬Έμ κ° λ°μν¨
- λν κ°μμλ£μ ν¨κ» μ¬μ©νκΈ°λ μ΄λ €μμ νμ¬ μμ νλ λ΄μ©μ΄ κ°μμλ£μμ λͺ νμ΄μ§μ ν΄λΉνλ μ§λ μκΈ° μ΄λ €μ
λ°λΌμ νλ©΄ λ±μ₯νλ κ°μμλ£μ νμ΄μ§ μ 보λ₯Ό λ΄μ©κ³Ό ν¨κ» ν΄μ€ν΄μ£Όλ μμ€ν
μ ꡬμΆνκ³ ,
μ΄λ¬ν μλ ν΄μ€ λμμμ μ¬μ©νκΈ° μ©μ΄νλλ‘ μ μ© μΉ νλ μ΄μ΄λ₯Ό ν¨κ» μ 곡νκ³ μ ν¨!
- κ΅μμκ° κ°μ λμμκ³Ό κ°μμλ£ νμΌμ μ λ‘λν¨
- μλ²μ ꡬμΆλμ΄ μλ μμ€ν μ΄ κ°μ λμμ λ΄ μ¬λΌμ΄λ μ ν μμ μ λμΆνκ³ , ν΄λΉ μ¬λΌμ΄λκ° κ°μμλ£μ λͺ λ²μ§Έ νμ΄μ§μ ν΄λΉνλμ§ μ μ¬λ λ§€μΉ μκ³ λ¦¬μ¦μ ν΅ν΄ νμ
- κ°μμλ£μμ μ¬λΌμ΄λλ³λ‘ ν μ€νΈ, μ΄λ―Έμ§, νμ λν΄μ μλμΌλ‘ ν΄μ€μ μ 곡νλ λΉλμ€ νμΌμ μμ±
- μμ 2λ¨κ³μμ μμλΈ μ¬λΌμ΄λλ³ λμμ κ°μ λ΄ λ±μ₯μμ μ 보λ₯Ό κΈ°λ°μΌλ‘ μ§μ μμ±ν ν΄μ€ λΉλμ€ νμΌκ³Ό μλ³Έ κ°μ λμμμ μ‘°ν© β μλ‘μ΄ ν΄μ€ λΉλμ€ νμΌ μμ±
- νμμ ν€λ³΄λλ‘ κ°νΈνκ² μ‘°μν μ μλ μ μ© νλ μ΄μ΄λ₯Ό μ¬μ©νμ¬ ν΄μ€ κ°μ λμμμ μκ°
- μμ° λ° λ°ν μμ λ§ν¬: https://youtu.be/qrxdCjk2UBw
- νλ‘μ νΈ κ΄λ ¨ μ μ λ Όλ¬Έ λ§ν¬: http://doi.org/10.17210/jhsk.2022.06.17.2.31
- μλ³Έ κ°μ μ λ‘λ λ° ν΄μ€ μ½μ (κ΅μμ νλ©΄): κ΅μμκ° λ‘κ·ΈμΈνλ©΄ κΈ°μ‘΄ LMS μμ€ν μ μ΄μ©νλ κ²κ³Ό λμΌνκ² λμμκ³Ό κ°μμλ£λ₯Ό μ λ‘λνλ©΄, λ³Έ μμ€ν μ΄ μλμΌλ‘ μ΄λ₯Ό λΆμνμ¬ μ¬λΌμ΄λλ§λ€ ν΄μ€μ μ½μ ν©λλ€
- μ¨λΌμΈ κ°μ νλ«νΌ ννμ΄μ§ (νμ νλ©΄): νμμ΄ LMS μμ€ν μ λ‘κ·ΈμΈνλ©΄, κΈ°μ‘΄κ³Ό λμΌνκ² κ°μ’λͺ©λ‘μ νμΈν μ μμ΅λλ€. μ¬κΈ°μ 'ν΄μ€ λΉλμ€ νμΌ μ¬μ' λ²νΌμ λλ₯΄λ©΄ μλμΌλ‘ ν΄μ€μ΄ μ 곡λλ λμμμ μ μ© νλ μ΄μ΄λ‘ μ¬μν μ μμ΅λλ€
- μλ³Έ κ°μ λμμ(mp4): μλ³Έ κ°μ λμμμ μλ¬΄λ° ν΄μ€μ΄ μ 곡λμ§ μλ κ΅μμκ° μ²μμ μ¬λ¦° λμμμ λλ€
- κ°μμλ£ ν΄μ€μ΄ μ 곡λλ λΉλμ€ νλ μ΄μ΄: κ°μμλ£ νλ©΄μ λν΄μ μλμΌλ‘ ν΄μ€μ΄ μ 곡λλ λμμμ ν¨κ³Όμ μΌλ‘ μ΄μ© λ° μκ°νκΈ° μν μ μ© νλ μ΄μ΄μ λͺ¨μ΅μ λλ€. ν€λ³΄λλ‘ κ°λ¨νκ² λμμ΄ κ°λ₯νλ©°, μ μμΈ νμλ μ΄μ©ν μ μλλ‘ μ¬λΌμ΄λ μ ν μμ λ¨μλ‘ GUIλ₯Ό ꡬμ±νμμ΅λλ€.
python manage.py runserver
$ pip install opencv-python scenedetect pandas pdf2image fitz pillow scikit-image gtts pdfplumber googletrans pytesseract moviepy pydub mutagen requests
- opencv-python: Pythonμ© OpenCV μ€μΉ
- scenedetect: κ°μ λμμ λ΄ μ νμμ νμ μ μν λΌμ΄λΈλ¬λ¦¬ μ€μΉ
- pandas: νλ ¬ κΈ°λ°μΌλ‘ λ°μ΄ν°λ₯Ό μ μ₯νκ³ , csv νμΌλ‘ λ΄λ³΄λ΄κΈ° μν λΌμ΄λΈλ¬λ¦¬ μ€μΉ
- pdf2image: pdf νμΌμ jpgλ‘ λ³ννλ λΌμ΄λΈλ¬λ¦¬ μ€μΉ
- fitz: μ΄λ―Έμ§ μΆμΆνλ λΌμ΄λΈλ¬λ¦¬ μ€μΉ
- pillow: νμ΄μ¬ μ΄λ―Έμ§ μ²λ¦¬νλ λΌμ΄λΈλ¬λ¦¬ μ€μΉ
- scikit-image: μ΄λ―Έμ§κ° μ μ¬λ κ³μ°μ μν λΌμ΄λΈλ¬λ¦¬ μ€μΉ
- gtts: ν μ€νΈλ₯Ό μμ±μΌλ‘ λ³νν΄μ£Όλ ꡬκΈμ tts λΌμ΄λΈλ¬λ¦¬ μ€μΉ
- pdfplumber: pdfνμΌμ ν μ€νΈλ‘ λ³νν΄μ£Όλ λΌμ΄λΈλ¬λ¦¬ μ€μΉ
- googletrans: κ΅¬κΈ λ²μμΌλ‘ μλ¬Έμ νκΈμΌλ‘ λ²μ μ€μΉ
- pytesseract: μΊ‘μ² μ΄λ―Έμ§μ λν΄ OCR κΈ°λ₯μ μννκΈ° μν λΌμ΄λΈλ¬λ¦¬ μ€μΉ
- moviepy: mp4 μμ λ³ν©μ μν λΌμ΄λΈλ¬λ¦¬ μ€μΉ
- pydub: μ€λμ€ νμΌμ μλ₯΄κ³ λΆμ΄κΈ° μν λΌμ΄λΈλ¬λ¦¬ μ€μΉ
- mutagen: mp3, mp4 νμΌμ κΈΈμ΄λ₯Ό μΆμΆνκΈ° μν λΌμ΄λΈλ¬λ¦¬ μ€μΉ]
- requests: μ΄λ―Έμ§ μΊ‘μ REST API μ¬μ©μ μν HTTP λΌμ΄λΈλ¬λ¦¬ μ€μΉ
- PDF λ λλ§ λΌμ΄λΈλ¬λ¦¬ poppler μ€μΉ: https://poppler.freedesktop.org/
- μ΄ν microsoft azure computer vision μ€μ κ°μ΄λ μ°Έκ³ : https://docs.microsoft.com/ko-kr/azure/cognitive-services/computer-vision/quickstarts-sdk/image-analysis-client-library?pivots=programming-language-python&tabs=visual-studio
λΈλΌμ°μ : Internet Explorer, Firefox (Chrome, Microsoft Edge μ μΈ)
Dongyeon Park: yeon0729@sookmyung.ac.kr
Sojeong Kang: thwjdrkd7@naver.com
Yujin Kim: heather0220@sookmyung.ac.kr
Original Repository: https://github.com/Commentor/commenting-video-lecture