undertheseanlp/automatic_speech_recognition

Việt Speech to Text

anhnhatanh opened this issue · 12 comments

Mình đang cần một ứng dụng chạy offline trên môi trường Windows để giải quyết vấn đề Việt Speech to Text. Các bạn có thể tư vấn cụ thể làm như thế nào, step 2 step ... (mã nguồn, cách training hoặc bằng cách nào đó thiết lập một hệ thống chạy độc lập hoặc trên trên môi trường mạngLAN cũng được)
Dùng không cần Internet mà giải quyết được.
Vì trước tới giờ mình toàn dùng Google Docs để chuyển giọng đọc thành text..hihi.

Chào @anhnhatanh

Hiện tại, nhóm mình vẫn đang hoàn thiện repository này. Tuy nhiên, các thử nghiệm không support trên môi trường Windows.

@anhnhatanh có thể tìm các giải pháp khác có hỗ trợ Windows nhé.

Hiện tại, nhóm mình đang làm việc trên môi trường Ubuntu, sử dụng kaldi. Kết quả đang khá thấp 20% WER trên tập test VLSP 2018

Nếu bạn có quan tâm chạy thử theo hướng dẫn tại https://github.com/undertheseanlp/automatic_speech_recognition#h%C6%B0%E1%BB%9Bng-d%E1%BA%ABn-s%E1%BB%AD-d%E1%BB%A5ng

Vu Anh ơi, mình đã cài Ubuntu 18.04 rồi, nhờ bạn giúp mình nêu từng bước cài đặt cụ thể để chạy thành công Demo trên được không?, like Vu Anh mạnh !..

@anhnhatanh nice, bạn bắt đầu từ hướng dẫn này nhé: Thiết lập môi trường

@pubbus giúp anh support bạn @anhnhatanh nhé

Vâng anh.

Chào nhóm tác giả, mình cũng đang muốn áp dụng sản phẩm như vậy vào công việc của mình, không biết sản phẩm này có chạy offline trong LAN được không?

@vanthanhcong1111 Hệ thống này bạn có thể cài đặt offline được. Nhưng hiện tại độ chính xác của hệ thống chỉ phù hợp với các bài toán có tập từ nhỏ, đối với bài toán tập từ lớn, cần lượng dữ liệu khá lớn để đảm bảo chất lượng có thể áp dụng trong sản phẩm thực tế.

Chúc bạn thành công!

Cảm ơn nhóm tác giả, mình sẽ cài đặt và dùng thử. Mình có tập từ kha khá, chắc phải training nhiều để tăng độ chính xác.

Với sự trợ giúp nhiệt tình của Mr Lê Phi Hùng, mình đã cài đặt và chạy được lệnh Train.py trên Unbuntu 18.04. Mình thấy sau khi Train xong, thư mục Kaldi-Trunk có dung lượng rất lớn khoảng hơn 10Gb không biết có làm sai gì không?. Và câu hỏi lớn thứ 2, ví dụ mình có 1 file ghi âm hoặc muốn đọc trực tiếp vào Micro trên máy vi tính cho nhận dạng thì làm thế nào? rất mong nhận sự trợ giúp tiếp của AE. Tks AE nhiều!

Chào nhóm tác giả, mình cũng đang muốn áp dụng sản phẩm như vậy vào công việc của mình, không biết sản phẩm này có chạy offline trong LAN được không?

Good quá, mình là member new có gì xin chia sẻ và trợ giúp nha @vanthanhcong1111??