/aws-translator-with-python

[backend] TraduzAI - A Personalized Solution for Effective and Fluent Translation in Different Contexts

Primary LanguagePythonMIT LicenseMIT

TraduzAI

Uma Solução Personalizada para Tradução Eficaz e Fluente em Diferentes Contextos

Resumo

Este projeto visa desenvolver um sistema de tradução automática que, além de traduzir de uma língua para outra, seja capaz de interpretar e traduzir jargões técnicos de áreas como medicina, psicologia, direito, matemática, química, física, programação, filosofia, entre outras ciências exatas e naturais, para uma linguagem cotidiana e acessível para pessoas que não são especialistas na área.

O sistema utiliza ao service da AWS Amazon Translate para realizar a tradução automática e a API da OpenAI para simplificar os textos técnicos, garantindo que a tradução seja precisa e compreensível para o público. A personalização do sistema permite que os usuários forneçam feedback sobre as traduções e simplificações, melhorando a qualidade e a precisão das traduções ao longo do tempo.

A solução inclui uma interface gráfica intuitiva desenvolvida em Python com Tkinter, onde os usuários podem inserir textos ou importar arquivos e selecionar o idioma de destino. O sistema detecta automaticamente o idioma de origem e fornece uma tradução que não apenas mantém a precisão técnica, mas também converte termos complexos em uma linguagem clara e acessível ao público geral.

Para facilitar a integração com outras plataformas, o projeto disponibiliza funcionalidades para exportar os resultados em diferentes formatos, como TXT, PDF e DOCX, permitindo que empresas automatizem o atendimento a clientes em diversos idiomas e incorporem a funcionalidade de tradução em suas aplicações.

Além disso, o sistema realiza análises de legibilidade utilizando sete métricas distintas: Índice de Flesch Reading Ease, Grau de Flesch-Kincaid, Índice SMOG, Índice de Coleman-Liau, Índice Automático de Legibilidade ( ARI), Pontuação de Dale-Chall e BLEU Score. Essas métricas auxiliam na avaliação da facilidade de leitura e compreensão dos textos traduzidos e simplificados, garantindo que a linguagem seja adequada ao público-alvo.

O projeto agora integra o cálculo do BLEU Score (Bilingual Evaluation Understudy) utilizando a estratégia de Back-Translation. O BLEU Score é uma métrica automática utilizada para avaliar a qualidade das traduções geradas por máquinas em comparação com traduções de referência humanas. Essa adição permite monitorar e melhorar a qualidade das traduções de forma objetiva e contínua.

A infraestrutura do sistema é baseada na AWS, utilizando serviços como Amazon S3 para armazenamento de dados e Amazon CloudWatch para monitoramento e registro de eventos, garantindo escalabilidade, segurança e alta disponibilidade.

Palavras-chave

Tradução Automática, Jargões Técnicos, Deep Learning, Redes Neurais Recorrentes, Transformer, Amazon Translate, Personalização, Feedback do Usuário, Atendimento ao Cliente, Exportação de Arquivos, Monitoramento de Qualidade, Legibilidade, Métricas de Legibilidade, BLEU Score.

Palavras-chave

Tradução Automática, Jargões Técnicos, Deep Learning, Redes Neurais Recorrentes, Transformer, Amazon Translate, Personalização, Feedback do Usuário, Atendimento ao Cliente, Exportação de Arquivos, Monitoramento de Qualidade, Legibilidade, Métricas de Legibilidade.


Índice

  1. Requisitos
  2. Instalação
  3. Código-Fonte
  4. Como Executar
  5. Como Usar
  6. Contribuição
  7. Licença

1. Requisitos

  • Python 3.12 ou superior
  • Conta na AWS com acesso ao Amazon Translate
  • Chave de API da OpenAI
  • Bibliotecas Python necessárias:
annotated-types==0.7.0
anyio==4.6.2.post1
awscli==1.35.2
boto3==1.35.36
botocore==1.35.36
certifi==2024.8.30
charset-normalizer==3.4.0
colorama==0.4.6
distro==1.9.0
docutils==0.16
EbookLib==0.18
h11==0.14.0
httpcore==1.0.6
httpx==0.27.2
idna==3.10
jiter==0.6.1
jmespath==1.0.1
langdetect==1.0.9
lxml==5.3.0
numpy==2.1.2
openai==1.51.2
packaging==24.1
pillow==11.0.0
pipdeptree==2.23.4
portalocker==2.10.1
pyasn1==0.6.1
pydantic==2.9.2
pydantic_core==2.23.4
PyPDF2==3.0.1
pyphen==0.16.0
python-dateutil==2.9.0.post0
python-docx==0.8.11
python-dotenv==1.0.1
pywin32==308
PyYAML==6.0.2
regex==2024.9.11
reportlab==3.6.13
requests==2.32.3
rsa==4.7.2
s3transfer==0.10.3
sacrebleu==2.4.3
setuptools==75.2.0
six==1.16.0
sniffio==1.3.1
tabulate==0.9.0
textstat==0.7.4
tqdm==4.66.5
typing_extensions==4.12.2
urllib3==2.2.3

2. Instalação

2.1 Clonar o Repositório

git clone https://github.com/TraduzAI/aws-translator-with-python
cd aws-translator-with-python

2.2 Criar e Configurar o Arquivo .env

Crie um arquivo .env na raiz do projeto com o seguinte conteúdo:

AWS_ACCESS_KEY_ID=suachaveAWS
AWS_SECRET_ACCESS_KEY=suasecretAWS
AWS_REGION=us-east-1
OPENAI_API_KEY=suaChaveOpenAI

2.3 Instalar as Dependências

pip install -r requirements.txt

3. Código-Fonte

A estrutura dos diretórios é a seguinte:

aws-translator-with-python/
├── main.py
├── requirements.txt
└── services/
    ├── api/
    │   ├── __init__.py
    │   ├── aws_translate_service.py
    │   └── openai_service.py
    ├── language/
    │   ├── __init__.py
    │   ├── bleu_score_service.py
    │   └── readability_service.py
    ├── __init__.py
    └── document_service.py

4. Como Executar

Após clonar o repositório e configurar o arquivo .env, execute o aplicativo com:

python main.py

5. Como Usar

5.1 Interface do Usuário

Desenvolvida com Tkinter para interação intuitiva.

5.2 Elementos da Interface

  • Seleção de Idioma: Escolha do idioma de destino.
  • Seleção da Área Técnica: Definição da área do texto.
  • Modelo OpenAI: Escolha do modelo para simplificação.
  • Checkbox "Resumir": Resumo opcional.
  • Botões de Exportação: Exportar como TXT, PDF ou DOCX.

5.3 Métricas de Legibilidade

Métricas do Texto Original e Texto Simplificado

  • Índice de Flesch Reading Ease: Mede a facilidade de leitura; valores mais altos indicam texto mais fácil.
  • Grau de Flesch-Kincaid: Indica o nível escolar necessário; valores mais baixos indicam texto mais acessível.
  • Índice SMOG: Estima os anos de educação necessários; valores mais baixos são melhores.
  • Índice de Coleman-Liau: Baseado em caracteres por palavra e palavras por frase; valores mais baixos indicam maior facilidade.
  • Índice Automático de Legibilidade (ARI): Usa caracteres por palavra e palavras por frase; valores mais baixos indicam texto mais simples.
  • Pontuação de Dale-Chall: Compara com uma lista de palavras familiares; valores mais baixos indicam texto mais fácil.
  • BLEU Score: Mede a qualidade da tradução; valores mais altos indicam traduções mais precisas.

6. Contribuição

  1. Fork o repositório.
  2. Crie uma branch: git checkout -b feature/nova-feature.
  3. Commit: git commit -m "Adiciona nova feature".
  4. Push: git push origin feature/nova-feature.
  5. Abra um Pull Request.

7. Licença

Este projeto está sob a Licença MIT. Consulte o arquivo LICENSE para mais detalhes.