/scrapper-sii-typescript-pptr-expressjs

Scrapper de obtención de datos de empresa al SII

Primary LanguageTypeScript

SII Scrapper

Contenido

Sobre el Scrapper

Scrapper de obtención de datos de empresa a través de API conectándose a la página de Situación Tributaria de Terceros del SII. Está diseñado para usar un servidor de memcache, pero funciona sin problemas al no tenerlo.

Para pruebas recomiendo bajar con docker un servidor de memcached.

Tecnologías

  • ExpressJS
  • Puppetter
  • Headless Chrome
  • NodeJS
  • Typescript
  • 2Captcha

Comenzando

Requerimientos

Como la página de terceros del SII usa un captcha simple, el único pre-requisito es tener un KEY de 2Captcha

Es aconsejable un servidor de memcached, sin embargo en caso de no usarla simplemente mostrará error en la consola.

Variables de entorno

El código usa las siguientes variables de entorno.

  • CAPTCHA_KEY . Key de 2Captcha (REQUERIDO)
  • MEMCACHIER_USERNAME . Usuario del servidor memcached.
  • MEMCACHIER_SERVERS . HOST del servidor memcached.
  • MEMCACHIER_PASSWORD . Clave del servidor de Memcached.

Instalando

Para instalar todas las dependencias simplemente usar npm

npm i

Esto también instalará la versión headless de Chrome.

Usage

Para probar de manera local simplemente en un browser puedes ir directamente a :

http://localhost:3000/byrut/RUT

En dónde RUT es el RUT a consultar sin puntos ni guión.

Autores y Contribuidores

  • Cristian Tala