Scrapper de obtención de datos de empresa a través de API conectándose a la página de Situación Tributaria de Terceros del SII. Está diseñado para usar un servidor de memcache, pero funciona sin problemas al no tenerlo.
Para pruebas recomiendo bajar con docker un servidor de memcached.
- ExpressJS
- Puppetter
- Headless Chrome
- NodeJS
- Typescript
- 2Captcha
Como la página de terceros del SII usa un captcha simple, el único pre-requisito es tener un KEY de 2Captcha
Es aconsejable un servidor de memcached, sin embargo en caso de no usarla simplemente mostrará error en la consola.
El código usa las siguientes variables de entorno.
- CAPTCHA_KEY . Key de 2Captcha (REQUERIDO)
- MEMCACHIER_USERNAME . Usuario del servidor memcached.
- MEMCACHIER_SERVERS . HOST del servidor memcached.
- MEMCACHIER_PASSWORD . Clave del servidor de Memcached.
Para instalar todas las dependencias simplemente usar npm
npm i
Esto también instalará la versión headless de Chrome.
Para probar de manera local simplemente en un browser puedes ir directamente a :
http://localhost:3000/byrut/RUT
En dónde RUT es el RUT a consultar sin puntos ni guión.
- Cristian Tala