MuriloKrominski
🇧🇷🇮🇹Brasileiro e Italiano 👨🏻💼Business Management 🤖Robotic Engineering 🧠💻A.I. 📊Data Science 🏛️Philosophy 🌍Volunteering 🦉Virtues/Values
IBM/FGVTreviso - Italia
Pinned Repositories
2.0-EDA-Analise-Exploratoria-de-Dados-com-DTale-Sweetviz-Autoviz-PandasProfilling-Titanic
Antes de trabalhar com seus dados, é importante conhece-los, e isso se torna fácil com uma EDA que usa bibliotecas Python, como como D-Tale, Sweetviz, Autoviz e Pandas Profilling. A Análise Exploratória de Dados (EDA) é uma das etapas INICIAIS e ESSENCIAIS na maioria dos projetos de ciência de dados e geralmente consiste em executar as mesmas etapas para caracterizar um conjunto de dados (por exemplo, descobrir tipos de dados, informações ausentes, distribuição de valores, correlações, etc.). Dada a repetitividade e semelhança de tais tarefas, existem algumas bibliotecas que se bem usadas, automatizam e ajudam a iniciar o processo. Usar essas ferramentas me dão um impulso significativo quando começo a analisar um novo conjunto de dados. Vale ressaltar que também acho útil usa-las mais tarde no processo de análise, por exemplo, durante a geração de recursos, para obter uma visão geral rápida de como os novos recursos funcionam. Espero que você ache uma ferramenta útil em sua própria análise de dados. Eu criei este de forma que fosse possível utilizar e replicar sua extrutura para agilizar EDAs simples e complexos, de tipos diferentes, e não apenas para este DB. Espero que gostem e que aproveitem bem está primeira parte, que é o EDA completo. A continuação também estará em meu Repositório.
APP_Upgrade_Your_English_B1-C1
APP Upgrade Your English B1-C1: Método que desenvolvi para agilizar o aprendizado de idiomas, usado para a língua inglesa (britânica), em um aplicativo para smartfones Android ou IOS, com 4952 aulas de inglês, otimizadas para aprendizado natural, com as palavras em ordem de importância real, algo que penso eu, é um trabalho inédito.
Data-Science_ENEM-2019
Database-Open-Source-Matityahu
Por Murilo Krominski
DDS-Flai_Inteligencia_Artificial-gitflai
FLAI Dominando Data Science: Baseado no desafio do Workshop FLAI Dominando Data Science. Relação dos dados com o custo e faz um modelo para prever se clientes do plano de saúde são potenciais fraudadores, de forma que seja possível enviar a informação para um departamento para uma investigação mais minuciosa sobre o potencial fraudador, juntamente a construção uma aplicação web para disponibilizar um acesso ao modelo bastante conveniente para o usuário final.
DNA-X-Doencas-e-Predisposicoes-Geneticas
murilo.krominski@fgv.edu.br Analisador de DNA X Doenças e Predisposições Genéticas - Por Murilo Krominski Idealizado e criado por Murilo Krominski, este é provavelmente, no mundo, o primeiro Analisador de DNA X Doenças e Predisposições Genéticas, gratúito e feito para qualquer pessoa que possua os dados Brutos do seu DNA (Raw Data), feito por qualquer laboratório. Qualquer um poderá conhecer as suas predisposições genéticas, isto é, os seus riscos de desenvolver determinadas doenças genéticas. Por hora analisa apenas 18 variantes genéticas associadas ao desenvolvimentos de doenças, mas irá aumentar em futuras atualizações que eu realizar, e trata de descobrir problemas como: Doença de Wilson Deficiência de Alfa-1 Antitripsina (variante PI*Z) Deficiência de Alfa-1 Antitripsina (variante PI*S) Deficiência de fator XII Trombofilia (Fator II - Protrombina) Trombofilia (Fator V de Leiden) Hemocromatose tipo 1 (variante H63D) Hemocromatose tipo 1 (variante C282Y) Hemocromatose tipo 1 (variante S65C) Infarto do miocárdio Doenças mieloproliferativas Amiloidose hereditária (variante V122I) Amiloidose hereditária (variante V50M) Amiloidose hereditária (variante T80A) Polipose associada ao gene MUTYH (variante G396D) Doença de Parkinson e Doença de Gaucher (gene GBA) Doença de Parkinson (gene LRRK2) Câncer Com os resultados, você poderá se planejar melhor para o futuro, sempre com o auxílio de um profissional especializado. É importante recordar que há outros fatores, além dos genéticos, que influenciam no surgimento de doenças. O arquivo de origem deve estar no formato .csv, se chamar "origem.csv" e possuir os dados dispostos da seguinte forma: 1ª Coluna: RSID: string Se disponível, carrega a variante rsID, que identifica o ramo dentro do banco de dados genético público dbSNP(SNP, sigla em inglês para Polimorfismo de Nucleotídeo Único, é uma variação do DNA em uma única base nucleotídica que nos permite traçar propensões e características..) 2ª Coluna: CHROMOSOME: string Indica o número do cromossomo onde se situa a variante genética. Existem 22 pares de cromossomos autossômicos que são indicados com um número e os cromossomos sexuais que são nomeados como X e Y. Há também marcadores no DNA mitocondrial que aparecem listados como “MT”. 3ª Coluna: POSITION: string É a posição variante no cromossomo, a posição do marcador genético de acordo com o conjunto genético humano GRCh37 (http://grch37.ensembl.org/index.html). 4ª Coluna: RESULT: string • O par de valores observados (alelo 1 e alelo 2 - representando os lados paterno e materno, não necessariamente nessa ordem), contém resultados de genotipagem para os marcadores genéticos.
English_Language_Database_2020-Murilo_Krominski
English_Language_Database_2020: Depois de muitas horas de intensa varredura(web scraping) e de processamento em Cloud da IBM, apresento um Banco de Dados que desenvolvi para servir aplicações que trabalhem com o aprendizado da língua inglesa (britânica). DATABASE com quase 20 mil palavras / frases exclusivas, ordenadas em ordem de importância para aprimorar um vocabulário até a fluência no inglês. Desenvolvido este de forma pública e para mais um Projeto Open Source, também de minha autoria, que usa as melhores técnicas de neurolinguística para memorização.
MuriloKrominski
MuriloKrominski.github.io
A repository for my personal Github site.
Pandas
Pandas - Series & Dataframes: Esta página pretende oferecer uma visão geral de todos os objetos, funções e métodos públicos do Pandas. Pandas é uma biblioteca de software criada para a linguagem Python para manipulação e análise de dados. Em particular, oferece estruturas e operações para manipular tabelas numéricas e séries temporais. Clique no link do Google Colaboratory(Colab), para poder ver, modificar os códigos Python e os executar por meio do navegador em tempo real. Colab é um serviço de notebook Jupyter hospedado que não requer muita configuração para uso, enquanto fornece acesso gratuito a recursos de computação, incluindo GPUs, especialmente adequado para aprendizado de máquina, análise de dados e educação. Pode-se baixar e rodar localmente.
MuriloKrominski's Repositories
MuriloKrominski/APP_Upgrade_Your_English_B1-C1
APP Upgrade Your English B1-C1: Método que desenvolvi para agilizar o aprendizado de idiomas, usado para a língua inglesa (britânica), em um aplicativo para smartfones Android ou IOS, com 4952 aulas de inglês, otimizadas para aprendizado natural, com as palavras em ordem de importância real, algo que penso eu, é um trabalho inédito.
MuriloKrominski/MuriloKrominski
MuriloKrominski/Data-Science_ENEM-2019
MuriloKrominski/DNA-X-Doencas-e-Predisposicoes-Geneticas
murilo.krominski@fgv.edu.br Analisador de DNA X Doenças e Predisposições Genéticas - Por Murilo Krominski Idealizado e criado por Murilo Krominski, este é provavelmente, no mundo, o primeiro Analisador de DNA X Doenças e Predisposições Genéticas, gratúito e feito para qualquer pessoa que possua os dados Brutos do seu DNA (Raw Data), feito por qualquer laboratório. Qualquer um poderá conhecer as suas predisposições genéticas, isto é, os seus riscos de desenvolver determinadas doenças genéticas. Por hora analisa apenas 18 variantes genéticas associadas ao desenvolvimentos de doenças, mas irá aumentar em futuras atualizações que eu realizar, e trata de descobrir problemas como: Doença de Wilson Deficiência de Alfa-1 Antitripsina (variante PI*Z) Deficiência de Alfa-1 Antitripsina (variante PI*S) Deficiência de fator XII Trombofilia (Fator II - Protrombina) Trombofilia (Fator V de Leiden) Hemocromatose tipo 1 (variante H63D) Hemocromatose tipo 1 (variante C282Y) Hemocromatose tipo 1 (variante S65C) Infarto do miocárdio Doenças mieloproliferativas Amiloidose hereditária (variante V122I) Amiloidose hereditária (variante V50M) Amiloidose hereditária (variante T80A) Polipose associada ao gene MUTYH (variante G396D) Doença de Parkinson e Doença de Gaucher (gene GBA) Doença de Parkinson (gene LRRK2) Câncer Com os resultados, você poderá se planejar melhor para o futuro, sempre com o auxílio de um profissional especializado. É importante recordar que há outros fatores, além dos genéticos, que influenciam no surgimento de doenças. O arquivo de origem deve estar no formato .csv, se chamar "origem.csv" e possuir os dados dispostos da seguinte forma: 1ª Coluna: RSID: string Se disponível, carrega a variante rsID, que identifica o ramo dentro do banco de dados genético público dbSNP(SNP, sigla em inglês para Polimorfismo de Nucleotídeo Único, é uma variação do DNA em uma única base nucleotídica que nos permite traçar propensões e características..) 2ª Coluna: CHROMOSOME: string Indica o número do cromossomo onde se situa a variante genética. Existem 22 pares de cromossomos autossômicos que são indicados com um número e os cromossomos sexuais que são nomeados como X e Y. Há também marcadores no DNA mitocondrial que aparecem listados como “MT”. 3ª Coluna: POSITION: string É a posição variante no cromossomo, a posição do marcador genético de acordo com o conjunto genético humano GRCh37 (http://grch37.ensembl.org/index.html). 4ª Coluna: RESULT: string • O par de valores observados (alelo 1 e alelo 2 - representando os lados paterno e materno, não necessariamente nessa ordem), contém resultados de genotipagem para os marcadores genéticos.
MuriloKrominski/English_Language_Database_2020-Murilo_Krominski
English_Language_Database_2020: Depois de muitas horas de intensa varredura(web scraping) e de processamento em Cloud da IBM, apresento um Banco de Dados que desenvolvi para servir aplicações que trabalhem com o aprendizado da língua inglesa (britânica). DATABASE com quase 20 mil palavras / frases exclusivas, ordenadas em ordem de importância para aprimorar um vocabulário até a fluência no inglês. Desenvolvido este de forma pública e para mais um Projeto Open Source, também de minha autoria, que usa as melhores técnicas de neurolinguística para memorização.
MuriloKrominski/MuriloKrominski.github.io
A repository for my personal Github site.
MuriloKrominski/Pandas
Pandas - Series & Dataframes: Esta página pretende oferecer uma visão geral de todos os objetos, funções e métodos públicos do Pandas. Pandas é uma biblioteca de software criada para a linguagem Python para manipulação e análise de dados. Em particular, oferece estruturas e operações para manipular tabelas numéricas e séries temporais. Clique no link do Google Colaboratory(Colab), para poder ver, modificar os códigos Python e os executar por meio do navegador em tempo real. Colab é um serviço de notebook Jupyter hospedado que não requer muita configuração para uso, enquanto fornece acesso gratuito a recursos de computação, incluindo GPUs, especialmente adequado para aprendizado de máquina, análise de dados e educação. Pode-se baixar e rodar localmente.
MuriloKrominski/2.0-EDA-Analise-Exploratoria-de-Dados-com-DTale-Sweetviz-Autoviz-PandasProfilling-Titanic
Antes de trabalhar com seus dados, é importante conhece-los, e isso se torna fácil com uma EDA que usa bibliotecas Python, como como D-Tale, Sweetviz, Autoviz e Pandas Profilling. A Análise Exploratória de Dados (EDA) é uma das etapas INICIAIS e ESSENCIAIS na maioria dos projetos de ciência de dados e geralmente consiste em executar as mesmas etapas para caracterizar um conjunto de dados (por exemplo, descobrir tipos de dados, informações ausentes, distribuição de valores, correlações, etc.). Dada a repetitividade e semelhança de tais tarefas, existem algumas bibliotecas que se bem usadas, automatizam e ajudam a iniciar o processo. Usar essas ferramentas me dão um impulso significativo quando começo a analisar um novo conjunto de dados. Vale ressaltar que também acho útil usa-las mais tarde no processo de análise, por exemplo, durante a geração de recursos, para obter uma visão geral rápida de como os novos recursos funcionam. Espero que você ache uma ferramenta útil em sua própria análise de dados. Eu criei este de forma que fosse possível utilizar e replicar sua extrutura para agilizar EDAs simples e complexos, de tipos diferentes, e não apenas para este DB. Espero que gostem e que aproveitem bem está primeira parte, que é o EDA completo. A continuação também estará em meu Repositório.
MuriloKrominski/Database-Open-Source-Matityahu
Por Murilo Krominski
MuriloKrominski/DDS-Flai_Inteligencia_Artificial-gitflai
FLAI Dominando Data Science: Baseado no desafio do Workshop FLAI Dominando Data Science. Relação dos dados com o custo e faz um modelo para prever se clientes do plano de saúde são potenciais fraudadores, de forma que seja possível enviar a informação para um departamento para uma investigação mais minuciosa sobre o potencial fraudador, juntamente a construção uma aplicação web para disponibilizar um acesso ao modelo bastante conveniente para o usuário final.
MuriloKrominski/Mercado-Imobiliario-Paranhos-Portugal
Mercado Imobiliário Paranhos Portugal: Realizei um Dossiê a pedido da RE/MAX de Portugal sobre áreas de investimento imobiliário no norte de Portugal. Essa foi a primeira vez que um trabalho assim foi realizado, pois pela primeira vez os dados oficiais das Freguesias foram comparados com os registros de imobiliárias locais que aceitaram fazer parte da pesquisa, e somadas essas parcerias obtidas, obtivemos mais de 85% do Mercado mapeado com precisão, mas ainda faltavam juntarmos os dados arrumarmos inconsistencias e submte-los a testes que pudessem ser auditados. Foi um Estudo de Mercado Completo, feito em Data Science, com dados auditados pelo CI (Confidencial Imobiliário), no qual fiz um levantamento por "Zona", apresentando um panorama sobre variáveis e características sócio demográficas, com direito a posterior mapeamento aéreo e vídeo, em trabalho posterior, que posso apresentar para quem tiver interesse.
MuriloKrominski/COVID-Maringa-Londrina
MuriloKrominski/Data-Science-e-Saude
MuriloKrominski/Data_Science_Movies
MuriloKrominski/Machine_Learning-scikit_learn-Titanic
MuriloKrominski/sklearn_e_Machine_Learning
MuriloKrominski/StrictoSensu-Brasil-2017a2020
Por Murilo Krominski. Os dados da seção contêm informações sobre os programas de pós-graduação stricto sensu no Brasil. Esta versão apresenta os dados para os anos de 2017 e 2018, os dois primeiros anos do novo período de avaliação, e será atualizada até completar-se os quatro anos do ciclo (2017-2020).