/Cinematic-Production-Viability

Predicting whether producing a movie is viable and profitable

Primary LanguageJupyter NotebookMIT LicenseMIT

Viabilidade de filmes

Grandes estúdios internacionais, como Warnes Bros, já apostam em startups que utilizam de machine learning e inteligência artificial para ajudar na tomada de decisão na produção de filmes prevendo seu possível sucesso de lançamento, mas esse tipo de previsibilidade ainda permanece uma ideia a ser desenvolvida no Brasil.

Um dos motivos que ainda não há este tipo de ferramenta aplicada no Brasil é a falta de pesquisadores no ramo e também temos pouco acesso a esses dados ligados a films produções e suas características que auxiliam no desenvolvimento de um modelo preciso e de possível utilização.

Ao nosso grupo acompanhar o mercado exterior de filmes e essa deficit do mercado brasileiro decidimos por usar da variabilidade nas previsões de aprendizado de máquina como um substituto para o risco podendo ajudar os executivos e produtores do estúdio a decidir se devem ou não dar a autorização a um projeto de filme.

Já de cara depois de decidirmos o tema notamos que prever o desempenho de um filme nas bilheterias, se seria uma produção viável ou não, é difícil porque há muitos fatores envolvidos no sucesso. Com isso em mente e em busca dos nossos dados, utilizamos de alguns artigos para que pudéssemos entender a complexidade dos dados.

Percebemos pela nossa pesquisa que seria essencial no processo termos cuidado ao fazer a seleção, filtragem, limpeza e junção dos dados, ja que tínhamos diferentes fontes de dados, e as informações nem sempre concordavam entre elas,o que cria complexidade na estrutura e necessita de mais atenção.

Sendo assim pegamos dados do IMDb, The Numbers, além de aplicarmos funções para criação de novas colunas. A base final que utilizamos em nosso estudo teve a estrtura da tabela no final deste texto.

Por fim, como já mencionamos antes o objetivo do nosso trabalho é ajudar os executivos e produtores de estúdio a tomarem a decisão da produção viável ou não de um filme baseada em dados concretos e modelos treinados, queremos proporcionar a essas empresas maiores lucros, filmes de sucesso e até visão correta do mercado (melhor gênero, público, período, duração e muito mais) que se inserem, conforme formos ajustando nossas bases e modelos com o tempo. Conforme, criamos em nosso projeto 5 modelos para que pudéssemos estudar as performance e usabilidade, pensando em modelos baseados em árvore que em teoria performariam melhor com base mais complexas, iremos utilizar a Árvore de decisão, Floresta aleatória e XGBoost de regressão para prevermos o número de ROI do filme, que é o retorno sobre o investimento em cimado filme, já para os nossos outros modelos não baseados em árvore, teremos Naive Bayes e SVC de classificação, prevendo a nossa coluna criada "Producao_Viavel" qual a variável binária foi classificada pelo ROI negativo, quando ouve gasto maior que o retorno e a produção não é viável, e pelo ROI positivo, que temos algum lucro tornando a produção viável.

Nome da coluna: Significado:
Titulo_ID Título do Filme
Titulo_Tamanho Número de caracteres do Título
TempoDuracao(min) Duração do Filme em minutos
Inicio_Ano Ano em que se iniciou a produção do filme
Inicio_Mes Mês em que se iniciou a produção do filme
GrauInfluencia_Diretor Grau de Influência do Diretor
GrauInfluencia_Ator Grau de Influência do Ator
RestritoParaAdultos Se o filme é restrito para adultos
Genero_Exclusividade Quão Exclusivo é o combo de gêneros daquele filme
Genero_* Se o filme faz parte ou não daquele Gênero
Producao_Orcamento($) Qual valor investido na produção do filme
Bilheteria_Nacional($) O valor obtido na bilheteria Nacional
Bilheteria_Mundial($) O valor obtido na bilheteria Mundial, ou seja, Nacional+Internacional
ROI_Nacional O Retorno sobre Investimento Contando apenas a bilheteria Nacional
ROI_Mundial O Retorno sobre Investimento Contando a bilheteria Mundial (total)
BilheteriaNacional_Importancia(%) Quanto a bilheteria nacional representa da bilheteria total
Producao_Viavel Se a produção do filme é viável, ou seja, se o retorno obtido é maior ou igual ao investimento