Machine learning models for predicting success of startups

Authors

DOI:

https://doi.org/10.5585/gep.v12i2.18942

Keywords:

Startup success prediction, Machine learning, Investment in startups, Crunchbase platform.

Abstract

This study analyzes results from machine learning models to predict the success of startups. As a proxy for success, we considered the investor's perspective, according to which startup buyout or IPO (Initial Public Offering) are ways to recover the investment. The literature review addresses startups and funding mechanisms, previous studies on prediction of startup success via machine learning models, and trade-offs between machine learning techniques. The empirical study comprised a quantitative research based on secondary data from the American Crunchbase platform, with startups from 171 countries. The research design used as filter startups founded between June/2010 and June/2015, as well as a prediction window from June/2015 to June/2020 to predict startup success. The final sample, after the data preprocessing stage, comprised 18,571 startups. Six binary classification models were used for success prediction: Logistic Regression, Decision Tree, Random Forest, Extreme Gradient Boosting, Support Vector Machine, and Neural Networks. In the end, the Random Forest and Extreme Gradient Boosting models had the best performance in the classification task. This article involving machine learning and startups contributes to research in hybrid fields by combining perspectives from Business and Data Science. Additionally, it contributes to investors with a tool for initial mapping of startups in search of targets with greater probability of success.

 

Author Biographies

Fabiano Rodrigues, ESPM Business School

Doutor em Administração de Empresas pela FEA-USP (2010), Mestre em Engenharia de Produção pela POLI-USP (2004) e Engenheiro de Produção pela POLI-USP (1996). Head do Centro de Gestão e Transformação de Negócios ESPM ADM: http://hubtransformacao.espm.br. Supervisor de Projetos Integrados do curso de Administração da ESPM. Durante 6 anos foi chefe de departamento na ESPM nas áreas de Gestão, Operações, Finanças e Métodos Quantitativos. Docente na graduação da ESPM, professor colaborador no Programa de Pós Graduação em Administração da ESPM (PPGA ESPM) e professor convidado na pós-graduação da FIA-USP. Pesquisador do Núcleo Decide da FEA-USP, grupo de pesquisa sobre Teoria e Análise de Decisão. Membro da Society for Decision Professionals e da Strategic Management Society. Formação complementar em Strategic Decisions and Risk Management, pelo programa de certificação profissional da Stanford University. 

Francisco Aparecido Rodrigues, Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo

Francisco A. Rodrigues é professor associado de Sistemas Complexos e Ciência de Dados no Instituto de Matemática e Informática (ICMC) da Universidade de São Paulo. Ele também é editor da revista Chaos, Solitons & Fractals e editor associado do Journal of Physics: Complexity. De fevereiro de 2018 a fevereiro de 2019, Francisco foi professor visitante na Universidade de Warwick, Reino Unido, Instituto de Matemática, trabalhando no Centro de Ciências da Complexidade. Ele foi agraciado com uma cátedra de Professor Visitante da Fundação Leverhulme (Reino Unido). Francisco é formado em Física (2001, B.A.) e mestrado em Física Computacional (2004), ambos pela Universidade de São Paulo. Em 2007, obteve seu doutorado em Física pelo Instituto de Física de São Carlos (Universidade de São Paulo). Francisco é bolsista nível 1D do Conselho Nacional de Pesquisa do Brasil (CNPq) desde 2011. Ele coordenou vários projetos de pesquisa (incluindo alguns projetos internacionais). Durante os últimos anos, ele tem trabalhado em vários problemas relacionados à estrutura e dinâmica de sistemas complexos, tais como o desenvolvimento de conceitos e métodos para caracterização de redes complexas, o estudo da epidemia e a disseminação de rumores em redes sociais e tecnológicas, a modelagem de sincronização de osciladores acoplados e o desenvolvimento de novos métodos para reconhecimento de padrões e mineração de dados. Francisco é autor de mais de 100 artigos científicos em revistas internacionais que já receberam mais de 6.100 citações. Ele também é autor do livro "An Introduction to Multiplex Networks: Basic Formalism and Structural Properties", publicado pela Springer em 2018.

Thelma Valéria Rocha Rodrigues, ESPM

É Professora do Programa de Pós-Graduação em Administração - PPGA da ESPM, tendo completado em 2020, 19 anos de ESPM, com 18 orientações de Mestrado concluídas e 2 orientações de Doutorado nas áreas de Marketing e Comportamento do Consumidor. É doutora em Administração com ênfase em Marketing pela FEA-USP. Mestre em Administração Mercadológica pela EAESP/ FGV com especialização em International Business pela Stockholm School of Economics (SSE) Suécia. Graduada em Administração pela FEA/USP e Graduada em Engenharia de Produção pela FEI. Tem mais de 50 publicações em diversos Journals, com destaque para Advanced in International Marketing v. 25 e v. 26, The Review of Business Management - RBGN, RAUSP Management Journal, REMARK, Internext, entre outras. Foi Coordenadora do Programa da ESPM entre 2012 a 2015, quando o curso teve sua primeira avaliação trienal, com nota 4, e obteve seu pedido de Doutorado aprovado. Atualmente faz uma formação em Terapia Artística de base Antroposófica na Associação Aurora em São Paulo. Pesquisa o tema International Franchising, International Marketing Strategy e Relationship Marketing. Teve funções executivas na área de Marketing por 12 anos nas empresas Credicard SA, Mapfre, MyWeb e CPM onde foi Gerente de Marketing. Autora de livros como: Gestão dos Stakeholders com Andrea Goldschmidt; A Hora da Recompensa, com André Veloso; e a Coleção Marketing com 4 volumes, pela Editora Saraiva. Autora também da coleção Internacionalização das Franquias Brasileiras, publicada a cada dois anos, desde 2010, vol. 5 em 2018, disponíveis em https://pesquisa.espm.br/administracao/livros-e-e-books/ em parceria com a ABF

References

Arroyo, J., Corea, F., Jimenez-Diaz, G., & Recio-Garcia, J. A. (2019). Assessment of machine learning performance for decision support in venture capital investments. IEEE Access, 7, 124233–124243. https://doi.org/10.1109/ACCESS.2019.2938659

Basole, R. C., Park, H., & Chao, R. O. (2019). Visual Analysis of Venture Similarity in Entrepreneurial Ecosystems. IEEE Transactions on Engineering Management, 66(4), 568–582. https://doi.org/10.1109/TEM.2018.2855435

Bento, F. R. S. R. (2017). Predicting Start-up Success with Machine Learning. Master Program in Information Management. Instituto Superior de Estatística e Gestão da Informação. Universidade Nova de Lisboa. Recuperado de: https://run.unl.pt/bitstream/10362/33785/1/TGI0132.pdf. Acesso em 14/mai/2020.

Blank, S. (2013). The Four Steps to the Epiphany: successful strategies for products that win. Pescadero: K&S Ranch Press.

CB Insights. (2020). The Complete List of Unicorn Companies. Recuperado de: https://www.cbinsights.com/research-unicorn-companies. Acesso em 10/dez/2020.

Cremades, A. (2016). The Art of Startup Fundraising: pitching investors, negotiating the deal, and everything else entrepreneurs need to know. Hoboken: John Wiley & Sons.

Crunchbase. Crunchbase Platform. Disponível em: https://www.Crunchbase.com/. Acesso em: 12 mar. 2020.

Dalle, J.-M., Den Besten, M. & Menon, C. (2017). Using Crunchbase for economic and managerial research. OECD Science, Technology and Industry Working Papers. Recuperado de: https://pdfs.semanticscholar.org/aa83/4b1ddd1d6c96bde1c6e526be6bb2a99ad011.pdf. Acesso em 07/jun/2020.

Ertel, W. (2017). Introduction to Artificial Intelligence. 2nd ed. London: Springer.

Facelli, K., Lorena, A. C., Gama, J., & de Carvalho, A. C, P. L. F. (2019). Inteligência Artificial: uma abordagem de aprendizado de máquina. Rio de Janeiro: LTC.

Gastaud, C., Carniel, T., & Dalle, J.-M. (2019). The varying importance of extrinsic factors in the success of startup fundraising: competition at early-stage and networks at growth-stage. arXiv preprint arXiv:1906.03210. Recuperado de: https://arxiv.org/abs/1906.03210. Acesso em 03/jun/2020.

Gereto, M. A. S. (2019). Caracterização dos ciclos de investimentos de venture capital em startups brasileiras em termos de rodadas de investimento e estratégias de desinvestimento a partir de dados da Crunchbase. Dissertação de mestrado em administração. FGV - Faculdade Getúlio Vargas, 2019. Recuperado de; http://bibliotecadigital.fgv.br/dspace;/handle/10438/27468. Acesso em 01/jun/2020.

Hsieh, K.-H., & Li, E. Y. (2017). Progress of Fintech industry from venture capital point of view. In: Proceedings of The 17th International Conference on Electronic Business. ICEB, Dubai, p. 297-301. Recuperado de: http://iceb.johogo.com/proceedings/2017/ICEB_2017_paper_36-WIP.pdf. Acesso em 3/jun/2020.

Kemeny, T., Nathan, M., & Almeer, B. (2017). Using Crunchbase to explore innovative ecosystems in the US and UK. Birmingham Business School Discussion Paper Series. Recuperado de: http://epapers.bham.ac.uk/3051/1/bbs-dp-2017-01-nathan.pdf. Acesso em 01/abr/2020.

Kosterich, A., & Weber, M. S. (2018). Starting up the News: The Impact of Venture Capital on the Digital News Media Ecosystem. International Journal on Media Management, 20(4), 239–262. https://doi.org/10.1080/14241277.2018.1563547

Kubat, M. (2017). An Introduction to Machine Learning. 2nd ed. Suiça: Springler.

Liang, E., & Daphne Yuan, S.-T. (2013). Investors Are Social Animals: Predicting Investor Behavior using Social Network Features via Supervised Learning Approach. In: Proceedings of the Workshop on Mining and Learning with Graphs (MLG-2013), Chicago. Recuperado de: http://chbrown.github.io/kdd-2013-usb/workshops/MLG/doc/liang-mlg13.pdf. Acesso em 03/jun/2020.

Losada, B. (2020). Finanças para Startups: o essencial para empreender, liderar e investir em startups. São Paulo: Editora Saint Paul.

National. Small Business Failure Rate. Recuperado de: https://www.national.biz/2019-small-business-failure-rate-startup-statistics-industry/. Acesso em 06/abr/2020.

Nylund, P. A., & Cohen, B. (2017). Collision density: driving growth in urban entrepreneurial ecosystems. International Entrepreneurship and Management Journal, 13(3), 757–776. https://doi.org/10.1007/s11365-016-0424-5

Pan, C., Gao, Y., & Luo, Y. (2018). Machine Learning Prediction of Companies ‘Business Success. CS229: Machine Learning, Stanford University. Recuperado de: http://cs229.stanford.edu/proj2018/report/88.pdf. Acesso em 25/mar/2020.

Porter, M. E. (2005). Estratégia Competitiva. Rio de Janeiro: Campus.

Profitfromtech (2020). The Ultimate List of Startup Statistics for 2020. Recuperado de: https://www.profitfromtech.com/startup-statistics/. Acesso em 01/out/2020.

Ries, E. (2012). A Startup Enxuta. 1ª ed. São Paulo: Leya.

Shan, Z., Cao, H., & Lin, Q. (2014). Capital Crunch: Predicting Investments in Tech Companies. CS221 Project: Crunchbase Investment Prediction. Training, 5831(32462), 32462. Recuperado de: http://www.zifeishan.org/files/capital-crunch.pdf. Acesso em 12/jun/2020.

Skiena, S. S. (2017). The Data Science Design Manual. Suiça: Springer.

Published

2021-06-15

How to Cite

Rodrigues, F., Rodrigues, F. A., & Rocha Rodrigues, T. V. (2021). Machine learning models for predicting success of startups. Revista De Gestão E Projetos, 12(2), 28–55. https://doi.org/10.5585/gep.v12i2.18942
Crossref
3
Scopus
0
Felipe Roberto da Silva, Samuel Façanha Câmara, Francisco Roberto Pinto, Francisco José da Costa, Leonardo Martins de Freitas, José Gilmar Cavalcante de Oliveira Júnior, Thiago Matheus De Paula, Marcelo Oliveira Soares (2023)
Machine learning application to assess deforestation and wildfire levels in protected areas with tourism management. Journal for Nature Conservation, 74, 126435.
10.1016/j.jnc.2023.126435
Rosemeire Silva, Matheus Noronha, Diandra Maynne Juliano Ferraro (2023)
AS CAPACIDADES DINÂMICAS E O SUCESSO DAS EMPRESAS EDTECH NO MERCADO DE STARTUPS. Review of Artificial Intelligence in Education, 4(00), e016.
10.37497/rev.artif.intell.educ.v4i00.16
Gabriela de Carvalho Colombo, Matheus da Costa Gomes, João Paulo Augusto Eça, Maurício Ribeiro do Valle, Matheus da Costa Gomes (2023)
Analysis of the capital structure of startups in light of the tradeoff and pecking Order theories. REGEPE Entrepreneurship and Small Business Journal,
10.14211/regepe.esbj.e2338
Views
  • Abstract 1920
  • PDF (Português (Brasil)) 1487