Posts recentes

Python ou R: qual a melhor linguagem de programação para trabalhar com dados?


Há uma discussão comum na área de Ciência de Dados sobre qual a melhor linguagem de programação entre as líderes de desenvolvedores e usuários na área de dados. Mas afinal, qual delas é a melhor: Python ou R para trabalhar com dados? Vamos saber um pouco mais sobre as duas.

A linguagem Pyhon foi criada por Guido van Rossum. É uma linguagem de alto nível, orientada a objetos e de propósito geral. Python ficou muito famosa na área de dados por sua simplicidade, por suas ferramentas diversas em Machine Learning, Inteligência Artificial e demais áreas muito importantes para análises de dados. Por ser uma linguagem de propósito geral, pode ser utilizada para diversas funções como softwares em bancos de dados, o que é uma vantagem sobre a linguagem R, como veremos mais à frente. A linguagem Python é open source e conta com uma comunidade enorme de entusiastas, desenvolvedores e participantes.

A linguagem R foi criada por Ross Ihaka e Robert Gentleman. É uma linguagem multiparadigma, voltada à manipulação e análise de dados. Possui um enorme número de bibliotecas para manipulação de dados de vários tipos, ferramentas estatísticas, Machine Learning, Inteligência Artificial etc. Não serve a propósito geral como a linguagem Python, mas possui um conjunto bem mais completo de ferramentas no universo de análise e manipulação de dados. Assim como a linguagem Python, é open source e possui uma grande comunidade de desenvolvedores e entusiastas.

Utilizar Python é uma vantagem se considerarmos que ela dá abertura, como linguagem de propósito geral, a desenvolver programas que não estejam somente ligados a manipulação de dados, o que é uma possibilidade muito interessante. No entanto, a linguagem R é mais rica em recursos no mundo da manipulação de dados e pode oferecer um aparato maior ao usuário. Qual a melhor opção? Isso depende do seu foco no projeto a ser desenvolvido.

Não é demais lembrar que o Cientista de Dados deve ter sólida formação em Computação e Matemática. Minha sugestão seria que estudasse profundamente as duas linguagens. Isso com toda certeza será um enorme diferencial em seu currículo. O Cientista de Dados é acima de tudo um eterno pesquisador e solucionador de problemas. Quanto mais rica for sua caixa de ferramentas, melhor solucionador de problemas você será. Até mais!


Fernando Montini é cientista de dados, programador, pedagogo, químico industrial e mestre em Biologia.

Escreve para o blog sobre tecnologia na área de Ciência de Dados, Business Intelligence e Mercado Financeiro.

300 visualizações0 comentário

Posts recentes

Ver tudo
VEJA TAMBÉM