Recopilación de Cheat Sheets de las principales librerías Python y SQL utilizadas en Ciencia de datos. Para acceder a cada una de ellas, simplemente se debe clicar a continuación en el nombre de la librería (índice) y seguido clicar sobre la imagen correspondiente.

Python

Python es un lenguaje open-source que gracias al desarrollo de librerías de analítica, procesamiento de datos y modelización se ha establecido como el principal lenguaje de programación utilizado para proyectos de Data Science junto con R.

Cheatsheet Python principiantes

SQL

Lenguaje de consulta estructurado que permite manipular y descargar datos de una base de datos. Tiene capacidad de hacer cálculos avanzados y operaciones algebráicas.

Cheatsheet SQL

Pandas

Manipulación y análisis de datos. Se usa esencialmente para cargar, alinear, manipular o incluso fusionar datos. En concreto, ofrece estructuras de datos y operaciones para manipular tablas numéricas y series temporales.

Cheatsheet Pandas

Numpy

Generación y control de datos extremadamente rápido. Tiene su propia estructura de datos incorporada llamada Array (similar a la lista de Python) pero puede almacenar y operar con datos de forma más eficiente.

Cheatsheet Numpy

Matplotlib

Librería para la visualización de datos. Genera gráficos en dos dimensiones a partir de datos contenidos en listas o arrays.

Cheatsheet Matplotlib

Seaborn

Basada en Matplotlib se integra con las estructuras de Pandas. Aporta funciones que permiten explorar y comprender rápidamente los datos a través de gráficos estadísticos.

Cheatsheet Seaborn

SpaCy (NLP)

Procesamiento del lenguaje natural. Contiene los datos lingüísticos y los algoritmos necesarios para procesar textos en lenguaje natural.

Cheatsheet Spacy NLP

Tensorflow

Construcción y entrenamiento de Redes Neuronales para detectar y descifrar patrones y correlaciones, análogos al aprendizaje y razonamiento usados por los humanos.

Cheatsheet Tensorflow

Keras

API open-source de Redes Neuronales que se ejecuta sobre frameworks como Theano y TensorFlow, y cuyo principal propósito es crear aplicaciones deep-learning.

Cheatsheet Keras

Pytorch

Destinada al reconocimiento de imágenes y el deep learning. Diseñada para realizar cálculos numéricos haciendo uso de la programación de tensores (matriz multidimensional).

Cheatsheet PyTorch

Scipy

Contiene módulos para optimización, álgebra lineal, integración, interpolación, funciones especiales, FFT (Transformada Rápida de Fourier), procesamiento de señales y de imagen, resolución de ODEs (Ecuación Diferencial Ordinaria) y otras tareas para la ciencia e ingeniería.

Cheatsheet Scipy

PySpark

Puede ejecutar aplicaciones de Python utilizando la capacidad de Apache Spark. Es decir, ejecutarlas paralelamente en un entorno distribuido con múltiples nodos.

Cheatsheet PySpark

PyCaret

Libería low-code que abarca el ciclo de modelización al completo, desde la preparación de los datos hasta el despliegue del modelo final. Además, permite realizar comparaciones de varios modelos automáticamente.

Cheatsheet PyCaret

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *