Esta librería permite acceder, manipular y trabajar con bases de datos grandes y hacer análisis de una manera eficiente y sintacticamente efectiva
Debemos traspasar el acrhivo csv en la misma carpeta en que está guardada el archivo de Jupìter notebook
- Importamos la librería pandas usando as pd
- Luego para importar un archivo CSV usamos pd.read_csv('NOMBRE DLE ARCHIVO')
- Luego guardamos esto en un dataframe llamado df

Atributo head
Se utiliza para imprimir las primeras filas del dataframe. Simplemente entre parentesis señalamos la cantidad de filas que deseamos imprimir
Atributo shape
Nos sirve para saber cuantos datos tenemos en nuestro dataframe y nos dará la cantidad de filas primeramente y de columnas
Atributo columns
Nos sirve para imprimir el nombre de cada columna
Imprimir los datos de una columna en específico
Simplemente usamos la variable correspondiente al csv que hemos llamado "df". y entre corchetes el nombre de la columna
y para limitar la cantidad de filas se utiliza seguidamente corchetes con el rango usando dos puntos
Imprimir dos o más columnas
Se utiliza doble corchetes y dentro los nombres de las columnas separadas por cola
Iloc
Con esta opción podemos ubicar un valor de acuerdo a coordenadas
Función describe
Facilita el análisis preliminar de los datos. Cálcula las estadisticas descriptivas básicas de cada columna: el conteo, el promedio, la desviación estandar, el mínimo, el máximo y los percentiles 25, 50 y 75
Función sort_value
Si organizamos los datos en base a una variable podemos ver si hay algún tipo de corelación. Vamos a usar. Entre parentesis se coloca la columna con la cuál vamos a organizar nuestro dataframe y lo hará en orden ascendente
Para cambiarlo a orden descendente agregamos el ascending = False
Si queremos ordenar el data frame de a cuerdo a dos columnas debemso dentro del parentesis crear una lista de las columnas
Para filtrar por condiciones
Entre corchetes debemos escoger las filas con las que quedemos quedarnos. Por ejemplo queremos las filas en las que rio es igual a 1
Para agregar dos condiciones simplemente usamos el &
Agregar una columna nueva a partir de las ya existentes
Por ejemplo si queremos crear una columna nueva que sea la suma de dos columnas, entre corchetes llamamos a la nueva columna y decimos que es igual a la suma de las dos columnas
Si quisieramos agrupar nuestro dataframe de acuerdo con la variable rio y agregando la función "mean" nos saca los promedios de todas las variables
También podemos usar dos variables pasandole una lista
Podemos sacar el valor total de las variables con sum. Suma el total de todas las variables separados