Esta librería permite acceder, manipular y trabajar con bases de datos grandes y hacer análisis de una manera eficiente y sintacticamente efectiva
Debemos traspasar el acrhivo csv en la misma carpeta en que está guardada el archivo de Jupìter notebook
- Importamos la librería pandas usando as pd
- Luego para importar un archivo CSV usamos pd.read_csv('NOMBRE DLE ARCHIVO')
- Luego guardamos esto en un dataframe llamado df
Atributo head
Se utiliza para imprimir las primeras filas del dataframe. Simplemente entre parentesis señalamos la cantidad de filas que deseamos imprimir
Atributo shape
Nos sirve para saber cuantos datos tenemos en nuestro dataframe y nos dará la cantidad de filas primeramente y de columnas
Atributo columns
Nos sirve para imprimir el nombre de cada columna
Imprimir los datos de una columna en específico
Simplemente usamos la variable correspondiente al csv que hemos llamado "df". y entre corchetes el nombre de la columna
y para limitar la cantidad de filas se utiliza seguidamente corchetes con el rango usando dos puntos
Imprimir dos o más columnas
Se utiliza doble corchetes y dentro los nombres de las columnas separadas por cola
Iloc
Función describe
Función sort_value
Si organizamos los datos en base a una variable podemos ver si hay algún tipo de corelación. Vamos a usar. Entre parentesis se coloca la columna con la cuál vamos a organizar nuestro dataframe y lo hará en orden ascendente
Para filtrar por condiciones
Por ejemplo si queremos crear una columna nueva que sea la suma de dos columnas, entre corchetes llamamos a la nueva columna y decimos que es igual a la suma de las dos columnas
Si quisieramos agrupar nuestro dataframe de acuerdo con la variable rio y agregando la función "mean" nos saca los promedios de todas las variables
También podemos usar dos variables pasandole una listaPodemos sacar el valor total de las variables con sum. Suma el total de todas las variables separados
No hay comentarios:
Publicar un comentario