miércoles, 27 de octubre de 2021

Librería pandas en jupiter notebook

Esta librería permite acceder, manipular y trabajar con bases de datos grandes y hacer análisis de una manera eficiente y sintacticamente efectiva

Debemos traspasar el acrhivo csv en la misma carpeta en que está guardada el archivo de Jupìter notebook

  1. Importamos la librería pandas usando as pd
  2. Luego para importar un archivo CSV usamos pd.read_csv('NOMBRE DLE ARCHIVO')
  3. Luego guardamos esto en un dataframe llamado df 

Atributo head

Se utiliza para imprimir las primeras filas del dataframe. Simplemente entre parentesis señalamos la cantidad de filas que deseamos imprimir

Atributo shape

Nos sirve para saber cuantos datos tenemos en nuestro dataframe y nos dará la cantidad de filas primeramente y de columnas



Atributo columns

Nos sirve para imprimir el nombre de cada columna

Imprimir los datos de una columna en específico

Simplemente usamos la variable correspondiente al csv que hemos llamado "df". y entre corchetes el nombre de la columna

y para limitar la cantidad de filas se utiliza seguidamente corchetes con el rango usando dos puntos

Imprimir dos o más columnas

Se utiliza doble corchetes y dentro los nombres de las columnas separadas por cola


Iloc

Con esta opción podemos ubicar un valor de acuerdo a coordenadas


Función describe

Facilita el análisis preliminar de los datos. Cálcula las estadisticas descriptivas básicas de cada columna: el conteo, el promedio, la desviación estandar, el mínimo, el máximo y los percentiles 25, 50  y 75

Función sort_value

Si organizamos los datos en base a una variable podemos ver si hay algún tipo de corelación. Vamos a usar. Entre parentesis se coloca la columna con la cuál vamos a organizar nuestro dataframe y lo hará en orden ascendente


Para cambiarlo a orden descendente agregamos el ascending = False

Si queremos ordenar el data frame de a cuerdo a dos columnas debemso dentro del parentesis crear una lista de las columnas

Para filtrar por condiciones

Entre corchetes debemos escoger las filas con las que quedemos quedarnos. Por ejemplo queremos las filas en las que rio es igual a 1

Para agregar dos condiciones simplemente usamos el &

Agregar una columna nueva a partir de las ya existentes

Por ejemplo si queremos crear una columna nueva que sea la suma de dos columnas, entre corchetes llamamos a la nueva columna y decimos que es igual a la suma de las dos columnas

Si quisieramos agrupar nuestro dataframe de acuerdo con la variable rio y agregando la función "mean" nos saca los promedios de todas las variables 

También podemos usar dos variables pasandole una lista 
Podemos sacar el valor total de las variables con sum. Suma el total de todas las variables separados 


No hay comentarios:

Publicar un comentario

Instalar paquetes de phyton en blender

Para agregar nuevos paquetes o mpdulos al phyton que tiene blender tenemos dos opciones según la documentación de blender   1. Reemplazar el...