Data Science N023 pad - backfill

By rafaelaquino on 5/25/2022

Cordiales saludos

portada_portada23.png

Dos de los métodos utilizados para sustituir valores con características que se adaptan a nuestras necesidades son pad y backfill. En esta oportunidad trabajaremos con un archivo .CSV creado por mi que podemos ver en la Capture de Pantalla N23_01, en el cual coloqué un dato con NaN con el cual trabajaremos.

**Capture de Pantalla N23_01**

portada1.png

Como siempre, llamaremos a la libraría pandas y luego cargaremos la información del .csv por medio de un Data Frame (Ver Capture de Pantalla N23_02)

Capture de Pantalla N23_02 ![portada23a.png](Image from post)

En la publicación anterior utilizabamos el método fillna() para sustituir NaN con cero ahora ampliaremos las posibilidades de uso de esta función. Nos apoyaremos de ella para sustituir valores de NaN por el valor del registro anterior o por el valor del siguiente registro. Además de su uso resumido y dos funciones afines que realizan el mismo procedimiento.

Uso del método pad

El método pad sustituye el valor de NaN por el valor correspondiente a la columna del registro anterior:

La sintaxis utilizada es la siguiente:

df.fillna(method='pad')

En el Capture de Pantalla N23_03 vemos los datos originales y en la Capture de Pantalla N23_04 notamos que el valor del NaN (recuadro rojo) es sustituido por 100.0 correspondiente al valor del registro anterior (circulo azul).

|Capture de Pantalla N23_03|Capture de Pantalla N23_04 | :-------------------------:|:-------------------------: ![pad01.png](Image from post)

La forma resumida de uso de este método es:

df.pad()

Donde Podemos observar que el Capture de Pantalla N23_05 y el Capture de Pantalla N23_06 nos da el mismo resultado de lo ya visto.

|Capture de Pantalla N23_05|Capture de Pantalla N23_06 | :-------------------------:|:-------------------------: ![pad03.png](Image from post)

La funcion afin de pad() es:

df.fillna(method='ffill')

Donde podemos detallar su funcionabilidad en las capture de pantalla N23_05, N23_06 y N23_06a que a continuación se muestran.

|Capture de Pantalla N23_05|Capture de Pantalla N23_06 | Capture de Pantalla N23_06a | :-------------------------:|:-------------------------:|:-------------------------: ![pad05.png](Image from post)

Uso del método backfill

El método backfill sustituye el valor de NaN por el valor correspondiente a la columna del siguiente registro.

La sintaxis utilizada es la siguiente:

df.fillna(method='backfill')

En el Capture de Pantalla N23_07 vemos los datos originales y en la Capture de Pantalla N23_08 notamos que el valor del NaN es sustituido por 111.0 correspondiente al valor del siguiente registro (recuadro rojo).

|Capture de Pantalla N23_07|Capture de Pantalla N23_08 | :-------------------------:|:-------------------------: ![pad07.png](Image from post)

La forma resumida de uso de este método es:

df.backfill()

Donde Podemos observar que el Capture de Pantalla N23_09 y el Capture de Pantalla N23_10 nos da el mismo resultado de lo ya visto.

|Capture de Pantalla N23_09|Capture de Pantalla N23_10 | :-------------------------:|:-------------------------: ![pad09.png](Image from post)

La funcion afin de backfill() es:

df.fillna(method='bfill')

Donde podemos detallar su funcionabilidad en las capture de pantalla N23_11, N23_12 y N23_13 que a continuación se muestran.

|Capture de Pantalla N23_11|Capture de Pantalla N23_12 |Capture de Pantalla N23_13 :-------------------------:|:-------------------------:|:-------------------------: ![pad11.png](Image from post)

Hasta aquí nuestros ejercicios con respecto a la sustitución de valores utilizando las funciones pad y backfill para la limpieza de datos. Podemos ver el Cuaderno completo con los ejercicios de hoy en mi repositorio de Github

Para quienes terminaron el Curso Gratis de Programación con python y para todos los interesados, ordené todas las publicaciones dedicadas a Data Science realizadas aquí en @hive, en una página web, para que tengan fácil acceso a cada entrada. La dirección es Python Cumanés (Data Science) y aquí la dirección de pythoncumanes

Una vez más los invito a practicar, practicar, practicar... Hasta la próxima entrega, Feliz Día!

![separador001.png](Image from post)
### Entrega anterior [ NaN - Not a Number (continuación) ](https://peakd.com/hive-154226/@rafaelaquino/data-science-n022-nan-not-a-number-continuacion)
![separador001.png](Image from post)

Clases gratis de programación / Free programming classes

[ESP/ENG] Mi proyecto en Python/My project in Python.

Mi twitter separador001.png

I started a Ko-fi Page! Ko-fi helps creators get support from fans of their work. Please support or follow my page! If you like what I do and feel in tune with my work in creating content for free programming courses and chess publications without any profit interest. [Give me a coffee...](https://ko-fi.com/rafaelaquino) I will be very grateful! ![separador001.png](Image from post) Todos a programar! [Rafael Aquino](https://www.facebook.com/rafael.aquino.5815) Bogotá / Colombia

Comments (2)

gangstalking's avatar @gangstalking 5/25/2022

Do you know the legal name of @themarkymark ???? It is needed to contact his local police station. Any information to his whereabouts would be much appreciated.

stemsocial's avatar @stemsocial 5/27/2022

Thanks for your contribution to the STEMsocial community. Feel free to join us on discord to get to know the rest of us!

Please consider delegating to the @stemsocial account (85% of the curation rewards are returned).

You may also include @stemsocial as a beneficiary of the rewards of this post to get a stronger support.