Cordiales saludos
Dos de los métodos utilizados para sustituir valores con características que se adaptan a nuestras necesidades son pad y backfill. En esta oportunidad trabajaremos con un archivo .CSV creado por mi que podemos ver en la Capture de Pantalla N23_01, en el cual coloqué un dato con NaN con el cual trabajaremos.
Como siempre, llamaremos a la libraría pandas y luego cargaremos la información del .csv por medio de un Data Frame (Ver Capture de Pantalla N23_02)

En la publicación anterior utilizabamos el método fillna() para sustituir NaN con cero ahora ampliaremos las posibilidades de uso de esta función. Nos apoyaremos de ella para sustituir valores de NaN por el valor del registro anterior o por el valor del siguiente registro. Además de su uso resumido y dos funciones afines que realizan el mismo procedimiento.
Uso del método pad
El método pad sustituye el valor de NaN por el valor correspondiente a la columna del registro anterior:
La sintaxis utilizada es la siguiente:
df.fillna(method='pad')
En el Capture de Pantalla N23_03 vemos los datos originales y en la Capture de Pantalla N23_04 notamos que el valor del NaN (recuadro rojo) es sustituido por 100.0 correspondiente al valor del registro anterior (circulo azul).
|
La forma resumida de uso de este método es:
df.pad()
Donde Podemos observar que el Capture de Pantalla N23_05 y el Capture de Pantalla N23_06 nos da el mismo resultado de lo ya visto.
|
La funcion afin de pad() es:
df.fillna(method='ffill')
Donde podemos detallar su funcionabilidad en las capture de pantalla N23_05, N23_06 y N23_06a que a continuación se muestran.
||
Uso del método backfill
El método backfill sustituye el valor de NaN por el valor correspondiente a la columna del siguiente registro.
La sintaxis utilizada es la siguiente:
df.fillna(method='backfill')
En el Capture de Pantalla N23_07 vemos los datos originales y en la Capture de Pantalla N23_08 notamos que el valor del NaN es sustituido por 111.0 correspondiente al valor del siguiente registro (recuadro rojo).
|
La forma resumida de uso de este método es:
df.backfill()
Donde Podemos observar que el Capture de Pantalla N23_09 y el Capture de Pantalla N23_10 nos da el mismo resultado de lo ya visto.
|
La funcion afin de backfill() es:
df.fillna(method='bfill')
Donde podemos detallar su funcionabilidad en las capture de pantalla N23_11, N23_12 y N23_13 que a continuación se muestran.
||
Hasta aquí nuestros ejercicios con respecto a la sustitución de valores utilizando las funciones pad y backfill para la limpieza de datos. Podemos ver el Cuaderno completo con los ejercicios de hoy en mi repositorio de Github
Para quienes terminaron el Curso Gratis de Programación con python y para todos los interesados, ordené todas las publicaciones dedicadas a Data Science realizadas aquí en @hive, en una página web, para que tengan fácil acceso a cada entrada. La dirección es Python Cumanés (Data Science) y aquí la dirección de pythoncumanes
Una vez más los invito a practicar, practicar, practicar... Hasta la próxima entrega, Feliz Día!


Clases gratis de programación / Free programming classes
[ESP/ENG] Mi proyecto en Python/My project in Python.
I started a Ko-fi Page! Ko-fi helps creators get support from fans of their work. Please support or follow my page! If you like what I do and feel in tune with my work in creating content for free programming courses and chess publications without any profit interest. [Give me a coffee...](https://ko-fi.com/rafaelaquino) I will be very grateful! 
Comments (2)
Do you know the legal name of @themarkymark ???? It is needed to contact his local police station. Any information to his whereabouts would be much appreciated.
Thanks for your contribution to the STEMsocial community. Feel free to join us on discord to get to know the rest of us!
Please consider delegating to the @stemsocial account (85% of the curation rewards are returned).
You may also include @stemsocial as a beneficiary of the rewards of this post to get a stronger support.