Ciencia de Datos Programación

Convirtiendo datos categóricos a númericos con OrdinalEncoder

4 ENE., 2025

//

1 min. de Lectura

El OrdinalEncoder es una herramienta de la biblioteca scikit-learn en Python que se utiliza para convertir datos categóricos ordinales en valores numéricos. Esto es útil en modelos de machine learning, donde los algoritmos requieren datos numéricos.

Estos procedimientos permiten manejar datos ordinales de manera efectiva para su uso en modelos analíticos.

Ejemplo Práctico:


# Se importa la clase OrdinalEncoder del módulo sklearn.preprocessing.
# Esta clase se utiliza para convertir datos categóricos en números enteros.
from sklearn.preprocessing import OrdinalEncoder

# Se crea una instancia de OrdinalEncoder llamada enc.
enc = OrdinalEncoder()

# Se define una lista de listas X que contiene datos categóricos
# y numéricos. En este caso, los datos categóricos
# son 'Male' y 'Female', y los datos numéricos son 1, 2 y 3.
X = [['Male', 1], ['Female', 3], ['Female', 2]]

# Se ajusta el codificador enc a los datos X.
# Esto significa que el codificador aprende las categorías presentes en los datos.
enc.fit(X)

# Se imprimen las categorías aprendidas por el codificador.
# Esto mostrará las categorías únicas para cada característica en X.
print(enc.categories_)

# Se transforman nuevos datos utilizando el codificador ajustado.
# Los datos categóricos se convierten en números enteros basados en las categorías aprendidas.
print(enc.transform([['Female', 3], ['Male', 1]]))

# Salida:
# [array(['Female', 'Male'], dtype=object), array([1, 2, 3], dtype=object)]
# [[0. 2.]
#  [1. 0.]]

Resumen:

Los datos ordinales son fundamentales en el análisis de datos, ya que permiten realizar comparaciones y análisis más profundos. Python, con sus bibliotecas como ScikIt-Learn, proporciona herramientas efectivas para manejar y visualizar estos datos, facilitando la toma de decisiones informadas basadas en la jerarquía de las categorías.

Inicia sesión para dar like
¡Like agregado!
Share:

Comentarios

0
Mínimo 10 caracteres /

Sin comentarios

Sé el primero en compartir tu opinión.

También te puede interesar

20 ABR., 2025 Comandos Básicos de Git

Lista de los principales comando de git

10 DIC., 2024 Principales Gráficos en R

Resumen de los principales gráficos que se pueden realizar con el lenguaje R

Bonnie image
José Elías Romero Guanipa
Autor
logo

©2024 ViveBTC