Convirtiendo datos categóricos a númericos con OrdinalEncoder

4 ENE., 2025

//

1 min. de Lectura

El OrdinalEncoder es una herramienta de la biblioteca scikit-learn en Python que se utiliza para convertir datos categóricos ordinales en valores numéricos. Esto es útil en modelos de machine learning, donde los algoritmos requieren datos numéricos.

Estos procedimientos permiten manejar datos ordinales de manera efectiva para su uso en modelos analíticos.

Ejemplo Práctico:


# Se importa la clase OrdinalEncoder del módulo sklearn.preprocessing.
# Esta clase se utiliza para convertir datos categóricos en números enteros.
from sklearn.preprocessing import OrdinalEncoder

# Se crea una instancia de OrdinalEncoder llamada enc.
enc = OrdinalEncoder()

# Se define una lista de listas X que contiene datos categóricos
# y numéricos. En este caso, los datos categóricos
# son 'Male' y 'Female', y los datos numéricos son 1, 2 y 3.
X = [['Male', 1], ['Female', 3], ['Female', 2]]

# Se ajusta el codificador enc a los datos X.
# Esto significa que el codificador aprende las categorías presentes en los datos.
enc.fit(X)

# Se imprimen las categorías aprendidas por el codificador.
# Esto mostrará las categorías únicas para cada característica en X.
print(enc.categories_)

# Se transforman nuevos datos utilizando el codificador ajustado.
# Los datos categóricos se convierten en números enteros basados en las categorías aprendidas.
print(enc.transform([['Female', 3], ['Male', 1]]))

# Salida:
# [array(['Female', 'Male'], dtype=object), array([1, 2, 3], dtype=object)]
# [[0. 2.]
#  [1. 0.]]

Resumen:

Los datos ordinales son fundamentales en el análisis de datos, ya que permiten realizar comparaciones y análisis más profundos. Python, con sus bibliotecas como ScikIt-Learn, proporciona herramientas efectivas para manejar y visualizar estos datos, facilitando la toma de decisiones informadas basadas en la jerarquía de las categorías.

Inicia sesión para dar like
¡Like agregado!
Share:

Comentarios

0
/

Sin comentarios

Sé el primero en compartir tu opinión.

También te puede interesar

Descubre más contenido relacionado que podría ser de tu interés

Principales Gráficos en R
cienciadedatos
10 DIC., 2024
15 min de lectura

Principales Gráficos en R

Resumen de los principales gráficos que se pueden realizar con el lenguaje R

Comandos Básicos de Git
programación
20 ABR., 2025
1 min de lectura

Comandos Básicos de Git

Lista de los principales comando de git

Bonnie image
José Elías Romero Guanipa
Autor

©2024 ViveBTC