Convirtiendo datos categóricos a númericos con OrdinalEncoder

4 ENE., 2025

//

1 min. de Lectura

El OrdinalEncoder es una herramienta de la biblioteca scikit-learn en Python que se utiliza para convertir datos categóricos ordinales en valores numéricos. Esto es útil en modelos de machine learning, donde los algoritmos requieren datos numéricos.

Estos procedimientos permiten manejar datos ordinales de manera efectiva para su uso en modelos analíticos.

Ejemplo Práctico:


# Se importa la clase OrdinalEncoder del módulo sklearn.preprocessing.
# Esta clase se utiliza para convertir datos categóricos en números enteros.
from sklearn.preprocessing import OrdinalEncoder

# Se crea una instancia de OrdinalEncoder llamada enc.
enc = OrdinalEncoder()

# Se define una lista de listas X que contiene datos categóricos
# y numéricos. En este caso, los datos categóricos
# son 'Male' y 'Female', y los datos numéricos son 1, 2 y 3.
X = [['Male', 1], ['Female', 3], ['Female', 2]]

# Se ajusta el codificador enc a los datos X.
# Esto significa que el codificador aprende las categorías presentes en los datos.
enc.fit(X)

# Se imprimen las categorías aprendidas por el codificador.
# Esto mostrará las categorías únicas para cada característica en X.
print(enc.categories_)

# Se transforman nuevos datos utilizando el codificador ajustado.
# Los datos categóricos se convierten en números enteros basados en las categorías aprendidas.
print(enc.transform([['Female', 3], ['Male', 1]]))

# Salida:
# [array(['Female', 'Male'], dtype=object), array([1, 2, 3], dtype=object)]
# [[0. 2.]
#  [1. 0.]]

Resumen:

Los datos ordinales son fundamentales en el análisis de datos, ya que permiten realizar comparaciones y análisis más profundos. Python, con sus bibliotecas como ScikIt-Learn, proporciona herramientas efectivas para manejar y visualizar estos datos, facilitando la toma de decisiones informadas basadas en la jerarquía de las categorías.

Inicia sesión para dar like
¡Like agregado!
Share:

Comentarios

0
Mínimo 10 caracteres /

Sin comentarios

Sé el primero en compartir tu opinión.

También te puede interesar

Descubre más contenido relacionado que podría ser de tu interés

🐼Pandas Avanzado: Técnicas de Maestría para el Procesamiento de Datos a Escala Industrial
python
22 AGO., 2025
7 min de lectura

🐼Pandas Avanzado: Técnicas de Maestría para el Procesamiento de Datos a Escala Industrial

implementación pipelines de datos productivos y resolver problemas complejos de forma elegante y eficiente.

El Arte de Organizar: Beneficios de la Estructura de Carpetas Tipo Screaming
programación
26 FEB., 2025
1 min de lectura

El Arte de Organizar: Beneficios de la Estructura de Carpetas Tipo Screaming

nosotros exploraremos los beneficios de esta metodología y cómo puede transformar la manera en que trabajamos y colaboramos

Bonnie image
José Elías Romero Guanipa
Autor
logo logo

©2024 ViveBTC