Ciencia de Datos Programación

Convirtiendo datos categóricos a númericos con OrdinalEncoder

4 ENE., 2025

//

1 min. de Lectura

El OrdinalEncoder es una herramienta de la biblioteca scikit-learn en Python que se utiliza para convertir datos categóricos ordinales en valores numéricos. Esto es útil en modelos de machine learning, donde los algoritmos requieren datos numéricos.

Estos procedimientos permiten manejar datos ordinales de manera efectiva para su uso en modelos analíticos.

Ejemplo Práctico:


# Se importa la clase OrdinalEncoder del módulo sklearn.preprocessing.
# Esta clase se utiliza para convertir datos categóricos en números enteros.
from sklearn.preprocessing import OrdinalEncoder

# Se crea una instancia de OrdinalEncoder llamada enc.
enc = OrdinalEncoder()

# Se define una lista de listas X que contiene datos categóricos
# y numéricos. En este caso, los datos categóricos
# son 'Male' y 'Female', y los datos numéricos son 1, 2 y 3.
X = [['Male', 1], ['Female', 3], ['Female', 2]]

# Se ajusta el codificador enc a los datos X.
# Esto significa que el codificador aprende las categorías presentes en los datos.
enc.fit(X)

# Se imprimen las categorías aprendidas por el codificador.
# Esto mostrará las categorías únicas para cada característica en X.
print(enc.categories_)

# Se transforman nuevos datos utilizando el codificador ajustado.
# Los datos categóricos se convierten en números enteros basados en las categorías aprendidas.
print(enc.transform([['Female', 3], ['Male', 1]]))

# Salida:
# [array(['Female', 'Male'], dtype=object), array([1, 2, 3], dtype=object)]
# [[0. 2.]
#  [1. 0.]]

Resumen:

Los datos ordinales son fundamentales en el análisis de datos, ya que permiten realizar comparaciones y análisis más profundos. Python, con sus bibliotecas como ScikIt-Learn, proporciona herramientas efectivas para manejar y visualizar estos datos, facilitando la toma de decisiones informadas basadas en la jerarquía de las categorías.

Share:

Comentarios (0)

Accede para comentar

Sin comentarios

También te puede interesar

26 NOV., 2024 Conceptos Básicos de Data Science

Principales conceptos de ciencia de datos

20 ABR., 2025 Comandos Básicos de Git

Lista de los principales comando de git

Bonnie image
José Elías Romero Guanipa
Autor
logo

©2024 ViveBTC