Ciencia de Datos Programación

Convirtiendo datos categóricos a númericos con OrdinalEncoder

4 ENE., 2025

//

1 min. de Lectura

El OrdinalEncoder es una herramienta de la biblioteca scikit-learn en Python que se utiliza para convertir datos categóricos ordinales en valores numéricos. Esto es útil en modelos de machine learning, donde los algoritmos requieren datos numéricos.

Estos procedimientos permiten manejar datos ordinales de manera efectiva para su uso en modelos analíticos.

Ejemplo Práctico:


# Se importa la clase OrdinalEncoder del módulo sklearn.preprocessing.
# Esta clase se utiliza para convertir datos categóricos en números enteros.
from sklearn.preprocessing import OrdinalEncoder

# Se crea una instancia de OrdinalEncoder llamada enc.
enc = OrdinalEncoder()

# Se define una lista de listas X que contiene datos categóricos
# y numéricos. En este caso, los datos categóricos
# son 'Male' y 'Female', y los datos numéricos son 1, 2 y 3.
X = [['Male', 1], ['Female', 3], ['Female', 2]]

# Se ajusta el codificador enc a los datos X.
# Esto significa que el codificador aprende las categorías presentes en los datos.
enc.fit(X)

# Se imprimen las categorías aprendidas por el codificador.
# Esto mostrará las categorías únicas para cada característica en X.
print(enc.categories_)

# Se transforman nuevos datos utilizando el codificador ajustado.
# Los datos categóricos se convierten en números enteros basados en las categorías aprendidas.
print(enc.transform([['Female', 3], ['Male', 1]]))

# Salida:
# [array(['Female', 'Male'], dtype=object), array([1, 2, 3], dtype=object)]
# [[0. 2.]
#  [1. 0.]]

Resumen:

Los datos ordinales son fundamentales en el análisis de datos, ya que permiten realizar comparaciones y análisis más profundos. Python, con sus bibliotecas como ScikIt-Learn, proporciona herramientas efectivas para manejar y visualizar estos datos, facilitando la toma de decisiones informadas basadas en la jerarquía de las categorías.

Share:

Comentarios (0)

Accede para comentar

Sin comentarios

También te puede interesar

3 DIC., 2024 Comandos Básicos de Git

Lista de los principales comando de git

4 DIC., 2024 Estructuras de Datos en Python

Descripción de las principales estructuras de datos explicadas usando el lenguaje de programación python

Bonnie image
José Elías Romero Guanipa
Autor
logo

©2024 ViveBTC