Supply Chain Design con Optimización lineal en Python

Iván Calderón

Data Analysis | SQL| Python Developer | Data Engineering | Machine Learning | Consultant |

Fecha de publicación: 21 feb 2022

Supongamos que una empresa que tiene presencia en 12 ciudades diferentes ha decidido que es momento de abrir sus propios centros de distribución. Sin embargo, existen 5 localidades en donde sería viable implementarlos. ¿Cómo escoger la opción de mayor costo-efectividad?. Este tipo de situaciones han sido ampliamente abordadas en la Investigación de Operaciones usando Programación Lineal. En este tutorial mostraré como implementar este tipo de modelos matemáticos usando Python, de manera concisa y fácilemnte escalable.

Para contextualizar, la progrmación lineal u optimización lineal es una técnica usada para encontrar los mínimos o máximos de una función lineal. Muchas decisiones de interés comercial pueden ser planteadas de esta manera, como por ejemplo la formulación de alimentos balanceados, distribución de la capacidad de producción, entre otras.

Específicamente, un modelo de programación lineal requiere definir una función objetivo y de restricciones para delimitar las posibles soluciones. En nuestro caso, buscamos minimizar el costo de transporte a partir de la apertura de centros de distribución, siempre y cuando permitan atender adecuadamente la demanda de los clientes en 12 diferentes ciudades. A continuación explicaré como plantear el problema y resolverlo usando Python.

Los paquetes que vamos a utilizar son Numpy, Pandas y PuLP. Adicionalmente, el notebook y los datos usados para el ejercicio pueden descargarse en el siguiente enlace:

Comenzamos con la importación de los paquetes necesarios:

import pandas as pd
import pulp
import numpy as np

A continuación usaremos pandas para leer el archivo excel que contiene los datos de la ubicación y capacidad de los centros de distribución, la demanda y ubicación de los clientes, y las distancias entre clientes y centros de distribución, así como los costos fijos de operación y costos variables de transporte.

archivo = 'facility_location.xlsx'
df = pd.ExcelFile(archivo)
names = df.sheet_names

La variable 'names' contiene los datos de todas las hojas del archivo excel. Para facilitar las cosas, crearemos un diccionario con los nombres de las hojas como 'keys' y los datos como valores. Posteriormente, convertiremos la información en listas o 'arrays' dependiendo la necesidad.

information = {k: df.parse(k, index_col=0) for k in names}

centros_distri = information['Oferta'].index.tolist()

fábricas = information['Demanda'].index.tolist()

capacity = dict(information['Oferta']['Capacidad'])

demand = dict(information['Demanda']['Cantidad'])

d = np.array(information['Distancias'].values)

cKm = np.array(information['Costo km'].values)

# Crear una matriz de costo de transporte multiplicando distancias por costo km
x = d * cKm

y = information['Oferta']['Costo fijo'].values

cost = np.array([])
for n in range(5):
    cost = np.concatenate((cost, x[:, n]))
}

Lo que sigue es crear una lista de pares que representen la ruta que conecta los centros de distribución con los puntos de consumo usando 'lists comprehension', para posteriormente tabular cada ruta con su respectivo costo. Además, creamos un diccionario para relacionar a los centros de distribución con sus costos fijos de operación.

pairs = [(i, j) for i in centros_distri for j in fábricas]

price_per_route = {k: v for k, v in zip(pairs, cost)}

fixed_cost = {k: v for k, v in zip(centros_distri, y)}

Como señalamos, la intención de nuestro modelo es minimizar el costo de transporte considerando la posibilidad de abrir uno o más centros de distribución (CD) para satisfacer la demanda, lo que se puede representar en la siguiente función:

Recomendado por LinkedIn

Programación Orientada a Objetos en el Mundo de Datos…

Miguel Angel Magaña Fuentes Hace 1 año

Optimizando Pandas al Máximo: Guía para Mejorar la…

Jordi Pompas Gutiérrez Hace 11 meses

Programación Orientada a Objetos en el Mundo de Datos…

Miguel Angel Magaña Fuentes Hace 1 año

No hay texto alternativo para esta imagen

El primer término de la ecuación es la sumatoria del costo por km multiplicado por la cantidad transportada, y el segundo término corresponde a la sumatoria del costo fijo de operación de un centro de distribución por la variable binaria Y, que es 0 en caso de que el centro sea descartado y 1 si se implementa. Tanto la cantidad transportada como la variable binaria son las variables de decisión.

Teniendo en cuenta todo lo anterior, continuaremos con la formulación del modelo propiamente dicha. En este punto es importante resaltar brevemente la ventaja de usar PuLP para el problema de optimización, en detrimento de otras opciones como scipy.optimize, ya que PuLP permite trabajar con funciones con varios términos, es decir, podemos agregar más definiciones a la ecuación que modela nuestro problema, en este caso, la función del costo de operación.

El primer paso consiste en crear una variable (model) que es una instancia de la clase pulp.LpProblem. Aquí especificaremos el nombre del modelo y el tipo de otpmización (minimizar). A continuación definiremos las variables de decisión, por una parte la cantidad transportada desde los CD a los clientes, y por otra parte la decisión de abrir o no el CD. El planteamiento termina cuando incluimos en el modelo la función que pretendemos minimizar, tal como lo describimos en notación matemática.

model = pulp.LpProblem('Supply_cost_minimization', sense=pulp.LpMinimize)

route = pulp.LpVariable.dicts('cdist_fbrca', pairs, lowBound=0, cat='Integer')

c_dist = pulp.LpVariable.dicts('cdist', centros_distri, cat='Binary')

model += pulp.lpSum([price_per_route[i] * route[i] for i in pairs]
                     + [fixed_cost[i] * c_dist[i] for i in centros_distri])

Por lo general los modelos de programación lineal buscan la solución óptima de la función objetivo, sin que las variables de decisión excedan ciertos límites denominados restricciones o condicionantes. En el ejemplo en cuestión, las restricciones implican que la cantidad despachada de cualquier centro de distribución sea igual o menor a su capacidad, que la cantidad que llega a los clientes sea igual o mayor a su requerimiento, el número de centros debe ser por lo menos 1 y no más de 5. A estos condicionantes debemos agregar dos más: todos los valores deben ser números positivos, y como ya mencioné, la variable Y solo puede tomar el valor de 0 o 1.

Por último, incluiremos una importante restricción denominada restricción de conexión, que fuerce al modelo a satisfacer la demanda de los clientes únicamente desde los centros que están en operación. Esto se consigue con la inecuación final que señala que la cantidad transportada debe ser menor a la multiplicación de un número arbitrario (M) por la variable binaria, esto se traduce en que si un CD no será abierto (variable binaria igual a 0) la desigualdad no se cumple y por tanto esa opción se descarta.

M = information['Demanda']['Cantidad'].sum()*10
num_max_cent = 5
num_min_cent = 1

for i in centros_distri:
    model += pulp.lpSum(route[(i, j)] for j in fábricas) <= capacity[i]
    
for j in fábricas:
    model += pulp.lpSum(route[(i, j)] for i in centros_distri) >= demand[j]

for k in route.keys():
    model += route[k] - M*c_dist[k[0]] <= 0

model += sum(c_dist.values()) >= 1
model += sum(c_dist.values()) <= 5

Lo que resta es resolver el modelo y averiguar si se econtró una solución factible(que respete las restricciones y cumpla con el objetivo). En caso que la respuesta sea óptima, continuaremos con la visualización de las cantidades transportadas y sus puntos de origen y destino.

model.solve()
pulp.LpStatus[model.status]

total_cost = pulp.value(model.objective)
print(f'El costo mínimo de transporte y operación es {total_cost}')

for v in model.variables():
    if v.varValue > 0:
        print(v.name, v.varValue)

Consideraciones finales

En este tutorial analizamos como resolver un problema de optimización usando el paquete PuLP de Python, que permite trabajar con funciones objetivo compuestas por varios términos, como en el caso del diseño de redes de distribución en donde se debe tener en cuenta costos variables de transporte, así como costos fijos de operación. Si bien el ejemplo trabajado abarca un número relativamente pequeño de variables, la forma en la que programamos la solución permite que sea fácilmente escalable, ya que lo único que deberíamos modificar sería el archivo que contiene los datos.

Finalmente, este tipo de modelos de optimización pueden ser ampliados para asemejarse más a situaciones reales al incluir la existencia de inventarios y mayor número de productos.

Inicia sesión para ver o añadir un comentario.

Más artículos de Iván Calderón

How I use Leo AI as a Coding Assistant / Consultant for Data Analysis

13 mar 2024

How I use Leo AI as a Coding Assistant / Consultant for Data Analysis

“If words of command are not clear and distinct, if orders are not thoroughly understood, then the general is to blame.…
Fetching data from Airtable to Google Sheets ... All of it!

6 mar 2024

Fetching data from Airtable to Google Sheets ... All of it!

Although Airtable is flexible enough to implement regular data analysis workflows, chances are that end users may feel…

7 comentarios
Adivina el Personaje usando Visión por Computadora

8 mar 2022

Adivina el Personaje usando Visión por Computadora

Hace algún tiempo el historiador Christian Nader propuso un desafío en redes sociales que consistía en identificar la…
Simulando la Clasificación al Mundial con Python

8 feb 2022

Simulando la Clasificación al Mundial con Python

A falta de 2 fechas para que se termine de jugar la eliminatoria sudamericana para el mundial de Catar 2022, en los…

Supply Chain Design con Optimización lineal en Python

Iván Calderón

Data Analysis | SQL| Python Developer | Data Engineering | Machine Learning | Consultant |

Recomendado por LinkedIn

Más artículos de Iván Calderón

Otros usuarios han visto

Introducción a Jupyter Notebook y JupyterLab: Herramientas Esenciales para el Análisis de Datos y la Ciencia de Datos

¿Qué puedo hacer en google colab?

Gráficos indicadores en Matplotlib

Análisis Univariado con python

PyCaret 3.0 - lo que viene

Código Eficaz en Proyectos de Datos - Parte I

REGRESIÓN NO LINEAL MULTIVARIADA EN PYTHON: AJUSTE DE UN MODELO DE VISCOSIDAD PARA LÍQUIDOS IÓNICOS.

Ventajas de la programación en R para modelos predictivos

Funciones de estadística en Python

Tiempedia: Modelos Bootstrap para Estimación de Incertidumbre en Series de Tiempo

Ver temas

Recomendado por LinkedIn

Más artículos de Iván Calderón

How I use Leo AI as a Coding Assistant / Consultant for Data Analysis

Fetching data from Airtable to Google Sheets ... All of it!

Adivina el Personaje usando Visión por Computadora

Simulando la Clasificación al Mundial con Python

Otros usuarios han visto

Introducción a Jupyter Notebook y JupyterLab: Herramientas Esenciales para el Análisis de Datos y la Ciencia de Datos

¿Qué puedo hacer en google colab?

Gráficos indicadores en Matplotlib

Análisis Univariado con python

PyCaret 3.0 - lo que viene

Código Eficaz en Proyectos de Datos - Parte I

REGRESIÓN NO LINEAL MULTIVARIADA EN PYTHON: AJUSTE DE UN MODELO DE VISCOSIDAD PARA LÍQUIDOS IÓNICOS.

Ventajas de la programación en R para modelos predictivos

Funciones de estadística en Python

Tiempedia: Modelos Bootstrap para Estimación de Incertidumbre en Series de Tiempo

Ver temas