Uso de la Minería de Datos para la Elaboración de un Modelo de Predicción para la Optimización de la Producción Agrícola en Distritos de Riego-Edición Única
![Thumbnail Image](../../assets/images/RITEC/thumbnail.png)
Citation
Share
Date
Abstract
A través del tiempo, distintos modelos y procedimientos han sido propuestos con el propósito de optimizar los elementos involucrados en el proceso productivo de cultivos agrícolas. La obtención de mayores ingresos con la inversión mínima de recursos es un problema que ha atraído desde hace mucho tiempo la atención de especialistas propios y ajenos de la materia. Lamentablemente, el inmenso número de factores involucrados en el proceso productivo dificultan enormemente la construcción de modelos eficientes y realistas que reflejen las condiciones que influyen en el rendimiento de la producción. Bajo este panorama, lo mejor es analizar los datos históricos de las cosechas con el fin de inferir comportamientos futuros que permitan realizar una correcta administración de los recursos involucrados, con miras a obtener el mayor ingreso posible. En los años recientes, un conjunto de técnicas agrupadas bajo el nombre de minería de datos ha surgido como propuesta para extraer conocimiento y descubrir relaciones desconocidas entre los datos a partir de grandes volúmenes de información. La minería de datos forma parte del proceso conocido como “descubrimiento de conocimiento en bases de datos” (KDD, Knowledge Discovery in Data bases), y además de la minería de datos, en el KDD están involucradas otras tareas, tales como la preparación de la información, la visualización y la exploración de datos y la interpretación de los resultados obtenidos. De las áreas dedicadas a la producción agrícola en México, los Distritos de Riego favorecen a la aplicación de este tipo de tecnologías, ya que mucha de la información generada en estas áreas es registrada y concentrada por dependencias oficiales de Gobierno. En esta tesis se presentan los resultados de la aplicación de un ejercicio de minería de datos orientado a la información productiva de un distrito de riego. La información utilizada contempla los principales elementos involucrados en el proceso de producción, como superficies, rendimientos, volumen de agua utilizada e información climática. Se muestra como ciertas técnicas de aprendizaje automático (concretamente, árboles de regresión M5), ofrecen mayores ventajas que las técnicas de análisis de regresión tradicionales, esto al momento de generar modelos de predicción del rendimiento de los cultivos del distrito de riego. Los modelos de predicción del rendimiento no son suficientes para optimizar el ingreso generado en el distrito. Para proporcionar una solución completa, esta tesis ofrece un algoritmo basado en métodos evolutivos, cuya función de aptitud está basada en el ingreso calculado por una maximización con el método Simplex de la producción de los cultivos. Esta maximización utiliza la información aportada por los modelos de predicción del rendimiento desarrollados en la etapa de minería de datos. Los resultados indican que la distribución de recursos realizada por el algoritmo mejora los resultados de una estimación realizada por técnicas tradicionales (como el uso de valores promedio y la maximización Simplex). Finalmente, el algoritmo desarrollado (denominado GenSM5) es implementado en una herramienta de software, la cual puede ser utilizada para la visualización de distintos escenarios en la planeación del proceso de siembra de los cultivos del distrito.