Planta de Fraccionamiento de Aceite
Planta de Fraccionamiento de Aceite
Planta de Fraccionamiento de Aceite
VICERRECTORADO ACADÉMICO
ÁREA DE INGENIERÍA
Febrero, 2011
RESUMEN
ii
A mi madre Carmelita de Jesús...
Te amo.
iii
AGRADECIMIENTOS
Saibel Ramos
iv
INDICE GENERAL
Pág.
Índice de Figuras vi
Índice de Tablas vii
Introducción 1
Capítulo 1 Metodología y Objetivos de Investigación 8
1.1 Metodología de Investigación 8
1.2 Objetivos de Investigación 10
Capítulo 2 Dominio de Aplicación 13
2.1 Producción Industrial del Aceite de Palma 13
2.2 El Proceso de Fraccionamiento de Aceite de Palma 18
2.2.1 Principios Básicos 18
2.2.2 Descripción y Condiciones del Proceso 19
2.2.3 Control Automatizado del Proceso 26
2.2.4 Problemas de Calidad en el Proceso de
Fraccionamiento de Aceite de Palma 31
2.3 Hipótesis 36
Capítulo 3 Minería de Datos Aplicada al Proceso de Fraccionamiento
de Aceite de Palma 40
3.1 Metodología para la Minería de Datos 40
3.2 Técnicas de Minería de Datos Utilizadas para
Modelar la Solución 49
3.2.1 Árboles de Decisión para Clasificación 50
3.2.3 Algoritmo J48 52
Capítulo 4 Resultados y Discusión 55
Capítulo 5 Conclusiones y Futuros Desarrollos 63
Anexo A 66
Anexo B 67
Referencias 68
v
INDICE DE FIGURAS
Pág.
vi
INDICE DE TABLAS
Pág.
vii
INTRODUCCIÓN
1
Puede decirse que la Minería de Datos emerge en el escenario tecnológico cuando
suceden dos avances de manera simultánea, el primer avance lo constituye el uso
generalizado de herramientas informáticas de reconocimiento de patrones, como
redes neuronales, lógica difusa, algoritmos genéticos y otras técnicas avanzadas de
análisis de datos; el segundo avance representado por la disponibilidad de grandes
volúmenes de datos organizados en bases de datos. La concurrencia de estos eventos
transformó el proceso de análisis de datos, inicialmente orientado por un proceso
disgregado de análisis estadístico para obtener información, hacia un proceso
inteligente de análisis de los datos orientado al descubrimiento de patrones, perfiles y
tendencias en los datos para adquirir conocimiento.
2
función del problema que se quiere resolver, cuál es la tarea a realizar, además, es la
fase donde se elige la técnica descriptiva o predictiva que se va a utilizar para
modelar la solución a dicha tarea. Es tal el auge y los avances que en cuestión de
Minería de Datos se han desarrollado que actualmente es sinónimo de KDD y se han
desarrollado metodologías específicas para realizar proyectos de Minería de Datos,
tales como: CRISP-DM [Chapman et al. (2000)], SEMMA [SAS (1998)], CRITIKAL
y 5A`s [Martínez de Pisón y Ordieres (2005)].
Ahora bien, se observan algunas tendencias actuales que ha tomado el KDD, sobre
todo con la llegada de la Web Semántica, los Sistemas de Bases de Datos
Heterogéneas (SBDH), y con la entrada al mercado de los sistemas (software) de
minería de datos. Según Pérez del Rey (2007), el descubrimiento de nuevo
conocimiento impulsa, por tanto, la investigación en métodos avanzados de
búsqueda, integración y procesamiento de información, en este sentido, para facilitar
el proceso KDD, los investigadores están trabajando con una de las últimas
evoluciones de la World Wide Web (WWW), denominada Web Semántica, y con
ontologías que facilitan el entendimiento del dominio y suministran un soporte de
conocimiento formal. Estas nuevas herramientas tienden a permitir el acceso a
grandes cantidades de datos, situados en distintos lugares, con múltiples formatos,
contextos, plataformas y también con diferentes semánticas.
3
Teniendo en cuenta adicionalmente la opinión de González (2007), en la mayoría de
los procesos industriales las relaciones entre variables no son lineales y esta
característica deriva en la dificultad de obtener modelos explícitos que definan su
comportamiento, por esta razón se comprende la importancia de los modelos basados
en datos, frente a otros modelos analíticos basados en ecuaciones explícitas.
Considerando los hallazgos referidos por los trabajos mencionados, puede decirse
que la aplicación de Minería de Datos trae grandes mejoras para la industria, pues se
comprende que al tener procesos industriales que alimentan bases de datos
informatizadas con información histórica, es decir representan transacciones o
situaciones que se han producido, útil para predecir información futura, la industria
obtenga ventajas competitivas al aplicar estas técnicas. Dichas ventajas se derivan de
resolver la problemática del análisis de grandes volúmenes de datos de mucha
variedad, igualmente de la posibilidad de obtener modelos y patrones tanto
predictivos como descriptivos comprensibles y útiles para la toma de decisiones en
las fases críticas de la cadena de producción, así como en el diseño e implantación de
sistemas de control más efectivos.
4
Dadas estas situaciones de constante y rápido crecimiento en los reservorios de
datos en las industrias y las posibilidades que se presentan con los avances
tecnológicos para su tratamiento automático, este trabajo de investigación se enmarca
en el área de la informática –en el proceso de Descubrimiento de Conocimiento en
Bases de Datos (KDD) como dominio de conocimiento, estudiando y aplicando
tareas y técnicas actuales empleadas en su fase Minería de Datos-, además, se
enmarca en el área de los procesos industriales de fabricación de alimentos, como
dominio de aplicación, específicamente en el proceso industrial de Fraccionamiento
de Aceite de Palma, el cual forma parte de la cadena de producción de grasas y
aceites comestibles extraídos del fruto de la especie arborícola Palma Aceitera.
5
Datos, aplicado en el ámbito del problema dentro de la planta caso de estudio. El
Capítulo 4, denominado Resultados y Discusión, muestra los resultados de la
aplicación de las técnicas de minería de datos al problema y en él se proponen las
mejoras al proceso de fraccionamiento de aceite de palma. Finalmente en el Capítulo
5, Conclusiones y Futuros Desarrollos, se desarrollan las conclusiones que se han
obtenido en función de los objetivos formulados al inicio del trabajo; se presenta su
impacto, alcance e importancia, y cuáles hallazgos resultantes de esta investigación
pueden ser objeto de futuros desarrollos.
6
7
Capítulo 1 Metodología y Objetivos de
Investigación
9
resultará ser el método y/o un modelo a emplear y comprobar en este
proceso práctico aplicado.
10
Estudiar el proceso de Fraccionamiento de Aceite de Palma y las situaciones
problemáticas de dicho proceso en la planta caso de estudio, en el contexto de la
producción industrial de grasas y aceites comestibles.
11
12
Capítulo 2 Dominio de Aplicación
14
Figura 2.1: Productores a Nivel Mundial de Aceite de Palma (periodo 2009)
Fuente: Malaysian Palm Oil Board (MPOB)
15
industria de grasas y aceites comestibles ha decidido procesar el aceite de palma, pues
su conformación molecular permite extraer los componentes con la textura adecuada
para la producción de margarinas y mantecas, sin necesidad de realizar un proceso de
hidrogenación1.
Por otro lado, los aceites naturales y grasas pueden necesitar ser modificados para
satisfacer la formulación de un producto particular en el mercado de consumo
humano, es este caso mezclar es el método más simple para modificar aceites y
grasas. Una gama amplia de productos puede derivarse de las frutas de la palma,
incluso el aceite de la palma, oleína de la palma, estearina de la palma, y sus
derivados. Éstos pueden mezclarse fácilmente con otros aceites comerciales y grasas
para varias aplicaciones de comida, extendiendo de esta manera el rango de
aplicación de aceites y grasas comestibles (Nor Aini et al., 2002).
1
Proceso que consiste en tratar el aceite con gas hidrógeno, en presencia de un catalizador, con el fin
de incrementar el contenido de sólidos y/o mejorar su estabilidad térmica u oxidativa (DE SMET
Process & Technology, INC, 2005).
16
Aceite de Palma Crudo
Refinamiento
Blanqueamiento
Desodorización
Fraccionamiento
17
2.2. El Proceso de Fraccionamiento de Aceite de Palma
2
Se define isomerización como el proceso químico mediante el cual una molécula es transformada en
otra que posee los mismos átomos pero dispuestos de forma distinta. De este modo, se dice que la
primera molécula es un isómero de la segunda, y viceversa (Sherman et. al, 1995).
18
humanos, pues el organismo no los elimina debido a su configuración molecular,
convirtiéndose estos elementos en pre cancerígenos (Gurr M., 1996).
DE SMET Process & Technology, INC (2005), indica tres métodos aplicados en la
industria de aceites comestibles para realizar el fraccionamiento: Fraccionamiento en
19
fase seca, Fraccionamiento en fase solvente (hexano, acetona u otro) y
Fraccionamiento con detergente que implica el uso de aditivos.
20
Etapa de
Acondicionamiento
Etapa de
Cristalización
Etapa de
Filtración
21
Etapa de Acondicionamiento.
En este punto es importante explicar que los aceites y las grasas son mezclas de
triglicéridos, los cuales a causa de su diferente composición en ácidos grasos, tienen
su punto de fusión en un rango que abarca de 50° C a los 80° C, y este punto es
específico para cada aceite. Para el caso del aceite de palma, el punto de fusión está
entre los 36° C y los 38° C, cabe aclarar la característica de uno de sus ácidos grasos
que lo componen, el tripalmítico, el cual tiene un punto de fusión de 68° C a 70° C.
22
de aceite contenida en el tanque TK1901, está por debajo de los 70° C, el serpentín
interno calienta con vapor, en el caso de sobrepasar los 70° C, la válvula proporcional
detiene la acción del intercambiador de placas, estabilizando la temperatura requerida
para la cristalización.
Etapa de Cristalización.
23
El punto crucial en el fraccionamiento seco es la selectividad de la cristalización,
la cual es determinada por las condiciones térmicas y más específicamente por las
características de enfriamiento. Los triglicéridos, principales constituyentes de los
aceites y grasas, se caracterizan por un complejo comportamiento en la fusión y en la
cristalización debido a la existencia de múltiples formas cristalinas en los triglicéridos
y a sus propiedades físicas específicas.
24
el tamaño y textura de los cristales; la cristalización se obtiene en un intervalo de
tiempo fijo y limitado; posibilidad de cristalización en un tiempo corto.
Etapa de Filtración.
25
recircula atravesando un intercambiador de placas y retorna al interior del tanque de
fusión. Un serpentín de vapor está instalado en el tanque de fusión para el
calentamiento de la primera estearina en el arranque, cuando hay suficiente estearina
líquida, este sistema de calentamiento de vapor se cierra.
Estos sistemas de supervisión y control, son descritos por Barreto (2009) como
sistemas que están constituidos por un computador central, conectado físicamente a
los dispositivos de adquisición de datos; el flujo de la información es como sigue: un
fenómeno físico (presión, temperatura, flujo, el disparo de un interruptor, exceso de
presión en una tubería, nivel de un tanque, etc.), es captado por un sensor, el cual
alimenta una señal eléctrica a un transmisor para que éste entregue una señal análoga
también eléctrica normalizada (0 a 5 V DC o desde 0 a 10 V DC) hacia un PLC
26
(Programmable Logic Controller) o RTU. Dependiendo del caso, el transmisor
además proveerá aislamiento eléctrico y filtraje con el objeto de reducir posibles
ruidos. Una vez que los datos llegan al computador central, se los almacena para su
análisis, generación de históricos y para la toma de decisiones. Basado en la
información, el operador puede tomar decisiones que pueden modificar el trabajo del
proceso supervisado, las que en general están sujetas a normas emitidas muchas veces
por el mismo equipo. El operador comanda al ordenador y este obedece enviando un
dato que al final llegará a un actuador (bobina, un relee, servomotor) que al mover un
elemento final logran controlar la variable bajo supervisión o control.
27
En la planta de fraccionamiento de aceite de palma, se utilizan diferentes tipos de
sensores para el control de distintas variables de interés. En el caso de los tanques
receptores y tanque pulmón, se utilizan sensores para la medición de la temperatura,
el nivel de llenado del tanque o volumen de aceite contenido; en el caso del filtro
prensa de membrana, se utilizan sensores que miden la presión ejercida en el proceso
de filtrado.
28
TK1900
Figura 2.4 Supervisión y control desde el PLC de la Recepción del aceite de palma y arranque
del proceso de Fraccionamiento. Sistema SCADA en planta, 2010.
TK1901
29
TK1902 TK1903
Figura 2.6 Supervisión y control desde el PLC Fase de Cristalización. Sistema SCADA en planta, 2010.
TK1904
TK1905
Figura 2.7 Supervisión y control desde el PLC Fase de Filtrado. Sistema SCADA en planta, 2010.
30
TK1906 TK1905
Figura 2.8 Supervisión y control desde el PLC Almacenamiento de la oleína. Sistema SCADA
en planta, 2010.
Berger (1992) indica que la oxidación y la hidrólisis constituyen los factores más
determinantes en la calidad de los aceites comestibles; ambos tipos de reacción
pueden originar sabores que hacen que el aceite no sea utilizable como alimento; los
aceites comestibles tanto de origen animal como vegetal, son triglicéridos de ácidos
grasos y es la reactividad de estos aceites la que conduce a su degradación. Además,
este autor indica que el contacto con el oxígeno de la atmósfera produce oxidación, la
reacción de la oxidación está relacionada con los radicales libres y parece que para
31
que se inicie son necesarias trazas metálicas que actúan como catalizadores 3, y una
vez iniciada, prosigue como una reacción en cadena.
- Humedad
- Impurezas
32
- Índice de Deterioro de la Blanqueabilidad (DOBI).
Ahora bien, una vez que los productos se entregan al cliente, estos aceites pueden
continuar degradándose durante las condiciones de manejo y el transporte a granel,
debido a su reactividad en contacto con agentes externos, por lo cual el lineamiento
de calidad en esta empresa, es producir las oleínas y estearinas con índices de
peróxido menores a 0.5%, brindando al cliente mayor estabilidad de estos productos.
Sin embargo, desde agosto del 2009 hasta abril del 2010, período en el que se
recopiló la información, se ha observado presencia de peróxido en los resultados de
los análisis realizados al aceite de palma en el tanque receptor TK1900, además,
análisis realizados en el aceite de palma en el tanque TK1901, una vez que este aceite
ha sido acondicionado, también acusan aumentos en índices de peróxido. Igualmente,
los análisis hechos en los productos finales en planta de fraccionamiento, presentan
índices de peróxido por encima de 1%, valor máximo tolerable por los clientes; en
estos casos el producto es sometido inmediatamente a un reproceso en planta de
refinación a fin de eliminar el peróxido. Por otro lado, se observa que los resultados
de análisis de peróxido en las oleínas, generalmente superan el 0,5%, lo cual se desvía
del estándar de calidad perseguido por la empresa para una mayor competitividad de
sus productos.
33
Varios factores pueden estar incidiendo en esta situación, los cuales se fueron
determinando a lo largo del proceso de investigación en la empresa. Un factor
importante, el tanque que alimenta la planta de fraccionamiento, es decir, el tanque
que recibe el aceite de palma una vez que sale de la planta de refinación, denominado
TK2161, está hecho de hierro negro, en este caso, según Berger (1992), las trazas
metálicas como las del hierro, tienen un efecto catalítico en el proceso de oxidación,
bien porque promueven la fase de radicales libres o la descomposición de los
hidroperóxidos. El hecho de mantener el aceite almacenado en el tanque TK2161, en
contacto con el hierro, puede estar promoviendo una rápida oxidación y esta reacción
pudiera estar acelerándose en proporción al tiempo de residencia del aceite en este
tanque, desde que es alimentado desde la planta de refinación, hasta que este aceite es
trasegado al tanque TK1900 en la planta de fraccionamiento.
Por otra parte, Berger (1992), señala que debido a la presencia de oxígeno y agua
en el aire ambiental, siempre existe la posibilidad de que se presenten estas
reacciones. En la planta de fraccionamiento se realiza la limpieza de los
cristalizadores y las tuberías bombeando aire a través de ellas, pudiendo ocasionar
34
que las trazas de aceite residuales en los tanques y las tuberías, absorban el oxígeno
necesario para comenzar la reacción en los siguientes lotes o cargas de aceite a
procesar.
35
oxidación de la oleína que despacha. Indistintamente del caso, los costos asociados a
los reprocesos, incrementan los costos operativos y merma la rentabilidad de la
empresa, con las consecuencias negativas en la competitividad de la misma.
2.3. Hipótesis
Por otro lado, Barreto (2009), explica que con los sistemas SCADA se realiza la
trazabilidad del producto. Lo que permite proporcionar conocimiento del proceso
productivo para determinar, en un momento dado, las causas de un posible defecto,
incluso después de haber salido de fábrica. El sistema SCADA utilizado en la planta
de fraccionamiento caso de estudio, mediante el módulo de visualización y el módulo
de alarmas, facilita tanto la supervisión como el control del proceso de
fraccionamiento; partiendo de esto, se supone que la calidad del producto depende en
gran parte de la operación efectiva de todas las unidades que intervienen en
fraccionamiento, apoyada en este tipo de supervisión y control. En este caso, los
operadores de planta pueden supervisar constantemente las temperaturas del aceite
36
durante todo el proceso; mediante el PLC pueden accionar (arranque, parada) de las
válvulas implicadas en las unidades de calentamiento, como es el caso del
intercambiador de calor denominado F1021A (ver figura 2.9), el cual controla
mediante una válvula proporcional, el porcentaje de vapor suministrado entre sus
placas para calentar el aceite que se trasiega del tanque TK1900 al tanque TK1901
durante la etapa de acondicionamiento.
Válvula Proporcional
Intercambiador de calor
Visualización y control
de temperatura del aceite
entre las placas
TK1901
Figura 2.9 Intercambiador de calor y válvula proporcional. Sistema SCADA en planta, 2010.
37
Otra hipótesis relacionada al dominio de conocimiento de esta investigación,
consiste en que la aplicación de la Minería de Datos permitirá obtener conocimiento
valioso y aún desconocido sobre los problemas presentados en el proceso de
Fraccionamiento de Aceite de Palma. Investigaciones previas, indican la posibilidad
de la aplicación exitosa de la Minería de Datos en el ámbito industrial [Rodríguez et
al. (2003), Martínez de Pisón et al. (2003b), Martínez de Pisón et al. (2005)].
Adicionalmente, González (2007), indica que la minería de datos es, esencialmente,
un proceso conducido por un problema: la respuesta a una pregunta o la solución a un
problema se busca analizando los datos disponibles. Por lo que se ha supuesto que
aplicando el proceso de Minería a los datos de índices de peróxido en las muestras de
laboratorio realizadas, las temperaturas registradas en la fase de acondicionamiento
del aceite y los tiempos de residencia en el tanque alimentador, se podrá obtener
patrones de comportamiento, además de relaciones e información valiosa sobre el
proceso industrial en estudio.
38
39
Capítulo 3 Minería de Datos Aplicada al Proceso
El KDD está compuesto de varios pasos o fases, de las cuales la Minería de Datos
constituye prácticamente la fase de mayor auge y desafío dentro de este campo, al
respecto, Hernández et al. (2004), resalta que la fase de Minería de Datos es la más
característica del KDD y, por esta razón, muchas veces se utiliza esta fase para
nombrar todo el proceso. Además, explica que el objetivo de esta fase es producir
nuevo conocimiento que pueda utilizar el usuario para la toma de decisiones. Esto se
realiza construyendo ya sea un modelo predictivo ó un modelo descriptivo basado en
los datos recopilados para este efecto, este modelo es utilizado para resolver una tarea
o problema y esta tarea, generalmente, puede consistir en una clasificación, una
regresión, un agrupamiento, correlación, o reglas de asociación.
41
González (2007), explica que existen varias propuestas metodológicas para
realizar proyectos de Minería de Datos, que en general dividen el proceso en un
determinado número de pasos secuenciales: primero el analista se familiariza con el
problema y los datos; posteriormente, se preparan los datos y se construyen y evalúan
los modelos para, finalmente consolidar el nuevo conocimiento adquirido y utilizarlo
para resolver el problema planteado. Esta autora también explica que una
metodología estándar de Minería de Datos y una de las más ampliamente utilizadas
en los ámbitos industrial y académico es el modelo CRISP-DM (Cross Industry
Standard Process for Data Mining)4 desarrollado por un consorcio de empresas
dedicadas a la investigación y desarrollo en este campo. El CRISP-DM es el modelo
de referencia utilizado en esta investigación y en la figura 3.1 se observan los
distintos pasos para realizar descubrimiento de conocimiento en bases de datos,
basándose en este enfoque metodológico.
Figura
4 3.1: Fases (http://www.crisp-dm.org/Process/index.htm)
CRISP-DM del Modelo CRISP-DM. Fuente: http://www.crisp-dm.org/Process/index.htm
42
Según González (2007), en el modelo CRISP-DM, el proceso de Minería de Datos se
divide en seis fases: Análisis del problema, Análisis de los datos, Preparación de los
datos, Modelado, Evaluación y Despliegue. A continuación se describe cada fase.
Fase II: Análisis de los datos; la comprensión de los datos incluye entender su
origen, naturaleza y fiabilidad, así como familiarizarse con el contenido de los
mismos a través de un análisis exploratorio. La adecuada preparación de los datos,
selección de las herramientas del modelado y evaluación, sólo es posible si el analista
tiene una idea global de los datos. En esta fase fue necesaria la colaboración del
departamento de Aseguramiento y Control de Calidad de la empresa, así como la
información suministrada por los operarios y el jefe de planta de fraccionamiento
para entender la naturaleza, origen y fiabilidad de los datos involucrados en todo el
proceso de fraccionamiento de aceite de palma. Se ubicaron en diferentes fuentes
(registros en formatos físicos y en bases de datos transaccionales), información
relacionada a las variables importantes del estudio.
43
a. Selección de los datos:
44
tp_residencia ip_tk1900 t_tk1901 ip_oleina
24 0.53 68 0.97
48 2.30 69 2.55
6 0.55 70 0.87
24 0.55 69 1.07
6 0.00 68 0.90
12 0.20 68 0.25
45
tp_residenciaip_tk1900 t_tk1901 ip_oleina reproceso
Sustituidos por
24 9.54 70 10.52 si
Sustituidos por
la media
30 9.56 68 13.13 si
la media
(0.39)
3 4.15 69 5.12 si
(1.02)
30 0.10 70 5.30 si
2 0.00 70 6.22 si
16 0.50 69 5.20 si
Tabla 3.2: Tratamiento de datos anómalos en el Datamarts. Fuente: la autora
46
depende del atributo ip_oleina, puesto que este valor según estándar de calidad de la
empresa, si es superior a 1%, la oleína va a reproceso, en este caso el atributo
reproceso toma el valor nominal “si”, de suceder lo contrario el atributo reproceso
toma el valor nominal “no”. La tabla 3.4 muestra un ejemplo del Datamarts después
de la transformación de los datos.
47
Fase IV: Modelado; es la fase principal de la metodología, porque es aquí donde
se aplican los diferentes algoritmos de análisis de datos, sobre los datos preparados en
las etapas anteriores. Durante esta fase se buscan los patrones presentes en los datos
y se buscan soluciones al problema. Mientras que las fases previas de análisis y
preparación, básicamente preparan los datos para el modelado, y las posteriores se
preocupan por su desarrollo en la práctica, la solución se especifica en esta fase, la
cual puede ser, como se dijo anteriormente, un modelo predictivo o descriptivo.
48
nuevas percepciones, ideas y modelos secundarios que robustecen la solución
encontrada.
5
Software de Minería de Datos de código abierto y de libre distribución, desarrollado por la
Universidad de Waikato en Hamilton, Nueva Zelanda, http://www.cs.waikato.ac.nz/ml/weka/
49
Se seleccionó la técnica predictiva “árboles de decisión para clasificación”, a fin
de obtener el modelo predictivo en el proceso de fraccionamiento de aceite de palma.
En los siguientes apartados se describe la técnica seleccionada para el modelo y se
describe el algoritmo para implementar dicha técnica.
En base a lo anterior, las clases identificadas para las instancias en la base de datos
son: reproceso (si) y reproceso (no); es decir, el atributo reproceso, que es el atributo
dependiente de cada instancia evaluada por el árbol, puede tomar uno de los
siguientes dos valores nominales para clasificarla: “si” ó “no”. Para determinar este
50
valor, el árbol evalúa en base a un conjunto de reglas definidas en el modelo por el
resto de los atributos de la instancia, llamados atributos predictores.
Una de las ventajas de los árboles de decisión es que, en su forma más general, las
opciones posibles a partir de una determinada condición son excluyentes. Esto
permite analizar una situación y, siguiendo el árbol de decisión apropiadamente,
llegar a una sola acción o decisión a tomar; esta ventaja puede verse claramente en la
figura 3.2.
51
Figura 3.2: Ejemplo de Árbol de Decisión para Clasificación.
Fuente: http://www.exa.unicen.edu.ar/catedras/dbdiscov/mirabella.pdf
52
- El árbol generado por el algoritmo J48 debe ser aplicado a cada dato en forma
secuencial hasta que los mismos caigan dentro de alguna categoría o clase.
53
54
Capítulo 4 Resultados y Discusión
6
El conjunto de entrenamiento (training set) permite al algoritmo crear el modelo, mientras que el
conjunto de prueba (test set) valida la precisión del modelo.
56
Una vez analizadas las distribuciones de las variables y observado los patrones
más relevantes, se entrenó el modelo clasificador. En WEKA 3.6.2 hay tres opciones
para entrenar el clasificador:
Las pruebas realizadas para cada opción de entrenamiento del modelo resultaron
en las siguientes conclusiones:
- Usando percentage split tomando el 66% del conjunto de datos para entrenar
el modelo y 34 % como conjunto de prueba, se clasificaron correctamente 16
instancias con un 72.72% de precisión.
7
Puede encontrarse información detallada sobre esta técnica de evaluación en Hernández (2004).
57
instancias del conjunto de prueba (test set) clasificadas correctamente, dividido por el
número de instancias totales en el conjunto de prueba.
no si
35 3
3 24
58
con 4 hojas, estas cuatro hojas indican que el árbol puede expresarse en 4 reglas de
decisión (ver figura 4.2).
59
Asimismo, 25 instancias del conjunto de entrenamiento cumplieron con las
condiciones de la cuarta regla, por ende estas instancias entran en la clase de oleínas
que van a reproceso. Esto hace poco significativo el comportamiento de los datos que
siguieron el patrón establecido en la segunda y tercera regla, con 7 instancias y 2
instancias respectivamente, lo que establece como patrones de comportamiento más
frecuentes los establecidos por las reglas 1 y 4, donde las variables ip_tk1900 y
t_tk1901, son las verdaderamente decisivas en la predicción del comportamiento de
los lotes de aceite de palma procesados, mostrándose la variable tp_residencia como
la menos determinante para establecer las predicciones.
Por otra parte, una vez que el ingeniero jefe de la planta de fraccionamiento,
analizó los comportamientos mostrados por el modelo, indicó que dichos resultados
60
coincidían con un plan de mejoras a la infraestructura de la planta. Dichas mejoras
consisten específicamente en la sustitución del tanque de hierro TK2161, por una
tubería de acero inoxidable desde la planta de refinación hasta el tanque receptor
TK1900 en planta de fraccionamiento. Como se observa, estos cambios en la
infraestructura están orientados a eliminar el problema del contacto del aceite de
palma con los agentes catalizadores presentes en el tanque alimentador TK2161, lo
que se está evidenciado en los resultados de análisis del peróxido de las muestras de
aceite extraídas del tanque receptor TK1900. Los tanques y tuberías de toda la planta
deben ser de acero inoxidable, ya que el hierro tiene como se indicó anteriormente, un
efecto catalítico sobre las reacciones termo-oxidativas.
Asimismo, una vez que fue sustituido el tanque alimentador TK2161 por las
tuberías de acero inoxidable, el ingeniero jefe se mostró interesado en realizar
investigaciones de este tipo en la planta de refinación del aceite de palma,
específicamente por los resultados del modelo que acusan directamente a la variable
ip_tk1900, la que indica el índice de peróxido del aceite de palma cuando comienza
la etapa de homogeneización. Este resultado da pie a la formulación de la siguiente
hipótesis a comprobar: aunque el aceite de palma sale de la planta de refinación con
un índice de peróxido en 0%, se observa que este índice frecuentemente sigue
incrementándose en la planta de fraccionamiento, lo que lleva a suponer problemas en
el control durante el proceso de blanqueo del aceite en la planta de refinería, que
pudieran estar causando envíos de aceite refinado para el fraccionamiento con
cantidades considerables de trazas metálicas promotoras de la oxidación.
61
62
Capítulo 5 Conclusiones y Futuros Desarrollos
Como se ha visto a lo largo de este documento, el proceso de fraccionamiento del
aceite de palma es complejo debido que es necesario cuidar el comportamiento de
diversos factores que influyen en la calidad del producto. Si la oleína producida no
cumple con las propiedades requeridas, entonces su estabilidad no sería la adecuada,
sobre todo porque es un producto que se verá sometido a factores del medio ambiente
una vez que sale de la planta de fraccionamiento, como la radiación solar, altas
temperaturas, humedad, frecuentes en los procesos de almacenamiento y transporte a
granel. En consecuencia, puede decirse que un control adecuado de este proceso
ayudará a obtener un producto final de la calidad deseada.
Por otro lado, se demostró que se puede realizar minería de datos en archivos
sencillos cuando no se cuenta con grandes almacenes de datos. Aún cuando en la
investigación se tomó la decisión de construir un Datamarts, dedicado exclusivamente
al registro de los datos del problema específico de fraccionamiento, se aplicaron
igualmente y de forma exitosa, técnicas de selección y preprocesado de los datos, las
cuales son fases realmente importantes y determinantes del proceso de minería.
En suma, puede decirse que los objetivos planteados que orientaron esta
investigación, se cubrieron satisfactoriamente y con resultados tangibles para la
empresa, al mismo tiempo que estos resultados representan un aporte significativo en
materia de aplicación de estas técnicas a los procesos industriales.
64
estas trazas deberían promover la oxidación en la medida de la concentración
presente de estos catalizadores en el tiempo.
Por otro lado, está la situación de los costos en que incurre la empresa como
consecuencia de los reprocesos de las oleínas que presentan índices de peróxido fuera
de los estándares de calidad. Este aspecto no fue tomando en cuenta en la presente
investigación, por lo que se propone profundizar en las técnicas de minería de datos
para el análisis del comportamiento de esta variable, como es el caso de la técnica de
la matriz de costes. En este caso, la matriz de costes permitiría evaluar los modelos
con sus costes de error de clasificación y, por ejemplo, buscar un modelo que
minimice el coste global.
Por último, puede decirse que la precisión de los modelos no garantiza que reflejen
el mundo real, en cualquier caso debe contrastarse el conocimiento que ellos nos
proporcionan con el conocimiento previo que se tiene del problema para detectar y en
su caso resolver los posibles conflictos.
8
Para mayor información sobre el modelo de regresión se sugiere Hernández (2004)
65
ANEXO A
66
ANEXO B
67
REFERENCIAS
Berger, K. (1992); Transport to Bulk of Oils Groceries; Oils & Fats International
Issue, 8 (4): 47-50.
Chapman P., Clinton J., Kerber R., Khabaza T., Reinartz T., Shearer C., Wirth R.;
CRISP-DM 1.0 (Step-by-step data mining guide); SPSS; E.E.U.U.; s/e; (2000).
Fayyad, U., Shapiro, G., Smyth, P. (1996); From Data Mining to Knowledge
Discovery in Databases; AI Magazine, 17:37-54.
68
Han, J., Kamber M. (2000); Data Mining: Concepts and Techniques. Morgan
Kaufmann.
Martínez de Pisón F., González J., Vergara E., Alba F., González A.; Mejora y
Optimización de un Proceso Industrial Mediante Técnicas de Minería de Datos e
Inteligencia Artificial; Ponencia presentada en el VII Congreso Internacional de
Ingeniería de Proyectos; Pamplona, España; (2003b).
Martínez de Pisón F., Ordieres J., Pernía A., Alba F.; Minería de Datos en Series
Temporales para la Búsqueda de Conocimiento Oculto en Históricos de Procesos
Industriales; Actas del III Taller Nacional de Minería de Datos y Aprendizaje,
TAMIDA; 31-38; (2005).
69
Mohd, B. W., Siti Nor, A. A., Henson, I. E. (2005); Oil Palm - Achievements and
Potential. Oil Palm Bulletin, 50. Publicación de Malaysian Palm Oil Board
(MPOB).
Nor Aini, I., Razali, I., Noor Lida, H. M.; Miskandar, M. S., Radzuan, J. (2002);
Blending of Palm Oil and Palm Products with other Oils and Fats for the Food
Applications. Oil Palm Bulletin, 45. Publicación de Malaysian Palm Oil Board
(MPOB).
Lal, V., K. (1991); Oil of Palm: Requirements of Quality to Obtain Good Refined
Products. Ponencia presentada en la Conferencia Internacional sobre Palma de
Aceite. Kuala Lumpur, Malasia. Versión traducida al español en Revista Palmas,
13 (3): 69-72.
Quinlan (1993); C4.5 Programs for Machine Learning. San Francisco: Morgan
Kaufmann.
Rodríguez M., Alvarez J., Mesa J., González A.; Metodologías para la realización de
proyectos de Data Mining; Ponencia presentada en el VII Congreso Internacional
de Ingeniería de Proyectos; Pamplona, España; (2003).
Sherman A., Sherman S., Russikoff L. (2008); Basic Concepts of Chemistry. Boston:
Houghton Miffilin Company.
70
Vargas, Z. (2009). La Investigación Aplicada: Una Forma de Conocer las
Realidades con Evidencia Científica. Revista EDUCACIÓN, vol. 33 (1): 155-
165; Universidad de Costa Rica. Disponible en:
http://redalyc.uaemex.mx/src/inicio/ArtPdfRed.jsp?iCve=44015082010.
Witten, H., Frank, E. (2000); Data Mining: Practical Machine Learning Tools and
Techniques with Java Implementation. Morgan Kaufmann.
71