Planta de Fraccionamiento de Aceite

UNIVERSIDAD NACIONAL ABIERTA
VICERRECTORADO ACADÉMICO
ÁREA DE INGENIERÍA
MINERÍA DE DATOS APLICADA A LA MEJORA DEL

FRACCIONAMIENTO DE ACEITE DE PALMA EN UNA PLANTA DE
PRODUCCIÓN
Trabajo presentado como requisito para optar a la categoría de

Profesor Agregado
Autor: Saibel Ramos Rojas
Febrero, 2011
RESUMEN
Este documento expone una experiencia de investigación aplicativa, cuyo propósito

fue determinar las mejoras en el proceso de fraccionamiento de aceite de palma en
una planta de producción basándose en la disciplina Minería de Datos. Para el
estudio se utilizó la metodología de proyectos de Minería de Datos CRISP-DM,
específicamente se aplicó la técnica de aprendizaje inductivo “árboles de decisión” a
fin de generar un modelo predictivo del comportamiento de las variables de interés en
las situaciones problemáticas observadas en el proceso de fraccionamiento de aceite
de palma en la planta caso de estudio. Los resultados de la aplicación del modelo
fueron muy satisfactorios, los mismos permitieron determinar e implementar los
controles para la toma de decisiones adecuada y las acciones pertinentes, a fin de
alcanzar los estándares de calidad buscados por la empresa en los productos finales
del proceso de fraccionamiento. Igualmente se dejan sentadas las bases para
próximos desarrollos de la aplicación de nuevas o diferentes técnicas de Minería de
Datos en este sector de la industria.
Palabras Clave: Fraccionamiento de Aceite de Palma, Minería de Datos, Modelos

Predictivos
ii
A mi madre Carmelita de Jesús...
Te amo.
iii
AGRADECIMIENTOS
Un sincero reconocimiento a mi familia, mis amigos, y muy especialmente al

personal del Consorcio Oleaginoso Portuguesa S.A.
Saibel Ramos
iv
INDICE GENERAL
Pág.
Índice de Figuras vi
Índice de Tablas vii
Introducción 1
Capítulo 1 Metodología y Objetivos de Investigación 8
1.1 Metodología de Investigación 8
1.2 Objetivos de Investigación 10
Capítulo 2 Dominio de Aplicación 13
2.1 Producción Industrial del Aceite de Palma 13
2.2 El Proceso de Fraccionamiento de Aceite de Palma 18
2.2.1 Principios Básicos 18
2.2.2 Descripción y Condiciones del Proceso 19
2.2.3 Control Automatizado del Proceso 26
2.2.4 Problemas de Calidad en el Proceso de
Fraccionamiento de Aceite de Palma 31
2.3 Hipótesis 36
Capítulo 3 Minería de Datos Aplicada al Proceso de Fraccionamiento
de Aceite de Palma 40
3.1 Metodología para la Minería de Datos 40
3.2 Técnicas de Minería de Datos Utilizadas para
Modelar la Solución 49
3.2.1 Árboles de Decisión para Clasificación 50
3.2.3 Algoritmo J48 52
Capítulo 4 Resultados y Discusión 55
Capítulo 5 Conclusiones y Futuros Desarrollos 63
Anexo A 66
Anexo B 67
Referencias 68
v
INDICE DE FIGURAS
Pág.
Figura 2.1 Productores a Nivel Mundial de Aceite de Palma

Periodo 2009 15
Figura 2.2 Fabricación Industrial de Grasas y Aceites Comestibles
derivados de la Palma Aceitera 17
Figura 2.3 Diagrama de Proceso de Fraccionamiento de Aceite de Palma 21
Figura 2.4 Supervisión y control desde el PLC de la Recepción del aceite
de palma y arranque del proceso de Fraccionamiento 29
Figura 2.5 Supervisión y control desde el PLC Fase de Acondicionamiento
y sistema de enfriamiento para la Cristalización 29
Figura 2.6 Supervisión y control desde el PLC Fase de Cristalización 30
Figura 2.7 Supervisión y control desde el PLC Fase de Filtrado 30
Figura 2.8 Supervisión y control desde el PLC Almacenamiento de la oleína 31
Figura 2.9 Intercambiador de calor y válvula proporcional 37
Figura 3.1 Fases del Modelo CRISP-DM 42
Figura 3.2 Ejemplo de Árbol de Decisión para Clasificación 52
Figura 4.1 Distribución de los datos en las variables predictoras
y en la variable dependiente 56
Figura 4.2 Modelo Predictivo del Proceso de Fraccionamiento
de Aceite de Palma 59
vi
INDICE DE TABLAS
Pág.
Tabla 2.1 Producción Mundial de Grasas y Aceites

Periodo 2001-2008 14
Tabla 3.1 Datamarts con datos seleccionados para el análisis
del proceso de fraccionamiento de aceite de palma 45
Tabla 3.2 Tratamiento de datos anómalos en el Datamarts 46
Tabla 3.3 Datamarts con datos preprocesados 46
Tabla 3.4 Datamarts con datos transformados 47
vii
INTRODUCCIÓN
La presente introducción realiza un recorrido sobre los orígenes, evolución y

aplicación de las técnicas de Minería de Datos en la industria, especificando la
minería de Datos como el dominio de conocimiento sobre el cual gira esta
investigación, y describiendo el propósito de este trabajo dentro de dicho dominio de
conocimiento.
El descubrimiento de nuevo conocimiento útil en las organizaciones, es impulsado

principalmente por la disponibilidad extraordinaria de grandes cantidades de datos
organizados en repositorios, además de la disponibilidad de potentes procesadores y
el desarrollo de técnicas de Minería de Datos (Data Mining), elementos que en
conjunto, permiten y hacen posible el análisis automático y adquisición de
conocimiento desde bases de datos. Con estas posibilidades se abre una nueva
dimensión en las mejoras que pueden introducirse en procesos industriales, debido a
la aplicación de técnicas de Minería de Datos en el desarrollo de modelos que
permiten comprender y describir mejor los datos a fin de predecir su comportamiento
futuro, orientando a la industria en la implementación de sistemas de control y una
toma de decisión más efectivos.
La Minería de Datos es concebida por algunos autores (Pérez y Santín, 2008),

como un proceso de descubrimiento de nuevas y significativas relaciones, patrones y
tendencias al examinar grandes cantidades de datos. Otros (Hernández, et al., 2004),
presentan una definición más clásica: proceso de extraer conocimiento útil y
comprensible, previamente desconocido, desde grandes cantidades de datos
almacenados en distintos formatos. Integrando ambas definiciones se coincide en que
la Minería de Datos implica fundamentalmente, descubrimiento de nuevo
conocimiento a partir de datos almacenados, para alcanzar una mejor comprensión de
los mismos y para predecir su comportamiento futuro.
1
Puede decirse que la Minería de Datos emerge en el escenario tecnológico cuando
suceden dos avances de manera simultánea, el primer avance lo constituye el uso
generalizado de herramientas informáticas de reconocimiento de patrones, como
redes neuronales, lógica difusa, algoritmos genéticos y otras técnicas avanzadas de
análisis de datos; el segundo avance representado por la disponibilidad de grandes
volúmenes de datos organizados en bases de datos. La concurrencia de estos eventos
transformó el proceso de análisis de datos, inicialmente orientado por un proceso
disgregado de análisis estadístico para obtener información, hacia un proceso
inteligente de análisis de los datos orientado al descubrimiento de patrones, perfiles y
tendencias en los datos para adquirir conocimiento.
No obstante la descripción anterior sobre el surgimiento de la minería de datos,

cabe señalar que según (Pérez y Santín, 2008), la Minería de Datos es ya un concepto
muy evolucionado que necesita ser aproximado conceptualmente por etapas:
inicialmente los sistemas de información para la gestión, daban soporte informático a
los procesos básicos de la organización; luego con la exigencia de nuevas
prestaciones, nacen los sistemas de información para la toma de decisiones
acompañados del surgimiento de las herramientas OLAP (On-Line Analytical
Processing), estas herramientas OLAP que proporcionan facilidades para manejar y
transformar los datos, producen otros datos (más agregados, combinados) y producen
diferentes vistas de los mismos. En paralelo evolucionan los sistemas de consulta en
bases de datos relacionales y las herramientas de minería de datos, estas últimas
analizan los datos, mientras que el resto de las herramientas citadas anteriormente
facilitan el acceso a la información, es decir, son instrumentos de apoyo a la Minería
de Datos.
Estos autores también coinciden en reconocer al proceso de Minería de Datos

como una fase de un proceso más amplio llamado Descubrimiento de Conocimiento
en Bases de Datos (KDD), el cual lo definen como “la extracción no trivial de
información implícita, desconocida, y potencialmente útil de los datos”, además,
concuerdan en que la Minería de Datos es la fase del KDD donde se decide, en
2
función del problema que se quiere resolver, cuál es la tarea a realizar, además, es la
fase donde se elige la técnica descriptiva o predictiva que se va a utilizar para
modelar la solución a dicha tarea. Es tal el auge y los avances que en cuestión de
Minería de Datos se han desarrollado que actualmente es sinónimo de KDD y se han
desarrollado metodologías específicas para realizar proyectos de Minería de Datos,
tales como: CRISP-DM [Chapman et al. (2000)], SEMMA [SAS (1998)], CRITIKAL
y 5A`s [Martínez de Pisón y Ordieres (2005)].
Ahora bien, se observan algunas tendencias actuales que ha tomado el KDD, sobre
todo con la llegada de la Web Semántica, los Sistemas de Bases de Datos
Heterogéneas (SBDH), y con la entrada al mercado de los sistemas (software) de
minería de datos. Según Pérez del Rey (2007), el descubrimiento de nuevo
conocimiento impulsa, por tanto, la investigación en métodos avanzados de
búsqueda, integración y procesamiento de información, en este sentido, para facilitar
el proceso KDD, los investigadores están trabajando con una de las últimas
evoluciones de la World Wide Web (WWW), denominada Web Semántica, y con
ontologías que facilitan el entendimiento del dominio y suministran un soporte de
conocimiento formal. Estas nuevas herramientas tienden a permitir el acceso a
grandes cantidades de datos, situados en distintos lugares, con múltiples formatos,
contextos, plataformas y también con diferentes semánticas.
En el contexto de las empresas, Gallardo (2009), explica que en años recientes se

ha dado inicio al desarrollo de una cantidad importante de proyectos de Minería de
Datos, y diversos estudios estiman que esta cantidad se incrementará en el futuro
inmediato. Las razones que estimulan este crecimiento considera este autor, son
numerosas y pueden resumirse como sigue: fundamentalmente, la gran cantidad de
datos que se generan y almacenan a diario en las bases de datos de las organizaciones;
la imposibilidad de procesar y analizar estos grandes volúmenes de datos mediante
métodos clásicos de análisis de datos y la necesidad de las empresas de descubrir en
dichos datos, patrones, relaciones, reglas o asociaciones útiles, que aporten
información relevante o conocimiento para el proceso de toma de decisiones.
3
Teniendo en cuenta adicionalmente la opinión de González (2007), en la mayoría de
los procesos industriales las relaciones entre variables no son lineales y esta
característica deriva en la dificultad de obtener modelos explícitos que definan su
comportamiento, por esta razón se comprende la importancia de los modelos basados
en datos, frente a otros modelos analíticos basados en ecuaciones explícitas.
Asimismo, el escenario del rápido crecimiento en la capacidad para almacenar

datos generados por los procesos industriales en la actualidad junto al desarrollo de
los procesadores, proporciona nuevas posibilidades para analizar el comportamiento
de estos datos. Un ejemplo de estas posibilidades es la aplicación de técnicas de
Minería de Datos para el modelado de soluciones automatizadas que definen de
forma explícita el comportamiento de estos datos (González, 2007). De igual manera,
trabajos previos orientados al campo de la minería de datos y su aplicación en la
fabricación industrial de productos [Martínez de Pisón, (2003a); Barreto, (2009)],
indican la existencia de grandes volúmenes de datos derivados de estos procesos
industriales y la necesidad e importancia de desarrollar técnicas robustas de Minería
de Datos para su análisis automático y adquisición de conocimiento.
Considerando los hallazgos referidos por los trabajos mencionados, puede decirse
que la aplicación de Minería de Datos trae grandes mejoras para la industria, pues se
comprende que al tener procesos industriales que alimentan bases de datos
informatizadas con información histórica, es decir representan transacciones o
situaciones que se han producido, útil para predecir información futura, la industria
obtenga ventajas competitivas al aplicar estas técnicas. Dichas ventajas se derivan de
resolver la problemática del análisis de grandes volúmenes de datos de mucha
variedad, igualmente de la posibilidad de obtener modelos y patrones tanto
predictivos como descriptivos comprensibles y útiles para la toma de decisiones en
las fases críticas de la cadena de producción, así como en el diseño e implantación de
sistemas de control más efectivos.
4
Dadas estas situaciones de constante y rápido crecimiento en los reservorios de
datos en las industrias y las posibilidades que se presentan con los avances
tecnológicos para su tratamiento automático, este trabajo de investigación se enmarca
en el área de la informática –en el proceso de Descubrimiento de Conocimiento en
Bases de Datos (KDD) como dominio de conocimiento, estudiando y aplicando
tareas y técnicas actuales empleadas en su fase Minería de Datos-, además, se
enmarca en el área de los procesos industriales de fabricación de alimentos, como
dominio de aplicación, específicamente en el proceso industrial de Fraccionamiento
de Aceite de Palma, el cual forma parte de la cadena de producción de grasas y
aceites comestibles extraídos del fruto de la especie arborícola Palma Aceitera.
Durante la investigación se abordó inicialmente, el análisis exhaustivo, sistemático

e integrado del dominio de conocimiento y el dominio de aplicación en los que se
enmarca dicha investigación. Adicionalmente, se ejecutaron las fases de un proyecto
de Minería de Datos como guía en la construcción de un modelo predictivo que
generó el conocimiento en situaciones problemáticas presentadas durante el proceso
de fraccionamiento de aceite de palma, y en base al modelo mencionado se
implementaron mejoras, brindando el aseguramiento de la calidad de los productos
derivados de este proceso. De esta manera, los resultados de este estudio revisten
gran importancia, ya que la obtención de los objetivos propuestos contribuyen a la
investigación, al desarrollo incremental e innovación (I+D+I) en la industria de
fabricación de aceites comestibles.
El trabajo presentado en este documento está estructurado como sigue: El

Capítulo 1 Metodología y Objetivos de Investigación, donde se describe el tipo de
investigación realizada según su propósito y los pasos metodológicos para llevarla a
cabo, al mismo tiempo presenta la formulación de objetivos general y específicos que
guiaron el desarrollo de la misma. El Capítulo 2 titulado Dominio de Aplicación,
presenta los hallazgos de la exploración realizada en el proceso de Fraccionamiento
del Aceite de Palma. El Capítulo 3, Minería de Datos Aplicada al Proceso de
Fraccionamiento de Aceite de Palma, describe las fases de un proyecto de Minería de
5
Datos, aplicado en el ámbito del problema dentro de la planta caso de estudio. El
Capítulo 4, denominado Resultados y Discusión, muestra los resultados de la
aplicación de las técnicas de minería de datos al problema y en él se proponen las
mejoras al proceso de fraccionamiento de aceite de palma. Finalmente en el Capítulo
5, Conclusiones y Futuros Desarrollos, se desarrollan las conclusiones que se han
obtenido en función de los objetivos formulados al inicio del trabajo; se presenta su
impacto, alcance e importancia, y cuáles hallazgos resultantes de esta investigación
pueden ser objeto de futuros desarrollos.
6
7
Capítulo 1 Metodología y Objetivos de
Investigación
1.1. Metodología de Investigación
El presente estudio se caracteriza por ser una investigación de tipo aplicativa.

Murillo (citado por Vargas, 2009), manifiesta que la investigación aplicada se
caracteriza porque busca la aplicación o utilización de los conocimientos adquiridos,
a la vez que se adquieren otros, después de implementar y sistematizar la práctica
basada en investigación.
Para Padrón (2006), la investigación aplicada hace referencia, en general, a aquel

tipo de estudios científicos orientados a resolver problemas de la vida cotidiana o a
controlar situaciones prácticas, haciendo dos distinciones: a) La investigación que
incluye cualquier esfuerzo sistemático y socializado para resolver problemas o
intervenir situaciones. En ese sentido, se concibe como investigación aplicada tanto
la innovación técnica, artesanal e industrial como la propiamente científica; b) La
investigación que sólo considera los estudios que explotan teorías científicas
previamente validadas, para la solución de problemas prácticos y el control de
situaciones de la vida cotidiana.
Adicionalmente, Vargas (2009) concreta que en ambas distinciones se observa que

la idea de fondo está en las relaciones de utilidad del conocimiento, para resolver
problemas e intervenir situaciones concretas, minimizando las fronteras entre la teoría
y lo aplicativo, propugnando una vinculación inseparable entre el “saber y el hacer”,
pretendiendo que toda investigación teórica se enfoque en sus aplicaciones. Debido a
su misma naturaleza, el concepto de „problema de investigación’ es diferente.
Mientras en los otros enfoques de investigación el problema es de orden cognitivo, en
ellas es de orden práctico, ya que se trata de una situación dada o deficitaria que
puede ser mejorada. No obstante, la investigación aplicada se encuentra
estrechamente vinculada con la investigación básica, pues depende de los principios
científicos de esta última para su ejecución.
El trabajo de investigación aplicativa que aquí se presenta, se basa en un dominio

de conocimiento y un dominio de aplicación, los cuales se detallan en capítulos
posteriores de este documento. A lo largo de este documento puede observarse la
utilidad de las teorías y métodos del proceso de Minería de Datos, el cual sería el
dominio de conocimiento, para resolver situaciones problemáticas del
fraccionamiento de aceite de palma en el contexto de su producción industrial, lo que
constituyó el dominio de aplicación, e intervenir en esas situaciones concretas de
deficiencias para mejorarlas.
Ahora bien, según Padrón (2006), una investigación aplicada comprende, en

principio, los siguientes pasos:
1. Partir de una situación problemática que requiere ser intervenida y

mejorada. Se debe describir sistemáticamente esa situación problema, de
manera que se justifique con criterios relevantes su orden práctico.
2. Seleccionar una teoría, para luego exponerla en sus conceptos centrales y

en sus rasgos contextuales.
3. Examinar la situación “problema” a la luz de la teoría seleccionada, de ésta

se deriva un prototipo de acción, con el cual se busca resolver
favorablemente la situación “problema”. Obviamente en él se contempla la
descripción sistemática con sus secuencias e instrumentaciones pues
9
resultará ser el método y/o un modelo a emplear y comprobar en este
proceso práctico aplicado.
4. Ensayar y probar el prototipo descrito como paso 3, para determinar la

probabilidad que tiene el modelo aplicativo para resolver la situación
problema.
Luego de estos pasos, se requiere analizar la práctica investigativa, detallando los

resultados obtenidos y relevando las consecuencias prácticas de los hallazgos de la
investigación para su aplicación inmediata o futura.
Basándose en estas definiciones y estructura de pasos descritos, se reitera el

carácter aplicativo de este estudio porque el mismo constituyó una experiencia de
investigación con el propósito de resolver o mejorar una situación específica o
particular, para comprobar un método o modelo de Minería de Datos, mediante la
aplicación innovadora y creativa de una propuesta de intervención, para este caso, en
una planta de producción de grasas y aceites comestibles.
1.2. Objetivos de Investigación
1.2.1. Objetivo General
Mejorar el proceso de Fraccionamiento de Aceite de Palma en una planta de

producción de grasas y aceites comestibles mediante la aplicación de técnicas de
Minería de Datos.
1.2.2. Objetivos Específicos
10
Estudiar el proceso de Fraccionamiento de Aceite de Palma y las situaciones
problemáticas de dicho proceso en la planta caso de estudio, en el contexto de la
producción industrial de grasas y aceites comestibles.
Estudiar la teoría, los métodos y técnicas de Minería de Datos aplicados

actualmente a casos de la industria.
Construir una vista minable (conjunto de datos de entrenamiento) con los

datos de variables que intervienen en el proceso de Fraccionamiento de Aceite de
Palma en la planta caso de estudio.
Generar un modelo predictivo del comportamiento de los datos, aplicando al

conjunto de datos de entrenamiento, la técnica de Minería de Datos más apropiada
para la tarea de adquisición de conocimiento que se desea resolver.
Validar la precisión del modelo predictivo mediante un conjunto de datos de

prueba.
Analizar los resultados de la aplicación del modelo predictivo, mediante el uso

de herramientas de visualización.
Proponer la implementación de controles y mejoras en el proceso de

Fraccionamiento de Aceite de Palma, en base al conocimiento adquirido.
11
12
Capítulo 2 Dominio de Aplicación
Este capítulo corresponde al primer paso de la investigación descrito por Padrón

(2006): partir de una situación problemática que requiere ser intervenida y mejorada,
describiendo sistemáticamente dicha situación problema, de manera que se justifique
con criterios relevantes su orden práctico. Inicialmente el capítulo introduce una
reseña sobre la producción industrial del aceite de palma. Luego se enfoca en la
descripción detallada del dominio de aplicación de la investigación, específicamente
el proceso de fraccionamiento de aceite de palma; se explican sus principios básicos y
etapas que lo componen; las condiciones bajo las que se ejecuta la línea de
producción; el control automatizado del proceso de fraccionamiento basado en un
sistema SCADA (sistema de supervisión, control y adquisición de datos); finalmente
se describen las situaciones problema observadas en el proceso, así como también se
presentan algunas formulaciones de hipótesis en esta investigación.
2.1. Producción Industrial del Aceite de Palma
El aceite de palma se ha usado en la preparación de comida durante más de 5.000

años. Hoy se consume mundialmente como un aceite de cocción, en forma de
margarina y aceite de reducción. También se usa como un ingrediente en las mezclas
de grasa y una inmensa serie de productos de comida. Importantes investigaciones
científicas como las publicadas por Malaysian Palm Oil Board (MPOB) del Palm Oil
Research Institute of Malaysia (PORIM), [Mohd et al. (2005), Nor Aini et al. (2002),
Kalyana Sundram (1996)] han confirmado la fuerte tendencia mundial dirigida a
incorporar el aceite de palma dentro de la gama de grasas y aceites comestibles
fabricados industrialmente, con el fin de fabricar productos libres de ácidos grasos
saturados.
Las indagaciones realizadas en este trabajo, indican que el cultivo de la palma de

aceite se ha extendido tremendamente en los recientes años tal que es secundado
ahora sólo por el de grano de soya, como una fuente mayor del suministro mundial de
aceites y grasas (Mohd et al., 2005). Actualmente, el Sudeste de Asia es la región
dominante de producción con Indonesia y Malasia como principales productores y
exportadores de aceite de la palma. Según el Consorcio Oleaginoso Portuguesa S.A.
(2008), cada vez se suman más naciones, Perú, Ecuador, Colombia, Norte de Brasil,
Panamá, Costa Rica, Honduras, Salvador, Nicaragua, Guatemala y República
Dominicana, Indonesia, Malasia, entre otros, que tienen la ventaja de poder cultivar y
procesar la palma aceitera, convirtiéndose algunas de estas naciones no solo en países
productores, sino también en exportadores importantes sobre todo para Europa,
México, Canadá y actualmente para Estados Unidos de América. Sobresalen entre los
países exportadores Colombia, Ecuador y Guatemala (ver tabla 2.1 y figura 2.1).
Actualmente la línea de producción de grasas y aceites comestibles derivados de la

palma aceitera, implica cuatro grandes procesos tecnificados que siguen una línea de
ejecución como la mostrada en la figura 2.3.
Tabla 2.1: Producción Mundial de Grasas y Aceites (periodo 2001-2008)

Fuente: Malaysian Palm Oil Board (MPOB)
14
Figura 2.1: Productores a Nivel Mundial de Aceite de Palma (periodo 2009)
Fuente: Malaysian Palm Oil Board (MPOB)
Ahora bien, esta tendencia mundial de producir aceites y grasas comestibles

derivados del aceite de palma, indudablemente puede estar impulsada por la
conjugación de factores de calidad alimenticia y de salud en la dieta humana de este
aceite, sumado a otras ventajas económicas y de diversificación para la industria,
mencionadas a continuación.
En principio, aspectos científicos encontrados en estudios, describen las calidades

nutritivas del aceite de la palma como un componente saludable de la dieta humana,
asimismo, estas investigaciones demuestran que a pesar de su grado de saturación, el
aceite de palma por ser un producto vegetal, que no ha sufrido transformaciones
genéticas, es asimilado sin problema, convirtiendo parte de él en colesterol bueno,
necesario para el funcionamiento del organismo humano (Kalyana Sundram, 1996).
Por su grado de saturación el aceite de palma no necesita ser hidrogenado

artificialmente para llegar a la saturación requerida por los fabricantes para la
producción de margarinas y mantecas de consumo humano. La obtención de
productos libres de hidrogenados es una de las principales razones por las que la
15
industria de grasas y aceites comestibles ha decidido procesar el aceite de palma, pues
su conformación molecular permite extraer los componentes con la textura adecuada
para la producción de margarinas y mantecas, sin necesidad de realizar un proceso de
hidrogenación1.
Por otro lado, los aceites naturales y grasas pueden necesitar ser modificados para
satisfacer la formulación de un producto particular en el mercado de consumo
humano, es este caso mezclar es el método más simple para modificar aceites y
grasas. Una gama amplia de productos puede derivarse de las frutas de la palma,
incluso el aceite de la palma, oleína de la palma, estearina de la palma, y sus
derivados. Éstos pueden mezclarse fácilmente con otros aceites comerciales y grasas
para varias aplicaciones de comida, extendiendo de esta manera el rango de
aplicación de aceites y grasas comestibles (Nor Aini et al., 2002).
Según el Consorcio Oleaginoso Portuguesa S.A. (2008), la hidrogenación

necesaria para procesar otros tipos de aceite como los poli insaturados, que
generalmente tienen los precios más altos del mercado, se sustituye en el caso del
aceite de palma por un proceso de fraccionamiento, obteniéndose dos productos, la
oleína (parte líquida) y la estearina (parte sólida); la oleína es muy importante para las
mezclas con otros aceites vegetales, como el aceite de soya, y derivar productos más
resistentes a los factores de solidificación que sufre éste último en las zonas
tropicales; por su lado la estearina, es la base para la fabricación de margarinas y una
gran variedad de otros productos industriales.
Actualmente la línea de producción de grasas y aceites comestibles derivados de la

palma aceitera, implica cuatro grandes procesos tecnificados que siguen una línea de
ejecución como la mostrada en la figura 2.2.
1
Proceso que consiste en tratar el aceite con gas hidrógeno, en presencia de un catalizador, con el fin
de incrementar el contenido de sólidos y/o mejorar su estabilidad térmica u oxidativa (DE SMET
Process & Technology, INC, 2005).
16
Aceite de Palma Crudo
Refinamiento
Aceite de Palma Refinado
Blanqueamiento
Aceite de Palma Refinado y Blanqueado
Desodorización
Aceite de Palma Refinado, Desodorizado

y Blanqueado (RBD)
Fraccionamiento
Oleína pura lista para envasado Estearina para utilizarse

en mezclas
Figura 2.2 Fabricación Industrial de Grasas y Aceites Comestibles derivados de la Palma

Aceitera. Fuente: La autora.
A grandes rasgos, los tres primeros procesos, Refinamiento, Blanqueamiento y

Desodorización, purifican el aceite crudo de palma al aplicarle diversos métodos y
tecnologías, liberándolo de materias extrañas a los glicéridos neutros tales como,
humedad, ácidos grasos libres (AGL) y materias colorantes y odorantes, que
naturalmente contiene el aceite crudo. En esta línea de producción, el proceso de
Fraccionamiento, recibe el aceite de palma libre de impurezas, color y olor, para
someterlo a una separación física de sus glicéridos sólidos (estearina) y líquidos
(oleína).
17
2.2. El Proceso de Fraccionamiento de Aceite de Palma
2.2.1. Principios Básicos
La mayoría de los aceites y grasas crudos, no pueden ser usados como

componentes en los productos alimenticios sin haber recibido antes un tratamiento
físico o químico. Según DE SMET Process & Technology, INC (2005), los procesos
usados para este propósito, pertenecen a dos categorías:
Refinación: en esta categoría se incluyen el desgomado, el neutralizado, el

blanqueado y el desodorizado. La refinación es necesaria para eliminar o reducir lo
más posible los contaminantes presentes en el aceite crudo, que puedan afectar la
operación de los procesos de modificación e influir en la calidad del producto final.
Modificación: entre los procesos que modifican los aceites y grasas, se

encuentran la hidrogenación, el fraccionamiento o la interesterificación.
Los procesos de hidrogenación e interesterificación amplían el rango de

aplicación de los aceites y las grasas, y en algunos casos, incrementan su resistencia a
la oxidación, produciendo cambios en las características al reordenar los ácidos
grasos en las moléculas de los triglicéridos. De cualquier forma, ambos procesos de
modificación entrañan una transformación química irreversible de la composición, la
cual en menor grado, favorece alguna reacción indeseable como la isomerización2.
Es de especial interés, el problema derivado de la hidrogenación, pues el resultado

de este proceso son aceites saturados artificialmente con hidrogeno, produciéndose lo
que se conoce como trans-isómeros, los cuales incrementan el colesterol malo en los
2
Se define isomerización como el proceso químico mediante el cual una molécula es transformada en
otra que posee los mismos átomos pero dispuestos de forma distinta. De este modo, se dice que la
primera molécula es un isómero de la segunda, y viceversa (Sherman et. al, 1995).
18
humanos, pues el organismo no los elimina debido a su configuración molecular,
convirtiéndose estos elementos en pre cancerígenos (Gurr M., 1996).
Contrariamente a la hidrogenación y la interesterificación, el fraccionamiento no

somete al aceite a ninguna modificación química, quedando descartado el problema
de la saturación artificial con hidrógeno. Consiste en la separación termomecánica
donde los triglicéridos de alto y bajo punto de fusión son separados por cristalización
parcial, seguida de un filtrado. El fraccionamiento es el más puro proceso de
modificación de los aceites y grasas, al ser básicamente un proceso reversible de
separación física (DE SMET Process & Technology, INC, 2005).
El dominio de aplicación de este estudio, se centra específicamente en el proceso

de Fraccionamiento del Aceite de Palma que ya ha sido previamente refinado,
blanqueado y desodorizado. El fraccionamiento del aceite de palma, es entendido
como la separación mecánica de los sólidos y líquidos contenidos en este aceite,
mediante un fenómeno físico de cristalización. El objetivo de someter el aceite de
palma a un proceso de fraccionamiento es obtener productos más saludables para la
producción de grasas y aceites comestibles, mediante la obtención de derivados no
hidrogenados a base de este aceite. Estos productos son la oleína (líquida) y la
estearina (sólida), los cuales están libres de hidrogenados, es decir, para obtener estos
productos, el aceite de palma es fraccionado, sin necesidad de exponerlo a un proceso
artificial de saturación con hidrógeno. En este orden de ideas, en el próximo apartado
se describe detalladamente este proceso.
2.2.2. Descripción y Condiciones del Proceso
DE SMET Process & Technology, INC (2005), indica tres métodos aplicados en la
industria de aceites comestibles para realizar el fraccionamiento: Fraccionamiento en
19
fase seca, Fraccionamiento en fase solvente (hexano, acetona u otro) y
Fraccionamiento con detergente que implica el uso de aditivos.
El fraccionamiento seco es el método más extensamente utilizado y es

precisamente en el que se centra esta investigación, por ser el método adoptado en la
planta caso de estudio. Es empleado para separar los triglicéridos sólidos de los
líquidos en numerosos tipos de grasas tanto vegetales como de origen animal y se
realiza generalmente en tres etapas:
Acondicionamiento; acondiciona el aceite de palma homogeneizándolo y

aumentando su temperatura que se inicia entre los 45° C y los 50° C hasta llegar y
mantenerse en una temperatura de 68° C y 70° C.
Cristalización por enfriamiento; se forman núcleos de cristalización en el aceite de

palma por enfriamiento progresivo siguiendo una fórmula preestablecida que lleva las
temperaturas del aceite gradualmente y de forma controlada hasta los 18° C ó 20° C.
Filtración o separación de las oleínas por filtrado; extrae la parte líquida de la

sólida que previamente se han separado durante el cristalizado.
A continuación se detallan las condiciones necesarias en cada etapa, presentes en

las instalaciones de la planta de fraccionamiento de aceite de palma donde se realizó
este estudio (vea la figura 2.3):
20
Etapa de
Acondicionamiento
Etapa de
Cristalización
Etapa de
Filtración
Figura 2.3 Diagrama de Proceso de Fraccionamiento de Aceite de Palma.

Fuente: Proyecto instalación de planta de fraccionamiento de aceite de palma (Consorcio Oleaginoso
Portuguesa S.A., 2008).
21
Etapa de Acondicionamiento.
Incluso cuando la planta procese aceites refinados, el aceite ha de ser mantenido en

tanques de almacenamiento provistos de agitador para impedir que se produzca un
inicio de cristalización y asegurar una alimentación homogénea de la planta, la
temperatura de almacenamiento debe oscilar entre 45° C y 50° C para el aceite de
palma, unos 5°C a 10° C por encima de su punto de fusión. Para el caso de estudio,
este paso se realiza en el tanque receptor de aceite de palma TK1900 (ver figura 2.3).
En este punto es importante explicar que los aceites y las grasas son mezclas de
triglicéridos, los cuales a causa de su diferente composición en ácidos grasos, tienen
su punto de fusión en un rango que abarca de 50° C a los 80° C, y este punto es
específico para cada aceite. Para el caso del aceite de palma, el punto de fusión está
entre los 36° C y los 38° C, cabe aclarar la característica de uno de sus ácidos grasos
que lo componen, el tripalmítico, el cual tiene un punto de fusión de 68° C a 70° C.
Con el objeto de fundir los cristales residuales de lotes anteriores, además de

conseguir el punto de fusión del tripalmítico contenido en el aceite de palma, antes de
pasar a la etapa de cristalización, el aceite debe llevarse a una temperatura entre los
68° C y los 70° C, en el caso de refraccionamiento de oleínas de palma con 65° C es
suficiente. Para llevar el aceite a esta temperatura, el sistema utiliza un
intercambiador de placas (F1021A en la figura 2.3), esta unidad calienta el aceite
haciéndolo pasar entre placas que contienen vapor para luego depositarlo en el tanque
pulmón TK1901 (ver figura 2.3). Este tanque pulmón tiene una capacidad para un
proceso de 6 horas y durante este tiempo, el aceite recircula mediante una bomba,
mientras la masa de aceite se mantiene en agitación constante por la acción de un
agitador interno en el tanque, consiguiendo de esta manera su homogeneización. En
el tanque TK1901 debe regularse constantemente el nivel de temperatura, para ello
este tanque está equipado con sensores de temperatura, serpentín interno y un sistema
de control o válvula proporcional (ver figura 2.3). Cuando la temperatura de la masa
22
de aceite contenida en el tanque TK1901, está por debajo de los 70° C, el serpentín
interno calienta con vapor, en el caso de sobrepasar los 70° C, la válvula proporcional
detiene la acción del intercambiador de placas, estabilizando la temperatura requerida
para la cristalización.
Una vez que ha transcurrido el tiempo de homogeneización y la temperatura del

aceite se estabiliza entre 68° C y los 70° C, está en condiciones (acondicionado) para
ser cristalizado en la siguiente etapa del fraccionamiento.
Etapa de Cristalización.
Como se describió anteriormente, en esta etapa se forman núcleos de cristalización

en el aceite por enfriamiento progresivo, siguiendo una curva preestablecida que lleva
las temperaturas del aceite gradualmente y de forma controlada hasta alcanzar los 18°
C ó 20° C, temperatura de filtrado.
Las condiciones de enfriamiento durante el proceso determinarán el número inicial

de núcleos y el tamaño de los cristales. Se acepta que dicho tamaño influye en la
facilidad de separación, y por consiguiente, en una mayor extracción de oleína y una
mejor calidad de estearina. Pero más importante que el tamaño de los cristales son la
uniformidad, su estructura y su tenacidad (resistance to mechanical stress); esto
requiere una cristalización selectiva y controlada desde el principio.
Es así como la uniformidad en tamaño y estabilidad de los cristales, determinan el

grado de filtración y la extracción de la fase fluida (oleína). Por esto durante la
segunda etapa del fraccionamiento, la velocidad de enfriamiento de la masa de aceite
y la uniformidad del mismo son indudablemente los factores más importantes que se
han de tener en cuenta para asegurar la formación de una fase sólida, filtrable y
diferenciada. Es decir, para extraer unos cristales estables y uniformes, debe
asegurarse una curva de enfriamiento perfectamente controlada, sin incrementos de
temperatura indeseables.
23
El punto crucial en el fraccionamiento seco es la selectividad de la cristalización,
la cual es determinada por las condiciones térmicas y más específicamente por las
características de enfriamiento. Los triglicéridos, principales constituyentes de los
aceites y grasas, se caracterizan por un complejo comportamiento en la fusión y en la
cristalización debido a la existencia de múltiples formas cristalinas en los triglicéridos
y a sus propiedades físicas específicas.
Se pueden formar cristales α, β´ y β la estabilidad del cristal aumenta en ese orden,

es decir, el grado de cristalización del tipo α, es mayor que el del β´, que a su vez es
mayor que el β. Si el enfriamiento se realiza demasiado rápido se produce la α
cristalización obteniéndose un magma de cristales diminutos. La forma β es muy
difícil de obtener pues requiere de un largo tiempo de enfriamiento y sólo aparece en
algunos casos excepcionales como es el caso de la manteca de cacao. Con el fin de
obtener una buena separación de los triglicéridos líquidos de los sólidos, los cristales
deben ser de un tamaño determinado y siempre de una forma esférica y uniforme,
condición que debe cumplirse cuando se encuentran en la forma β´.
Durante la etapa de cristalización, los cristalizadores (tanques TK1902 y

TK1903), reciben cargas de aceite medidas desde el tanque pulmón TK1901, a
intervalos fijos (ver figura 2.3). Para comenzar esta etapa se requiere tener en el
tanque cristalizador una cantidad mínima de 25 toneladas de aceite acondicionado y
el ciclo de cristalización siempre se completa en un intervalo fijo de tiempo.
Los tanques cristalizadores tienen una gran superficie de enfriamiento (doble

camisa) y están equipados con agitadores que mantienen el aceite cerca de la
superficie de enfriamiento, están diseñados para asegurar la homogeneidad máxima
del producto y un alto intercambio de calor durante la totalidad del proceso (ver
figura 2.6), que supone las siguientes ventajas: alta capacidad de enfriamiento y por
tanto un completo control de la temperatura del aceite; ausencia de aumentos
indeseables de temperatura durante la cristalización; posibilidad de intervención sobre
24
el tamaño y textura de los cristales; la cristalización se obtiene en un intervalo de
tiempo fijo y limitado; posibilidad de cristalización en un tiempo corto.
Cada cristalizador también está equipado con un sistema de circulación de agua

utilizado para obtener la curva de enfriamiento; este sistema consta de tres circuitos,
cada uno conectado a un tanque, y cada tanque contiene un tipo de agua: agua
caliente (60° C a 70° C), agua ambiente (25° C a 27° C) y agua fría (8° C a 6° C).
Otras unidades que se suman a este sistema son, válvulas de entrada y salida de
aceite, diferentes válvulas para entrada y salida de agua, y un eyector de vapor para el
calentamiento del agua (ver figura 2.5).
Etapa de Filtración.
Luego de transcurrida la etapa de cristalización, el aceite cristalizado es

almacenado en el tanque TK1904 con una capacidad de 50 toneladas y el cual tiene
igualmente una chaqueta para mantener la temperatura del aceite en 18° C ó 20° C
(temperatura de filtrado). Desde este tanque el aceite es bombeado fuera del
cristalizador al filtro prensa de membrana con una bomba volumétrica rotativa de
bajas revoluciones (ver figura 2.3). El aceite cristalizado es alimentado al interior de
todas las cámaras donde la oleína fluye a través de las lonas que cubren cada placa de
membrana. Las cámaras de filtración se componen de dos membranas sustentadas
por el marco de la placa filtrante. La torta de estearina es prensada por aplicación
progresiva de presión en el reverso de las placas mediante aire comprimido, para
sacar el último contenido de fracción oleica. La fracción esteárica se retiene entre las
lonas de las placas de filtración (ver figura 2.7).
Después del prensado de la torta, el interior de las cámaras filtrantes es soplado

con aire, a efectos de limpieza para el próximo ciclo. Similarmente el conducto de
oleína es soplado desde su parte superior para forzar la salida de todo el aceite
remanente posible. Es aquí donde se despresuriza la prensa y se abre
automáticamente para que caiga la torta de estearina, la cual es almacenada en el
tanque de fusión TK1907 (ver figura 2.3). Para fundir la torta de estearina fría, esta
25
recircula atravesando un intercambiador de placas y retorna al interior del tanque de
fusión. Un serpentín de vapor está instalado en el tanque de fusión para el
calentamiento de la primera estearina en el arranque, cuando hay suficiente estearina
líquida, este sistema de calentamiento de vapor se cierra.
Durante la filtración y el prensado el aceite que fluye a través de las lonas es

recogido en el tanque colector de oleínas TK1905, desde aquí es bombeado fuera de
la instalación, después de ser calentado a la temperatura de almacenamiento.
También se utiliza un tanque TK1906 para almacenar la oleína de lavado del filtro
prensa de membrana, la cual es reciclada una vez terminada la limpieza (ver figuras
2.3 y 2.8).
2.2.3. Control Automatizado del Proceso
La supervisión y control de la operación de la planta de fraccionamiento caso de

estudio, se encuentra totalmente basado en un sistema SCADA (Supervisory Control
and Data Acquisition), definido por Barreto (2009) como un sistema que permite
supervisar una planta o proceso por medio de una estación central que hace de Master
(llamada también estación maestra o unidad terminal maestra MTU) y una o varias
unidades remotas (Remote Terminal Unit, RTU), por medio de los cuales se hace el
control/adquisición de datos.
Estos sistemas de supervisión y control, son descritos por Barreto (2009) como
sistemas que están constituidos por un computador central, conectado físicamente a
los dispositivos de adquisición de datos; el flujo de la información es como sigue: un
fenómeno físico (presión, temperatura, flujo, el disparo de un interruptor, exceso de
presión en una tubería, nivel de un tanque, etc.), es captado por un sensor, el cual
alimenta una señal eléctrica a un transmisor para que éste entregue una señal análoga
también eléctrica normalizada (0 a 5 V DC o desde 0 a 10 V DC) hacia un PLC
26
(Programmable Logic Controller) o RTU. Dependiendo del caso, el transmisor
además proveerá aislamiento eléctrico y filtraje con el objeto de reducir posibles
ruidos. Una vez que los datos llegan al computador central, se los almacena para su
análisis, generación de históricos y para la toma de decisiones. Basado en la
información, el operador puede tomar decisiones que pueden modificar el trabajo del
proceso supervisado, las que en general están sujetas a normas emitidas muchas veces
por el mismo equipo. El operador comanda al ordenador y este obedece enviando un
dato que al final llegará a un actuador (bobina, un relee, servomotor) que al mover un
elemento final logran controlar la variable bajo supervisión o control.
En esencia, un SCADA, capta el estado del sistema a través de los elementos

sensores e informa al usuario a través de las herramientas de visualización.
Basándose en los comandos ejecutados por el usuario, el sistema de proceso inicia las
acciones pertinentes para mantener el control del sistema a través de los elementos
actuadores (por ejemplo, las bombas, los eyectores de vapor, las válvulas, entre
otros). Adicionalmente, los SCADA permiten opciones como: posibilidad de crear
paneles de alarma, que exigen la presencia del operador para reconocer una parada o
situación de alarma, con registro de incidencias; generación de históricos de la planta,
que pueden ser volcados para su proceso en una hoja de cálculo o archivo de formato
similar; creación de informes, avisos y documentación en general; ejecución de
programas que modifican el control.
La automatización en la planta de fraccionamiento caso de estudio, tiene como

objetivo supervisar y controlar la operación total de la planta. El sistema
automatizado está basado en un control durante la operación normal de los
parámetros de proceso, procesamiento de los datos principales por un PLC, acción
sobre las variables requeridas, y ajuste de los parámetros de proceso. En este caso, la
planta puede ser programada para que arranque y pare según las horas de trabajo
necesarias.
27
En la planta de fraccionamiento de aceite de palma, se utilizan diferentes tipos de
sensores para el control de distintas variables de interés. En el caso de los tanques
receptores y tanque pulmón, se utilizan sensores para la medición de la temperatura,
el nivel de llenado del tanque o volumen de aceite contenido; en el caso del filtro
prensa de membrana, se utilizan sensores que miden la presión ejercida en el proceso
de filtrado.
El SCADA se comunica continuamente con los equipos de control en el campo

como el PLC, instrumentos de medida y otros aparatos. Como los equipos son
monitorizados y la información obtenida registrada, si el sistema lógico lo requiere o
el operador lo solicita, el sistema SCADA contesta por envío de datos o
instrucciones. Además, tiene un componente de visualización del proceso, imágenes
representan los diagramas de control del proceso. El operador puede enfocar
cualquier parte de la imagen para obtener mayor definición de cualquier nivel, o al
contrario para obtener una vista general. Como los parámetros del campo cambian,
también cambian los gráficos y las pantallas de texto. Las válvulas y motores son
identificados con un color diferente según su estado o situación (abierto/cerrado;
marcha/paro). Además se visualiza en los gráficos la indicación numérica de
contadores, telemedida de caudales, presión, temperatura, entre otros. Por otro lado,
el sistema comprueba continuamente las condiciones de alarma definidas por el
ingeniero de planta. Las alarmas son recogidas y presentadas por un simulador
sofisticado, que las clasifica y coloca según distintas categorías. La información
específica de la alarma puede ser detectada a cada señal y un operador puede
encontrar esa información de ayuda en línea obteniendo asistencia inmediatamente
para mensajes de alerta específicos.
28
TK1900
Figura 2.4 Supervisión y control desde el PLC de la Recepción del aceite de palma y arranque
del proceso de Fraccionamiento. Sistema SCADA en planta, 2010.
TK1901
Figura 2.5 Supervisión y control desde el PLC Fase de Acondicionamiento y sistema de

enfriamiento para la Cristalización. Sistema SCADA en planta, 2010.
29
TK1902 TK1903
Figura 2.6 Supervisión y control desde el PLC Fase de Cristalización. Sistema SCADA en planta, 2010.
TK1904
TK1905
Figura 2.7 Supervisión y control desde el PLC Fase de Filtrado. Sistema SCADA en planta, 2010.
30
TK1906 TK1905
Figura 2.8 Supervisión y control desde el PLC Almacenamiento de la oleína. Sistema SCADA
en planta, 2010.
2.2.4. Problemas de Calidad en el Proceso de

Fraccionamiento de Aceite de Palma
Berger (1992) indica que la oxidación y la hidrólisis constituyen los factores más
determinantes en la calidad de los aceites comestibles; ambos tipos de reacción
pueden originar sabores que hacen que el aceite no sea utilizable como alimento; los
aceites comestibles tanto de origen animal como vegetal, son triglicéridos de ácidos
grasos y es la reactividad de estos aceites la que conduce a su degradación. Además,
este autor indica que el contacto con el oxígeno de la atmósfera produce oxidación, la
reacción de la oxidación está relacionada con los radicales libres y parece que para
31
que se inicie son necesarias trazas metálicas que actúan como catalizadores 3, y una
vez iniciada, prosigue como una reacción en cadena.
La presencia de peróxido (índice de peróxido, IP) es el indicador de oxidación del

aceite procesado. Este elemento puede incrementarse durante el proceso industrial de
los aceites debido a que son sometidos a aumentos de temperatura, también puede
incrementarse por contacto del aceite con el oxígeno y por la presencia de trazas
metálicas en el aceite. La presencia de trazas metálicas en el aceite se debe a que no
han sido eliminadas en su totalidad durante el proceso de refinación ó, son adquiridas
mediante el contacto del aceite con los contenedores donde es almacenado, durante el
procesamiento, almacenamiento y traslado, en el caso de que dichos contenedores
sean de hierro. En consecuencia, una de las preocupaciones constantes de la industria
de fabricación de grasas y aceites comestibles, es mantener los niveles o porcentajes
mínimos de peróxido en sus productos, exigidos en el mercado o por sus clientes, lo
que las conduce a una búsqueda de mejores medidas de control en la cadena de
producción.
En este sentido, la empresa donde se realizó la investigación, coloca parámetros de

calidad de sus productos para cumplir con las exigencias del mercado; en función de
esto, la oleína y estearina que sale del proceso de fraccionamiento hacia el cliente, se
somete a constantes análisis durante las diferentes etapas del proceso. Según Lal
(1991), entre los parámetros más importantes de la calidad del aceite de palma y de
sus derivados (oleína y estearina), están:
- Acidez (presencia de ácidos grasos libres - AGL)
- Humedad
- Impurezas
- Índice de Peróxido (IP)

3
Un catalizador es una sustancia que aumenta la velocidad en la cual ocurre una reacción química. Un
catalizador permanece inalterable al final de la reacción (Sherman et. al, 1995).
32
- Índice de Deterioro de la Blanqueabilidad (DOBI).
El índice de peróxido, es uno de los parámetros más determinantes para la

aceptación comercial de estos productos, debido que este componente es un promotor
de la oxidación del aceite, ocasiona rancidez en el producto e interfiere en su frescura
para el consumidor, Berger (1992).
Por esto, los esfuerzos de la planta de fraccionamiento caso de estudio, se

encaminan en mantener los niveles de peróxido a raya y en porcentajes muy por
debajo del valor máximo aceptado por los clientes, que para el caso de la oleína y
estearina, 1% es el máximo tolerado.
Ahora bien, una vez que los productos se entregan al cliente, estos aceites pueden
continuar degradándose durante las condiciones de manejo y el transporte a granel,
debido a su reactividad en contacto con agentes externos, por lo cual el lineamiento
de calidad en esta empresa, es producir las oleínas y estearinas con índices de
peróxido menores a 0.5%, brindando al cliente mayor estabilidad de estos productos.
Sin embargo, desde agosto del 2009 hasta abril del 2010, período en el que se
recopiló la información, se ha observado presencia de peróxido en los resultados de
los análisis realizados al aceite de palma en el tanque receptor TK1900, además,
análisis realizados en el aceite de palma en el tanque TK1901, una vez que este aceite
ha sido acondicionado, también acusan aumentos en índices de peróxido. Igualmente,
los análisis hechos en los productos finales en planta de fraccionamiento, presentan
índices de peróxido por encima de 1%, valor máximo tolerable por los clientes; en
estos casos el producto es sometido inmediatamente a un reproceso en planta de
refinación a fin de eliminar el peróxido. Por otro lado, se observa que los resultados
de análisis de peróxido en las oleínas, generalmente superan el 0,5%, lo cual se desvía
del estándar de calidad perseguido por la empresa para una mayor competitividad de
sus productos.
33
Varios factores pueden estar incidiendo en esta situación, los cuales se fueron
determinando a lo largo del proceso de investigación en la empresa. Un factor
importante, el tanque que alimenta la planta de fraccionamiento, es decir, el tanque
que recibe el aceite de palma una vez que sale de la planta de refinación, denominado
TK2161, está hecho de hierro negro, en este caso, según Berger (1992), las trazas
metálicas como las del hierro, tienen un efecto catalítico en el proceso de oxidación,
bien porque promueven la fase de radicales libres o la descomposición de los
hidroperóxidos. El hecho de mantener el aceite almacenado en el tanque TK2161, en
contacto con el hierro, puede estar promoviendo una rápida oxidación y esta reacción
pudiera estar acelerándose en proporción al tiempo de residencia del aceite en este
tanque, desde que es alimentado desde la planta de refinación, hasta que este aceite es
trasegado al tanque TK1900 en la planta de fraccionamiento.
Otro factor determinante, consiste en el aumento de temperatura que sufre el aceite

de palma durante la etapa de acondicionamiento; en esta etapa se aumenta la
temperatura del aceite con el propósito de fundir todos los glicéridos contenidos en él.
Es de resaltar que las reacciones químicas como la oxidación, se aceleran por tres
causas: la concentración, la temperatura y la presencia de catalizadores; estos tres
factores influyen en la velocidad en la cual sigue su curso la reacción (Sherman et. al,
1995). Por esto, durante la etapa de acondicionamiento, el incrementar la temperatura
del aceite que se encuentra a unos 45°C en el tanque receptor TK1900, hasta unos
68°C o 70°C, una vez que este aceite pasa por el intercambiador de temperatura
F1021A y se mantiene recirculando en el tanque TK1901 (ver figura 2.3), pudiera
estar incidiendo en el aumento del índice de peróxido del aceite. En concreto, en el
caso del proceso de fraccionamiento, las variaciones en la temperatura, pueden estar
ocasionando la mayoría de los problemas.
Por otra parte, Berger (1992), señala que debido a la presencia de oxígeno y agua
en el aire ambiental, siempre existe la posibilidad de que se presenten estas
reacciones. En la planta de fraccionamiento se realiza la limpieza de los
cristalizadores y las tuberías bombeando aire a través de ellas, pudiendo ocasionar
34
que las trazas de aceite residuales en los tanques y las tuberías, absorban el oxígeno
necesario para comenzar la reacción en los siguientes lotes o cargas de aceite a
procesar.
En suma, si se mantiene un largo tiempo de residencia del aceite en los tanques

alimentadores; si se tiene contacto de los residuos de procesos anteriores con el
oxígeno durante la limpieza de los cristalizadores y tuberías por donde pasa el aceite;
adicionalmente, si no se tiene el control de las temperaturas durante el proceso de
acondicionamiento, los antecedentes presentados, llevan a pensar que estas
condiciones incrementan el índice de peróxido global del producto en planta de
fraccionamiento.
Aunque el aceite de palma sale con un índice de peróxido en 0% de la planta de

refinería a los tanques alimentadores de la planta de fraccionamiento, si se mantienen
las condiciones presentadas en planta de fraccionamiento que posiblemente causan el
aumento del peróxido, probablemente disminuye la posibilidad de mantener la
producción bajo los parámetros de calidad exigidos por el cliente, lo que implica el
reproceso del producto. Los reprocesos se realizan con el propósito de llevar el
índice de peróxido y el color a los niveles deseados, con los costos derivados de esto.
Es de explicar, que cuando ocurre una reversión de color y peróxido en los

productos de fraccionamiento, específicamente en la oleína, superando el índice de
peróxido el 1% tolerado por el cliente, son reprocesados sometiéndolos nuevamente
al proceso de deodorización en la planta de refinamiento de la empresa (ver figura
2.2). Es en la deodorización donde se eliminan los componentes volátiles no
deseables del aceite, entre ellos el peróxido, mediante la aplicación de temperaturas
por encima de los 270°C. En el caso de la estearina, son menos frecuentes los
reprocesos, esto se debe a que este producto es más saturado que la oleína, tiene
menos capacidad de absorción de las moléculas de oxígeno, por lo cual es un
producto más estable. Dicha estabilidad en la estearina enfoca entonces el problema
de planta de fraccionamiento en cumplir con los parámetros de tolerancia de
35
oxidación de la oleína que despacha. Indistintamente del caso, los costos asociados a
los reprocesos, incrementan los costos operativos y merma la rentabilidad de la
empresa, con las consecuencias negativas en la competitividad de la misma.
2.3. Hipótesis
En la sección anterior se ha supuesto que los problemas con el índice de peróxido

surgen durante el tiempo de residencia del aceite de palma en el tanque alimentador
TK2161 y durante la etapa de acondicionamiento del aceite; se descartan las etapas
posteriores, cristalización y filtrado porque en ellas se disminuye de manera
controlada la temperatura del aceite, además todas las estructuras utilizadas en estas
dos últimas etapas, incluyendo los tanques, filtro y tuberías, están hechos de acero
inoxidable que no promueven la oxidación.
Partiendo de este supuesto y considerando los aspectos abordados en este capítulo,

la hipótesis que en principio tiene mayor fuerza es la siguiente: La inestabilidad de la
oleína se relaciona con el tiempo de residencia del aceite de palma en el tanque
alimentador TK2161 y con los aumentos de temperatura no controlados en la fase de
acondicionamiento.
Por otro lado, Barreto (2009), explica que con los sistemas SCADA se realiza la
trazabilidad del producto. Lo que permite proporcionar conocimiento del proceso
productivo para determinar, en un momento dado, las causas de un posible defecto,
incluso después de haber salido de fábrica. El sistema SCADA utilizado en la planta
de fraccionamiento caso de estudio, mediante el módulo de visualización y el módulo
de alarmas, facilita tanto la supervisión como el control del proceso de
fraccionamiento; partiendo de esto, se supone que la calidad del producto depende en
gran parte de la operación efectiva de todas las unidades que intervienen en
fraccionamiento, apoyada en este tipo de supervisión y control. En este caso, los
operadores de planta pueden supervisar constantemente las temperaturas del aceite
36
durante todo el proceso; mediante el PLC pueden accionar (arranque, parada) de las
válvulas implicadas en las unidades de calentamiento, como es el caso del
intercambiador de calor denominado F1021A (ver figura 2.9), el cual controla
mediante una válvula proporcional, el porcentaje de vapor suministrado entre sus
placas para calentar el aceite que se trasiega del tanque TK1900 al tanque TK1901
durante la etapa de acondicionamiento.
Válvula Proporcional
Intercambiador de calor
Visualización y control
de temperatura del aceite
entre las placas
TK1901
Figura 2.9 Intercambiador de calor y válvula proporcional. Sistema SCADA en planta, 2010.
Ahora bien, si la supervisión de estos parámetros no se hace debidamente, puede

estar recalentándose el aceite en el tanque TK1901, superando los 70°C máximos
recomendados, tal situación puede llevar a pensar que los aumentos inesperados de
peróxido son consecuencia de un recalentamiento excesivo del aceite en la etapa de
acondicionamiento, debido a la falta de supervisión y control efectivos en la planta de
fraccionamiento.
37
Otra hipótesis relacionada al dominio de conocimiento de esta investigación,
consiste en que la aplicación de la Minería de Datos permitirá obtener conocimiento
valioso y aún desconocido sobre los problemas presentados en el proceso de
Fraccionamiento de Aceite de Palma. Investigaciones previas, indican la posibilidad
de la aplicación exitosa de la Minería de Datos en el ámbito industrial [Rodríguez et
al. (2003), Martínez de Pisón et al. (2003b), Martínez de Pisón et al. (2005)].
Adicionalmente, González (2007), indica que la minería de datos es, esencialmente,
un proceso conducido por un problema: la respuesta a una pregunta o la solución a un
problema se busca analizando los datos disponibles. Por lo que se ha supuesto que
aplicando el proceso de Minería a los datos de índices de peróxido en las muestras de
laboratorio realizadas, las temperaturas registradas en la fase de acondicionamiento
del aceite y los tiempos de residencia en el tanque alimentador, se podrá obtener
patrones de comportamiento, además de relaciones e información valiosa sobre el
proceso industrial en estudio.
38
39
Capítulo 3 Minería de Datos Aplicada al Proceso
de Fraccionamiento de Aceite de Palma
El presente capítulo lo constituye en sí, el dominio de conocimiento de la

investigación, y se trata del proceso de Descubrimiento de Conocimiento en Bases de
Datos (KDD). El capítulo se orienta en describir este proceso, y seguidamente se
enfoca en su fase más importante, la Minería de Datos, explicándose la metodología
CRISP-DM (Cross Industry Standard Process for Data Mining), desarrollada para
este tipo de proyectos; se describe la aplicación de las fases de este método en el
contexto de esta investigación, específicamente se detallan las tareas y técnicas de
Minería de Datos aplicadas en el proceso de fraccionamiento de aceite de palma en la
empresa caso de estudio. Los aspectos tocados en este capítulo son el resultado de
los siguientes pasos ejecutados dentro de la estructura de una investigación aplicada:
seleccionar una teoría, para luego exponerla en sus conceptos centrales y en sus
rasgos contextuales, y examinar la situación “problema” a la luz de la teoría
seleccionada, derivabdo un prototipo de acción, con el cual se busca resolver
favorablemente la situación “problema”.
3.1. Metodología para la Minería de Datos

Aunque hace ya tiempo se desarrollaron técnicas para el análisis de datos, en la
actualidad, se requieren procedimientos avanzados para el análisis inteligente de los
mismos, debido a que existe un vacío entre la generación de datos y su comprensión.
Por tanto, el problema central del descubrimiento del conocimiento se concreta en lo
siguiente: cómo convertir la información que se encuentra expresada en términos de
datos almacenados, en conocimiento plasmado en reglas referentes a algunas
características o relaciones que se produzcan en dichos datos; así mismo, el problema
también implica el desarrollo de métodos aplicados al razonamiento de ese
conocimiento extraído. A causa del interés de científicos en diversas áreas de
investigación en el problema del análisis de los datos, surgió KDD (Knowledge
Discovery in Data Bases), definido como el proceso no trivial de descubrimiento de
patrones novedosos, válidos, potencialmente útiles y comprensibles en grandes
volúmenes de datos, (Viani, 2007).
El KDD está compuesto de varios pasos o fases, de las cuales la Minería de Datos
constituye prácticamente la fase de mayor auge y desafío dentro de este campo, al
respecto, Hernández et al. (2004), resalta que la fase de Minería de Datos es la más
característica del KDD y, por esta razón, muchas veces se utiliza esta fase para
nombrar todo el proceso. Además, explica que el objetivo de esta fase es producir
nuevo conocimiento que pueda utilizar el usuario para la toma de decisiones. Esto se
realiza construyendo ya sea un modelo predictivo ó un modelo descriptivo basado en
los datos recopilados para este efecto, este modelo es utilizado para resolver una tarea
o problema y esta tarea, generalmente, puede consistir en una clasificación, una
regresión, un agrupamiento, correlación, o reglas de asociación.
A efectos de esta investigación y como se verá en detalle en este mismo capítulo,

la tarea de minería de datos realizada para analizar el comportamiento de las variables
en estudio, consiste en una clasificación, utilizando para ello la técnica predictiva
llamada árboles de decisión para clasificación.
41
González (2007), explica que existen varias propuestas metodológicas para
realizar proyectos de Minería de Datos, que en general dividen el proceso en un
determinado número de pasos secuenciales: primero el analista se familiariza con el
problema y los datos; posteriormente, se preparan los datos y se construyen y evalúan
los modelos para, finalmente consolidar el nuevo conocimiento adquirido y utilizarlo
para resolver el problema planteado. Esta autora también explica que una
metodología estándar de Minería de Datos y una de las más ampliamente utilizadas
en los ámbitos industrial y académico es el modelo CRISP-DM (Cross Industry
Standard Process for Data Mining)4 desarrollado por un consorcio de empresas
dedicadas a la investigación y desarrollo en este campo. El CRISP-DM es el modelo
de referencia utilizado en esta investigación y en la figura 3.1 se observan los
distintos pasos para realizar descubrimiento de conocimiento en bases de datos,
basándose en este enfoque metodológico.
Figura
4 3.1: Fases (http://www.crisp-dm.org/Process/index.htm)
CRISP-DM del Modelo CRISP-DM. Fuente: http://www.crisp-dm.org/Process/index.htm
42
Según González (2007), en el modelo CRISP-DM, el proceso de Minería de Datos se
divide en seis fases: Análisis del problema, Análisis de los datos, Preparación de los
datos, Modelado, Evaluación y Despliegue. A continuación se describe cada fase.
Fase I: Análisis del problema; inicialmente el analista debe abordar a profundidad

el dominio del problema. Este acercamiento al problema, permite tener un
conocimiento adecuado de lo que es interesante, importante o relevante respecto al
problema que se intenta resolver. Constituye una fase esencial porque de ella
depende que se realice una buena toma de decisiones en las siguientes fases de la
minería de datos. Para el caso específico de la planta de fraccionamiento, se
realizaron entrevistas con el jefe de planta a fin de precisar o delimitar todos los
aspectos del área que se deseaba investigar, además de las indagaciones realizadas en
investigaciones relacionadas al tema de estudio. Este proceso de exploración y
análisis permitió profundizar en el problema, lo cual se refleja en el contenido del
capítulo 2 de este documento.
Fase II: Análisis de los datos; la comprensión de los datos incluye entender su
origen, naturaleza y fiabilidad, así como familiarizarse con el contenido de los
mismos a través de un análisis exploratorio. La adecuada preparación de los datos,
selección de las herramientas del modelado y evaluación, sólo es posible si el analista
tiene una idea global de los datos. En esta fase fue necesaria la colaboración del
departamento de Aseguramiento y Control de Calidad de la empresa, así como la
información suministrada por los operarios y el jefe de planta de fraccionamiento
para entender la naturaleza, origen y fiabilidad de los datos involucrados en todo el
proceso de fraccionamiento de aceite de palma. Se ubicaron en diferentes fuentes
(registros en formatos físicos y en bases de datos transaccionales), información
relacionada a las variables importantes del estudio.
Fase III: Preparación de los datos; el objetivo fundamental de esta fase es

construir una “vista minable” o dataset, a fin de facilitar la labor de construir modelos
precisos y fiables. Para ello, según Barreto (2009) se siguen los siguientes pasos:
43
a. Selección de los datos:
Consiste en la identificación de los datos importantes para una aplicación correcta

de Minería de Datos. No puede ser automatizado y debe ser realizado de manera
cuidadosa por el analista en conjunción con el usuario debido que, de la buena
información que se tenga, será el éxito del proyecto. La obtención de los datos puede
realizarse directamente desde sistemas transaccionales, archivos o a partir de un
almacén de datos (Data Warehouse). Habitualmente esta obtención viene
predeterminada en función de la disponibilidad de los datos: existencia de bases de
datos para el proceso, datos almacenados en archivos, entre otros.
A efectos de esta investigación se construyó un tipo de almacén de datos

denominado Datamarts, que según Hernández (2004), son almacenes de datos
diseñados para un problema específico en una determinada área de la empresa. Este
tipo de almacén de datos no necesita tener una cantidad inmensa de registros para
realizar minería de datos, es decir, puede realizarse minería de datos sobre un archivo
sencillo que contenga los registros de las instancias de información que se desea
minar.
Debido que la información preponderante sobre las variables de interés implicadas

en el modelo a construir, se encontraban, en su mayoría, disponibles en formatos
físicos de la empresa (ver Anexo 1 y Anexo 2), se creó un Datamarts a fin de
mantener almacenado un conjunto de datos (Dataset) para aplicar minería de datos en
el proceso de fraccionamiento; igualmente se exploró la base de datos transaccional
del sistema de supervisión y control de proceso en esta planta de fraccionamiento,
dando como resultado un conjunto de datos o atributos relevantes para realizar el
análisis. La tabla 3.1 muestra un ejemplo de la estructura del Datamarts.
44
tp_residencia ip_tk1900 t_tk1901 ip_oleina
24 0.53 68 0.97
48 2.30 69 2.55
6 0.55 70 0.87
24 0.55 69 1.07
6 0.00 68 0.90
12 0.20 68 0.25
Tabla 3.1: Datamarts con datos seleccionados para el análisis

del proceso de fraccionamiento de aceite de palma. Fuente: la autora
b. Preproceso de los datos:
Una vez identificados y seleccionados los datos a utilizar, es necesario estudiarlos

para el logro de dos propósitos. Primero, entender el significado de los atributos. En
segundo lugar, detectar errores de integración; como por ejemplo, que existan datos
repetidos con distintos nombres o datos que significan lo mismo, pero con diferente
formato. Estos problemas surgen porque los datos pueden provenir de fuentes
diferentes, y no todas almacenan la misma información de la misma manera. Con el
preproceso lo que se consigue es tener un conjunto de datos adecuado para el correcto
funcionamiento de las fases posteriores de la Minería de Datos.
En este paso se realizó la búsqueda y sustitución de datos faltantes u omitidos y

datos erróneos encontrados. Para reemplazar estos datos en el Datamarts, se sustituyó
el valor en los atributos de aquellos registros que presentaban datos anómalos, con el
valor de la media del atributo, calculada a partir del conjunto de instancias o registros
procesados cuyos valores se encontraban dentro de lo normal. La tabla 3.2 y tabla 3.3
muestran un ejemplo de los datos preprocesados para analizar el proceso de
fraccionamiento.
45
tp_residenciaip_tk1900 t_tk1901 ip_oleina reproceso
Sustituidos por
24 9.54 70 10.52 si
Sustituidos por
la media
30 9.56 68 13.13 si
la media
(0.39)
3 4.15 69 5.12 si
(1.02)
30 0.10 70 5.30 si
2 0.00 70 6.22 si
16 0.50 69 5.20 si
Tabla 3.2: Tratamiento de datos anómalos en el Datamarts. Fuente: la autora
tp_residencia ip_tk1900 t_tk1901 ip_oleina

24 0.39 70 1.02
30 0.39 68 1.02
3 0.39 69 1.02
30 0.10 70 1.02
2 0.00 70 1.02
16 0.50 69 1.02
Tabla 3.3: Datamarts con datos Preprocesados. Fuente: la autora
c. Transformación de los datos:
Una vez analizado el tipo de problema y el tipo de datos disponible, se selecciona

el algoritmo o algoritmos, es decir, la técnica que se aplicará para implementar el
modelo. Como cada algoritmo requiere un formato diferente en los datos de entrada,
en esta fase se deben transformar los datos para que se ajusten al formato de entrada
del algoritmo seleccionado. Se busca, por un lado, preparar la información que se
tiene para que pueda ser procesada por los algoritmos de Minería de Datos y además,
reducir la cantidad de información redundante para simplificar las tareas posteriores.
En este paso se seleccionó un algoritmo de árboles de decisión para clasificación

llamado J48, el cual es capaz de trabajar con tipos de datos numéricos y nominales,
por esta razón no fue necesario numerizar ni discretizar los datos para cambiar su
formato. Sin embargo, se realizó una modificación en la estructura del Datamarts, se
sustituyó el atributo ip_oleina, por el atributo reproceso; el atributo reproceso
46
depende del atributo ip_oleina, puesto que este valor según estándar de calidad de la
empresa, si es superior a 1%, la oleína va a reproceso, en este caso el atributo
reproceso toma el valor nominal “si”, de suceder lo contrario el atributo reproceso
toma el valor nominal “no”. La tabla 3.4 muestra un ejemplo del Datamarts después
de la transformación de los datos.
Tabla 3.4: Datamarts con datos transformados. Fuente: la autora
47
Fase IV: Modelado; es la fase principal de la metodología, porque es aquí donde
se aplican los diferentes algoritmos de análisis de datos, sobre los datos preparados en
las etapas anteriores. Durante esta fase se buscan los patrones presentes en los datos
y se buscan soluciones al problema. Mientras que las fases previas de análisis y
preparación, básicamente preparan los datos para el modelado, y las posteriores se
preocupan por su desarrollo en la práctica, la solución se especifica en esta fase, la
cual puede ser, como se dijo anteriormente, un modelo predictivo o descriptivo.
A efectos de analizar la información referente al proceso de fraccionamiento de

aceite de palma, se desarrolló un modelo predictivo utilizando la técnica de árbol de
decisión para clasificación; esta técnica se implementó mediante el algoritmo J48, un
algoritmo de aprendizaje que sigue un criterio de partición de las instancias o
registros de datos, por lo cual pertenece a los llamados algoritmos de “partición” o
algoritmos de “divide y vencerás”.
Fase V: Evaluación; antes de desplegar la solución, es necesario evaluarla desde el

punto de vista del problema original, y de esta manera determinar si la solución
encontrada es lo suficientemente buena como para ser desarrollada. En esta parte de
la metodología es cuando se interpretan y evalúan los resultados obtenidos en la fase
anterior. Se suelen utilizar técnicas de visualización para ver los resultados
conseguidos. Una vez presentados los resultados, el analista debe interpretarlos, y si
no responden a las expectativas del usuario, debe volver a aplicar los algoritmos con
otros parámetros, e incluso ejecutar otros algoritmos para tratar de obtener unos
resultados más deseables. Todo esto hace que el proceso de Minería de Datos sea
iterativo. En esta fase también se debe determinar cómo utilizar el conocimiento
obtenido, los resultados se pueden integrar en un sistema experto o como
procedimientos almacenados en un gestor de base de datos. Un factor muy importante
en esta fase, es el grado de experiencia y conocimiento del analista. La cantidad de
información extraída depende en gran medida del grado de conocimiento que el
analista tenga del problema, así como de sus experiencias en la resolución de
problemas. Cabe señalar que con la solución, el proceso de Minería de Datos, genera
48
nuevas percepciones, ideas y modelos secundarios que robustecen la solución
encontrada.
Fase VI: Despliegue; finalmente la solución se utiliza para resolver el problema

original y se difunde para consolidar el conocimiento descubierto. En el próximo
capítulo se muestra y se explica el conocimiento adquirido con el modelo predictivo
generado. Es de mencionar que esta y todas las fases anteriormente descritas, fueron
realizadas apoyándose en el software de minería de datos WEKA5 versión 3.6.2.
3.2. Técnicas de Minería de Datos Utilizadas para

Modelar la Solución.
Como se explicó en el apartado anterior, la minería de datos produce nuevo

conocimiento construyendo un modelo (predictivo ó descriptivo) basado en los datos
recopilados para este efecto, este modelo es utilizado para resolver una tarea o
problema y esta tarea, generalmente, puede consistir en una clasificación, regresión,
agrupamiento, correlación, o reglas de asociación, entre otras (Hernández, 2004).
Asimismo, las técnicas empleadas por la Minería de Datos para resolver las tareas
mencionadas son numerosas, en el trabajo que aquí se presenta, se empleó una técnica
predictiva, los árboles de decisión para clasificación. El objetivo de las técnicas
predictivas es construir un modelo que permita predecir el valor de una variable a
partir de valores conocidos de otras variables. La Minería de Datos analiza una base
de datos existente mediante una técnica predictiva para generar un modelo que
determine algunas de las características esenciales de los datos. Por supuesto, los
datos deben incluir observaciones completas y válidas de forma que la técnica pueda
aprender de ellas y generar un modelo que realice predicciones acertadas [Martínez
de Pisón y Ordieres (2004)].
5
Software de Minería de Datos de código abierto y de libre distribución, desarrollado por la
Universidad de Waikato en Hamilton, Nueva Zelanda, http://www.cs.waikato.ac.nz/ml/weka/
49
Se seleccionó la técnica predictiva “árboles de decisión para clasificación”, a fin
de obtener el modelo predictivo en el proceso de fraccionamiento de aceite de palma.
En los siguientes apartados se describe la técnica seleccionada para el modelo y se
describe el algoritmo para implementar dicha técnica.
3.2.1. Árboles de Decisión para Clasificación
Hernández (2004), explica que en una clasificación, cada instancia (o registro de la

base de datos) que se analiza pertenece a una clase, la cual se indica mediante el valor
de un atributo que llamamos la clase de la instancia. Este atributo puede tomar
diferentes valores discretos, cada uno de los cuales corresponde a una clase. El resto
de los atributos de la instancia (los relevantes a la clase) se utilizan para predecir la
clase. Entonces, el objetivo es predecir la clase de nuevas instancias de las que se
desconoce la clase.
Conociendo esto, para el caso de estudio se eligió la clasificación como tarea de

minería de datos, porque se quería obtener un modelo comprensible en forma de
reglas que apoye el control de la operación del proceso de fraccionamiento, es decir,
este modelo busca clasificar la calidad de la oleína producida en cada lote de aceite de
palma fraccionado, y de este modo determinar si debe ser sometida a un reproceso en
planta de refinación. Al mismo tiempo la intención del modelo construido incluye
también visualizar el comportamiento de los datos y en función de ello se proponer
mejoras al permitir evaluar las condiciones o reglas en el modelo para tomar
decisiones en el control durante el proceso.
En base a lo anterior, las clases identificadas para las instancias en la base de datos
son: reproceso (si) y reproceso (no); es decir, el atributo reproceso, que es el atributo
dependiente de cada instancia evaluada por el árbol, puede tomar uno de los
siguientes dos valores nominales para clasificarla: “si” ó “no”. Para determinar este
50
valor, el árbol evalúa en base a un conjunto de reglas definidas en el modelo por el
resto de los atributos de la instancia, llamados atributos predictores.
Los atributos predictores del modelo para el fraccionamiento de aceite de palma

son:
- tp_residencia: Tiempo de residencia (en horas) del aceite de palma en el

tanque alimentador TK2161.
- ip_tk1900: Índice de peróxido del aceite de palma en el tanque receptor

TK1900, al comenzar la etapa de acondicionamiento del aceite.
- t_tk1901: Temperatura del aceite de palma en el tanque TK1901, al terminar

la etapa de acondicionamiento.
Según Hernández (2004), un árbol de decisión es un conjunto de condiciones

organizadas en una estructura jerárquica, de tal manera que la decisión final a tomar
se puede determinar siguiendo las condiciones que se cumplen desde la raíz del árbol
hasta alguna de sus hojas.
Una de las ventajas de los árboles de decisión es que, en su forma más general, las
opciones posibles a partir de una determinada condición son excluyentes. Esto
permite analizar una situación y, siguiendo el árbol de decisión apropiadamente,
llegar a una sola acción o decisión a tomar; esta ventaja puede verse claramente en la
figura 3.2.
51
Figura 3.2: Ejemplo de Árbol de Decisión para Clasificación.
Fuente: http://www.exa.unicen.edu.ar/catedras/dbdiscov/mirabella.pdf
El objetivo de realizar esta clasificación es determinar de entre dos clases

(reprocesar y no reprocesar), a qué clase pertenece un nuevo lote de oleína, y la
estructura de condición y ramificación de un árbol de decisión es idónea para este
problema.
3.2.2. Algoritmo J48
Se implementó el árbol de decisión para clasificación utilizando el algoritmo J48,

el cual es una de las opciones que ofrece para esta técnica el software de minería de
datos WEKA. Dicho algoritmo presenta las siguientes características:
- Representa el clasificador como un árbol.
- Es la implementación en el lenguaje de programación Java, del algoritmo

C4.5, (Quinlan, 1993).
- Puede procesar datos Categóricos y Numéricos.
- Puede manejar instancias ponderadas por peso.
52
- El árbol generado por el algoritmo J48 debe ser aplicado a cada dato en forma
secuencial hasta que los mismos caigan dentro de alguna categoría o clase.
Como se mencionó anteriormente, el J48 es un algoritmo de aprendizaje que sigue

un criterio de partición de las instancias; el espacio de instancias se va partiendo de
arriba abajo, utilizando cada vez una partición, es decir, un conjunto de condiciones
excluyentes y exhaustivas.
El siguiente algoritmo muestra un esquema básico para generar un árbol de

decisión a partir de un conjunto de ejemplos o instancias, utilizando la estrategia de
partición, en el cual, para clasificar un conjunto de ejemplos E, se invoca al algoritmo
con la llamada Partición(R,E), donde R es un nodo raíz de un árbol por empezar.
ALGORITMO Partición (N: nodo, E: conjunto de ejemplos)

SI todos los ejemplos E son de la misma clase c ENTONCES
Asignar la clase c al nodo N
SALIR; //esta rama es pura, ya no hay que seguir partiendo. N es hoja.
SI NO
Particiones:= generar posibles particiones
MejorParticion:= seleccionar la mejor partición según el criterio de partición
PARA CADA condición i de la partición elegida
Añadir un nodo i a N y asignar los ejemplos consistentes a cada hijo (Ei)
Partición(i, Ei) //Realizar el mismo procedimiento global con cada hijo
FIN PARA
FIN SI
FIN ALGORITMO
Cumpliendo con el último paso de la metodología de investigación aplicada de

Padrón (2006), el siguiente capítulo mostrará los resultados de la aplicación de esta
técnica seleccionada que constituye el prototipo para analizar el proceso de
fraccionamiento de aceite de palma en la planta caso de estudio, específicamente para
el conjunto de datos preparados en la segunda fase de la metodología CRISP-DM.
53
54
Capítulo 4 Resultados y Discusión
En resumen, los pasos más relevantes realizados durante el proceso de minería de

datos fueron los siguientes: determinar qué tipo de tarea de minería es el más
apropiado para el análisis del proceso de fraccionamiento de aceite de palma; elegir el
tipo de modelo; elegir el algoritmo de minería que resuelva la tarea y obtenga el tipo
de modelo que se busca implementar; preparar los datos para que sean apropiados y
se encuentren en los formatos requeridos por el algoritmo de minería de datos
elegido; aplicar las técnicas en los datos previamente preparados. Partiendo de esto,
el problema de minería de datos o tarea a abordar en este trabajo, consistió en una
clasificación, seleccionando la técnica de árboles de decisión a fin de construir un
modelo para predecir los lotes de oleína que van a reproceso, este modelo se hizo en
función del tiempo de residencia del aceite en el tanque alimentador, del índice de
peróxido del aceite en el tanque receptor al comenzar la fase de acondicionamiento, y
la temperatura del aceite de palma al culminar esta fase. Por otra parte, se seleccionó
el algoritmo J48 para construir el árbol de decisión a partir de la vista minable
construida durante la fase de preparación de los datos de la metodología CRISP-DM.
Los resultados de todo este proceso se verán a lo largo de este capítulo.
Durante el análisis y preparación del conjunto de datos, la distribución de las

variables indicó que existían dos clases de comportamiento de los datos durante el
proceso de fraccionamiento del aceite de palma: el primer comportamiento de las
variables llevaba a agrupar a las oleínas resultantes del fraccionamiento en una clase
(las que se envían a despacho sin mayores problemas), mientras que en el segundo
patrón de comportamiento de los datos, estas oleínas resultantes se agrupaban en otra
clase (las que debían ser sometidas a un reproceso en planta de refinación por
presentar índices de peróxido por encima de los valores tolerados).
Luego de eliminar los datos atípicos y dividir el conjunto de datos de

entrenamiento6 en las dos clases detectadas, se observó que ambos grupos de datos
mostraban suficientes patrones de comportamiento para entrenar el árbol de decisión.
El número de ejemplos analizados para entrenar el modelo fue 65 instancias
correspondientes a los 65 lotes de aceite de palma fraccionados desde agosto del 2009
hasta abril del 2010, período en el que se recopiló la información, y en el conjunto
conformado por estas 65 instancias se presentaron para cada uno de los atributos o
variables estudiadas, las distribuciones mostradas en la figura 4.1.
Figura 4.1: Distribución de los datos en las variables predictoras y en la

variable dependiente. Fuente: la autora
6
El conjunto de entrenamiento (training set) permite al algoritmo crear el modelo, mientras que el
conjunto de prueba (test set) valida la precisión del modelo.
56
Una vez analizadas las distribuciones de las variables y observado los patrones
más relevantes, se entrenó el modelo clasificador. En WEKA 3.6.2 hay tres opciones
para entrenar el clasificador:
- Usando la base de datos completa con la opción Training Set: entrena el

modelo y realiza la prueba (test) sobre el conjunto de datos completo del Datamarts.
- Usando un porcentaje de la base de datos con la opción Percentage Split:

entrena el modelo en un porcentaje del Datamarts indicado por el analista y realiza el
test sobre el porcentaje restante.
- Dividiendo la base de datos en n grupos y realizando una validación cruzada

con la opción Cross Validation7.
Las pruebas realizadas para cada opción de entrenamiento del modelo resultaron
en las siguientes conclusiones:
- Usando el conjunto de datos completo como conjunto de entrenamiento

(training set) y como conjunto de prueba (test set), se clasificaron correctamente 59
instancias con un 90.76% de precisión.
- Usando percentage split tomando el 66% del conjunto de datos para entrenar
el modelo y 34 % como conjunto de prueba, se clasificaron correctamente 16
instancias con un 72.72% de precisión.
- Usando la opción cross validation, dividiendo el conjunto de datos en 10

grupos y aplicando la validación cruzada entre estos grupos, se clasificaron
correctamente 53 instancias con 81.53% de precisión.
En el contexto de la clasificación, lo normal es evaluar la calidad de los patrones

encontrados respecto a su precisión predictiva, la cual se calcula como el número de
7
Puede encontrarse información detallada sobre esta técnica de evaluación en Hernández (2004).
57
instancias del conjunto de prueba (test set) clasificadas correctamente, dividido por el
número de instancias totales en el conjunto de prueba.
De las opciones anteriores, la primera fue la que más instancias clasificó

correctamente con un mayor porcentaje de precisión (90.76%); las otras dos opciones
de entrenamiento del modelo también posen un porcentaje de precisión bastante
bueno, pero clasificaron correctamente un número menor de instancias. Por esto se
seleccionó como modelo para el análisis del proceso de fraccionamiento de palma, el
entrenado con la primera opción, Training Set, cuya precisión en la clasificación
realizada puede observarse en la siguiente matriz de confusión, la cual muestra el
recuento de casos de las clases predichas y sus valores actuales:
no si
35 3
3 24
En la anterior matriz de confusión perteneciente al conjunto de entrenamiento,

puede observarse que de los 65 lotes de oleína clasificados, se han predicho
correctamente 35 como no (no va a reproceso), y 24 como si (si va a reproceso),
obteniéndose un porcentaje global de acierto del 90.76%. El resto de los datos que
presenta la matriz de confusión se refiere a 3 lotes clasificados incorrectamente como
no y 3 lotes de oleína clasificados incorrectamente como si, lo que resultó en un
9.24% global de desacierto del modelo.
En vista de los altos porcentajes de asertividad se continúa con el análisis y

descubrimiento de reglas y patrones de comportamiento de los datos con este modelo.
Por lo que durante el análisis pudo observarse como primer resultado que el
algoritmo J48 generó en un tiempo de proceso de 0.02 segundos, un árbol de decisión
58
con 4 hojas, estas cuatro hojas indican que el árbol puede expresarse en 4 reglas de
decisión (ver figura 4.2).
Los árboles de decisión pertenecen al conjunto de los métodos de aprendizaje
Figura 4.2: Modelo predictivo del proceso de fraccionamiento de aceite de palma.

Fuente: la autora
inductivo y como puede observarse en la figura 4.2, es fácil inducir el siguiente
conjunto de reglas a partir de las condiciones que generalizan el árbol:
1. SI ip_TK 1900 <= 0.3 ENTONCES no

2. SI ip_TK1900 > 0.3 Y t_TK1901 <= 68 Y tp_residencia <= 24 ENTONCES no
3. SI ip_TK1900 > 0.3 Y t_TK1901 <= 68 Y tp_residencia > 24 ENTONCES si
4. SI ip_TK1900 > 0.3 Y t_TK1901 > 68 ENTONCES si
Observando el árbol de decisión y el conjunto de reglas, puede deducirse además,

que 31 instancias del conjunto de entrenamiento cumplieron las condiciones de la
primera regla, clasificándose como lotes de oleína que no van a reproceso.
59
Asimismo, 25 instancias del conjunto de entrenamiento cumplieron con las
condiciones de la cuarta regla, por ende estas instancias entran en la clase de oleínas
que van a reproceso. Esto hace poco significativo el comportamiento de los datos que
siguieron el patrón establecido en la segunda y tercera regla, con 7 instancias y 2
instancias respectivamente, lo que establece como patrones de comportamiento más
frecuentes los establecidos por las reglas 1 y 4, donde las variables ip_tk1900 y
t_tk1901, son las verdaderamente decisivas en la predicción del comportamiento de
los lotes de aceite de palma procesados, mostrándose la variable tp_residencia como
la menos determinante para establecer las predicciones.
En definitiva, considerando las buenas estimaciones conseguidas con el modelo

creado, estas fueron utilizadas para normar las reglas de decisión necesarias para
establecer los controles en el proceso de fraccionamiento de aceite de palma,
específicamente para aquellos parámetros del proceso que son los que se pueden
modificar para conseguir mejoras en el producto final.
En general, se necesita un buen control de la cantidad de calor que se aplica para

evitar que el peróxido aumente demasiado. La regulación de la temperatura debe
hacerse tanto por los controles automáticos del SCADA, como por las válvulas que
controlan el flujo de vapor caliente en el intercambiador de temperatura, cuando el
aceite pasa del tanque receptor TK1900 al tanque TK1901, durante la etapa de
acondicionamiento del proceso de fraccionamiento del aceite de palma.
En función de la necesidad planteada se recomendó ampliamente al ingeniero jefe

de la planta de fraccionamiento caso de estudio, introducir controles de operación del
proceso, orientados a mantener las temperaturas del aceite de palma hasta un máximo
de 68°C durante la etapa de acondicionamiento, para lo cual se recomendó agregar
en el sistema SCADA una alarma que indique a los operadores si el aceite de palma
ha llegado a esta temperatura recomendada.
Por otra parte, una vez que el ingeniero jefe de la planta de fraccionamiento,
analizó los comportamientos mostrados por el modelo, indicó que dichos resultados
60
coincidían con un plan de mejoras a la infraestructura de la planta. Dichas mejoras
consisten específicamente en la sustitución del tanque de hierro TK2161, por una
tubería de acero inoxidable desde la planta de refinación hasta el tanque receptor
TK1900 en planta de fraccionamiento. Como se observa, estos cambios en la
infraestructura están orientados a eliminar el problema del contacto del aceite de
palma con los agentes catalizadores presentes en el tanque alimentador TK2161, lo
que se está evidenciado en los resultados de análisis del peróxido de las muestras de
aceite extraídas del tanque receptor TK1900. Los tanques y tuberías de toda la planta
deben ser de acero inoxidable, ya que el hierro tiene como se indicó anteriormente, un
efecto catalítico sobre las reacciones termo-oxidativas.
Asimismo, una vez que fue sustituido el tanque alimentador TK2161 por las
tuberías de acero inoxidable, el ingeniero jefe se mostró interesado en realizar
investigaciones de este tipo en la planta de refinación del aceite de palma,
específicamente por los resultados del modelo que acusan directamente a la variable
ip_tk1900, la que indica el índice de peróxido del aceite de palma cuando comienza
la etapa de homogeneización. Este resultado da pie a la formulación de la siguiente
hipótesis a comprobar: aunque el aceite de palma sale de la planta de refinación con
un índice de peróxido en 0%, se observa que este índice frecuentemente sigue
incrementándose en la planta de fraccionamiento, lo que lleva a suponer problemas en
el control durante el proceso de blanqueo del aceite en la planta de refinería, que
pudieran estar causando envíos de aceite refinado para el fraccionamiento con
cantidades considerables de trazas metálicas promotoras de la oxidación.
61
62
Capítulo 5 Conclusiones y Futuros Desarrollos
Como se ha visto a lo largo de este documento, el proceso de fraccionamiento del
aceite de palma es complejo debido que es necesario cuidar el comportamiento de
diversos factores que influyen en la calidad del producto. Si la oleína producida no
cumple con las propiedades requeridas, entonces su estabilidad no sería la adecuada,
sobre todo porque es un producto que se verá sometido a factores del medio ambiente
una vez que sale de la planta de fraccionamiento, como la radiación solar, altas
temperaturas, humedad, frecuentes en los procesos de almacenamiento y transporte a
granel. En consecuencia, puede decirse que un control adecuado de este proceso
ayudará a obtener un producto final de la calidad deseada.
Para llegar a esta conclusión, se aplicó la metodología CRISP-DM para proyectos

de Minería de Datos, así como algunas de sus técnicas, obteniendo conocimiento
valioso que permitió mayor comprensión acerca de las relaciones entre las variables
que intervienen en el proceso de fraccionamiento de aceite de palma y la forma en
que inciden en el producto final obtenido.
Se demostró que utilizando convenientemente algoritmos de aprendizaje de

árboles de decisión, pueden obtenerse modelos precisos, fiables y, en última medida,
comprensibles a partir de datos. Para este caso se obtuvo un clasificador que permite
determinar a partir de ciertos atributos o variables, los lotes de oleína que deben ir a
un reproceso en planta de refinación y en consecuencia, se determinaron las
condiciones adecuadas de operación del proceso de fraccionamiento de aceite de
palma al establecer el conjunto de reglas que llevan a los productos deseados. Es
obvio que al determinar este conjunto de reglas, se pudieron concebir mejoras
importantes tanto en el ámbito operativo de la planta como en su infraestructura.
Por otro lado, se demostró que se puede realizar minería de datos en archivos
sencillos cuando no se cuenta con grandes almacenes de datos. Aún cuando en la
investigación se tomó la decisión de construir un Datamarts, dedicado exclusivamente
al registro de los datos del problema específico de fraccionamiento, se aplicaron
igualmente y de forma exitosa, técnicas de selección y preprocesado de los datos, las
cuales son fases realmente importantes y determinantes del proceso de minería.
Los resultados obtenidos y mostrados en el capítulo 4, respaldan especialmente los

supuestos formulados en esta investigación, al mismo tiempo llevaron a plantear
mejoras significativas en el proceso de fraccionamiento de aceite de palma,
demostrando de este modo, la utilidad de la minería de datos como herramienta para
el análisis automático de los datos, para la extracción de conocimiento no explicito en
ellos y por ende ayuda a realizar una eficiente toma de decisiones, especialmente
cuando se aplica a los procesos industriales considerando sus parámetros de calidad.
En suma, puede decirse que los objetivos planteados que orientaron esta
investigación, se cubrieron satisfactoriamente y con resultados tangibles para la
empresa, al mismo tiempo que estos resultados representan un aporte significativo en
materia de aplicación de estas técnicas a los procesos industriales.
En cuanto a futuros desarrollos, a la luz de la primera hipótesis formulada en el

segundo capítulo de este documento, parte de los resultados de la investigación
tienden a negarla, puesto que señalan el tiempo de residencia del aceite de palma en
el tanque alimentador TK2161 como la variable menos determinante en el modelo.
Ahora bien, es preciso aclarar, que el índice de peróxido en el tanque receptor
TK1900, es sólo un indicador del proceso de oxidación que ha sufrido el aceite
durante su permanencia en el TK2161 bajo condiciones de inestabilidad; si el aceite
que se trasiega desde la planta de refinación contiene trazas metálicas, consecuencia
de un procedimiento de blanqueo fuera de las especificaciones técnicas de calidad,
64
estas trazas deberían promover la oxidación en la medida de la concentración
presente de estos catalizadores en el tiempo.
El análisis anterior lleva a proponer como futura línea de trabajo, la investigación

sobre el proceso de blanqueo del aceite de palma crudo, considerando los parámetros
de calidad de este aceite crudo, el tiempo de residencia del aceite en las tierras de
blanqueo, la dosificación de estas tierras de blanqueo y su relación con la calidad del
aceite refinado que sale hacia la planta de fraccionamiento, en función del porcentaje
de impurezas y elementos no deseados, como es el caso de las trazas metálicas. Por
supuesto, esta propuesta debe seguir la temática de la aplicación de técnicas de
minería de datos para la mejora de procesos industriales, para el caso específico que
se plantea, se sugiere utilizar un modelo de regresión8 implementado con la técnica de
redes neuronales artificiales.
Por otro lado, está la situación de los costos en que incurre la empresa como
consecuencia de los reprocesos de las oleínas que presentan índices de peróxido fuera
de los estándares de calidad. Este aspecto no fue tomando en cuenta en la presente
investigación, por lo que se propone profundizar en las técnicas de minería de datos
para el análisis del comportamiento de esta variable, como es el caso de la técnica de
la matriz de costes. En este caso, la matriz de costes permitiría evaluar los modelos
con sus costes de error de clasificación y, por ejemplo, buscar un modelo que
minimice el coste global.
Por último, puede decirse que la precisión de los modelos no garantiza que reflejen
el mundo real, en cualquier caso debe contrastarse el conocimiento que ellos nos
proporcionan con el conocimiento previo que se tiene del problema para detectar y en
su caso resolver los posibles conflictos.
8
Para mayor información sobre el modelo de regresión se sugiere Hernández (2004)
65
ANEXO A
66
ANEXO B
67
REFERENCIAS
Barreto, C.; Minería de Datos Aplicada a la Mejora de Procesos de Extrusión de

Elastómeros; Tesis Doctoral; Universidad Politécnica de Valencia, España;
(2009).
Berger, K. (1992); Transport to Bulk of Oils Groceries; Oils & Fats International
Issue, 8 (4): 47-50.
Chapman P., Clinton J., Kerber R., Khabaza T., Reinartz T., Shearer C., Wirth R.;
CRISP-DM 1.0 (Step-by-step data mining guide); SPSS; E.E.U.U.; s/e; (2000).
Consorcio Oleaginoso Portuguesa S.A.; Instalación de Planta de Fraccionamiento de

Aceite de Palma; Proyecto de Innovación Tecnológica enmarcado en la Ley
Orgánica de Ciencia y Tecnología e Innovación (LOCTI); Acarigua, República
Bolivariana de Venezuela; (2008).
DE SMET Process & Technology, INC; Fraccionamiento de Aceite de Palma; Oferta

N° US041116.4S; Atlanta, North America; (2005).
Fayyad, U., Shapiro, G., Smyth, P. (1996); From Data Mining to Knowledge
Discovery in Databases; AI Magazine, 17:37-54.
Gallardo, J.; Metodología para la Definición de Requisitos en Proyectos de Data

Mining; Tesis Doctoral; Universidad Politécnica de Madrid, España; (2009).
González A.; Desarrollo de Técnicas de Minería de Datos en Procesos Industriales:

Modelización en Línea de Producción de Acero; Tesis Doctoral; Servicio de
Publicaciones; Universidad de la Rioja, España; (2007).
Gurr, M. (1996); Carotenoids: Golden Nutrients. Publicado en Lipid Technology, 6:

15-18.
68
Han, J., Kamber M. (2000); Data Mining: Concepts and Techniques. Morgan
Kaufmann.
Hernández, J., Ramírez, J., y Ferri, C. (2004); Introducción a la Minería de Datos.

Madrid: Pearson Prentice Hall.
Kalyana Sundram (1996); Modulation of Human Lipids and lipoproteins by Dietary

Palm Oil and Palm Olein. Palm Oil Nutrition, Update 2. Publicación de
Malaysian Palm Oil Board (MPOB).
Martínez de Pisón, F.; Optimización Mediante Técnicas de Minería de Datos del

Ciclo de Recocido de una Línea de Galvanizado; Tesis Doctoral; Servicio de
Publicaciones, Universidad de la Rioja, España; (2003a).
Martínez de Pisón F., González J., Vergara E., Alba F., González A.; Mejora y
Optimización de un Proceso Industrial Mediante Técnicas de Minería de Datos e
Inteligencia Artificial; Ponencia presentada en el VII Congreso Internacional de
Ingeniería de Proyectos; Pamplona, España; (2003b).
Martínez de Pisón, F., Ordieres Mere J.; Apuntes de la asignatura “Minería de

Datos”; Versión 1.2; Editado por la Universidad de La Rioja, España.; (2004).
Martínez de Pisón F., Ordieres J., Pernía A., Alba F.; Minería de Datos en Series
Temporales para la Búsqueda de Conocimiento Oculto en Históricos de Procesos
Industriales; Actas del III Taller Nacional de Minería de Datos y Aprendizaje,
TAMIDA; 31-38; (2005).
Mirabella C.; Descubrimiento de Conocimiento en Bases de Datos. [en-línea].

<http://www.exa.unicen.edu.ar/catedras/dbdiscov/mirabella.pdf>. [Modificación
22/10/2007] [Consulta 15/05/2010].
69
Mohd, B. W., Siti Nor, A. A., Henson, I. E. (2005); Oil Palm - Achievements and
Potential. Oil Palm Bulletin, 50. Publicación de Malaysian Palm Oil Board
(MPOB).
Nor Aini, I., Razali, I., Noor Lida, H. M.; Miskandar, M. S., Radzuan, J. (2002);
Blending of Palm Oil and Palm Products with other Oils and Fats for the Food
Applications. Oil Palm Bulletin, 45. Publicación de Malaysian Palm Oil Board
(MPOB).
Lal, V., K. (1991); Oil of Palm: Requirements of Quality to Obtain Good Refined
Products. Ponencia presentada en la Conferencia Internacional sobre Palma de
Aceite. Kuala Lumpur, Malasia. Versión traducida al español en Revista Palmas,
13 (3): 69-72.
Padrón, J. (2006); Bases del Concepto de Investigación Aplicada. [en-línea].

<http://padron.entretemas.com/InvAplicada/index.htm>. [Consulta 10/01/2010]
Pérez, C. y Santín D. (2008); Minería de Datos, Técnicas y Herramientas. Madrid:

Internacional Thomson Editores Spain Paraninfo.
Pérez del Rey, D. (2007); Un Modelo de Integración y Preprocesamiento de

Información Distribuida Basado en Ontologías; Tesis Doctoral; Universidad
Politécnica de Madrid, España; (2007).
Quinlan (1993); C4.5 Programs for Machine Learning. San Francisco: Morgan
Kaufmann.
Rodríguez M., Alvarez J., Mesa J., González A.; Metodologías para la realización de
proyectos de Data Mining; Ponencia presentada en el VII Congreso Internacional
de Ingeniería de Proyectos; Pamplona, España; (2003).
Sherman A., Sherman S., Russikoff L. (2008); Basic Concepts of Chemistry. Boston:
Houghton Miffilin Company.
70
Vargas, Z. (2009). La Investigación Aplicada: Una Forma de Conocer las
Realidades con Evidencia Científica. Revista EDUCACIÓN, vol. 33 (1): 155-
165; Universidad de Costa Rica. Disponible en:
http://redalyc.uaemex.mx/src/inicio/ArtPdfRed.jsp?iCve=44015082010.
Viani, J.; La Metodología Data Mining como Subsistema de Información y su

Funcionalidad en Contexto KDD. Una Aproximación Empírica; Tesis doctoral;
Universidad de Deusto; (2007).
Weiss, S.M., Indurkhya, N. (1998); Predictive Data Mining: A Practical Guide.

Morgan Kaufmann.
Witten, H., Frank, E. (2000); Data Mining: Practical Machine Learning Tools and
Techniques with Java Implementation. Morgan Kaufmann.
71

Planta de Fraccionamiento de Aceite

Cargado por

Copyright:

Formatos disponibles

Planta de Fraccionamiento de Aceite

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Planta de Fraccionamiento de Aceite

Cargado por

Copyright:

Formatos disponibles

UNIVERSIDAD NACIONAL ABIERTA

MINERÍA DE DATOS APLICADA A LA MEJORA DEL

Trabajo presentado como requisito para optar a la categoría de

Autor: Saibel Ramos Rojas

Este documento expone una experiencia de investigación aplicativa, cuyo propósito

Palabras Clave: Fraccionamiento de Aceite de Palma, Minería de Datos, Modelos

Un sincero reconocimiento a mi familia, mis amigos, y muy especialmente al

Figura 2.1 Productores a Nivel Mundial de Aceite de Palma

Tabla 2.1 Producción Mundial de Grasas y Aceites

La presente introducción realiza un recorrido sobre los orígenes, evolución y

El descubrimiento de nuevo conocimiento útil en las organizaciones, es impulsado

La Minería de Datos es concebida por algunos autores (Pérez y Santín, 2008),

No obstante la descripción anterior sobre el surgimiento de la minería de datos,

Estos autores también coinciden en reconocer al proceso de Minería de Datos

En el contexto de las empresas, Gallardo (2009), explica que en años recientes se

Asimismo, el escenario del rápido crecimiento en la capacidad para almacenar

Durante la investigación se abordó inicialmente, el análisis exhaustivo, sistemático

El trabajo presentado en este documento está estructurado como sigue: El

1.1. Metodología de Investigación

El presente estudio se caracteriza por ser una investigación de tipo aplicativa.

Para Padrón (2006), la investigación aplicada hace referencia, en general, a aquel

Adicionalmente, Vargas (2009) concreta que en ambas distinciones se observa que

El trabajo de investigación aplicativa que aquí se presenta, se basa en un dominio

Ahora bien, según Padrón (2006), una investigación aplicada comprende, en

1. Partir de una situación problemática que requiere ser intervenida y

2. Seleccionar una teoría, para luego exponerla en sus conceptos centrales y

3. Examinar la situación “problema” a la luz de la teoría seleccionada, de ésta

4. Ensayar y probar el prototipo descrito como paso 3, para determinar la

Luego de estos pasos, se requiere analizar la práctica investigativa, detallando los

Basándose en estas definiciones y estructura de pasos descritos, se reitera el

1.2. Objetivos de Investigación

1.2.1. Objetivo General

Mejorar el proceso de Fraccionamiento de Aceite de Palma en una planta de

1.2.2. Objetivos Específicos

Estudiar la teoría, los métodos y técnicas de Minería de Datos aplicados

Construir una vista minable (conjunto de datos de entrenamiento) con los

Generar un modelo predictivo del comportamiento de los datos, aplicando al

Validar la precisión del modelo predictivo mediante un conjunto de datos de

Analizar los resultados de la aplicación del modelo predictivo, mediante el uso

Proponer la implementación de controles y mejoras en el proceso de

Este capítulo corresponde al primer paso de la investigación descrito por Padrón

2.1. Producción Industrial del Aceite de Palma

El aceite de palma se ha usado en la preparación de comida durante más de 5.000

Las indagaciones realizadas en este trabajo, indican que el cultivo de la palma de

Actualmente la línea de producción de grasas y aceites comestibles derivados de la

Tabla 2.1: Producción Mundial de Grasas y Aceites (periodo 2001-2008)

Ahora bien, esta tendencia mundial de producir aceites y grasas comestibles

En principio, aspectos científicos encontrados en estudios, describen las calidades

Por su grado de saturación el aceite de palma no necesita ser hidrogenado

Según el Consorcio Oleaginoso Portuguesa S.A. (2008), la hidrogenación

Actualmente la línea de producción de grasas y aceites comestibles derivados de la

Aceite de Palma Refinado

Aceite de Palma Refinado y Blanqueado

Aceite de Palma Refinado, Desodorizado

Oleína pura lista para envasado Estearina para utilizarse

Figura 2.2 Fabricación Industrial de Grasas y Aceites Comestibles derivados de la Palma

A grandes rasgos, los tres primeros procesos, Refinamiento, Blanqueamiento y

2.2.1. Principios Básicos