Teoriaautomatas y Len..

50
ISBN 84-7723-747-6
ISBN 978-84-7723-747-1
Teorías de Autómatas
y Lenguajes Formales
9 788477 237471
• Álgebra lineal y Geometría

Colección manuales uex - 55
(E.E.E.S.)
50 Elena 55
Jurado Málaga
Teoría de autómatas
y lenguajes formales
manuales uex
55 (E.E.E.S.)
Espacio
Europeo
Educación
Superior
Elena jurado málaga
teoría de autómatas
y lenguajes formales
2008
La publicación del presente manual fue subvencionada por el Vicerrectorado de
Calidad y Formación Continua de la Universidad de Extremadura en la Convocatoria
de Acciones para la Mejora de la Calidad Docente del curso 2007/08 dentro de la
modalidad B.2: “Diseño y desarrollo de materiales docentes adaptados a la metodo-
logía derivada del E.E.E.S.” Esta convocatoria de acciones forma parte del Plan de
Adaptación de la UEX al Espacio Europeo de Educación Superior.
FSE
Fo n d o S o c i a l E u ro p e o
Edita
Universidad de Extremadura. Servicio de Publicaciones

C./ Caldereros, 2 - Planta 2ª - 10071 Cáceres (España)
Telf. 927 257 041 - Fax 927 257 046
publicac@unex.es
www.unex.es/publicaciones
ISSN 1135-870-X
ISBN 978-84-691-6345-0
Depósito Legal M-45.211-2008
Edición electrónica: Pedro Cid, S.A.

Teléf.: 914 786 125
A Juan
Prólogo
El estudio de la teorı́a de autómatas y de los lenguajes formales se puede ubicar

en el campo cientı́fico de la Informática Teórica, un campo clásico y multidisciplinar
dentro de los estudios universitarios de Informática. Es un campo clásico debido no
sólo a su antigüedad (anterior a la construcción de los primeros ordenadores) sino,
sobre todo, a que sus contenidos principales no dependen de los rápidos avances
tecnológicos que han hecho que otras ramas de la Informática deban adaptarse a los
nuevos tiempos a un ritmo vertiginoso. Es multidisciplinar porque en sus cimientos
encontramos campos tan aparentemente dispares como la lingüı́stica, las matemáticas
o la electrónica.
El hecho de que esta materia no haya sufrido grandes cambios en las últimas
décadas no le resta un ápice de interés. El estudio de las máquinas secuenciales que
abarca la teorı́a de autómatas, por una parte, sienta las bases de la algoritmia y
permite modelar y diseñar soluciones para un gran número de problemas. Por otra
parte, permite abordar cuestiones de gran interés para un informático como qué tipo
de problemas pueden ser resueltos por un computador o, caso de existir una solución
computable para un problema, cómo podemos medir la calidad (en términos de efica-
cia) de dicha solución. Es decir, la teorı́a de autómatas es la puerta que nos permite
la entrada hacia campos tan interesantes como la computabilidad y la complejidad
algorı́tmica. Además, una de las principales aportaciones del estudio de los lenguajes
formales, sobre todo desde un punto de vista práctico, es su contribución al diseño de
lenguajes de programación y a la construcción de sus correspondientes traductores.
En este sentido la asignatura ayudará a conocer con mayor profundidad la estructura
de los lenguajes de programación y el funcionamiento de los compiladores.
Este manual es el resultado del trabajo que durante varios años he realizado impar-
tiendo la asignatura de Teorı́a de Autómatas y Lenguajes Formales en las titulaciones
de Informática de la Universidad de Extremadura. Dicha asignatura es troncal para
manuales uex
los alumnos de Ingenierı́a Informática y de Ingenierı́a Técnica en Informática de Sis-

temas pero también puede ser cursada como materia optativa por los alumnos de
Ingenierı́a Técnica en Informática de Gestión. Se imparte en el tercer curso de estas
titulaciones.
La asignatura se ha diseñado teniendo en cuenta las diferentes circunstancias de
los alumnos de las tres titulaciones, ası́ como el tiempo disponible a lo largo del
IX
Elena Jurado Málaga
curso para impartirla. Por tanto, y teniendo en cuenta sobre todo esto último, los
contenidos han sido seleccionados de forma realista con la intención de que puedan
ser abarcados por completo a lo largo del curso académico. Por este motivo, la alta
carga formal que suele acompañar a los libros de esta materia ha sido aligerada,
procurando no incluir, siempre que ha sido posible, demostraciones complejas y otras
cuestiones formales que harı́an el texto inabordable en una única asignatura. Como
contrapartida se han intentado presentar los conceptos e ideas básicos de una manera
intuitiva y clara.
Otro de los aspectos que se ha tenido en cuenta al diseñar los contenidos del
manual ha sido destacar una de las aplicaciones prácticas más interesantes de esta
materia: el diseño de lenguajes de programación y de compiladores. Esto ha motivado
que, al clásico estudio de la jerarquı́a para las gramáticas formales de Chomsky, de
los Autómatas Finitos, de los Autómatas de Pila y de las Máquinas de Turing, se
hayan añadido temas como el de las gramáticas atribuidas, los reconocedores LR o
un anexo sobre la generación automática de analizadores léxicos y sintácticos. Si bien
estás últimas cuestiones pueden considerarse al margen de la asignatura, tienen un
claro interés desde el punto de vista práctico.
Considerando la próxima implantación de los nuevos planes de estudio dentro del
espacio europeo de educación superior, se ha incluido un apartado en el que se describe
el plan docente de la asignatura, indicando la metodologı́a docente, el plan de trabajo
del estudiante, ası́ como las competencias especı́ficas de la materia y de la titulación.
En este sentido, y teniendo en cuenta que el trabajo no presencial del estudiante
tiene cada vez más relevancia en el nuevo marco de las enseñanzas universitarias,
consideramos que este manual puede convertirse en una herramienta de gran utilidad
para los estudiantes, como complemento a los apuntes y como material de ayuda en
la preparación previa de los temas.
Quisiera terminar este prólogo agradeciendo la colaboración de los estudiantes que
han cursado esta asignatura durante los últimos años. Sus comentarios y sugerencias
han resultado imprescindibles para mejorar los contenidos y el diseño de las primeras
versiones de este manual.
Elena Jurado Málaga

manuales uex
X
TEORÍA DE AUTÓMATAS Y LENGUAJES FORMALES
Plan Docente
I. Descripción y contextualización
Identificación y caracterı́sticas de la materia
Denominación: Teorı́a de Autómatas y Lenguajes Formales
Curso y Titulaciones:
3o Ingenierı́a Informática,
3o Ingenierı́a Técnica en Informática de Sistemas,
3o Ingenierı́a Técnica en Informática de Gestión
Área: Lenguajes y Sistemas Informáticos
Departamento: Ingenierı́a de Sistemas Informáticos y Telemáticos
Tipo:
Troncal en Ingenierı́a Informática,
Troncal en Ingenierı́a Técnica en Informática de Sistemas,
Optativa en Ingenierı́a Técnica en Informática de Gestión
Coeficientes:
Practicidad: 3 (Medio)
Agrupamiento: 3 (Medio)
Duración: Anual, 8.18 créditos ECTS (204.5 horas)
Distribución ECTS:
Grupo Grande: 62 horas (30.31 %)
Seminario-Laboratorio: 20 horas (9.77 %)
Tutorı́a ECTS: 10 horas (4.88 %)
No presencial: 112.5 horas (55.01 %)
Descriptores (según BOE): Teorı́a de Autómatas y Lenguajes Formales
Perfiles (y subperfiles) profesionales de la titulación

manuales uex
I. Perfil Profesional de Desarrollo Software

II. Perfil Profesional de Sistemas
III. Perfil Profesional de Gestión y Explotación de Tecnologı́as de la Información
XI
Competencias Especı́ficas de la Titulación (y perfiles rela-

cionados)
1. Aprender de manera autónoma nuevos conocimientos y técnicas adecuados para
la concepción, el desarrollo o la explotación de sistemas informáticos.(Todos)
2. Comunicar de forma efectiva, tanto por escrito como oral, conocimientos, pro-
cedimientos, resultados e ideas relacionadas con las TIC y, concretamente de la
Informática, conociendo su impacto socioeconómico.(Todos)
3. Comprender la responsabilidad social, ética y profesional, y civil en su caso, de

la actividad del Ingeniero en Informática y su papel en el ámbito de las TIC y
de la Sociedad de la Información y del Conocimiento.(Todos)
4. Concebir y llevar a cabo proyectos informáticos utilizando los principios y

metodologı́as propios de la ingenierı́a.(I,II)
5. Diseñar, desarrollar, evaluar y asegurar la accesibilidad, ergonomı́a, usabilidad

y seguridad de los sistemas, aplicaciones y servicios informáticos, ası́ como de la
información que proporcionan, conforme a la legislación y normativa vigentes.(I)
6. Definir, evaluar y seleccionar plataformas hardware y software para el desarrollo

y la ejecución de aplicaciones y servicios informáticos de diversa complejidad.(I,II)
7. Disponer de los fundamentos matemáticos, fı́sicos, económicos y sociológicos

necesarios para interpretar, seleccionar, valorar, y crear nuevos conceptos, teorı́as,
usos y desarrollos tecnológicos relacionados con la informática, y su aplicación.(Todos)
8. Concebir, desarrollar y mantener sistemas y aplicaciones software empleando

diversos métodos de ingenierı́a del software y lenguajes de programación ade-
cuados al tipo de aplicación a desarrollar manteniendo los niveles de calidad
exigidos.(I)
9. Concebir y desarrollar sistemas o arquitecturas informáticas centralizadas o

distribuidas integrando hardware, software y redes.(II)
10. Proponer, analizar, validar, interpretar, instalar y mantener soluciones informáticas

en situaciones reales en diversas áreas de aplicación dentro de una organi-
zación.(Todos)
manuales uex
11. Concebir, desplegar, organizar y gestionar sistemas y servicios informáticos en

contextos empresariales o institucionales para mejorar sus procesos de nego-
cio, responsabilizándose y liderando su puesta en marcha y mejora continua,
ası́ como valorar su impacto económico y social.(III)
XII
II. Objetivos. Competencias Especı́ficas de la Ma-

teria (y relación con CET)
1. Ser capaz de realizar operaciones básicas con cadenas y con lenguajes.(7)
2. Conocer los diferentes tipos de gramáticas y de lenguajes que forman la jerar-
quı́a de Chomsky y su utilidad en el diseño de los lenguajes de programación y
sus traductores.(7)
3. Saber cómo reconocer de que tipo es una determinada gramática o lenguaje.(7)
4. Ser capaz de construir autómatas para resolver diferentes tipos de problemas y
para reconocer diferentes lenguajes.(7,11)
5. Conocer el funcionamiento de diferentes tipos de autómatas y entender el tipo
de problemas que cada uno puede resolver.(7,11)
6. Conocer y ser capaz de utilizar métodos que permitan construir, dado un
lenguaje regular: gramáticas que los generan, expresiones regulares que los re-
presentan y autómatas finitos que los reconocen.(7)
7. Conocer el esquema funcional de un traductor.(4)
8. Conocer los diferentes aspectos léxicos, sintácticos y semánticos que hay que
tener en cuenta a la hora de diseñar lenguajes formales y traductores para esos
lenguajes.(4,8)
9. Ser capaz de construir un traductor.(1,2,4,8,10)
10. Ser capaz de diseñar una gramática para un lenguaje de programación sencillo.(4,7)
11. Conocer metalenguajes que permitan describir lenguajes regulares y lenguajes
independientes del contexto.(1,8)
12. Saber utilizar herramientas que permitan generar automáticamente analizado-
res léxicos y sintácticos.(1,8)
13. Ser capaz de calcular la complejidad espacial y temporal de máquinas de Turing
sencillas.(5,6,10,11)
14. Entender el concepto de recursividad y de calculabilidad.(5,6,7,10,11)
manuales uex
15. Ser capaz de demostrar que algunas funciones son recursivas primitivas o µ-
recursivas.(5,6,7)
16. Entender el concepto y conocer ejemplos de problemas de la clase P, NP o
NP-completo.(5,6,7)
XIII
III. Contenidos
Los contenidos de la asignatura son los que se describen a lo largo de este docu-
mento (ver Índice General ).
Interrelaciones
1. Las asignaturas de 1o curso, Elementos de Programación y Laboratorio
de Programación I, y de 2o curso, Estructuras de Datos y Algoritmos y
Laboratorio de Programación II, son requisitos para esta asignatura ya que
proporcionan los conocimientos sobre programación necesarios para abordar la
tarea de la construcción de un compilador. También permiten que el alumno
conozca con antelación conceptos básicos para la asignatura como el de lenguaje
de programación y el de compilador.
2. El concepto de complejidad algorı́tmica se ha tratado en asignaturas como

Elementos de Programación y Estructuras de Datos y Algoritmos. En
nuestra asignatura éste se relaciona con el concepto de Maquina de Turing.
3. La asignatura de Teorı́a de Autómatas y Lenguajes Formales debe sentar las

bases para que los alumnos de Ingenierı́a Informática puedan abordar con
garantı́as la asignatura de 5o curso Procesadores de Lenguajes
IV. Metodologı́a docente y plan de trabajo del es-

tudiante
En esta sección se describe la metodologı́a utilizada para cada uno de los temas
que aparecen en este manual. A cada una de las actividades programadas se le asigna
un determinado tipo y el número de horas estimadas de dedicación del estudiante. A
continuación se indican las siglas utilizadas para representar los diferentes tipos de
actividades:
GG Grupo grande S Seminario-Laboratorio
Tut Tutorı́a ECTS NO No Presencial.
Tema 1. Preliminares (Objetivos: 1,7)

Lectura y estudio (previo y/o posterior)(NP): 1h.
manuales uex
Explicación, discusión y ejemplificación en clase(GG): 3h.

Realización de ejercicios propuestos (NP): 3h.
Tema 2. Lenguajes y Gramáticas Formales (Objetivos: 1,2)
XIV

Explicación de cuestiones y ejercicios relacionados con la teorı́a(GG): 2h.
Tema 3. Expresiones y gramáticas regulares (Objetivos: 1,3,8,10,12,11)

Prácticas (S): 2h.
Revisión de las actividades prácticas (Tut): 2h.
Tema 4. Autómatas Finitos (Objetivos: 3,4,5,8,6,12,11)

Evaluación del primer bloque temático
Tema 5. Gramáticas Independientes del Contexto (GIC) y Autómatas de Pila

(Objetivos: 3,4,5,8,9,10,12,11)
manuales uex
Tema 6. Gramáticas Atribuidas (Objetivos: 7,8,10,12,11)

XV

Tema 7. Máquinas de Turing(MT) (Objetivos: 4,5)

Tema 8. Gramáticas de tipo 0 y 1 (Objetivos: 3)

Tema 9. Computabilidad y Máquinas de Turing (Objetivos: 13,14,15)

Tema 10. Introducción a la Complejidad Computacional (Objetivos: 16)

V. Evaluación
Criterios de Evaluación
1. Aplicar los conceptos y métodos estudiados para la resolución de problemas
manuales uex
relacionados con el diseño de autómatas y gramáticas.

En este aspecto, las principales habilidades a tener en cuenta son:
a) Definir formalmente un lenguaje.
XVI
b) Ser capaz de determinar el tipo al que pertenece un lenguaje.

c) Ser capaz de convertir un Autómata Finito No Determinista en Autómata
Finito Determinista.
d ) Diseñar una gramática a partir del autómata que reconoce al lenguaje que
ésta genera.
e) Construir el autómata que reconoce a un determinado lenguaje.
f ) Diseñar una máquina de Turing que resuelva un problema dado o que
reconozca o genere un lenguaje determinado.
g) Ser capaz de probar que una función es recursiva primitiva o µ-recursiva.
2. Diseñar un lenguaje formal y construir, utilizando las herramientas adecuadas,

un traductor para dicho lenguaje.
Actividades e instrumentos de evaluación

Examen parcial Prueba de desarrollo escrito con 1 pregunta dirigida a la compren-
sión de conceptos y 4 o 5 a la aplicación los métodos para resolver problemas
relacionados con el diseño de lenguajes y autómatas (Temas 1-4). (20 %)
Examen final Prueba de desarrollo escrito con 1 pregunta dirigida a la compren-

sión de conceptos y 4 o 5 a la aplicación los métodos para resolver problemas
relacionados con el diseño de lenguajes y autómatas. (55 %)
Seminarios y Tutorı́as ECTS Revisión y análisis del trabajo no presencial del

alumno ası́ como del trabajo desarrollado en los Seminarios.
1. Revisión de ejercicios prácticos a realizar por el alumno durante los Semi-

narios. (5 %)
2. Revisión del lenguaje y del traductor construido por el alumno, haciendo
especial hincapié en un correcto diseño de ambos. Prueba en la que el
alumno debe realizar una sencilla ampliación de su trabajo práctico con el
objetivo de valorar el control que tiene sobre su trabajo. (20 %)
manuales uex
XVII
Índice General
1. Preliminares 5
1.1. Antecedentes históricos y conceptos básicos . . . . . . . . . . . . . . . 5
1.2. Desarrollo de la asignatura . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3. Conceptos básicos sobre compiladores . . . . . . . . . . . . . . . . . . 10
1.3.1. Componentes de un compilador . . . . . . . . . . . . . . . . . 11
2. Lenguajes y Gramáticas Formales 15

2.1. Definiciones básicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.2. Operaciones con palabras . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.3. Lenguajes y operaciones con lenguajes . . . . . . . . . . . . . . . . . 17
2.4. Concepto de gramática formal . . . . . . . . . . . . . . . . . . . . . . 19
2.4.1. Definiciones previas . . . . . . . . . . . . . . . . . . . . . . . . 19
2.4.2. Ejemplo con un lenguaje natural(castellano) . . . . . . . . . . 20
2.4.3. Ejemplo en un lenguaje artificial . . . . . . . . . . . . . . . . 21
2.4.4. Definición de gramática formal . . . . . . . . . . . . . . . . . 22
2.5. Clasificación de las gr. formales . . . . . . . . . . . . . . . . . . . . . 24
2.5.1. Gramáticas de tipo 0 . . . . . . . . . . . . . . . . . . . . . . . 24
2.6. Gramáticas equivalentes . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.6.1. Simplificación de gramáticas . . . . . . . . . . . . . . . . . . . 26
2.7. Problemas y cuestiones . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3. Expresiones y gramáticas regulares 33

3.1. Definición de expresión regular . . . . . . . . . . . . . . . . . . . . . . 33
Manuales Uex
3.2. Álgebra de las expresiones regulares . . . . . . . . . . . . . . . . . . . 34

3.3. Definición de gramática regular . . . . . . . . . . . . . . . . . . . . . 35
3.4. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.5. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
1
1
ELENA JURADO MÁLAGA
2 ÍNDICE GENERAL
4. Autómatas Finitos 39
4.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
4.2. Definición de Autómata Finito Determinista . . . . . . . . . . . . . . 40
4.3. Representación de Autómatas . . . . . . . . . . . . . . . . . . . . . . 40
4.4. Los AFD como reconocedores de lenguajes . . . . . . . . . . . . . . . 43
4.5. Minimización de un AFD . . . . . . . . . . . . . . . . . . . . . . . . . 43
4.6. Autómatas Finitos No Deterministas(AFND) . . . . . . . . . . . . . 47
4.7. Lenguaje aceptado por un AFND . . . . . . . . . . . . . . . . . . . . 50
4.8. Simulación de un AFD y AFND . . . . . . . . . . . . . . . . . . . . . 51
4.9. Paso de un AFND a AFD . . . . . . . . . . . . . . . . . . . . . . . . 52
4.10. Relación entre AF, gr. y exp. reg. . . . . . . . . . . . . . . . . . . . . 55
4.10.1. Construcción de la expresión regular reconocida por un AF . . 55
4.10.2. Construcción del AF que reconoce una expresión regular . . . 58
4.10.3. Relación entre A.F. y gramáticas regulares . . . . . . . . . . . 62
4.11. Lı́mites para los leng. regulares . . . . . . . . . . . . . . . . . . . . . 65
4.11.1. El lema del bombeo(pumping lemma) . . . . . . . . . . . . . . 65
4.11.2. El teorema de Myhill-Nerode . . . . . . . . . . . . . . . . . . 66
4.12. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
5. G.I.C y Autómatas de Pila 73

5.1. Definición de G.I.C. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
5.2. Autómatas de Pila . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
5.3. Árboles de derivación . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
5.3.1. Ambigüedad. . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
5.4. Reconocimiento descendente . . . . . . . . . . . . . . . . . . . . . . . 80
5.4.1. Simplificación de las GIC . . . . . . . . . . . . . . . . . . . . . 81
5.4.2. Reconocedores LL(1) . . . . . . . . . . . . . . . . . . . . . . . 83
5.5. Reconocimiento ascendente . . . . . . . . . . . . . . . . . . . . . . . . 87
5.5.1. Construcción de la Tabla de Acciones . . . . . . . . . . . . . . 89
5.6. Propiedades de los L.I.C. . . . . . . . . . . . . . . . . . . . . . . . . . 93
5.6.1. El lema del bombeo para LIC(pumping lemma) . . . . . . . . 94
5.7. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
6. Gramáticas Atribuidas 97
6.1. Concepto de Semántica y de Gramática Atribuida . . . . . . . . . . . 97
6.2. Atributos heredados y sintetizados . . . . . . . . . . . . . . . . . . . 99
Manuales Uex
6.3. Gramáticas S-atribuidas y L-Atribuidas . . . . . . . . . . . . . . . . . 100

6.3.1. Gramáticas S-atribuidas . . . . . . . . . . . . . . . . . . . . . 100
6.3.2. Gramáticas L-atribuidas . . . . . . . . . . . . . . . . . . . . . 101
6.4. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
2
ÍNDICE GENERAL 3
7. Máquinas de Turing 105

7.1. Introducción. Antecedentes históricos . . . . . . . . . . . . . . . . . . 105
7.2. Definición y ejemplos de M.T.’s . . . . . . . . . . . . . . . . . . . . . 107
7.3. Restricciones a la M.T. . . . . . . . . . . . . . . . . . . . . . . . . . . 110
7.3.1. M.T. con alfabeto binario . . . . . . . . . . . . . . . . . . . . 111
7.3.2. M.T. con la cinta limitada en un sentido . . . . . . . . . . . . 112
7.3.3. M.T. con restricciones en cuanto a las operaciones que realiza
simultáneamente . . . . . . . . . . . . . . . . . . . . . . . . . 112
7.4. Modificaciones de la M.T. . . . . . . . . . . . . . . . . . . . . . . . . 113
7.4.1. Almacenamiento de información en el control finito . . . . . . 113
7.4.2. Pistas múltiples . . . . . . . . . . . . . . . . . . . . . . . . . . 114
7.4.3. Sı́mbolos de chequeo . . . . . . . . . . . . . . . . . . . . . . . 114
7.4.4. Máquinas multicinta . . . . . . . . . . . . . . . . . . . . . . . 115
7.4.5. M.T. no determinista . . . . . . . . . . . . . . . . . . . . . . . 116
7.5. Técnicas para la construcción de M.T. . . . . . . . . . . . . . . . . . 116
7.6. La M.T. Universal . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
7.7. La M.T. como generadora de lenguajes . . . . . . . . . . . . . . . . . 119
7.8. La tesis de Church-Turing . . . . . . . . . . . . . . . . . . . . . . . . 120
7.9. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
8. Gramáticas de tipo 0 y 1 123

8.1. Gramáticas de tipo 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
8.2. Lenguajes de tipo 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
8.3. El problema de la parada . . . . . . . . . . . . . . . . . . . . . . . . . 126
8.4. Lenguajes y gramáticas de tipo 1 . . . . . . . . . . . . . . . . . . . . 126
9. Computabilidad y Máquinas de Turing 129

9.1. Funciones calculables . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
9.2. Funciones recursivas . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
9.2.1. Funciones recursivas primitivas . . . . . . . . . . . . . . . . . 132
9.2.2. Funciones µ-recursivas . . . . . . . . . . . . . . . . . . . . . . 134
9.3. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
10.Introducción a la Complejidad Computacional 137

10.1. Complejidad y Máquinas de Turing . . . . . . . . . . . . . . . . . . . 137
10.2. Medidas de complejidad algorı́tmica . . . . . . . . . . . . . . . . . . . 138
10.3. Problemas P, NP y NP-completos . . . . . . . . . . . . . . . . . . . . 141
Manuales Uex
A. Generación automática de analizadores 143

A.1. Generador de analizadores léxicos . . . . . . . . . . . . . . . . . . . . 143
A.1.1. Cómo utilizar PCLEX . . . . . . . . . . . . . . . . . . . . . . 144
A.1.2. Estructura de un programa Lex . . . . . . . . . . . . . . . . . 144
3
4 ÍNDICE GENERAL
A.1.3. Cómo representar una expresión regular . . . . . . . . . . . . 146

A.1.4. Variables y procedimientos predefinidos . . . . . . . . . . . . . 147
A.1.5. Condiciones de comienzo . . . . . . . . . . . . . . . . . . . . . 148
A.1.6. Acciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
A.2. Generador de analizadores sintácticos . . . . . . . . . . . . . . . . . . 149
A.2.1. Cómo utilizar PCYACC . . . . . . . . . . . . . . . . . . . . . 150
A.2.2. Estructura de un programa para YACC . . . . . . . . . . . . . 151
A.2.3. Gramáticas atribuidas . . . . . . . . . . . . . . . . . . . . . . 152
A.2.4. Prioridad y asociatividad de operadores . . . . . . . . . . . . . 152
Manuales Uex
4
Tema 1
Preliminares
Contenido
1.1. Antecedentes históricos y conceptos básicos . . . . . . . 5
1.2. Desarrollo de la asignatura . . . . . . . . . . . . . . . . . . 8
1.3. Conceptos básicos sobre compiladores . . . . . . . . . . . 10
En este primer tema de la asignatura pretendemos sentar las bases de la misma

y explicar cuál va a ser su estructura. En la sección 1.1 explicaremos cuales son los
temas centrales sobre los que va a girar la asignatura, ası́ como los antecedentes
históricos sobre los que se han desarrollado estos temas, mencionando los personajes
que más han influido en su nacimiento. La estructura de la asignatura es el contenido
fundamental de la sección 1.2 en la que también se detallan algunas de las aplicaciones
más interesantes de los conceptos teóricos que estudiaremos. Teniendo en cuenta que
probablemente la aplicación práctica más interesante de esta asignatura es el diseño
de lenguajes de computación y la construcción de sus correspondientes traductores,
en la sección 1.3 se sentarán las bases que permitirán entender la estructura de un
compilador y las tareas que debe llevar a cabo.
1.1. Antecedentes históricos y conceptos básicos

La mayor parte del conocimiento cientı́fico es el resultado de muchos años de
investigación, con frecuencia sobre temas que aparentemente no tienen una relación
directa. Como veremos, esto sucede también con un campo como la Informática Teóri-
ca (ámbito en el que se enmarca la asignatura de Teorı́a de Autómatas y Lengua-
Manuales Uex
jes Formales). Esta materia se ha desarrollado gracias a la confluencia de campos

muy diferentes, como son: las matemáticas, la teorı́a de máquinas, la lingüı́stica, etc.
Podemos considerarla, por tanto, como una materia multidisciplinar. En este aparta-
do pretendemos explicar de manera intuitiva los conceptos básicos que constituyen las
5
5
6 TEMA 1. PRELIMINARES
bases de la asignatura ası́ como los campos cientı́ficos que han influido fundamental-
mente en el desarrollo de esta materia y que nos ayudarán a entender sus aplicaciones
más importantes.
Veamos, en primer lugar, la relación entre conceptos que trataremos a lo largo
de todo el temario: lenguaje, gramática y autómata. Toda comunicación conlle-
va la utilización de un lenguaje, que podemos definir como un conjunto de palabras
(también llamadas cadenas) formadas por sı́mbolos de un alfabeto. Las gramáticas
permitirán definir la estructura de los lenguajes, es decir, proporcionarán las formas
válidas en las que se pueden combinar los sı́mbolos del alfabeto para construir ca-
denas correctas. Una máquina abstracta o autómata es un dispositivo teórico que
recibe como entrada una cadena de sı́mbolos y los procesa, cambiando de estado, de
manera que genera una determinada salida. Los autómatas pueden servir, entre otras
cosas, para determinar si una palabra pertenece o no a un determinado lenguaje. Por
lo tanto, las gramáticas nos permitirán definir lenguajes y los autómatas podrán re-
conocer las palabras de dichos lenguajes. A pesar de la conexión que existe entre estos
conceptos, los trabajos iniciales sobre autómatas y lenguajes tienen, como veremos a
continuación, un origen diferente.
Para encontrar los principios de la Informática Teórica debemos remontarnos a
los años 30, década en la que el mundo de las matemáticas se hallaba ocupado, sobre
todo, en temas como la lógica y la definición de sistemas axiomáticos.
El método axiomático requiere una colección de enunciados básicos, llamados
axiomas, que describen las propiedades fundamentales del sistema que se estudia.
A partir de estos axiomas, se derivan enunciados adicionales, llamados teoremas,
aplicando secuencias finitas de reglas de inferencia.
Una ventaja del método axiomático es que ofrece un modelo de razonamiento
deductivo en el cual todas las suposiciones están aisladas en los axiomas iniciales y
las reglas de inferencia. Cualquier enunciado que se derive posteriormente será una
consecuencia de estas suposiciones.
A principios del siglo XX, muchos matemáticos creı́an que era posible encontrar un
único sistema axiomático en el que podrı́an basarse todas las matemáticas. Su meta
era encontrar un conjunto de axiomas y reglas de inferencia correctos de manera que
las matemáticas pudieran reducirse a un sistema computacional con el cual pudiera
deducirse la veracidad o falsedad de cualquier enunciado matemático. Uno de los
principales defensores de esta idea era el conocido matemático alemán Hilbert.
Sin embargo, en 1931, el austriaco Kurt Gödel publicó el “Teorema de la in-
completitud”, en el que demostraba que era imposible la completa axiomatización
de las matemáticas. Este teorema incrementó el debate por el poder de los métodos
Manuales Uex
axiomáticos y los procesos computacionales.

En 1937, el matemático inglés Alan Turing, en su artı́culo “Sobre los números
computables”, presentó la conocida Máquina de Turing(M.T.), una entidad matemática
6
1.1. ANTECEDENTES HISTÓRICOS Y CONCEPTOS BÁSICOS 7
abstracta con la que se formalizó el concepto de algoritmo1 , además demostró que

muchos problemas perfectamente definidos no pueden ser resueltos mediante una
M.T., es decir, no son computables y de esta manera ratificó la teorı́a de Gödel. Esta
máquina serı́a la precursora, desde un punto de vista teórico, de los computadores que
se construyeron durante la siguiente década. La Máquina de Turing tiene el poder
computacional más alto conocido hasta el momento, es decir, es capaz de resolver
cualquier problema que tenga una solución computacional.
Podemos considerar todo esto como el primer eslabón dentro del campo de la
Informática Teórica. El segundo eslabón se ubicarı́a en un campo muy cercano a la
Electrónica en el que el matemático Shannon estableció las bases para la aplicación
de la lógica matemática al diseño de los circuitos combinatorios y secuenciales. Las
ideas de Shannon derivarı́an en la formalización de una teorı́a de máquinas secuen-
ciales y autómatas, cuyo principal objetivo era representar de manera formal el com-
portamiento de un determinado dispositivo electrónico o mecánico. Los autómatas
son, en un sentido amplio, sistemas que aceptan señales del medio que les rodea, cam-
bian de estado como consecuencia de estas señales y trasmiten otras señales al medio.
En este sentido, un electrodoméstico común, una central telefónica, un ordenador, e
incluso ciertas facetas del comportamiento de los seres vivos pueden modelarse me-
diante autómatas. A finales de los años 50 se comenzó a estudiar la utilidad de los
autómatas en relación con los lenguajes de programación y su proceso de traducción.
La Teorı́a de Autómatas estudia diferentes niveles de autómatas entre los que
podemos destacar, de una parte, los Autómatas Finitos por constituir el grupo más
sencillo de autómatas y, de otra, las Máquinas de Turing que, por el contrario, son
los autómatas más complejos y con mayor poder computacional. Estos dos tipos de
autómatas representan los dos extremos de la jerarquı́a, otros niveles intermedios los
encontramos en los Autómatas de Pila y en los Autómatas Linealmente Acotados.
Básicamente, la diferencia principal entre estos autómatas estriba en la utilización o
no de memoria auxiliar y en la forma de acceso a dicha memoria.
Para llegar al tercer eslabón de la Informática Teórica hay que saltar al campo de la
lingüı́stica. En la década de los años 50, el lingüista y pensador Noam Chomsky, en
un intento de formalizar los lenguajes naturales, estableció las bases de la lingüı́stica
matemática o formal y con ello proporcionó una poderosa herramienta que facilitó la
definición de los primeros lenguajes de programación, que empezaban a surgir en esa
época.
Manuales Uex
1
Un algoritmo puede considerarse como un método genérico que, en un número finito de pasos
o computaciones, permite resolver un determinado problema. Recordemos que la palabra algoritmo
debe su nombre a un matemático persa Abu Ja’far Mohamed ibn Musa al-Jowâizmı̂, autor de un
tratado de aritmética publicado en el año 825.
7
1.2. Desarrollo de la asignatura

Chomsky clasificó las gramáticas formales (y los lenguajes que éstas generan) de
acuerdo a una jerarquı́a de cuatro niveles representada en la tabla 1.1. Sorprendente-
mente, es posible establecer una relación biunı́voca entre los diferentes niveles de la
jerarquı́a de Chomsky y cuatro niveles de una jerarquı́a definida entre los diferentes
tipos de autómatas. A cada nivel de gramática se le puede asociar de forma natural
un conjunto de lenguajes que serán los que esas gramáticas generan, pero además, se
le puede asociar una clase de autómatas formada por aquellos que podrán reconocer
a dichos lenguajes.
La siguiente figura describe la relación que hay entre los diferentes niveles de
gramáticas de la jerarquı́a de Chomsky, los lenguajes que generan y las máquinas que
reconocen estos lenguajes.
Lenguajes Gramáticas Autómatas
Lenguajes recursivamente enumerables Máquinas

Gr.
tipo 0 de Turing
Lenguajes recursivos
Lenguajes Dependientes del Contexto Autómatas

Gr.
Linealmente
Lenguajes Independientes del Contexto tipo 1
Acotados
Leng. LR(k)
Gr. Autómatas
Leng. LR(1) tipo 2 de Pila
Leng. LL(k)
Leng. LL(1) Autómatas

Gr.
tipo 3 Finitos
Leng. (expresiones) regulares
Figura 1.1: Jerarquı́a de gramáticas, lenguajes y autómatas
Cada nivel de lenguaje se corresponde con un tipo de autómata. Por ejemplo,

dado un lenguaje de tipo 3 siempre será posible encontrar un Autómata Finito que
reconozca dicho lenguaje, es decir, que permita determinar si una determinada pala-
Manuales Uex
bra pertenece o no al lenguaje. Si el lenguaje es de tipo 2 será necesario utilizar un

autómata más complejo, concretamente un Autómata de Pila. La figura 1.1, además
de sintetizar la Jerarquı́a de Chomsky, presenta un sencillo esquema de los temas a
abordar durante el curso. Comenzaremos con el estudio de los lenguajes más sencillos
8
1.2. DESARROLLO DE LA ASIGNATURA 9
(los de tipo 3) y de los autómatas asociados a ellos, para acabar con el estudio de
los lenguajes de tipo 0 y de las M.T. Los nombres de los lenguajes de la jerarquı́a
de Chomsky aparecen destacados en esta figura, pero también aparecen otros con-
juntos de lenguajes que representan niveles intermedios de esta jerarquı́a y que por
su interés serán también estudiados en la asignatura. Concretamente, los lenguajes
LL(1) y LR(1), incluidos en el conjunto de los lenguajes independientes del contexto
se estudiarán en el tema 5 y los lenguajes recursivos serán tratados en el tema 8.
Como muestra la figura 1.1, en los tres conceptos estudiados (gramáticas, lengua-
jes y autómatas) cada nivel contiene al anterior. Por ejemplo, cualquier lenguaje de
tipo 3 es a su vez un lenguaje de tipo2 (sin embargo, comprobaremos que lo contrario
no es cierto), es decir (L3�L2�L1�L0). De la misma forma, un Autómata Finito
puede considerarse como un caso particular de Autómata de Pila y éste como un
caso particular de Máquina de Turing.
A continuación comentaremos cuáles son las principales aplicaciones de los temas
que se estudiarán en esta asignatura.
El estudio de las gramáticas formales será una herramienta muy útil para el
diseño de los lenguajes de programación. El estudio de determinados autómatas
(concretamente los autómatas finitos y los de pila) permitirá construir de ma-
nera sistemática algunos de los componentes básicos de los compiladores.
Los autómatas finitos se pueden aplicar con éxito en el procesamiento del

lenguaje natural, por ejemplo, en la categorización gramatical de las palabras
en una oración o en la extracción de información a partir de grandes volúmenes
de texto. También pueden ser utilizados para manipular ficheros de texto que
almacenan una información estructurada, por ejemplo, con objeto de modificar
dicha estructura.
Los autómatas, en general, tienen una gran aplicación en el mundo industrial,

ya que permiten modelar el comportamiento de cualquier dispositivo electro-
mecánico: una cadena de montaje, un robot, un electrodoméstico, etc. También
pueden ser utilizados para el reconocimiento de patrones y para el diseño de
redes neuronales. Los Autómatas Finitos ayudan a diseñar software que com-
pruebe la corrección de cualquier sistema que tenga un número finito de estados:
protocolos de comunicación, protocolos para el intercambio seguro de informa-
ción, etc. También se utilizan en el diseño y la verificación del comportamiento
de circuitos digitales.
Manuales Uex
Los lenguajes regulares se pueden utilizar para especificar argumentos en de-

terminados comandos de un sistema operativo o de un sistema de búsqueda de
información.
9
Los autómatas son también esenciales para el estudio de los lı́mites de la com-
putación. En este terreno, existen dos cuestiones importantes que nos podemos
plantear y que se estudiarán en los últimos temas de la asignatura:
1. ¿Qué puede hacer un computador? Utilizaremos el concepto de computa-

bilidad para aplicarlo a los problemas que puede resolver un computador.
2. ¿Qué puede hacer un computador eficientemente? Diremos que un proble-
ma es tratable, si un computador puede resolverlo en un tiempo que crezca
lentamente al aumentar el tamaño de los datos de entrada.
1.3. Conceptos básicos sobre compiladores

Salvo los dos últimos temas que se centrarán en la teorı́a de la computación,
el planteamiento del resto de los temas estará, en general, enfocado al diseño de
lenguajes de programación y a la construcción de compiladores, teniendo en cuenta
que es ésta una de las aplicaciones más interesantes de los conceptos teóricos tratados
en esta asignatura. Por este motivo, en esta sección se introducen conceptos muy
elementales sobre el proceso de traducción de los lenguajes de programación.
Un traductor es un programa que recibe como entrada un texto escrito en un
lenguaje, llamado fuente, y genera como salida otro texto equivalente pero escrito
en un lenguaje diferente denominado objeto.
En el caso de que el lenguaje fuente sea un lenguaje de programación de alto
nivel y el objeto sea un lenguaje de bajo nivel (ensamblador o código máquina), a
dicho traductor se le denomina compilador. Análogamente, un ensamblador es un
traductor cuyo lenguaje fuente es el lenguaje ensamblador.
A diferencia de los programas mencionados anteriormente, un intérprete es un
traductor que no genera un programa en código objeto, sino que toma una sentencia
del programa fuente en un lenguaje de alto nivel, la traduce y la ejecuta directamente.
En los primeros lenguajes, y debido a la escasez de memoria de los ordenadores
de la época, se impuso la utilización de intérpretes frente a la de compiladores, pues
el programa fuente y el intérprete juntos requerı́an menos memoria que la que era
necesaria para el proceso de compilación. Por ello, los primero ordenadores personales
tenı́an instalado habitualmente un intérprete para el lenguaje BASIC. Sin embargo,
con el tiempo se impusieron los compiladores debido, sobre todo, a la información que
ofrecı́an sobre los errores cometidos por el programador, y a una mayor velocidad de
ejecución del código resultante. A modo de resumen, los siguientes párrafos indican
las ventajas que pueden tener un método de traducción frente al otro.
Manuales Uex
Ventajas del compilador frente al intérprete
El programa se compila una sola vez, pero se puede ejecutar muchas.
10
1.3. CONCEPTOS BÁSICOS SOBRE COMPILADORES 11
La ejecución del programa objeto es mucho más rápida que la interpretación

del fuente.
El compilador tiene una visión completa del programa, por lo que puede dar
una información más detallada de los errores cometidos por el programador.
Ventajas del intérprete
El intérprete necesita menos memoria que el compilador.
Permite una mayor interactividad con el código en tiempo de desarrollo.
Un compilador no suele funcionar de manera aislada sino que se apoya en otros

programas para conseguir su objetivo. Algunos de estos programas de apoyo se descri-
ben a continuación. El preprocesador se ocupa de incluir ficheros, expandir macros,
eliminar comentarios, etc. El enlazador (linker ) construye el fichero ejecutable añadi-
endo al fichero objeto las cabeceras necesarias y las funciones de librerı́a utilizadas
por el programa fuente. El depurador permite seguir paso a paso la ejecución del
programa. Finalmente, muchos compiladores generan un programa en lenguaje en-
samblador que debe después convertirse en un ejecutable mediante la utilización de
un ensamblador.
1.3.1. Componentes de un compilador

Un compilador es un programa complejo en el que no es fácil distinguir claramente
unas partes de otras. Sin embargo, se ha conseguido establecer una división lógica del
compilador en fases, lo que permite formalizar y estudiar por separado cada una de
ellas. En la práctica, estas fases no siempre se ejecutan secuencialmente sino que lo
hacen simultáneamente, pudiendo ser unas fases tratadas como subrutinas de otras.
Análisis léxico El analizador léxico, también conocido como scanner, lee los ca-
racteres del programa fuente, uno a uno, desde el fichero de entrada y va formando
grupos de caracteres con alguna relación entre sı́ (tokens). Cada token es tratado co-
mo una única entidad, constituyendo la entrada de la siguiente fase del compilador.
Existen diferentes tipos de tokens y a cada uno se le puede asociar un tipo y, en
algunos casos, un valor. Los tokens se pueden agrupar en dos categorı́as:
Manuales Uex
Cadenas especı́ficas, como las palabras reservadas (if, while, . . .), signos de pun-
tuación (., ,, =, . . .), operadores aritméticos (+,*, . . .) y lógicos (AND, OR, . . .),
etc. Habitualmente, las cadenas especı́ficas no tienen asociado ningún valor, sólo
su tipo.
11
Cadenas no especı́ficas, como los identificadores o las constantes numéricas o de

texto. Las cadenas no especı́ficas siempre tienen tipo y valor. Por ejemplo, si
dato es el nombre de una variable, el tipo del token será identificador y su
valor será dato.
Frecuentemente el analizador léxico funciona como una subrutina del analizador

sintáctico. Para el diseño del analizadores léxicos se utilizan los Autómatas Finitos.
Análisis sintáctico El analizador sintáctico, también llamado parser, recibe como

entrada los tokens que genera el analizador léxico y comprueba si estos tokens van
llegando en el orden correcto. Siempre que no se hayan producido errores, la salida
teórica de esta fase del compilador será un árbol sintáctico. Si el programa es in-
correcto se generarán los mensajes de error correspondientes. Para el diseño de los
analizadores sintácticos se utilizan los Autómatas de Pila.
Análisis semántico El analizador semántico trata de determinar si el significado

de las diferentes instrucciones del programa es válido. Para conseguirlo tendrá que
calcular y analizar información asociada a las sentencias del programa, por ejemplo,
deberá determinar el tipo de los resultados intermedios de la expresiones, comprobar
que los argumentos de un operador pertenecen al conjunto de los operandos posibles,
comprobar que los operandos son compatibles entre si, etc.
La salida teórica de esta fase será un árbol semántico. Éste es una ampliación de
un árbol sintáctico en el que cada rama del árbol ha adquirido, además, el significado
que debe tener el fragmento de programa que representa. Esta fase del análisis es
más difı́cil de formalizar que las dos anteriores y se utilizarán para ello las gramáticas
atribuidas.
Generación de código intermedio Cuando una empresa se dedica a la gen-

eración de compiladores, normalmente trabaja con muchos lenguajes fuentes (m) y
con muchos lenguajes objetos (n) diferentes. Para evitar el tener que construir m*n
compiladores, se utiliza un lenguaje intermedio. De esta forma sólo hay que construir
m programas que traduzcan cada lenguaje fuente al código intermedio (front ends)
y n programas que traduzcan del lenguaje intermedio a cada lenguaje objeto (back
ends). La utilización del lenguaje intermedio permite construir en menos tiempo
compiladores para nuevos lenguajes y para nuevas máquinas. Desgraciadamente, no
existe consenso para utilizar un único lenguaje intermedio.
Manuales Uex
Optimización de código La mayorı́a de los compiladores suelen tener una fase de

optimización de código intermedio (independiente de los lenguajes fuente y objeto),
y una fase de optimización de código objeto (no aplicable a otras máquinas).
12
1.3. CONCEPTOS BÁSICOS SOBRE COMPILADORES 13
Estas fases se añaden al compilador para conseguir que el programa objeto sea
más rápido y necesite menos memoria para ejecutarse.
Veamos en los siguientes párrafos algunos ejemplos de optimización:
Eliminar expresiones comunes. Por ejemplo:
A := B+C+D Aux := B+C

E := (B+C)*F se convierte en A := Aux + D
E := Aux * F
Optimizar los bucles. Se trata de sacar de los bucles aquellas expresiones que
sean invariantes.
REPEAT
B := 1
A := A-B
UNTIL A = 0 La asignación B := 1 se puede sacar del bucle
Generación de código objeto En esta fase, el código intermedio optimizado es

traducido a una secuencia de instrucciones en ensamblador o en código máquina. Por
ejemplo, la sentencia A := B+C se convertirı́a en una colección de instrucciones que
podrı́an representarse ası́:
LOAD B
ADD C
STORE A
Tabla de sı́mbolos El compilador necesita gestionar la información de los elemen-

tos que se va encontrando en el programa fuente: variables, tipos, funciones, clases,
etc. Esta información se almacena en una estructura de datos interna conocida como
tabla de sı́mbolos.
Para que la compilación sea eficiente la tabla debe ser diseñada cuidadosamente
de manera que contenga toda la información que el compilador necesita. Además, hay
que prestar especial atención a la velocidad de acceso a la información con objeto de
no ralentizar el proceso.
Control de errores Informar adecuadamente al programador de los errores que

hay en su programa es una de las misiones más importantes y complejas de un
compilador. Es una tarea difı́cil porque a veces unos errores ocultan a otros, o porque
Manuales Uex
un error desencadena una avalancha de errores asociados. El control de errores se

lleva a cabo, sobre todo, en las etapas de análisis sintáctico y semántico.
13
Tema 2
Lenguajes y Gramáticas Formales
Contenido
2.1. Definiciones básicas . . . . . . . . . . . . . . . . . . . . . . 15
2.2. Operaciones con palabras . . . . . . . . . . . . . . . . . . . 16
2.3. Lenguajes y operaciones con lenguajes . . . . . . . . . . . 17
2.4. Concepto de gramática formal . . . . . . . . . . . . . . . . 19
2.5. Clasificación de las gr. formales . . . . . . . . . . . . . . . 24
2.6. Gramáticas equivalentes . . . . . . . . . . . . . . . . . . . 26
2.7. Problemas y cuestiones . . . . . . . . . . . . . . . . . . . . 29
En este tema se abordan los conceptos de gramática y lenguaje formal. El tema

comienza con la definición de una serie de conceptos básicos, seguidamente, se es-
tudian las diferentes operaciones que se pueden llevar a cabo con palabras y con
lenguajes, y las propiedades que estas operaciones tienen. Probablemente el punto
central de este tema es la introducción del concepto de gramática formal, que se
hará en primer lugar de forma intuitiva, hasta llegar a una definición formal. El tema
acaba con la presentación de una taxonomı́a de las gramáticas formales realizada
por Noam Chomsky y con el estudio de algunos métodos para simplificar ciertas
gramáticas.
2.1. Definiciones básicas

A continuación se incluyen las definiciones de conceptos elementales que se uti-
Manuales Uex
lizarán a lo largo de toda la asignatura.

Alfabeto: conjunto no vacı́o y finito de sı́mbolos. A estos sı́mbolos también se les
suele llamar letras del alfabeto. Se denota con la letra griega Σ. Ejemplos:
15
15
16 TEMA 2. LENGUAJES Y GRAMÁTICAS FORMALES
Σ1 = {a,b,c,...,z} Σ2 = {0,1}
Palabra: secuencia finita de sı́mbolos de un alfabeto. Lo correcto es hablar de “pala-

bras definidas sobre un alfabeto”. Habitualmente utilizaremos en nuestros ejem-
plos las últimas letras minúsculas de nuestro alfabeto (x, y, z) para denotar a
las palabras. Ejemplos:
x = casa es una palabra definida sobre el alfabeto Σ1
y = 010100 es una palabra definida sobre el alfabeto Σ2
Palabra vacı́a: es una palabra que no tiene ningún sı́mbolo y se representa como λ.
Longitud de una palabra: es el número de sı́mbolos que componen la palabra. Se

representa utilizando dos barras verticales(||). Ejemplos:
|x| = 4 |y| = 6 |λ| = 0
Lenguaje Universal definido sobre un alfabeto es el conjunto de todas las palabras

que se pueden construir con las letras de dicho alfabeto. Se denota por ω(Σ).
El lenguaje universal de cualquier alfabeto es infinito, y siempre pertenece a él
la palabra vacı́a.
Ejemplo: si Σ = {a} entonces ω(Σ) = {λ, a, aa, aaa, ...}
Lenguaje L definido sobre un alfabeto Σ, es un conjunto cualquiera de palabras

definidas sobre dicho alfabeto, por lo tanto, L ⊂ ω(Σ).
2.2. Operaciones con palabras

En este apartado se presenta una colección de operaciones que se pueden realizar
con palabras y las propiedades que cumplen estas operaciones.
1. Concatenación Sean x e y dos palabras, se concatenan para formar otra palabra

que se denota xy y que está formada por todas las letras de x seguidas por las letras
de y.
Ejemplo: x= casa y=blanca ⇒xy = casablanca
Propiedades:
Operación cerrada. Si x e y están definidas sobre el mismo alfabeto, xy también

lo estará.
Manuales Uex
Asociativa. (xy)z = x(yz)
Elemento neutro (λ). xλ = λx = x
16
2.3. LENGUAJES Y OPERACIONES CON LENGUAJES 17
|xy| = |x| + |y|
No es una operación conmutativa
2. Potencia i-esima de una palabra (xi ) Consiste en concatenar una palabra x

consigo misma, i veces. xi = x . . .i x
Ejemplo: x = la ⇒ x4 = lalalala
Propiedades:
xi+j = xi xj
|xi | = i|x|
x0 = λ
3. Reflexión (o inversa) de una palabra (x−1 ) Es otra palabra definida sobre

el mismo alfabeto y formada por los mismos sı́mbolos que x, dispuestos en orden
inverso.
Ejemplo: x = casa ⇒ x−1 = asac
Propiedad: |x| = |x−1 |
2.3. Lenguajes y operaciones con lenguajes

Como hemos visto anteriormente un lenguaje definido sobre un alfabeto no es más
que un subconjunto del lenguaje universal de ese alfabeto. Por ejemplo, si Σ = {0,1},
podemos definir diferentes lenguajes sobre ese alfabeto:
L1 = {x/|x| = 4} L2 = {0n 1n /n > 0}
L3 = {x/x no contenga un número par de 0’s }
Sobre cualquier alfabeto se pueden definir lenguajes especiales como el lenguaje
vacı́o, que se representa como LØ = Ø y que no tiene ninguna palabra. También
existe el lenguaje que contiene solamente la palabra vacı́a Lλ = {λ}
Se presentan, a continuación, diferentes operaciones que se pueden definir sobre
los lenguajes. Casi todas están basadas en las operaciones sobre palabras que se
explicaron en la sección anterior.
1. Unión de lenguajes La unión de dos lenguajes L1 y L2 definidos sobre el

mismo alfabeto Σ es otro lenguaje, también definido sobre ese alfabeto, que contiene
todas las palabras de L1 y todas las de L2 .
Manuales Uex
L = L1 ∪ L2 = {x/x ∈ L1 ∨ x ∈ L2 }
Propiedades:
17
Operación cerrada. El lenguaje resultante está definido sobre el mismo alfabeto

que L1 y L2 .
Asociativa. (L1 ∪ L2 ) ∪ L3 = L1 ∪ (L2 ∪ L3 )
Conmutativa. L1 ∪ L2 = L2 ∪ L1
Elemento Neutro (Ø). L ∪ Ø=Ø ∪ L=L
Idempotencia. L ∪ L = L
2. Concatenación Sean dos lenguajes L1 y L2 definidos sobre el mismo alfabeto Σ,

la concatenación de ambos lenguajes estará formada por todas las palabras obtenidas
al concatenar una palabra cualquiera de L1 con otra de L2 .
L = L1 L2 = {xy/x ∈ L1 ∧ y ∈ L2 }
Propiedades:
Operación cerrada. El lenguaje resultante está definido sobre el mismo alfabeto

que L1 y L2 .
Asociativa. (L1 L2 ) L3 = L1 (L2 L3 )
Elemento Neutro (Lλ = {λ}). Lλ L = LLλ = L
No es conmutativa.
3. Potencia i-esima Es el resultado de concatenar un lenguaje consigo mismo un

número i de veces. Li = L . . .i L
Propiedades:
Li+j = Li Lj
L0 = Lλ = {λ}
4. Clausura (o cierre de Kleene) La clausura de un lenguaje (L∗ ) es el resultado

de unir todas las potencias de dicho lenguaje, es decir,
Manuales Uex
∞
�
L∗ = Li
i=0
18
2.4. CONCEPTO DE GRAMÁTICA FORMAL 19
5. Clausura positiva La clausura positiva de un lenguaje (L+ ) es la unión de

todas las potencias de ese lenguaje, exceptuando la potencia cero.
∞
�
L+ = Li
i=1
Propiedades:
L∗ = L+ ∪ {λ}
L+ = L∗ L = LL∗
ω(Σ) = Σ∗
En este caso el alfabeto es considerado como un lenguaje, concretamente el
formado por todas las cadenas de longitud 1.
Σ+ = Σ∗ \ {λ}
6. Reflexión La reflexión de un lenguaje (L−1 ) está formada por las inversas de

todas las palabras de ese lenguaje. L−1 = {x−1 /x ∈ L}
2.4. Concepto de gramática formal

Si nos referimos a los lenguajes naturales el concepto de gramática es muy antiguo.
Los primeros trabajos aparecen en la India durante los comienzos del primer milenio
antes de Cristo, alcanzándose el máximo apogeo con Panini (siglos VII y VI a. C.).
Al mismo tiempo en Grecia se desarrollaba una corriente de investigación gramatical,
cuyo máximo representante serı́a Pitágoras. Sin embargo, el concepto de gramática
desde un punto de vista formal tiene su origen en los trabajos de Chomsky a mediados
del siglo XX.
2.4.1. Definiciones previas

Comenzaremos este apartado con una serie de definiciones cuyo interés práctico
quedará de manifiesto con los ejemplos que aparecen a continuación.
Definición 2.1 (Producción)

Manuales Uex
Sea Σ un alfabeto, llamamos producción (o regla) definida sobre ese alfabeto a un

par ordenado de palabras (x, y) donde x, y ∈ Σ∗ . Se dice que x es la parte izquierda
de la producción y que y es la parte derecha. A las producciones también se las llama
reglas de derivación. Se representa x ::= y.
19
Definición 2.2 (Producción compresora)

Se dice que una producción es compresora si la longitud de su parte derecha es menor
que la de la parte izquierda.
Definición 2.3 (Derivación directa)

Sea Σ un alfabeto, P un conjunto de producciones definidas sobre ese alfabeto
 

 x1 ::= y1 

 
x2 ::= y2
P =

 ··· 

 
xn ::= yn
y v, w ∈ Σ∗ .
Decimos que v produce directamente a w, o que w deriva directamente de v, si
∃z, u ∈ Σ∗ y una producción xi ::= yi tal que v = zxi u y w = zyi u
La notación utilizada para representar una derivación directa es v → w
Definición 2.4 (Derivación)

Sea Σ un alfabeto, P un conjunto de producciones definidas sobre ese alfabeto y
v, w ∈ Σ∗ .
Decimos que v produce a w, o que w deriva de v, si ∃w0 , w1, . . . , wm ∈ Σ∗ tales
que
v = w0 → w1
w1 → w2
...
wm−1 → wm = w
∗
La notación utilizada en este caso es v → w
2.4.2. Ejemplo con un lenguaje natural(castellano)

Estamos familiarizados con el concepto tradicional de gramática que, de forma
intuitiva, podrı́amos considerar como un conjunto de reglas que nos indican qué es
correcto y qué no lo es en un lenguaje natural. Con el fin de acercarnos a una definición
Manuales Uex
más formal comenzaremos con un ejemplo en lengua castellana.

La gramática debe describir la estructura de las frases y de las palabras de un
lenguaje. Veamos una serie de reglas muy sencillas que nos permitirı́an comprobar
que la frase “el perro corre deprisa” es correcta.
20
Reglas gramaticales:
1. < sentencia >::=< sujeto >< predicado >

2. < sujeto >::=< articulo >< nombre >
3. < predicado >::=< verbo >< complemento >
4. < predicado >::=< verbo >
5. < articulo > ::= el
6. < articulo > ::= la
7. < nombre > ::= perro
8. < nombre > ::= gata
9. < verbo > ::= corre
10. < verbo > ::= come
11. < complemento > ::= deprisa
12. < complemento > ::= mucho
Estas reglas pueden ser consideradas como un conjunto de producciones. Si uti-

lizamos algunas de estas producciones para llevar a cabo derivaciones a partir del
item < sentencia > podemos llegar a obtener frases como: “el perro corre deprisa”,
“la gata come mucho” o “la gata corre”. Sin embargo, nunca podrı́amos llegar a
construir la frase “mucho deprisa perro”.
Veamos, paso a paso, como se podrı́a generar la frase “la gata corre” a partir
del sı́mbolo < sentencia >. En cada fase del proceso hemos destacado en negrita el
sı́mbolo que se transforma.
Aplicando la pr. 1 < sentencia >−→ < sujeto > < predicado >
∗
Aplicando la pr. 2 < sentencia >−→ < articulo >< nombre > < predicado >
∗
Aplicando la pr. 4 < sentencia >−→ < articulo > < nombre >< verbo >
∗
Aplicando la pr. 6 < sentencia >−→ la< nombre > < verbo >
∗
Aplicando la pr. 8 < sentencia >−→ la gata< verbo >
∗
Aplicando la pr. 9 < sentencia >−→ la gata corre
Sin embargo, la forma más habitual de representar este mismo proceso de gen-
eración de una cadena de sı́mbolos es mediante un árbol de derivaciones (o árbol
parser ) como el que se muestra en la figura 2.1.
2.4.3. Ejemplo en un lenguaje artificial

Manuales Uex
Aplicaremos el mismo método para definir un fragmento de un lenguaje de pro-

gramación. Pretendemos describir cómo son las instrucciones que permiten asignar
el valor de una expresión a una variable en un lenguaje como C.
21
<oracion>
<sujeto> <predicado>
<articulo> <nombre> <verbo>
la gata corre
Figura 2.1: Árbol de derivación
1. < asignacion > ::= < variable > � =� < expresion >
2. < expresion > ::= < numero >
3. < expresion > ::= < variable >
4. < expresion > ::= < expresion > � +� < expresion >
5. < expresion > ::= < expresion > � ∗� < expresion >
Si consideramos que A, B y C pueden ser considerados como < variable > y que
2 y 4 pueden ser considerados como < numero >, es fácil comprobar que a partir
del sı́mbolo < asignacion > y utilizando diferentes producciones podemos llegar a
construir instrucciones como:
A=B+C
B=B*2
C=C+4
Sin embargo, no podrı́amos construir sentencias como A = + 2 * / + 4 o 4=A
Es decir, en los ejemplos anteriores podemos ver que hay construcciones grama-
ticalmente correctas y otras que no lo son.
2.4.4. Definición de gramática formal

Analizando los ejemplos anteriores podemos observar como el objetivo es llegar a
tener una secuencia correcta de sı́mbolos (en el primer ejemplo, estos sı́mbolos son:
el, la, perro, gata, etc. y en el segundo, los sı́mbolos son: A, B, *,+, 2, etc.) partiendo
de un determinado sı́mbolo, que llamaremos inicial, (< oracion > en el primer caso
o < asignacion > en el segundo), y utilizando algunas de las producciones definidas.
A partir de estas ideas intuitivas, formalizaremos la definición de gramática.
Manuales Uex
Definición 2.5 (Gramática Formal)

Se llama gramática formal definida sobre un alfabeto Σ a una tupla de la forma
G = {ΣT , ΣN , S, P } donde:
22
•ΣT es el alfabeto de sı́mbolos terminales

•ΣN es el alfabeto de sı́mbolos no terminales (aparecen en los ejemplos encerrados
entre <>)
•S es el sı́mbolo inicial de la gramática
•P es un conjunto de producciones gramaticales
Hay que tener en cuenta que:
S ∈ ΣN
ΣT ∩ ΣN = Ø
Σ = ΣT ∪ ΣN
Ejemplo 2.1 ΣT = {+, −, 0, 1, 2, . . . , 9}

ΣN = {< Signo >, < Digitos >, < Numero >, < Caracter >}
S =< Numero >
 

 < Numero >::=< Signo >< Digito > 


 


 < Signo >::= + 


 


 < Signo >::= − 


 

 < Digito >::=< Caracter >< Digito > 
P = < Digito >::=< Caracter >

 


 < Caracter >::= 0 


 


 < Caracter >::= 1 


 


 ··· 

 
< Caracter >::= 9
Con esta gramática, y a partir del sı́mbolo < Numero >, podemos generar
cualquier número natural, siempre que vaya precedido por un signo. Por ejemplo:
-57, +5, -4999.
Hasta este momento hemos distinguido los sı́mbolos no terminales de los termi-
nales encerrando a los primeros entre <>. Sin embargo, en los ejemplos que veremos
a partir de ahora y por simplicidad, utilizaremos las letras mayúsculas para repre-
sentar a los sı́mbolos no terminales y las minúsculas para los terminales. Además,
utilizaremos la notación BNF (Backus Normal Form). Con esta notación se utilizan
los sı́mbolos ::= para separar la parte izquierda de una producción de la derecha y
Manuales Uex
además, se emplea el sı́mbolo | para indicar que la parte izquierda de una producción
coincide con la de la anterior, ası́ no se repite la parte izquierda de determinadas
producciones. Por tanto, en el ejemplo anterior la descripción de las producciones
quedarı́a ası́:
23
 

 < Numero >::=< Signo >< Digito > 


 


 < Signo >::= + 


 


 |− 


 

 < Digito >::=< Caracter >< Digito > 
P = | < Caracter >

 

 < Caracter >::= 0
 


 


 |1 


 


 |··· 

 
|9
Definición 2.6 (Lenguaje generado por una gramática)

Sea una gramática definida como G = {ΣT , ΣN , S, P } llamamos lenguaje generado
por dicha gramática a L = {x ∈ Σ∗T /S →
∗
x}
Por lo tanto, las palabras del lenguaje estarán formadas por cadenas de sı́mbo-
los terminales generadas a partir del sı́mbolo inicial de la gramática, utilizando las
producciones que la definen.
Definición 2.7 (Recursividad)
∗
Una gramática es recursiva si tiene alguna derivación recursiva, es decir, si A → xAy
∗
donde A ∈ ΣN , x, y ∈ Σ . Si x = λ se dice que la gramática es recursiva por la
izquierda, y si y = λ se dice que es recursiva por la derecha.
Es evidente que si una gramática tiene producciones recursivas, es decir producciones
con la forma A ::= xAy, entonces es recursiva.
Teorema 2.1
Un lenguaje es infinito si y sólo si existe una gramática recursiva que lo genera.
2.5. Clasificación de las gr. formales

Noam Chomsky clasificó las gramáticas en cuatro grupos (G0 , G1 , G2 , G3 ),
donde cada uno contiene al siguiente. La diferencia entre cada grupo se centra en
la forma de las producciones. La misma clasificación puede ser aplicada a los lengua-
jes, es decir, los lenguajes de tipo 0 son los generados por las gramáticas de tipo 0 y
ası́ sucesivamente.
2.5.1. Gramáticas de tipo 0

Manuales Uex
También se las llama gramáticas sin restricciones o gramáticas recursivamente

enumerables.
Las producciones de las gramáticas de tipo 0 tienen la forma:
24
2.5. CLASIFICACIÓN DE LAS GR. FORMALES 25
xAy ::= v donde A ∈ ΣN , x, y, v ∈ Σ∗
Sin embargo, es posible demostrar que cualquier lenguaje de tipo 0 puede ser tam-
bién generado por una gramática que pertenece a un grupo algo más restringido, las
gramáticas con estructura de frase. Podemos decir, por tanto, que las gr. de tipo 0 y
las gr. con estructura de frase tienen el mismo poder generativo.
Las producciones de las gramáticas con estructura de frase tienen la forma:
xAy ::= xvy donde A ∈ ΣN , x, y, v ∈ Σ∗

A este tipo de gramáticas también se las llama gramáticas dependientes del
contexto. Las producciones deben tener la siguiente forma:
xAy ::= xvy donde A ∈ ΣN , v ∈ Σ+ x, y ∈ Σ∗
Es obvio que todas las gramáticas de tipo 1 son también gramáticas con estructura
de frase, pero en este caso hay una restricción añadida y es que la longitud de la parte
derecha de las producciones es siempre mayor o igual que la de la parte izquierda, es
decir, no hay producciones compresoras.
El nombre de gramáticas dependientes del contexto se debe a que las producciones
se pueden interpretar como que “A se convierte en v, siempre que se encuentre en
un determinado contexto, es decir, precedida por x y seguida por y”. Por lo tanto,
es necesario conocer el contexto en el que se encuentra A para poder aplicar la
producción.

Son también llamadas gramáticas independientes del contexto. Sus produc-
ciones son aún más restrictivas. En este caso, la parte izquierda de la producción
está formada por un único sı́mbolo no terminal. Por lo tanto, las producciones son
de la forma:
A ::= v donde A ∈ ΣN v ∈ Σ∗
Manuales Uex
En este tipo de gramáticas, la conversión de A en v se realiza independientemente del

contexto en el que se encuentre A, de ahı́ su nombre. Son especialmente adecuadas
para representar los aspectos sintácticos de cualquier lenguaje de programación.
25

Es el grupo más restringido de gramáticas y también son llamadas regulares. En
este caso también se le imponen restricciones a la parte derecha de las producciones,
que tendrán como máximo dos sı́mbolos. Hay dos tipos de gramáticas regulares y sus
producciones pueden ser de la siguiente forma:
1. Para las gramáticas lineales por la derecha (GLD)
a) A ::= a
b) A ::= aV donde A, V ∈ ΣN , a ∈ ΣT
c) S ::= λ y S es el sı́mbolo inicial de la gramática.
2. Para las gramáticas lineales por la izquierda (GLI)
a) A ::= a
b) A ::= V a donde A, V ∈ ΣN , a ∈ ΣT
c) S ::= λ y S es el sı́mbolo inicial de la gramática.
Cualquier lenguaje de tipo 3 puede ser generado tanto por una gramática lineal por la
derecha como por una lineal por la izquierda. Es decir, estos dos grupos de gramáticas
tienen el mismo poder generativo.
2.6. Gramáticas equivalentes

A continuación veremos como, en ocasiones, es recomendable simplificar ciertas
gramáticas, eliminando sı́mbolos o producciones no deseadas. En estos casos, el obje-
tivo será llegar a definir una gramática equivalente a la primera pero que no tenga esos
elementos indeseables. En este apartado trabajaremos exclusivamente con gramáticas
independientes del contexto.
Definición 2.8 (Gramáticas equivalentes)

Dos gramáticas son equivalentes cuando generan el mismo lenguaje. Es evidente que,
para que esto suceda, deben estar definidas sobre el mismo ΣT .
Manuales Uex
2.6.1. Simplificación de gramáticas

Comenzaremos definiendo los elementos indeseables de los que hablábamos ante-
riormente.
26
2.6. GRAMÁTICAS EQUIVALENTES 27
Definición 2.9 (Reglas innecesarias)

Son produciones de la forma A ::= A. Evidentemente no aportan información a la
gramática.
Definición 2.10 (Sı́mbolos inaccesibles)

Son sı́mbolos no terminales que no aparecen en ninguna cadena de sı́mbolos que
pueda derivarse a partir del sı́mbolo inicial de la gramática.
Definición 2.11 (Sı́mbolos no generativos)

Son sı́mbolos no terminales a partir de los cuales no puede derivarse ninguna cadena
de sı́mbolos terminales.
Veamos a continuación métodos para localizar los sı́mbolos inaccesibles y los no ge-
nerativos.
Método para localizar los sı́mbolos inaccesibles de una gramática En rea-

lidad, el método trata de identificar los sı́mbolos accesibles, ası́ el resto serán sı́mbolos
inaccesibles. Para conseguirlo se puede diseñar un algoritmo que construya de forma
incremental este conjunto de sı́mbolos accesibles.
Inicialmente cualquier sı́mbolo que aparezca en la parte derecha de una producción
que tiene a S en la parte izquierda, es un sı́mbolo accesible. A partir de aquı́, si un
sı́mbolo está en la parte derecha de una producción que tiene a un sı́mbolo accesible
en la parte izquierda es también accesible.
Veamos un algoritmo para llevar a cabo esta tarea:
Algoritmo 2.1 Búsqueda Sı́mbolos inaccesibles

Output: SimInacc ⊂ ΣN
Begin
SimAccesibles = {V ∈ ΣN /∃ S ::= xV y, x, y ∈ Σ∗ }
Auxiliar = Ø
while Auxiliar �= SimAccesibles do
Auxiliar = SimAccesibles
SimAccesibles = SimAccesibles ∪ {V ∈ ΣN /∃ A ::= xV y, x, y ∈ Σ∗ A ∈
SimAccesibles}
end while
SimInacc = ΣN \ SimAccesibles.
End
Manuales Uex
Método para localizar los sı́mbolos no generativos El método es análogo

al anterior, es decir, tiene como objetivo localizar, en primer lugar, los sı́mbolos
generativos. Inicialmente son sı́mbolos generativos aquellos que aparecen en la parte
27
izquierda de una producción que tiene sólo sı́mbolos terminales o la cadena nula en
la parte derecha. Veamos el algoritmo:
Algoritmo 2.2 Búsqueda Sı́mbolos No Generativos

Output: SimNoGen ⊂ ΣN
Begin
SimGenerativos = {V ∈ ΣN /∃ V ::= α, α ∈ Σ∗T }
Auxiliar = Ø
while Auxiliar �= SimGenerativos do
Auxiliar = SimGenerativos
SimGenerativos = SimGenerativos ∪ {V ∈ ΣN /∃ V ::= α, α ∈ (ΣT ∪
SimGenerativos)∗ }
end while
SimNoGen = ΣN \ SimGenerativos
End
Tanto las reglas innecesarias como los sı́mbolos no generativos o los inaccesibles
pueden eliminarse de cualquier gramática, ya que no aportan información relevante
a la misma.
Definición 2.12 (Gramática Limpia)
Decimos que una gramática es limpia si no tiene reglas innecesarias, ni sı́mbolos no
generativos, ni sı́mbolos inaccesibles.
Definición 2.13 (Reglas de redenominación)
Son reglas en las que hay un único sı́mbolo no terminal tanto en la parte izquierda
de la producción como en la derecha. Es decir, tienen la forma:
A ::= B, A, B ∈ ΣN
Para eliminar las reglas de redenominación de una gramática es necesario susti-
tuirlas por otras producciones que sean equivalentes.
Por ejemplo, si tenemos las producciones
A::=B
B::=x
B::=y donde x,y ∈ Σ∗
y deseamos eliminar A::=B, las producciones anteriores deben ser sustituidas por
las siguientes producciones:
A::=x
A::=y
B::=x
Manuales Uex
B::=y
Definición 2.14 (Reglas no generativas)
Son aquellas en las que sólo aparece λ en la parte derecha de la producción.
28
2.7. PROBLEMAS Y CUESTIONES 29
Para eliminar estas reglas también es necesario añadir otras a la gramática.

Si queremos eliminar la producción A ::= λ es necesario localizar las producciones
que tiene a A en la parte derecha (por ejemplo: B ::= xAy) y añadir para cada
producción de este tipo otra equivalente en la que no aparece A (en este caso, B ::=
xy).
La producción S ::= λ no puede eliminarse de ninguna gramática ya que es
imprescindible si se pretende que el lenguaje generado contenga la palabra nula.
Definición 2.15 (Gramática bien formada)

Decimos que una gramática está bien formada si no tiene reglas de redenominación
ni reglas no generativas.
2.7. Problemas y cuestiones

2.1 Dado el alfabeto Σ = {a, b}, ¿cuántas palabras hay en el lenguaje An B y cómo
son dichas palabras?, considerando los siguientes casos:
1. A = {a} B = {b}
2. A = {a} B = {b, λ}
3. A = {a, λ} B = {b, λ}
4. A = {a, λ} B = {b}
2.2 Dado el alfabeto Σ = {a, b}, y el lenguaje definido sobre él, L = {aa, bb} ¿cómo
son las palabras del lenguaje L4 ?
2.3 ¿En qué situación se cumple que L∗ = L+ ?
2.4 Dadas las siguientes gramáticas, indicar de qué tipo son y cómo es el lenguaje
que generan:
1. ΣT = {a, b, c, 0, 1} ΣN = {S}
 

 S ::= a 


 


 |b 


 


 |c 

 
|Sa
P =
 |Sb 
Manuales Uex

 


 |Sc 


 


 |S0 


 

|S1
29
2. ΣT = {a, b} ΣN = {S, A}
 

 S ::= A 

 
|λ
P =

 A ::= aAb 

 
|ab
3. ΣT = {a, b} ΣN = {S, A}
 

 S ::= A 


 


 |λ 

 
A ::= aA
P =

 |Ab 


 


 |a 

 
|b
4. ΣT = {a} ΣN = {S, A}
 

 S ::= A 

 
|λ
P =

 A ::= AaA 

 
|a
2.5 Dados los siguientes lenguajes, diseñar una gramática que los genere
1. L1 = {abn a/ n = 0, 1, . . .}
2. L2 = {am bn / m ≥ n ≥ 0}
3. L3 = {ak bm an / n = k + m}
4. L4 = {waw −1/ w es una cadena binaria definida en el alfabeto {0, 1}}
2.6 Dadas las siguientes gramáticas, obtener gramáticas equivalentes a ellas que
sean limpias y bien formadas
1. ΣT = {a, b} ΣN = {S, A, B, C, D, E}
 

 S ::= Aa 


 


 |Ca 


 


 |a 


 

 B ::= Aa 
P = |Ca

 

 |a 
Manuales Uex

 


 C ::= Bb 


 


 D ::= Ca 


 

E ::= Cb
30
2.7. PROBLEMAS Y CUESTIONES 31
2. ΣT = {x, y, z} ΣN = {S, P, Q}
 

 S ::= zP zQz 


 

 P ::= xP x 
P = |Q

 


 Q ::= yP y 

 
|λ
Manuales Uex
31
Tema 3
Expresiones y gramáticas regulares
Contenido
3.1. Definición de expresión regular . . . . . . . . . . . . . . . 33

3.2. Álgebra de las expresiones regulares . . . . . . . . . . . . 34
3.3. Definición de gramática regular . . . . . . . . . . . . . . . 35
3.4. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.5. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
En este tema se van a estudiar las gramáticas regulares, también llamadas de

tipo 3 atendiendo a la clasificación de Chomsky. También se aborda el estudio de las
expresiones regulares que permiten definir de forma precisa los lenguajes generados
por estas gramáticas (lenguajes regulares).
3.1. Definición de expresión regular

Una expresión regular es una notación normalizada para representar lenguajes
regulares, es decir, lenguajes generados por gramáticas de tipo 3. Como veremos, las
expresiones regulares permiten describir con exactitud y sencillez cualquier lenguaje
regular. Para definir una expresión regular(e.r.) se pueden utilizar todos los sı́mbolos
del alfabeto Σ y, además, λ y Ø. Los operadores que también se pueden utilizar son:
+ representa la unión
. representa la concatenación (este sı́mbolo no se suele escribir)

Manuales Uex
* representa el cierre de Kleene
( ) modifican las prioridades de los demás operadores
33
33
34 TEMA 3. EXPRESIONES Y GRAMÁTICAS REGULARES
Una expresión regular se puede definir de acuerdo a los siguientes criterios:
1. Ø es una e.r. que representa al lenguaje vacı́o (no tiene palabras) LØ = Ø
2. λ es una e.r. que representa al lenguaje Lλ = {λ}
3. a ∈ Σ es una e.r. que representa al lenguaje La = {a}
4. Si α y β son e.r. entonces α + β también lo es y representa al lenguaje Lα+β =

Lα ∪ Lβ
5. Si α y β son e.r. entonces αβ también lo es y representa al lenguaje Lαβ = Lα Lβ
6. Si α es una e.r. entonces α∗ también lo es y representa al lenguaje

�
Lα∗ = ∞ i ∗ ∞
i=0 Lα que también se puede representar α = Σi=0 α
i
Sólo son e.r. aquellas que puedan ser definidas utilizando los 6 puntos vistos ante-
riormente.
La prioridad de las operaciones, que puede modificarse utilizando paréntesis, es
de mayor a menor: ∗ . +
Ejemplos Sea Σ = {0, 1}
1. 01 + 001 es una e.r. que representa al lenguaje L = {01, 001}
2. 0∗ 10∗ es una e.r. que representa a cualquier cadena binaria en la que hay un
solo 1, L = {0n 10m /n, m ≥ 0}
Sea Σ = {a, b, c}
3. a(a + b + c)∗ representa a cualquier cadena que empiece por a
4. (a + b + c)∗ representa al lenguaje universal definido sobre el alfabeto
3.2. Álgebra de las expresiones regulares

Propiedades de la unión (+)
1. Asociativa (α + β) + γ = α + (β + γ)
2. Conmutativa α+β =β+α

Manuales Uex
3. Elemento neutro (Ø) α+Ø=α
4. Idempotencia α+α=α
34
3.3. DEFINICIÓN DE GRAMÁTICA REGULAR 35
Propiedades de la concatenación (.)
1. Asociativa (αβ)γ = α(βγ)
2. Distributiva respecto de la unión α(β + γ) = αβ + αγ
3. Elemento neutro (λ) αλ = λα = α
4. αØ = Ø
5. No es conmutativa
Propiedades del cierre de Kleene (*)
1. λ∗ = λ
2. Ø∗ = λ
3. α∗ α∗ = α∗
4. α∗ α = αα∗
5. (α∗ )∗ = α∗
6. α∗ = λ + αα∗
7. α∗ = λ + α + α2 + . . . + αn + αn+1 α∗
Si tenemos una función f : EΣn −→ EΣ (por ejemplo f (α, β) = α∗ β), donde EΣ
representa al conjunto de las expresiones regulares definidas sobre Σ, entonces:
8. f (α, β, γ, . . .) + (α + β + γ + . . .)∗ = (α + β + γ + . . .)∗
9. (f (α∗ , β ∗, γ ∗ , . . .))∗ = (α + β + γ + . . .)∗
3.3. Definición de gramática regular

Como vimos en el tema anterior existen dos tipos de gramáticas de tipo 3: las
gramáticas lineales por la derecha y las lineales por la izquierda.
Las producciones de las gramáticas lineales por la derecha pueden ser de la forma:
1. A ::= a
Manuales Uex
2. A ::= aV donde A, V ∈ ΣN , a ∈ ΣT
3. S ::= λ y S es el sı́mbolo inicial de la gramática.
35
Las producciones de las gramáticas lineales por la izquierda pueden ser de la

forma:
1. A ::= a
2. A ::= V a donde A, V ∈ ΣN , a ∈ ΣT
3. S ::= λ y S es el sı́mbolo inicial de la gramática.
Estos dos tipos de gramáticas tienen el mismo poder generativo, es decir, dada una
gramática lineal por la izquierda siempre existe una gramática lineal por la derecha
que es equivalente a ella y viceversa. Además, dado un lenguaje regular siempre
existen, al menos, una gramática lineal por la izquierda y una gramática lineal por
la derecha que lo generan.
Todo lenguaje de tipo 3 puede representarse mediante una e.r. y una e.r. siempre
representa a un lenguaje de tipo 3.
3.4. Ejemplos
Supongamos que Σ1 = {a, b, . . . , z}
1. El lenguaje L1 = {λ, a, aa, aaa, . . .} puede representarse con la e.r. a∗ y puede
ser generado por la gr. lineal por la izquierda
P = {S ::= λ|Sa}
y por la gr. lineal por la derecha
P = {S ::= λ|aS}
2. El lenguaje de todas las palabras que empiezan por a puede representarse con
la e.r. a(a + b + . . . + z)∗ y puede ser generado por la gr. lineal por la izquierda
 

 S ::= a 

 

 |Sa 
P = |Sb
 


 ··· 


 
|Sz
 

 S ::= aA 


 


 A ::= aA 

 
|bA
Manuales Uex
P =

 ··· 


 


 |zA 

 
|λ
36
3.4. EJEMPLOS 37
3. El lenguaje de las palabras que empiezan por a, terminan por c y además de

estas dos letras sólo pueden tener b´s (tantas como se quieran) puede represen-
tarse con la e.r. ab∗ c y puede ser generado por la gr. lineal por la izquierda
 
 S ::= Ac 
P = A ::= Ab
 
|a

 
 S ::= aA 
P = A ::= bA
 
|c
Los lenguajes regulares son especialmente adecuados para representar las carac-
terı́sticas léxicas de un lenguaje de programación, como veremos en los siguien-
tes ejemplos en los que consideraremos un lenguaje de programación similar a
C.
4. Las cadenas que pueden ser consideradas como un identificador del lenguaje
(nombres inventados por el programador para definir variables, funciones, etc.)
están formadas por letras (mayúsculas y minúsculas), dı́gitos y el guión bajo
( ), pero no pueden comenzar por un dı́gito. Este lenguaje definido sobre el
alfabeto Σ2 = {a, . . . , z, A, . . . , Z, 0, . . . , 9, } se puede representar por la e.r.
(a + . . . + z + A + . . . + Z + )(a + . . . + z + A + . . . + Z + + 0 + . . . + 9)∗
Esta e.r. representa palabras como Suma o T otal1 pero no representarı́a a 1Ab
Si trabajamos con el alfabeto Σ3 = {0, . . . , 9, .,+ , −, e, E} (el sı́mbolo de la suma
+ ha sido representado en un tamaño menor del habitual para distinguirlo con
claridad del operador unión (+))
5. La e.r. α = (0 + . . . + 9)(0 + . . . + 9)∗ permite representar a cualquier número

natural (por ejemplo: 4, 27 o 256).
6. La e.r. β = α.(0 + . . . + 9)∗ representa números reales no negativos con una

notación clásica (por ejemplo: 55.7, 854.95 o 5.).
Manuales Uex
7. La e.r. γ = (β(e + E)α) + (β(e + E)+ α) + (β(e + E) − α) representa números

reales no negativos con una notación cientı́fica (por ejemplo: 5.5e+10).
37
3.5. Problemas
3.1 Describir los lenguajes representados por las siguientes expresiones regulares
definidas sobre el alfabeto Σ = {a, b, c}
1. (a + b)∗ c
2. (aa+ )(bb∗ )
3. (aa+ ) + (bb∗ )
4. a∗ b∗ c∗
3.2 Representar, mediante una expresión regular, los siguientes lenguajes

1. Considerando que Σ = {a},
a) el lenguaje formado por cadenas de a’s de longitud par
b) el lenguaje formado por cadenas de a’s de longitud impar
2. Considerando que Σ = {a, b}, el lenguaje formado por cadenas de a’s y b´s, de
longitud impar, en las que se van alternando los dos sı́mbolos, es decir, nunca
aparece el mismo sı́mbolo dos veces seguidas. Por ejemplo: abababa o bab
3.3 Dadas las siguientes expresiones regulares escribir, para cada una de ellas, una
palabra que pertenezca al lenguaje que la expresión representa y otra que no pertenez-
ca a dicho lenguaje
1. (1∗ + 0∗ )(1∗ + 0∗ )(1∗ + 0∗ ) 3. 1∗ (0 + 10∗ )1∗
2. (1 + 0)∗ 10(1 + 0)∗ 4. 10∗ + 01∗
3.4 Simplificar las siguientes expresiones regulares
1. (a + b + ab + ba)∗ 3. a(a∗ a + a∗ ) + a∗
2. (a + λ)∗ 4. (a + b)∗ ba(a + b)∗ + a∗ b∗
3.5 Dadas dos expresiones regulares
α = 0 ∗ + 1∗ β = 01∗ + 10∗ + 1∗ 0 + (0∗ 1)∗
encontrar
1. una palabra que pertenezca a α pero no a β
2. una palabra que pertenezca a β pero no a α
Manuales Uex
3. una palabra que pertenezca a α y a β

4. una palabra que no pertenezca a α ni a β
38
Tema 4
Autómatas Finitos
Contenido
4.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . 39
4.2. Definición de Autómata Finito Determinista . . . . . . . 40
4.3. Representación de Autómatas . . . . . . . . . . . . . . . . 40
4.4. Los AFD como reconocedores de lenguajes . . . . . . . . 43
4.5. Minimización de un AFD . . . . . . . . . . . . . . . . . . . 43
4.6. Autómatas Finitos No Deterministas(AFND) . . . . . . 47
4.7. Lenguaje aceptado por un AFND . . . . . . . . . . . . . . 50
4.8. Simulación de un AFD y AFND . . . . . . . . . . . . . . 51
4.9. Paso de un AFND a AFD . . . . . . . . . . . . . . . . . . 52
4.10. Relación entre AF, gr. y exp. reg. . . . . . . . . . . . . . 55
4.11. Lı́mites para los leng. regulares . . . . . . . . . . . . . . . 65
4.12. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
4.1. Introducción
Aunque no se puede considerar como una definición correcta de autómata, está muy
extendida una idea que confunde el concepto de autómata con el de robot. Por lo
tanto, se considera erróneamente que un autómata es una máquina que imita fun-
ciones tı́picas de los seres vivos, sobre todo relacionadas con el movimiento, pudiendo
Manuales Uex
incluso ejecutar ciertas órdenes. En realidad el concepto de autómata es mucho más

genérico, ya que podemos considerarlo como un dispositivo que procesa cadenas de
sı́mbolos que recibe como entrada, cambiando de estado y produciendo una salida
que, en algunos casos, puede estar formada por otra cadena de sı́mbolos.
39
39
40 TEMA 4. AUTÓMATAS FINITOS
La teorı́a de autómatas se ocupa de clasificar y estudiar de modo sistemático

diferentes tipos de máquinas abstractas que llevan a cabo un procesamiento secuencial
de la información. Dentro del conjunto de las máquinas abstractas que estudiaremos
en esta asignatura, los Autómatas Finitos constituyen el grupo de máquinas más
sencillas y que, por tanto, tienen un menor poder funcional.
El estudio de los autómatas finitos se utiliza para modelar el comportamiento de
dispositivos mecánicos y también de sistemas naturales. Concretamente, permite es-
tudiar procesos que dependen de una historia, es decir, sistemas cuyo comportamien-
to actual depende del pasado. También se aplican en el procesamiento del lenguaje
natural, pero en el contexto de esta asignatura su principal aplicación será el re-
conocimiento de lenguajes regulares (de tipo 3).
4.2. Definición de Autómata Finito Determinista

Los Autómatas Finitos son máquinas teóricas que van cambiando de estado de-
pendiendo de la entrada que reciban. La salida de estos Autómatas está limitada
a dos valores: aceptado y no aceptado, que pueden indicar si la cadena que se ha
recibido como entrada es o no válida. Generalmente utilizaremos los Autómatas Fini-
tos para reconocer lenguajes regulares, es decir, una palabra se considerará válida sólo
si pertenece a un determinado lenguaje.
Formalmente, un Autómata Finito Determinista (AFD) se define como una tupla
AF D = (Σ, Q, f, q0 , F ), donde
Σ es el alfabeto de entrada
Q es el conjunto finito y no vacı́o de los estados del Autómata
f es la función de transición que indica en qué situaciones el Autómata pasa de
un estado a otro, se define f : Q × Σ −→ Q
q0 ∈ Q es el estado inicial
F ⊂ Q es el conjunto de estados finales de aceptación (F �= Ø)
4.3. Representación de Autómatas

Existen dos formas de representar un AFD, mediante tablas de transición o
mediante diagramas de transición. Introduciremos estas dos representaciones con
un ejemplo.
Sea el siguiente AFD: Σ = {a, b} Q = {p, q, r} q0 = p F = {q}
Manuales Uex
donde f se define de la siguiente forma:

f (p, a) = q f (p, b) = r
f (q, a) = q f (q, b) = r
f (r, a) = r f (r, b) = r
40
4.3. REPRESENTACIÓN DE AUTÓMATAS 41
Tabla de transición El AFD se representarı́a mediante la siguiente tabla que

representa los valores de la función de transición.
a b
→ p q r
∗ q q r
r r r
La flecha indica que p es el estado inicial, y el asterisco indica que q es un estado
final de aceptación (en general, pueden aparecer muchos asteriscos aunque sólo puede
aparecer una flecha ya que sólo hay un estado inicial).
Diagrama de transición La figura 4.1 representa de forma gráfica las transi-
a
a
p q
b b
r
a,b
Figura 4.1: Ejemplo de AFD
ciones del autómata. Los estados finales de aceptación se identifican por estar ence-
rrados en un doble circulo. El estado inicial se destaca con una flecha arrugada.
Al analizar el autómata del ejemplo es evidente que sólo considera como cadenas
aceptadas aquellas que están formadas solamente por a’s. Cualquier cadena que con-
tenga una b hará que el autómata acabe en el estado r , que es un estado muerto.
Diremos que un estado está muerto si no es un estado final de aceptación y no parte
de él ninguna transición hacia otro estado. Es evidente que si durante el análisis de
una cadena se llega a un estado muerto, como ya no es posible salir de dicho estado,
la cadena no será aceptada por el autómata.
Autómatas Incompletos A menudo nos encontramos con autómatas para los

Manuales Uex
que no están definidas todas las transiciones. Las situaciones que no están definidas
deben ser consideradas como situaciones de error, es decir, si una cadena hace llegar
al autómata hasta una situación no definida, consideraremos que la cadena no ha
sido reconocida por dicho autómata.
41
Si deseamos completar un autómata (no es imprescindible) bastará con añadir un

estado muerto que reciba todas las transiciones que le faltan al autómata incompleto.
En la figura 4.2 podemos ver un ejemplo de esta situación. El autómata de la
izquierda está incompleto, pero podemos completarlo trasformándolo en el de la
derecha, al que hemos añadido el estado r, que es un estado muerto.
a
p a
q p q
a,b
b a
b a
a,b
s
s
r
b
Figura 4.2: Ejemplo de AF incompleto y completo
Estados accesibles y autómatas conexos
Definición 4.1 (Autómata Conexo)

Un autómata es conexo si todos sus estados son accesibles desde el estado inicial.
Definición 4.2 (Parte conexa de un autómata)

Si un autómata no es conexo, se llama parte conexa del autómata al conjunto de
estados accesibles desde el estado inicial.
Ejemplo 4.1 El autómata representado en la figura 4.3 no es conexo y su parte

conexa es la formada por los estados p y q y por las transiciones que hay entre ellos.
a
a
p q
b
a r
Manuales Uex
Figura 4.3: AF no conexo
42
4.4. LOS AFD COMO RECONOCEDORES DE LENGUAJES 43
4.4. Los AFD como reconocedores de lenguajes

Como se ha visto en secciones anteriores, la función de transición f ha sido definida
de manera que depende de un único sı́mbolo del alfabeto de entrada. A continuación,
se ampliará esta definición de forma que dicha función pueda actuar sobre cadenas
de sı́mbolos, es decir, la función indicará a qué estado pasa el autómata ante la
llegada de una cadena de sı́mbolos (y no solamente de un único sı́mbolo). Por tanto,
consideraremos que f : Q × Σ∗ −→ Q. Para conseguir esta ampliación, f se redefine
de forma recursiva:
f (q, λ) = q ∀q ∈ Q
f (q, ax) = f (f (q, a), x) ∀a ∈ Σ, x ∈ Σ∗ , q ∈ Q
Ejemplo 4.2 Considerando el autómata que aparece en la figura 4.1 la función de

transición extendida devolverı́a los siguientes valores:
f (p, a) = q f (p, aa) = q
f (p, ab) = r f (p, aabbb) = r
f (p, baba) = r f (r, abb) = r
Con esta nueva definición de la función de transición es posible definir formalmente

cuál es el lenguaje aceptado por un AFD.
Definición 4.3 (Leng. aceptado por un AFD)

El lenguaje que acepta un AFD es el conjunto de palabras definidas sobre Σ que
hacen que el autómata llegue a un estado final de aceptación
L = {x ∈ Σ∗ / f (q0 , x) ∈ F }
4.5. Minimización de un AFD

En ocasiones nos encontramos con autómatas que tienen algunos estados equiva-
lentes, en estos casos esos estados se pueden agrupar de manera que se consigue un
autómata, equivalente al primero, pero con un menor número de estados. Se dice que
el autómata ha sido minimizado. Un concepto diferente al de minimizar un autómata
es el de simplificar un autómata que consiste en eliminar estados muertos o inacce-
sibles.
Manuales Uex
A continuación se presenta un algoritmo para minimizar un AFD. El objetivo

principal de este algoritmo consiste en agrupar estados equivalentes. Consideraremos
que dos estados son equivalentes cuando las transiciones que parten de ellos, para cada
uno de los sı́mbolos del alfabeto, llevan al mismo estado o a estados que también son
43
equivalentes entre sı́. Todos los estados que sean equivalentes entre sı́ se fundirán en un
único estado en el autómata resultante. Para conseguir este objetivo se construirá una
partición de Q, que se irá refinando paulatinamente, de manera que finalmente cada
elemento de la partición agrupará estados equivalentes. Inicialmente, se construye
una partición de Q formada por dos únicos elementos: los estados de aceptación y los
que no lo son. Dicha partición se irá refinando todo lo posible, separando en diferentes
elementos a los estados que no son equivalentes. Recordemos que una partición de Q
consiste en dividir Q en varios subconjuntos {Gi }1≤i≤n de tal forma que:
�
Gi ∩ Gj = Ø ∀i �= j y Gi = Q
1≤i≤n
Algoritmo 4.1 Minimización de un AFD

Input: AF D A = (Σ, Q, f, q0 , F )
Output: AF D A� = (Σ, Q� , f �, q0� , F � )
Begin
Partición = {G1 , G2 } donde G1 = F y G2 = Q \ F
Auxiliar = Ø
while Auxiliar �= Partición do
Auxiliar = Partición
∀Gi ∈ Partición y ∀a ∈ Σ separar en diferentes grupos a los estados
s y t ∈ Gi siempre que f (s, a) ∈ Gj , f (t, a) ∈ Gk siendo j �= k
end while
Cada elemento Gi de Partición se convierte en un estado de Q� , las transiciones
serán las mismas que define f
End
Ejemplo 4.3 Se minimizará el Autómata representado en la figura 4.4.

Inicialmente, Partición = {G1 , G2 } G1 = {E} G2 = {A, B, C, D}
Evidentemente no es posible refinar el grupo G1 . Pero hay que comprobar cómo
se comportan los estados de G2 con los sı́mbolos a y b.
G2 sı́mbolo a G2 sı́mbolo b
A → B ∈ G2 A → C ∈ G2
B → B ∈ G2 B → D ∈ G2
C → B ∈ G2 C → C ∈ G2
Manuales Uex
D → B ∈ G2 D → E ∈ G1
Analizando el comportamiento de los cuatro estados con el sı́mbolo b, es evidente
que D no es equivalente a los otros tres estados. Por tanto, es necesario dividir G2
en dos nuevos elementos.
44
4.5. MINIMIZACIÓN DE UN AFD 45
b
C E
b
a
a
b
A
a
b
B D
a a
Figura 4.4: Autómata a minimizar
Partición = {G1 , G�2 , G3 } G1 = {E} G�2 = {A, B, C} G3 = {D}

Veamos como se comporta G�2 con los sı́mbolos a y b.
G�2 sı́mbolo a G�2 sı́mbolo b

A → B ∈ G�2 A → C ∈ G�2
B → B ∈ G�2 B → D ∈ G3
C → B ∈ G�2 C → C ∈ G�2
De nuevo es evidente que el estado B no es equivalente a los otros dos. Es necesario

dividir G�2 . Ahora, Partición = {G1 , G��2 , G3 , G4 } donde
G1 = {E} G��2 = {A, C} G3 = {D} G4 = {B}
Volvemos a comprobar el comportamiento de G��2 , el único grupo que es posible
refinar.
G��2 sı́mbolo a G��2 sı́mbolo b

A → B ∈ G4 A → C ∈ G��2
C → B ∈ G4 C → C ∈ G��2
No es posible refinar más la partición. Es evidente que A y C son equivalentes

y, por tanto, deben formar parte del mismo grupo. A continuación aparece el nuevo
autómata (figura 4.5), equivalente al anterior, que tiene un estado menos, debido al
agrupamiento entre A y C(representado por G��2 ).
Manuales Uex
Definición 4.4 (AFD equivalentes)

Dos AFD son equivalentes si reconocen el mismo lenguaje. Es evidente que para que
esto ocurra deben estar definidos sobre el mismo alfabeto.
45
b G1
a
b
G’’2
a
b
G4 G3
b
a a
Figura 4.5: Autómata minimizado
A veces es fácil comprobar de manera intuitiva si dos AFD son equivalentes, pero
esto no siempre ocurre. Un método para comprobar si dos AFD son equivalentes
consiste en unirlos de manera que formen un único AFD que, por supuesto, no es
conexo. Formalmente, la unión de los dos autómatas se llevarı́a a cabo ası́:
Sean A1 = {Σ, Q1 , f1 , q01 , F1 } A2 = {Σ, Q2 , f2 , q02 , F2 }
El autómata resultante tras la unión serı́a
A = A1 + A2 = {Σ, Q1 ∪ Q2 , f, q0 , F1 ∪ F2 } donde
�
f1 (q, a) si q ∈ Q1
f (q, a) =
f2 (q, a) si q ∈ Q2
El nuevo estado inicial q0 puede ser tanto q01 como q02 .
Una vez construido el autómata unión, éste se minimiza. Si al concluir el proceso
de minimización, los dos estados iniciales q01 y q02 forman parte del mismo elemento de
la partición, los autómatas originales son equivalentes y el AFD que hemos obtenido
es el autómata mı́nimo equivalente a ambos.
Ejemplo 4.4 Dados los autómatas de la figura 4.6, aplicaremos el método anterior
para decidir si son equivalentes o no.
Como hemos visto inicialmente, Partición = {G1 , G2 }
donde G1 = {q, r, w} G2 = {p, s, v, u}
Hay que comprobar cómo se comportan los elementos de G1 y G2 con los sı́mbolos
a y b.
Manuales Uex
q → r ∈ G1 q → p ∈ G2
r → q ∈ G1 r → p ∈ G2
w → w ∈ G1 w → v ∈ G2
46
4.6. AUTÓMATAS FINITOS NO DETERMINISTAS(AFND) 47
b
b
a
a a
p q v w
b b
a
a,b a b
a
b
s r u
Autómata 1 Autómata 2
Figura 4.6: ¿Autómatas equivalentes?
p → q ∈ G1 p → p ∈ G2
s → p ∈ G2 s → p ∈ G2
v → w ∈ G1 v → v ∈ G2
u → w ∈ G1 u → v ∈ G2
En principio, parece que los estados del elemento G1 son equivalentes, sin embargo,
analizando el comportamiento de los estados del elemento G2 con el sı́mbolo a, es
evidente que s no es equivalente a los otros tres estados. Por tanto, es necesario dividir
G2 en dos subgrupos.
Partición = {G1 , G�2 , G3 } G1 = {q, r, w} G�2 = {p, v, u} G3 = {s}
Veamos cómo se comporta G�2 con los sı́mbolos a y b.
G�2 sı́mbolo a G�2 sı́mbolo b
p → q ∈ G1 p → p ∈ G�2
v → w ∈ G1 v → v ∈ G�2
u → w ∈ G1 u → v ∈ G�2
�
Es evidente que todos los estados de G2 son equivalentes. Por tanto, no es posible
refinar más la partición. Podemos determinar que los Autómatas 1 y 2 son equiva-
lentes ya que los estados iniciales p y v son equivalentes. Además, el autómata que
se muestra en la figura 4.7 es equivalente a ambos y es mı́nimo.
Como el estado G3 es inaccesible se puede eliminar. Ası́ el autómata quedarı́a
como muestra la figura 4.8.
4.6. Autómatas Finitos No Deterministas(AFND)

Manuales Uex
En los autómatas deterministas sabemos exactamente cuál es la transición que

debemos llevar a cabo ante una determinada situación. Sin embargo, en los no de-
terministas podemos encontrarnos con varias opciones e, incluso, con λ-transiciones
47
a
b
G’2 G1
a
a, b
G3
G1 = {q, r, w} G’2 = {p, u, v} G3 = {s}
Figura 4.7: Autómata mı́nimo
a
b
G’2 G1
a
G1 = {q, r, w} G’2 = {p, u, v}
Figura 4.8: Autómata simplificado
que se realizan sin considerar el correspondiente sı́mbolo de la cadena de entrada.

Para tener en cuenta estas consideraciones, los AFND se definen como una tupla:
AF ND = (Σ, Q, f, q0 , F, T ), f : Q × Σ −→ 2Q donde
2Q es el conjunto formado por los subconjuntos de Q, incluyendo a Ø
T es una relación binaria definida sobre Q que indica las λ-transiciones del
autómata (si pT q ⇒ existe una λ-transición desde p hasta q)
El resto de los sı́mbolos tiene el mismo significado que en la definición de AFD.

Manuales Uex
Ejemplo 4.5 Representación de un AFND utilizando un diagrama de transiciones:

ver figura 4.9
Descripción del mismo autómata mediante una tabla de transiciones:
48
4.6. AUTÓMATAS FINITOS NO DETERMINISTAS(AFND) 49
a b λ
→ ∗p {q} Ø Ø
q {p, s} {r, p} {s}
r Ø {s, p} {r, s}
∗s Ø Ø {r}
a
p q
a,b
b a, λ b
s λ
r λ
λ,b
Figura 4.9: A.F. no determinista
Es evidente que un AFD no es más que un caso particular de AFND, es decir, AFD
⊂ AFND. En realidad, un AFD es un AFND que cumple
T = Id y |f (q, a)| = 1 ∀q ∈ Q, ∀a ∈ Σ
Es útil conocer el cierre transitivo de la relación T , que se denota T ∗ . Si pT ∗ q,

entonces q es accesible desde p utilizando exclusivamente λ-transiciones.
Para calcular T ∗ podemos utilizar una matriz booleana (BT ) que permita repre-
sentar a T y calcular después todas las potencias de dicha matriz (llega un momento
en que las potencias se repiten y no es necesario calcular más). Ası́ BT 2 = (BT )2 repre-
senta las parejas de estados que están conectadas por dos λ-transiciones, BT 3 las que
están conectadas por tres, y ası́ sucesivamente. Por lo tanto Id+BT +BT 2 +BT 3 +. . . es
una matriz booleana que representa la relación que deseamos calcular T ∗ . En nuestro
ejemplo:
   
Manuales Uex
p 0 0 0 0 0 0 0 0
q 
 0 0 0 1  
 (BT )2 = BT 2 =  0 0 1 0 

BT =
r  0 0 1 1   0 0 1 1 
s 0 0 1 0 0 0 1 1
49
   
0 0 0 0 1 0 0 0
 0 0 1 1   0 1 1 1 
BT 3 = BT 4 = ... = 
 0
 B ∗ = BId + BT + BT 2 + BT 3 =  
0 1 1  T  0 0 1 1 
0 0 1 1 0 0 1 1
Definición 4.5 (λ-clausura)

Sea q ∈ Q, se llama λ-clausura(q) al conjunto de estados de Q que son accesibles
desde q mediante λ-transiciones. Por lo tanto,
λ − clausura(q) = {p ∈ Q/qT ∗ p}
Esta definición se puede ampliar a conjuntos
� de estados de manera natural.
Si R ⊂ Q, entonces λ − clausura(R) = q∈R λ − clausura(q)
Aunque para calcular la λ-clausura de un estado se pueden utilizar las matrices
booleanas que acabamos de ver, a continuación se describe un algoritmo que también
nos permite calcular la λ-clausura.
Algoritmo 4.2 Cálculo de la λ-clausura(q)

Output: Clausura ⊂ Q
Begin
Clausura = {q}
Auxiliar = Ø
while Auxiliar �= Clausura do
Auxiliar = Clausura
Clausura = Clausura ∪ {s ∈ Q/∃ λ-transición desde p hasta s, siendo p ∈
Auxiliar}
end while
λ-clausura(q) = Clausura
End
4.7. Lenguaje aceptado por un AFND

El lenguaje aceptado por un AFND es el conjunto de todas las cadenas de sı́mbolos
terminales que pueden hacer que el AFND llegue a un estado final de aceptación. Para
Manuales Uex
llegar a una definición formal de este lenguaje ampliaremos la definición de la función

de transición con objeto de que acepte cadenas de caracteres. Es decir, si la función
de transición de un AFND de define ası́: f : Q ∗ Σ → 2Q . Definiremos una función de
transición ampliada, de la siguiente forma f � : Q ∗ Σ∗ → 2Q , donde
50
4.8. SIMULACIÓN DE UN AFD Y AFND 51
f � (q, λ) = λ − clausura(q)
f � (q, ax) = {p ∈ f � (r, x)/r ∈ f � (q, a)} =

= {p ∈ Q/ ∃r ∈ f � (q, a) y p ∈ f � (r, x)} siendo a ∈ Σ, x ∈ Σ∗
Una vez ampliada la definición de la función de transición, el lenguaje aceptado

por el AFND es: L(AF ND) = {x ∈ Σ∗ /f � (q0 , x) ∩ F �= Ø}
4.8. Simulación de un AFD y AFND

En esta sección veremos sendos algoritmos que nos permitirán simular el compor-
tamiento de un AFD y de un AFND. Por tanto, permitirán determinar si una cadena
pertenece o no al lenguaje que reconoce el autómata.
Algoritmo 4.3 Simulación de un AFD

Input: x ∈ Σ∗
Begin
c es el primer carácter de x
q = q0
while c �= Fin do
q = f (q, c)
c es el siguiente carácter de x
end while
if q ∈ F then
la palabra x ha sido reconocida por el AFD
else
la palabra x no ha sido reconocida por el AFD
end if
End
Para detallar el algoritmo de simulación de un AFND, supondremos que tenemos

implementadas las siguientes funciones:
f (R, a) = ∪q∈R f (q, a), siendo R ⊂ Q y a ∈ Σ
λ − clausura(R), siendo R ⊂ Q
Manuales Uex
La diferencia fundamental entre ambos algoritmos está en el significado de q y S.

En el algoritmo 4.3, q representa el estado que el autómata tiene en cada instante.
Sin embargo, en el algoritmo 4.4, q es sustituido por S que representa al conjunto de
los estados en los que puede estar el autómata.
51
Algoritmo 4.4 Simulación de un AFND

Input: x ∈ Σ∗
Begin
c es el primer carácter de x
S = λ − clausura(q0 )
while c �= Fin do
S = λ − clausura(f (S, c))
c es el siguiente carácter de x
end while
if S ∩ F �= Ø then
la palabra x ha sido reconocida por el AFND
else
la palabra x no ha sido reconocida por el AFND
end if
End
4.9. Paso de un AFND a AFD

Los AFND y los AFD tienen el mismo poder computacional (esto no ocurre en
otros niveles de la jerarquı́a de los autómatas), es decir, pueden resolver los mismos
problemas. Por lo tanto, dado un AFND siempre es posible encontrar un AFD que sea
equivalente a él. En esta sección estudiaremos un método para resolver este problema.
En primer lugar explicaremos de manera genérica el paso de un autómata a otro, para
después ilustrar con un ejemplo este mecanismo de trasformación.
Partimos de un AFND = (Σ, Q, f, q0 , F, T ) y queremos construir un
AFD = (Σ, Q� , f � , q0� , F � ) que sea equivalente, donde:
1. Q� = 2Q
2. q0� = λ − clausura(q0 )
3. F � = {C ⊂ Q/C ∩ F �= Ø}
�
4. f � (C, a) = {C � ⊂ Q/C � = q∈C λ − clausura(f (q, a))}, siendo C ⊂ Q
El autómata que se obtiene por este método no tiene porqué ser mı́nimo y podrı́a
llegar a tener, como máximo, 2|Q| estados.
Manuales Uex
Ejemplo 4.6 Calcularemos el AFD equivalente al AFND que se muestra en la figura

4.10. Comenzamos calculando el estado inicial q0 que es la λ-clausura del estado inicial
del AFND. q0 =λ-clausura(A) = {A,C}
A continuación hay que calcular la función de transición para el estado q0
52
4.9. PASO DE UN AFND A AFD 53
B b
a,b
A a λ D
λ
a
a
a
C E
b a,b
λ
Figura 4.10: Ejemplo
f (q0 , a) = λ-clausura(f (A, a) ∪ f (C, a)) = λ-clausura(B, A) = {A, B, C, D} = q1

f (q0 , b) = λ-clausura(f (A, b) ∪ f (C, b)) = λ-clausura(B, E) = {B, D, E} = q2
Es necesario seguir calculando la función de transición para los nuevos estados que
van apareciendo.
f (q1 , a) = λ-clausura(f (A, a) ∪ f (B, a) ∪ f (C, a) ∪ f (D, a))
= λ-clausura(B, C, A, E) = {A, B, C, D, E} = q3
f (q1 , b) = λ-clausura(f (A, b) ∪ f (B, b) ∪ f (C, b) ∪ f (D, b))
= λ-clausura(B, E) = {B, D, E} = q2
f (q2 , a) = λ-clausura(f (B, a) ∪ f (D, a) ∪ f (E, a))
= λ-clausura(C, E) = {C, E} = q4
f (q2 , b) = λ-clausura(f (B, b) ∪ f (D, b) ∪ f (E, b))
f (q3 , a) = λ-clausura(f (A, a) ∪ f (B, a) ∪ f (C, a) ∪ f (D, a) ∪ f (D, a))
= λ-clausura(B, C, A, E) = {A, B, C, D, E} = q3
f (q3 , b) = λ-clausura(f (A, b) ∪ f (B, b) ∪ f (C, b) ∪ f (D, b) ∪ f (D, b))
f (q4 , a) = λ-clausura(f (C, a) ∪ f (E, a)) = λ-clausura(A, E) = {A, C, E} = q5
f (q4 , b) = λ-clausura(f (C, b) ∪ f (E, b)) = λ-clausura(E) = {E} = q6
f (q5 , a) = λ-clausura(f (A, a) ∪ f (C, a) ∪ f (E, a))
= λ-clausura(B, A, E) = {A, B, C, D, E} = q3
Manuales Uex
f (q5 , b) = λ-clausura(f (A, b) ∪ f (C, b) ∪ f (E, b))

f (q6 , a) = λ-clausura(f (E, a)) = λ-clausura(E) = q6
f (q6 , b) = λ-clausura(f (E, b)) = λ-clausura(E) = q6
53
El AFD resultante aparece en la siguiente figura.
q1
a a
a
q0 b
q3
b
b
a
b b q5
q2
a a
a,b
q6 q4
b
Figura 4.11: AFD equivalente al de la figura 4.10
Una vez obtenido el AFD, intentaremos minimizarlo.

Inicialmente, Partición = {G1 , G2 } G1 = {q2 , q3 , q4 , q5 , q6 } G2 = {q0 , q1 }
Analizaremos el comportamiento de todos los estados con a y b.
q2 → q4 ∈ G1 q2 → q2 ∈ G1
q3 → q3 ∈ G1 q3 → q2 ∈ G1
q4 → q5 ∈ G1 q4 → q6 ∈ G1
q5 → q3 ∈ G1 q5 → q2 ∈ G1
q6 → q6 ∈ G1 q6 → q6 ∈ G1
q0 → q1 ∈ G2 q0 → q2 ∈ G1
q1 → q3 ∈ G1 q1 → q2 ∈ G1
Todos los estados de G1 son equivalentes, sin embargo, esto no ocurre con los
de G2 , por lo que es necesario separarlos en dos elementos diferentes. La nueva y
definitiva partición serı́a:
Manuales Uex
{G1 , G�2 , G3 } G1 = {q2 , q3 , q4 , q5 , q6 } G�2 = {q0 } G3 = {q1 }.

A continuación se representa el nuevo autómata (figura 4.12) que es determinista,
mı́nimo y equivalente al AFND del que partimos.
54
4.10. RELACIÓN ENTRE AF, GR. Y EXP. REG. 55
a, b
b
G’2 G1
a
a, b
G3
G1 = {q2, q3, q4, q5, q6} G’2 = { q0} G3 = { q1}
Figura 4.12: AFD mı́nimo equivalente al del figura 4.11
4.10. Relación entre Autómatas Finitos, gramáticas

y expresiones regulares
Como sabemos las gramáticas regulares generan lenguajes regulares que pueden
ser representados mediante expresiones regulares. A su vez, estos lenguajes pueden
ser reconocidos por Autómatas Finitos.
En esta sección estudiaremos diferentes métodos que nos permitirán construir
unos elementos a partir de otros.
4.10.1. Construcción de la expresión regular reconocida por

un AF
Estudiaremos dos métodos diferentes.
El método del sistema de ecuaciones
El método de las funciones recursivas
Previamente se define y demuestra la Regla de Inferencia que se aplicará en el

primer método como un mecanismo para despejar incógnitas.
Teorema 4.1 (Regla de Inferencia)

Sean R, S, T tres expresiones regulares de manera que λ ∈
/ S.
Se cumple que R = SR + T ⇔ R = S ∗ T
Manuales Uex
Demostración:
Suponemos que R = S ∗ T y queremos demostrar que R = SR + T

R = S ∗ T = (λ + S + )T = (λ + SS ∗ )T = T + SS ∗ T = T + S(S ∗ T ) = T + SR
55
Suponemos que R = SR + T y queremos demostrar que R = S ∗ T , para ello

comenzaremos demostrando que S ∗ T ⊂ R
Si α ∈ S y β ∈ T (como R = SR + T entonces T ⊂ R y por tanto β ∈ R)
⇒ αβ ∈ SR ⊂ R
Análogamente y aplicando n veces el mismo razonamiento,
si α1 , . . . , αn ∈ S y β ∈ T ⇒ α1 . . . αn β ∈ R ⇒ S ∗ T ⊂ R
Supongamos que S ∗ T �= R, entonces R = S ∗ T + C
(consideramos que C ∩ S ∗ T = Ø)
R = SR + T = S(S ∗ T + C) + T = SS ∗ T + SC + T = (SS ∗ + λ)T + SC
= S ∗ T + C = S ∗ T + SC
Eso significa que cualquier palabra de C debe pertenecer a SC (ya que no puede
pertenecer a S ∗ T ) y esto es absurdo ya que λ ∈
/ S por lo tanto C = Ø y se
cumple que S ∗ T = R �
El método del sistema de ecuaciones

Este método se basa en la definición de una serie de e.r. que inicialmente serán
las incógnitas de un sistema de ecuaciones.
Partimos de un AF D = (Σ, Q, f, q0 , F ) y para cada uno de los estados qi ∈ Q
definimos una e.r. Xi que representa a todas las cadenas que permiten llegar desde
el estado i hasta algún estado final de aceptación.
Xi = Ø si F es inaccesible desde qi
a ∈ Xi , ∀a ∈ Σ tal que f (qi , a) ∈ F
Todas las cadenas de la forma aXj pertenecen a Xi , si f (qi , a) = qj
Teniendo en cuenta estas consideraciones, Xi se define de la siguiente forma:

Xi = Σnj=1 aij Xj + af 1 + af 2 + . . . + af m donde f (qi , aij ) = qj y f (qi , af k ) ∈ F .
Además, hay que añadir λ si qi ∈ F .
Si aplicamos esta definición para todos los estados del AF, conseguimos construir
un sistema de n ecuaciones con n incógnitas, donde n es el número de estados del
AF. El sistema de ecuaciones se resolverá sustituyendo unas ecuaciones en otras y
aplicando la regla de inferencia para despejar dichas incógnitas. En realidad, no es
Manuales Uex
necesario resolver el sistema completo ya que la única incógnita que nos interesa es
X0 (considerando que q0 es el estado inicial) que es la e.r. buscada.
Ejemplo 4.7 Sea el siguiente AF
56
b b
a
q0 q1
a
Definimos el sistema de ecuaciones:

� �
X0 = bX0 + aX1 + a
X1 = aX0 + bX1 + b + λ
Aplicamos la regla de inferencia en la 2 ecuación.
(considerando que R = X1 , S = b y T = aX0 + b + λ)
X1 = aX0 + bX1 + b + λ = b∗ (aX0 + b + λ)
Sustituimos X1 en la primera ecuación.
X0 = bX0 + aX1 + a
= bX0 + a(b∗ (aX0 + b + λ)) + a
= bX0 + ab∗ aX0 + ab∗ b + ab∗ + a
= (b + ab∗ a)X0 + ab∗
Aplicamos de nuevo la regla de inferencia, esta vez en la primera ecuación.
(ahora, R = X0 , S = b + ab∗ a y T = ab∗ )
X0 = (b + ab∗ a)X0 + ab∗ = (b + ab∗ a)∗ ab∗
El método de las funciones recursivas

Para que este método pueda llevarse a cabo sin ambigüedades es necesario numerar
los estados a partir del 1, es decir, Q = {q1 , . . . , qn }.
También en este caso definiremos una serie de e.r.(en este caso, de forma recursiva)
que inicialmente serán incógnitas que es necesario calcular.
k
Cada e.r. Rij representará a las cadenas que permiten llegar del estado qi al
0
estado qj pasando exclusivamente por los estados q1 , . . . , qk . Definiremos Rij como el
conjunto de cadenas (en este caso, sı́mbolos) que nos llevarán directamente del estado
0
qi al estado qj . Las e.r del tipo Rij se definen de forma directa, mientras que las e.r.
k
Rij , k ≥ 1 se definen de forma recursiva.
�
0 {a ∈ Σ/f (qi , a) = qj } si i �= j
Rij =
{a ∈ Σ/f (qi , a) = qj } ∪ λ si i = j
Manuales Uex
k k−1 k−1 k−1 ∗ k−1

Rij = Rij + Rik (Rkk ) Rkj , k≥1
k n n
Una vez calculadas las e.r. Rij , la e.r. buscada es: R1f 1
+ R1f 2
+ . . . donde q1 es el
estado inicial y qfi ∈ F
57
k
Ejemplo 4.8 Dado el siguiente AFD, calculamos las e.r. Rij
b
a
q1 q2
k=0 k=1 k=2

R11 λ λ λ
R12 a a ab∗
R21 Ø Ø Ø
R22 b+λ b+λ b∗
Las dos últimas columnas se han calculado mediante la fórmula recursiva vista
anteriormente.
0 ∗ 0
1
R11 0
= R11 0
+ R11 (R11 ) R11 = λ + λλ∗ λ = λ
R12 = R12 + R11 (R11 ) R12 = a + λλ∗ a = a
1 0 0 0 ∗ 0
0 ∗ 0
1
R21 0
= R21 0
+ R21 (R11 ) R11 = Ø + Øλ∗ λ = Ø
R22 = R22 + R21 (R11 ) R12 = (b + λ) + Øλ∗ a = b + λ
1 0 0 0 ∗ 0
1 ∗ 1
2
R11 1
= R11 1
+ R12 (R22 ) R21 = λ + a(b + λ)∗ Ø = λ
1 ∗ 1
2
R12 1
= R12 1
+ R12 (R22 ) R22 = a + a(b + λ)∗ (b + λ) = a + ab∗ = ab∗
1 ∗ 1
2
R21 1
= R21 1
+ R22 (R22 ) R21 = Ø + (b + λ)(b + λ)∗ Ø = Ø
1 ∗ 1
2
R22 1
= R22 1
+ R22 (R22 ) R22 = (b + λ) + (b + λ)(b + λ)∗ (b + λ) = b∗
Teniendo en cuenta que sólo hay un estado final de aceptación q2 , la e.r. que
estamos buscando será R12 2
= ab∗
4.10.2. Construcción del AF que reconoce una expresión re-

gular
Estudiaremos dos métodos que nos ayudarán a construir un autómata que re-
conoce el lenguaje que representa una e.r. dada. El primero construye un AFND
mientras que el segundo permite construir un AFD.
Paso de expresión regular a AFND De la misma forma que las e.r. se definieron
Manuales Uex
de forma recursiva, este método para construir el AFND, que está basado en la
definición de las e.r., también puede considerarse recursivo. Para cada tipo de e.r.
construiremos un AFND, de esta manera diferentes autómatas pueden ensamblarse
para construir otro más complejo.
58
1 - e.r. = ∅
q1 qf
2 - e.r. = λ q1
3 – e.r. = a ∈ Σ a
q1 qf
Mα
q1 qf1 λ
λ
4 – e.r. = α + β q0 qf
λ
λ Mβ
q2 qf2
5 – e.r. = α β Mα λ Mβ
q1 qf1 q2 qf
Mα
q1 qf1
λ
6 – e.r. = α∗ λ
q0 λ
qf
Figura 4.13: Paso de e.r. a AFND
En la figura anterior se detallan los esquemas asociados a cada una de las opera-
ciones que podemos encontrar en una e.r., Mα y Mβ representan a los autómatas que
reconocen a las e.r. α y β respectivamente.
Paso de expresión regular a AFD Introduciremos este método mediante un

Manuales Uex
ejemplo con la e.r. (a + b)*abb.

Para desarrollar este método es necesario etiquetar con un número a cada uno
de los sı́mbolos que componen la e.r. A estas etiquetas las llamaremos posiciones.
Además, añadiremos el sı́mbolo # a la derecha de la e.r. para indicar el final de las
59
palabras del lenguaje representado.
( a + b ) * a b b #
1 2 3 4 5 6
Para cada una de las posiciones es necesario definir su conjunto siguiente que
estará formado por las posiciones que pueden seguir a una dada en cualquier pala-
bra que pertenezca al lenguaje representado por la e.r. Para calcular estos conjuntos
es necesario analizar cada una de las operaciones que intervienen en la e.r. y estu-
diar cómo afectan a las diferentes posiciones. Para este ejemplo, los valores de estos
conjuntos serı́an:
sig(1) = {1, 2, 3} sig(3) = {4} sig(5) = {6}

sig(2) = {1, 2, 3} sig(4) = {5} sig(6) = Ø
Cada estado de nuestro AFD será un conjunto de posiciones. Los estados finales
de aceptación serán aquellos que contienen a la posición asociada al sı́mbolo # (en el
ejemplo, la posición 6). Se calculan simultáneamente estos estados y las transiciones
correspondientes mediante el algoritmo 4.5. En este algoritmo hay que tener en cuenta
que simb(i) indica el sı́mbolo del alfabeto asociado a la posición i. En nuestro caso:
simb(1) = {a} simb(3) = {a} simb(5) = {b}

simb(2) = {b} simb(4) = {b} simb(6) = Ø
Además, pp representa a las primeras posiciones de la e.r., es decir, las posiciones

por las que puede comenzar cualquier palabra representada por la e.r. En este ejemplo,
pp = {1, 2, 3}
Las siglas EM y ENM significan Estados Marcados y Estados No Marcados re-
spectivamente, y representan a dos conjuntos de estados del autómata que se está con-
struyendo. Estos conjuntos se utilizan para saber si un estado ha sido marcado o no.
Marcar un estado significa procesarlo, es decir, calcular las transiciones que parten de
dicho estado. Cuando un estado se procesa pasa del conjunto ENM al conjunto EM.
La construcción del autómata terminará cuando no quede ningún estado sin marcar.
Veamos como se aplicarı́a el algoritmo 4.5 al ejemplo con el que estamos traba-
jando.
Comenzamos definiendo el estado inicial q0 = pp = {1, 2, 3}.
Inicialmente, EM = Ø y ENM = {q0 }
A continuación hay que calcular la función de transición para el estado q0
Manuales Uex
f (q0 , a) = sig(1) ∪ sig(3) = {1, 2, 3, 4} = q1

f (q0 , b) = sig(2) = {1, 2, 3} = q0 Ahora: EM = {q0 } y ENM = {q1 }
Es necesario seguir calculando la función de transición para los nuevos estados que
van apareciendo.
60
Algoritmo 4.5 Construcción del AFD a partir de la e.r.

Input: x ∈ Σ∗
Begin
ENM = pp
EM = Ø
while ENM �= Ø do
Pasar T desde ENM hasta EM
for all �a ∈ Σ do
R = ∀i∈T sig(i) tal que simb(i) = a
if R �= Ø and R ∈/ (EM ∪ ENM) then
añadir R a ENM
f (T, a) = R
end if
end for
end while
End
f (q1 , a) = sig(1) ∪ sig(3) = {1, 2, 3, 4} = q1

f (q1 , b) = sig(2) ∪ sig(4) = {1, 2, 3, 5} = q2 EM = {q0 , q1 } y ENM = {q2 }
f (q2 , a) = sig(1) ∪ sig(3) = {1, 2, 3, 4} = q1
f (q2 , b) = sig(2) ∪ sig(5) = {1, 2, 3, 6} = q3 EM = {q0 , q1 , q2 }, ENM = {q3 }
f (q3 , a) = sig(1) ∪ sig(3) = {1, 2, 3, 4} = q1
f (q3 , b) = sig(2) = {1, 2, 3} = q0 EM = {q0 , q1 , q2 , q3 } y ENM = Ø
La figura 4.14 representa gráficamente al autómata construido. Como se puede

observar, el único estado final de aceptación es q3 .
q1 a
q3
a
b a b
q0
b
b
q2
Manuales Uex
Figura 4.14: AFD correspondiente a la e.r. (a + b)∗ abb
61
4.10.3. Relación entre A.F. y gramáticas regulares

En este apartado, se estudiarán métodos, similares entre si, para construir el AF
que reconoce al lenguaje generado por una gramática regular (distinguiendo si es
lineal por la izquierda o por la derecha). De forma análoga se estudiarán métodos
para construir gramáticas que generen el lenguaje que reconoce un AF dado. Para
poder definir una relación entre los AF’s y las gr. regulares estableceremos, en primer
lugar, las siguientes correspondencias:
Cada estado del autómata se corresponderá con un sı́mbolo no terminal de la

gramática.
Cada transición del autómata se corresponderá con una producción de la gramática.
Paso de GLD a AFND En este caso:
1. El estado inicial del autómata se corresponderá con el sı́mbolo inicial de la

gramática.
2. Definiremos un estado final de aceptación P que no se corresponde con ningún

sı́mbolo no terminal de la gramática.
3. A cada producción de la gramática le corresponde una transición en el autómata

según el siguiente esquema:
a
A ::= a A
P
A ::= aB a
A B
S ::= λ λ
S P
Manuales Uex
Ejemplo 4.9 En la figura 4.15 se muestra la obtención de un autómata finito a

partir de una gramática lineal por la derecha.
62
A
S ::= 1A 1
| 0B S 0
|1 1
P
A ::= 0S
| 1B 1
0
B ::= 0B
| 1B
B
0, 1
Figura 4.15: Ejemplo de paso de GLD a AFND
Paso de AFND a GLD En este caso debemos tener en cuenta las mismas rela-
ciones que hemos visto en el caso anterior. Sin embargo, las transiciones que llevan
a un estado final dan lugar a dos producciones diferentes como indica la siguiente
figura.
a Obtenemos dos producciones:

A A ::= aB y A ::= a
B
Ejemplo 4.10 En la figura 4.16 se muestra la obtención de una gramática lineal

por la derecha a partir de un autómata finito. La gramática ha sido posteriormente
simplificada ya que el sı́mbolo P no es un estado generativo.
1
S A
0
S ::= 1A
| 1P S ::= 1A
1 |1
|1
A ::= 0S A ::= 0S
P
Figura 4.16: Ejemplo de paso de AFND a GLD

Manuales Uex
Paso de GLI a AFND Si trabajamos con GLI’s, debemos tener en cuenta que:
1. El estado final del autómata se corresponderá con el sı́mbolo inicial de la

gramática.
63
2. Definiremos un estado inicial llamado P que no se corresponde con ningún

sı́mbolo no terminal de la gramática.
3. A cada producción de la gramática le corresponde una transición en el Autóma-
ta según el siguiente esquema:
a
A ::= a P A
A ::= Ba a
B A
S ::= λ λ
P S
Ejemplo 4.11 En la figura 4.17 se muestra el autómata obtenido a partir de una

gramática lineal por la izquierda.
A 0
1
S ::= A0 P 1
| B1 S
A ::= S1
|1 0
0
B ::= S0 1
|0 B
Figura 4.17: Ejemplo de paso de GLI a AFND
Paso de AFND a GLI En este caso debemos tener en cuenta las mismas relaciones
que hemos visto en el caso anterior. Sin embargo, hay que tener en cuenta que puede
haber varios estados finales, en ese caso las transiciones que llevan a un estado final
dan lugar a dos producciones según se indica en el siguiente esquema.
• Si A es el único estado final,

a obtenemos la producción S ::= Ba
Manuales Uex
B • Si hay varios estados finales,

A
obtenemos las producciones
A ::= Ba y S ::= Ba
64
4.11. LÍMITES PARA LOS LENG. REGULARES 65
Ejemplo 4.12 En la figura 4.18 se muestra la gramática lineal por la izquierda

obtenida a partir de un autómata finito.
1 1 F
0 B D
0
A 1 0
1 0
C E G
0
1 0
B ::= A0 D ::= B1 G ::= E0 A es no generativo

| D0 |G0 F y G son
|0 E ::= C0 inaccesibles B ::= D0 D ::= B1
C ::= A1 |0 E ::= C0
| E1 F ::= D1 S ::= B1 C ::= E1 S ::= B1
|1 | C1 | C0 |1 | C0
Figura 4.18: Ejemplo de paso de AFND a GLI
4.11. Lı́mites para los leng. regulares

En esta sección estudiaremos dos resultados, el lema del bombeo y el teorema de
Myhill-Nerode que nos permitirán establecer lı́mites para determinar si un lenguaje
es o no regular.
4.11.1. El lema del bombeo(pumping lemma)

El lema del bombeo enuncia una propiedad que deben cumplir todos los lenguajes
regulares. El hecho de comprobar que un lenguaje no cumple dicha propiedad es
suficiente para demostrar que no es regular. Sin embargo, en ningún caso este lema
servirá para demostrar que un lenguaje es regular.
Lema 4.1 (El lema del bombeo para leng. regulares)
Sea L un lenguaje regular, entonces existe una constante asociada al lenguaje n > 0,
de manera que ∀z ∈ L tal que |z| ≥ n, se cumple que z se puede descomponer en
tres partes z = uvw que verifican:
1. |v| ≥ 1
Manuales Uex
2. |uv| ≤ n
3. ∀i ≥ 0 ⇒ uv i w ∈ L
65
Ejemplo 4.13 Utilizaremos el lema del bombeo para demostrar que el lenguaje L =
{ak bk /k ≥ 0} no es regular. La demostración se realizará por el método de reducción
al absurdo. Es decir, supondremos que L es regular, si partiendo de esta hipótesis
llegamos a una situación absurda habremos comprobado que nuestra suposición inicial
era falsa.
Supongamos que L es regular y que n ≥ 0 es la constante asociada a L que
menciona el lema del bombeo. Evidentemente sea cual sea el valor de n siempre es
posible encontrar una palabra en L cuya longitud sea mayor que n, por ejemplo, sea
z = an bn , en este caso |z| = 2n > n. Veamos diferentes formas de dividir z en tres
partes:
1. z = uvw = a . . . |a . . . a| . . . ab . . . b
2. z = uvw = a . . . ab . . . |b . . . b| . . . b
3. z = uvw = a . . . |a . . . ab . . . b| . . . b
En el primer caso sólo se bombearı́an a’s con los que conseguirı́amos cadenas con
más a’s que b’s, que no pertenecerı́an a L. En el segundo caso ocurrirı́a lo contrario ya
que sólo bombearı́amos b’s. En el tercer caso bombeamos a’s y b’s simultáneamente,
por tanto serı́a posible obtener el mismo número de a’s que de b’s. Sin embargo,
las cadenas obtenidas contendrı́an subcadenas del tipo ababab o aabbaabbaabb, de
cualquier forma estas palabras nunca pertenecerı́an a L. No existe ninguna otra forma
de dividir la cadena en tres partes; por tanto, hemos comprobado que el lema no se
cumple y podemos asegurar que el lenguaje no es regular.
4.11.2. El teorema de Myhill-Nerode

Este teorema nos permitirá saber si un lenguaje es o no regular. Además y en
el caso de que el lenguaje sea regular, la demostración del teorema nos muestra
un método para construir el AFD mı́nimo que reconoce a dicho lenguaje. Antes de
enunciar el teorema será necesario conocer algunas definiciones acerca de las relaciones
binarias. Consideraremos que R es una relación de equivalencia definida sobre el
conjunto X.
Definición 4.6 (Relación invariante por la derecha)
Se dice que R es invariante por la derecha respecto a una operación ◦ definida sobre
X, si se cumple que:
si xRy ⇒ ∀z ∈ X, x ◦ zRy ◦ z
Manuales Uex
Definición 4.7 (Relación de ı́ndice finito)

Se dice que R es de ı́ndice finito si el cardinal de su conjunto cociente es finito, es
decir, si el número de clases de equivalencia que define R es finito.
66
Teorema 4.2 (Teorema de Myhill-Nerode)

Dado un lenguaje L definido sobre un alfabeto Σ, las siguientes afirmaciones son
equivalentes:
1. L ⊂ Σ∗ es regular
2. L es la unión de algunas clases de equivalencia de una relación de equivalencia

RM definida sobre Σ∗ que es de ı́ndice finito e invariante por la derecha respecto
a la concatenación.
3. A partir de L se puede definir una relación binaria RL sobre Σ∗ , de la siguiente

forma:
xRL y ⇐⇒ ∀z ∈ Σ∗ xz ∈ L ⇔ yz ∈ L
Es decir, o ambas cadenas (xz e yz) pertenecen a L, o ninguna de las dos

pertenece a L.
Se cumple que la relación RL es una relación de equivalencia, de ı́ndice finito e
invariante por la derecha respecto a la concatenación.
Demostración.
Para demostrar este teorema comprobaremos en primer lugar que 1 ⇒ 2, después
que 2 ⇒ 3 y finalmente que 3 ⇒ 1.
1 =⇒ 2 Suponemos que L es regular, entonces existe un AF D = (Σ, Q, f, q0 , F ) que

lo reconoce. A partir de este autómata podemos definir una relación binaria sobre Σ∗
a la que llamaremos RM :
∀x, y ∈ Σ∗ xRM y ⇐⇒ f (q0 , x) = f (q0 , y)
Es evidente que esta relación es de equivalencia y además tendremos tantas clases

de equivalencia como estados tenga el autómata, por tanto, será una relación de ı́ndice
finito.
Veamos que RM es de invariante por la derecha respecto a la concatenación. Si
xRM y ⇒ f (q0 , x) = f (q0 , y) ⇒ f (q0 , xz) = f (q0 , yz) ∀z ∈ Σ∗ ⇒ xzRM yz c.q.d.
Si x ∈ Σ∗ entonces [x] representa a la clase de equivalencia de x, es decir, [x] es
Manuales Uex
el conjunto de todas las cadenas que están relacionadas con x.

Utilizando esta notación y teniendo en cuenta la definición de RM es evidente que
L = {∪[x]/f (q0 , x) ∈ F }. Es decir, L es la unión de varias clases de equivalencia de
RM , concretamente, tantas como estados finales tenga el autómata.
67
2 =⇒ 3 Suponemos que L es la unión de varias clases de equivalencia definidas

por una relación a la que llamaremos RM que es de ı́ndice finito e invariante por la
derecha.
Por otra parte, se ha definido la relación RL de la siguiente forma:
xRL y ⇐⇒ ∀z ∈ Σ∗ xz ∈ L ⇔ yz ∈ L
Es evidente que RL es una relación de equivalencia. Veamos que es invariante por
la derecha:
xRL y =⇒ ∀z ∈ Σ∗ xz ∈ L ⇔ yz ∈ L
=⇒ ∀z, z � ∈ Σ∗ xzz � ∈ L ⇔ yzz � ∈ L
=⇒ ∀z ∈ Σ∗ xzRL yz
Comprobaremos a continuación que xRM y ⇒ xRL y. Si esto ocurre el número de
clases de equivalencia que genera RM será mayor o igual que el número de clases de
RL , lo que permitirá afirmar que RL es de ı́ndice finito.
�
si [xz] ⊆ L ⇒ xz ∈ L, yz ∈ L
xRM y =⇒ ∀z ∈ Σ∗ xzRM yz =⇒ como[xz] = [yz]
si [xz] � L ⇒ xz ∈
/ L, yz ∈
/L
=⇒ xz ∈ L ⇔ yz ∈ L =⇒ xzRL yz c.q.d.
3 =⇒ 1 Suponemos que RL es de ı́ndice finito e invariante por la derecha. Para

demostrar que L es un lenguaje regular, vamos a construir un AF D = (Σ, Q, f, q0 , F )
que lo reconozca.
Q = Σ∗ /RL f ([x], a) = [xa]

q0 = [λ] F = {[x]/x ∈ L}
Q es un conjunto finito porque RL es de ı́ndice finito.
f está bien definido porque si [x] = [y] ⇒ [xa] = [ya]∀a ∈ Σ ya que RL es

invariante por la derecha respecto a la concatenación ⇒ f ([x], a) = f ([y], a)
Este autómata finito que se ha definido reconoce a L ya que

x ∈ L ⇐⇒ [x] ∈ F ⇐⇒ f (q0 , x) = f ([λ], x) = [x] ∈ F
Como hemos demostrado que L es reconocido por un Autómata Finito, podemos

asegurar que L es un lenguaje regular. �
Ejemplo 4.14 Utilizando el teorema de Myhill-Nerode construiremos el AFD mı́ni-

mo que reconozca el lenguaje 0∗ 10∗ .
Manuales Uex
q0 = [λ] =⇒ f (q0 , 0) = [λ0] = [0] f (q0 , 1) = [λ1] = [1]
[0] = [λ]? ⇐⇒ ∀z 0z ∈ L ⇔ z ∈ L? Cierto =⇒ f (q0 , 0) = [0] = q0
68
[1] = [λ]? ⇐⇒ ∀z 1z ∈ L ⇔ z ∈ L? Falso =⇒ f (q0 , 1) = [1] = q1
f (q1 , 0) = [10] f (q1 , 1) = [11]
[10] = [λ]? ⇐⇒ ∀z 10z ∈ L ⇔ z ∈ L? Falso
[10] = [1]? ⇐⇒ ∀z 10z ∈ L ⇔ 1z ∈ L? Cierto =⇒ f (q1 , 0) = [10] = q1
[11] = [λ]? ⇐⇒ ∀z 11z ∈ L ⇔ z ∈ L? Falso
[11] = [1]? ⇐⇒ ∀z 11z ∈ L ⇔ 1z ∈ L? Falso =⇒ f (q1 , 1) = [11] = q2
f (q2 , 0) = [110] f (q2 , 1) = [111]
[110] = [11]? ⇐⇒ ∀z 110z ∈ L ⇔ 11z ∈ L? Cierto =⇒ f (q2 , 0) = q2
[111] = [11]? ⇐⇒ ∀z 111z ∈ L ⇔ 11z ∈ L? Cierto =⇒ f (q2 , 1) = q2
La siguiente figura muestra el autómata que se acaba de construir.
0 0 0,1
1 1
q0 q1 q2
q0 = [λ]=[0]=[00] q1 =[1]=[01] q2=[11]=[110]=[111]
Es importante destacar que el estado q0 = [λ] = [0] representa a todas las cadenas
binarias que no tienen ningún 1, el estado q1 = [1] = [10] representa a las cadenas
binarias que tienen un solo 1 y, por tanto, pertenecen al lenguaje (por ese motivo es
el único estado final de aceptación), y el estado q2 = [11] representa a las cadenas
que tienen más de un 1. Es evidente que q0 , q1 y q2 o, lo que es lo mismo, las clases de
equivalencia [λ], [1] y [11] constituyen una partición del lenguaje universal (0 + 1)∗ .
Ejemplo 4.15 Utilizando el teorema de Myhill-Nerode es posible demostrar que el

lenguaje L = {an bn / n ≥ 0} no es regular.
Comprobaremos que existe un número infinito de clases de equivalencia para la
relación RL , concretamente [a] �= [a2 ] �= [a3 ] �= . . .
Manuales Uex
Bastará demostrar que [ai ] �= [aj ] cuando i �= j, o lo que es lo mismo, que

ai R
/ L aj cuando i �= j.
Sea z = bj entonces aj z ∈ L y sin embargo ai z ∈ / L =⇒ ai R
/ L aj
69
4.12. Problemas
4.1 Minimizar el siguiente autómata
a b
→ q0 q1 q2
q1 q3 q2
q2 q4 q1
∗ q3 q4 q3
∗ q4 q3 q4
4.2 Construir un AFD mı́nimo a partir del siguiente AFND:

0 1
→ p {q, s} q
∗ q − q
∗ s − p
4.3 ¿Qué lenguajes reconocen los siguientes autómatas?
A
0 1
0,1
1 0
B
0 1
1 0 1
1
C
1 0,1
0 0 0
0
D 0,1
0 1
1 0 1 0,1
Manuales Uex
4.4 A partir de los siguiente Autómatas Finitos:
70
4.12. PROBLEMAS 71
a b λ 0 1
→ A {B, D} − − → A B C
B C − A B − D
∗ C − − − C E −
∗ D − A − ∗ D B −
∗ E − C
construir una GLD y una GLI, limpias y bien formadas, para generar los lenguajes
que reconocen dichos autómatas. Calcular las expresiones regulares que describen
dichos lenguajes utilizando el método del sistema de ecuaciones.
4.5 Utilizando el método de los conjuntos siguientes calcular el AFD que reconoce
a cada uno de los siguientes lenguajes:
1. ab∗ c + a∗ c∗
2. b∗ (a + bc)
3. a(bc)∗ + ab(cb)∗ cd
4.6 Utilizando el teorema de Myhill-Nerode construir un AFD mı́nimo que reconoz-

ca los lenguajes L1 = (ab)∗ y L2 = ab∗
Manuales Uex
71
Tema 5
Gramáticas Independientes del

Contexto y Autómatas de Pila
Contenido
5.1. Definición de G.I.C. . . . . . . . . . . . . . . . . . . . . . . 74
5.2. Autómatas de Pila . . . . . . . . . . . . . . . . . . . . . . . 74
5.3. Árboles de derivación . . . . . . . . . . . . . . . . . . . . . 77
5.4. Reconocimiento descendente . . . . . . . . . . . . . . . . . 80
5.5. Reconocimiento ascendente . . . . . . . . . . . . . . . . . 87
5.6. Propiedades de los L.I.C. . . . . . . . . . . . . . . . . . . . 93
5.7. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
En este tema se estudiarán las Gramáticas Independientes del Contexto (GIC), los
lenguajes que éstas definen, llamados lenguajes independientes del contexto (LIC),
y los autómatas que reconocen a estos últimos, los Autómatas de Pila (AP). Con-
siderando la jerarquı́a de Chomsky, también se les llama respectivamente gramáticas
y lenguajes de tipo 2. Estas gramáticas, igual que ocurre con las regulares, tienen una
gran importancia práctica en la definición de lenguajes de programación, ya que nos
permiten formalizar el concepto de sintaxis, de la misma forma que los Autómatas
Manuales Uex
de Pila nos permitirán modelar el funcionamiento del analizador sintáctico, una de

las partes fundamentales de un compilador. Análogamente, los lenguajes regulares y
los Autómatas Finitos permiten representar los aspectos léxicos y el análisis léxico,
respectivamente, de los lenguajes de programación.
73
73
74 TEMA 5. G.I.C Y AUTÓMATAS DE PILA
5.1. Definición de G.I.C.

En las Gramáticas Independientes del Contexto las producciones son menos res-
trictivas que en las gramáticas regulares. En este caso, la parte izquierda de la produc-
ción también está formada por un único sı́mbolo no terminal, pero no hay restricciones
respecto a la parte derecha de la producción. Por lo tanto, las producciones son de
la forma:
A ::= v donde A ∈ ΣN , v ∈ Σ∗
En este tipo de gramáticas, la conversión de A en v se realiza independientemente
del contexto en el que se encuentre A, de ahı́ su nombre.
5.2. Autómatas de Pila

De la misma forma que cualquier lenguaje regular puede ser reconocido por un
Autómata Finito, cualquier lenguaje independiente del contexto puede ser reconocido
por un Autómata de Pila. Sin embargo, en este caso la equivalencia es menos satis-
factoria ya que los Autómatas de Pila no son dispositivos deterministas y el conjunto
de los Autómatas de Pila Deterministas sólo permite reconocer a un subconjunto de
los lenguajes de tipo 2. Afortunadamente, este subconjunto suele ser suficiente para
definir los aspectos más comunes de cualquier lenguaje de programación.
En esencia, un Autómata de Pila es un Autómata Finito al que se le ha incorpora-
do memoria que se gestiona como una pila, con lo que se aumenta su poder funcional.
El dispositivo será no determinista y tendrá un número finito de movimientos (o tran-
siciones) a elegir en cada situación. Hay dos tipos de movimientos:
1. Dependiendo del estado actual del Autómata, del sı́mbolo que hay en la cima
de la pila y del que hay en la cadena de entrada, habrá que elegir entre un
conjunto de posibles transiciones. Cada transición está formada por un posible
cambio de estado y por una cadena (puede ser λ) que reemplazará al sı́mbolo
que ocupa la cima de la pila. Después de realizar un movimiento se avanza en
el análisis de la cinta de entrada.
2. Se le llama λ-movimiento y es similar al anterior salvo que el sı́mbolo de la

cadena de entrada no se tiene en cuenta y, por tanto, el análisis de dicha cadena
no avanza.
Definiremos formalmente un Autómata de Pila de la siguiente forma:
Manuales Uex
AP = {Q, Σ, f, Γ, q0 , z0 , F }
Q es el conjunto finito de estados
74
5.2. AUTÓMATAS DE PILA 75
Σ es el alfabeto de la cinta de entrada
Γ es el alfabeto de la pila
z0 ∈ Γ es el sı́mbolo inicial del la pila
F ⊂ Q es el conjunto de estados finales
f : Q × (Σ ∪ λ) × Γ −→ P(Q × Γ∗ )
f (q, a, z) = {(p1 , ψ1 ), (p2 , ψ2 ), . . . , (pn , ψn )}
Estas transiciones indican que si el Autómata de Pila se encuentra en el estado
q, recibe como entrada el sı́mbolo a y z es el sı́mbolo que se encuentra en la
cima de la pila, el Autómata puede pasar al estado p1 y reemplazar en la pila el
carácter z por la cadena ψ1 , o bien elegir cualquiera de las otras posibilidades.
Para describir formalmente la configuración de un Autómata de Pila en un ins-

tante dado, utilizamos la Descripción Instantánea(DI). La DI estará definida por
una tupla (q, w, γ) donde q es el estado actual del Autómata, w es la cadena de
sı́mbolos de entrada que aún queda por procesar, y γ es la cadena de los sı́mbolos
almacenados en la pila (el carácter más a la izquierda de γ será la cima de la pila).
Utilizaremos la notación (q, aw, zγ) −→ (p, w, βγ) cuando (p, β) ∈ f (q, a, z). La
∗
notación (q, w, γ) −→ (p, w �, β) indica que se ha pasado de la primera situación a la
segunda en un número indeterminado de transiciones.
Lenguaje aceptado por un Autómata de Pila El lenguaje aceptado por un

Autómata de Pila se puede definir de dos formas diferentes y equivalentes:
1. De forma análoga a los Autómatas Finitos, es decir, el lenguaje aceptado es

el conjunto de entradas que hacen que el Autómata llegue a un estado final.
L(M) = {w ∈ Σ∗ /(q0 , w, z0 ) −→
∗
(p, λ, γ), p ∈ F }
2. El lenguaje está formado por el conjunto de entradas que vacı́an la pila. En

este caso decimos que es un Autómata de Pila Vacı́a. Para esta definición el
conjunto F es irrelevante y podemos considerar que F = Ø.
N(M) = {w ∈ Σ∗ /(q0 , w, z0) −→
∗
(p, λ, λ)}.
Manuales Uex
Dado un lenguaje independiente del contexto siempre es posible encontrar un

Autómata de Pila con estados finales y un Autómata de Pila Vacı́a que reconozcan
a dicho lenguaje.
75
Ejemplo 5.1 Construiremos un Autómata de Pila con estados finales para el lengua-
je L = {0n 1n /n ≥ 0}, generado por la GIC S ::= 0S1|λ
La estrategia será la siguiente: mientras se procesan los primeros caracteres de
la cadena (que deberán ser 0’s), éstos se almacenan en la pila. Cuando se llega a
la segunda mitad de la cadena y comienzan a llegar 1’s, se pasa a otro estado cuya
misión será eliminar un 0 de la pila por cada 1 que se procese. Cuando se termine de
procesar la cadena, la pila deberá estar vacı́a (en realidad, sólo almacenará el sı́mbolo
inicial de la pila z0 ).
El AP se define: Q = {q0 , q1 , q2 } Σ = {0, 1} Γ = {z0 , 0} F = {q0 }
Y la función de transición se define de la siguiente forma:
f (q0 , 0, z0) = (q1 , 0z0 )

f (q1 , 0, 0) = (q1 , 00) en el estado q1 se añaden caracteres a la pila
f (q1 , 1, 0) = (q2 , λ)
f (q2 , 1, 0) = (q2 , λ) en el estado q2 se eliminan caracteres de la pila
f (q2 , λ, z0 ) = (q0 , λ)
En este caso el estado inicial también es estado final debido a que λ ∈ L. Cualquier
situación que no haya sido definida indicará un error. Por ejemplo, si la cadena
comienza con 1 el autómata detectará el error, nótese que la función de transición no
está definida para la situación (q0 , 1, z0 ).
Ejemplo 5.2 Construiremos un Autómata de Pila Vacı́a para el lenguaje

L = {w2w −1/w ∈ (0 + 1)∗ } generado por la gramática
S ::= 0S0
| 1S1
| 2
La estrategia será la siguiente: cuando se está procesando la primera mitad de la

cadena (antes de recibir el 2), los caracteres se almacenan en la pila. Cuando comienza
a llegar la segunda mitad de la cadena, cada carácter debe coincidir con el que está en
la cima de la pila, si es ası́ se borra la cima y se continua el proceso. Cuando se termine
Manuales Uex
de procesar la cadena, la pila debe estar vacı́a.

El AP se define Q = {q0 , q1 } Σ = {0, 1, 2} Γ = {z0 , 0, 1}
La función de transición será:
76
5.3. ÁRBOLES DE DERIVACIÓN 77
f (q0 , 0, z0) = (q0 , 0z0 )

f (q0 , 1, z0) = (q0 , 1z0 ) esta función se puede simplificar
f (q0 , 0, 0) = (q0 , 00) utilizando como comodı́n * que
f (q0 , 1, 0) = (q0 , 10) representa a {z0 , 0, 1}
f (q0 , 0, 1) = (q0 , 01)
f (q0 , 1, 1) = (q0 , 11)
f (q0 , 2, z0) = (q1 , z0 ) f (q0 , 0, ∗) = (q0 , 0∗)
f (q0 , 2, 0) = (q1 , 0) f (q0 , 1, ∗) = (q0 , 1∗)
f (q0 , 2, 1) = (q1 , 1) f (q0 , 2, ∗) = (q1 , ∗)
f (q1 , 0, 0) = (q1 , λ) f (q1 , 0, 0) = (q1 , λ)
f (q1 , 1, 1) = (q1 , λ) f (q1 , 1, 1) = (q1 , λ)
f (q1 , λ, z0 ) = (q1 , λ) f (q1 , λ, z0 ) = (q1 , λ)
Ejemplo 5.3 Construiremos un Autómata de Pila Vacı́a para el lenguaje

L = {ww −1/w ∈ (0 + 1)∗ } generado por la GIC S ::= 0S0|1S1|λ.
En este caso no podremos construir un AP determinista ya que no es posible cono-
cer cuál es el punto medio de la cadena, momento en el que serı́a necesario cambiar
de estado. Cada vez que lleguen dos sı́mbolos iguales seguidos cabe la posibilidad
de que estemos en el centro de la cadena por lo que hay que considerar el hecho de
que el autómata pueda cambiar de estado. La estrategia será similar a la del ejemplo
anterior.
El AP se define Q = {q0 , q1 } Σ = {0, 1} Γ = {z0 , 0, 1}
La función de transición será:
f (q0 , 0, z0) = (q0 , 0z0 )
f (q0 , 1, z0) = (q0 , 1z0 )
f (q0 , 0, 0) = {(q0 , 00), (q1 , λ)} hay dos posibilidades, considerando o no
f (q0 , 0, 1) = (q0 , 01) el haber llegado al centro de la cadena
f (q0 , 1, 0) = (q0 , 10)
f (q0 , 1, 1) = {(q0 , 11), (q1 , λ)} idem
f (q1 , 0, 0) = (q1 , λ)
f (q1 , 1, 1) = (q1 , λ)
f (q1 , λ, z0 ) = (q1 , λ) la pila queda vacı́a
5.3. Árboles de derivación

El árbol de derivación, al representar las producciones utilizadas para generar
una palabra, está indicando además su estructura, lo que resulta determinante para
Manuales Uex
entender su significado. Por esa razón, en los mecanismos para reconocer lenguajes
independientes del contexto no es suficiente con indicar si una cadena determinada
pertenece o no al lenguaje, también es muy importante que el reconocedor construya
el árbol de derivación de dicha cadena.
77
Cada nodo interno del árbol será un sı́mbolo no terminal de la gramática mientras
que las hojas serán los sı́mbolos terminales. Una producción como A ::= X1 . . . Xn se
representará como un subárbol cuyo nodo padre es A siendo sus hijos los sı́mbolos
X1 , . . . , Xn .
Si en un paso de la construcción del árbol, se aplica una producción al sı́mbolo no
terminal que está situado más a la izquierda del árbol, se dice que es una derivación
por la izquierda. La misma definición se aplica a derivación por la derecha.
5.3.1. Ambigüedad.
Una gramática es ambigua cuando es posible construir dos o más árboles de
derivación diferentes para una misma palabra. El problema de la ambigüedad es muy
complejo ya que no existe ningún algoritmo que permita reconocer si una gramática
es o no ambigua y, en el caso de que lo sea, tampoco existe ningún algoritmo que
permita eliminar dicha ambigüedad (ni siquiera es posible eliminarla en todos los
casos). Los lenguajes independientes del contexto para los cuales todas las GIC que
los generan son ambiguas, se dice que tienen una ambigüedad inherente.
Ejemplo 5.4 (Gramática ambigua) Un ejemplo clásico de gramática ambigua se

presenta en la definición de las expresiones aritméticas que aparecen comúnmente
en los lenguajes de programación. El siguiente ejemplo simplificado permite definir
expresiones en las que intervienen las cuatro operaciones aritméticas básicas con
operandos que pueden ser identificadores (id) o constantes (cte). Llamaremos a esta
gramática G Exp 0.
ΣT = {id, cte, (, ), +, −, ∗, /}
ΣN = {< expre >, < op >}
S =< expre >
 

 < expre >::=< expre >< op >< expre > 


 


 |(< expre >) 


 


 |id 

 
|cte
P =
 < op >::= +
 


 


 |− 


 


 |∗ 

 
Manuales Uex
|/
Es fácil demostrar que esta gramática es ambigua construyendo dos árboles dife-
rentes para generar la misma expresión, concretamente id + cte * id
78
5.3. ÁRBOLES DE DERIVACIÓN 79
<expre> <expre>
<expre> <op> <expre> <expre> <op> <expre>
<expre> <op> <expre> <expre> <op> <expre>
id + cte * id id + cte * id
Figura 5.1: Ejemplo de ambigüedad
Analizando la figura 5.1 es fácil comprobar que la ambigüedad está provocada

por la ausencia de una jerarquı́a entre los operadores. En el árbol de la izquierda
la operación suma, entre los dos primeros operandos, se lleva a cabo antes que la
multiplicación. Sin embargo, en el árbol de la derecha se comenzarı́a multiplicando
los dos últimos operandos y al resultado de esta operación se le sumarı́a el valor
del primer operando. Es evidente que a pesar de que la expresión es correcta, la
utilización de cada árbol generarı́a en cada caso resultados diferentes.
Para resolver este caso de ambigüedad hay que imponer una jerarquı́a entre los
operadores. Como suele ser habitual consideraremos que la multiplicación y la división
tienen una prioridad más alta que la suma y la resta. Si aparecen varias operaciones
con la misma prioridad se ejecutarán de izquierda a derecha, aunque en este caso el
resultado de la expresión siempre serı́a el mismo. Para definir la jerarquı́a se van a
introducir en la gramática nuevos sı́mbolos no terminales:
< termino > y < op − adt > estarán asociados a los operadores aditivos suma y
resta.
< f actor > y < op − mult > estarán asociados a los operadores multiplicación y
división.
Ası́ llegamos a la siguiente gramática, equivalente a G Exp 0:

Manuales Uex
ΣN = {< expre >, < termino >, < f actor >, < op − adt >, < op − mult >}
S =< expre >
79
 

 < expre >::=< expre >< op − adt >< termino > 


 


 | < termino > 


 


 < termino >::=< termino >< op − mult >< f actor > 


 


 | < f actor > 


 

 < f actor >::= (< expre >) 
P = |id

 


 |cte 


 


 < op − adt >::= + 


 


 |− 


 


 < op − mult >::= ∗ 

 
|/
Con esta nueva gramática, a la que llamaremos G Exp 1, la expresión anterior
tendrı́a un único árbol de derivación que se representa en la figura 5.2.
<expre>
<expre> <op_adt> <termino>
<termino>
<termino> <op_mult> <factor>
<factor> <factor>
id + cte * id
Figura 5.2: Nuevo árbol de derivación
Este árbol representa la estructura de la expresión id + cte * id, obligando a

que la multiplicación se realice antes que la suma.
5.4. Reconocimiento descendente

En general, un reconocedor es un algoritmo que recibe como entrada una palabra
Manuales Uex
w ∈ Σ+ T , examina sus sı́mbolos de izquierda a derecha e intenta construir un árbol

de derivación para dicha palabra. Con el proceso de construcción del árbol se obtiene
además la estructura de la palabra, las producciones gramaticales que han de aplicarse
y el orden en el que deben utilizarse.
80
5.4. RECONOCIMIENTO DESCENDENTE 81
Un reconocedor descendente o analizador sintáctico descendente es un método de

reconocimiento de palabras de un LIC que se caracteriza porque construye el árbol
de derivación de cada palabra de manera descendente, es decir, desde la raı́z hasta
las hojas.
A continuación se describirá un reconocedor descendente llamado LL(1) (Left-
Left(1)). De su nombre, la primera L indica que la cadena se analiza de izquierda
a derecha, la segunda L indica que en cada paso se construye la derivación por la
izquierda, y el 1 indica que sólo es necesario un carácter para que el reconocedor
decida qué producción debe utilizar en la construcción del árbol.
Como paso previo a la descripción de los reconocedores LL(1) estudiaremos al-
gunos aspectos de las GIC que es importante detectar y evitar para el correcto fun-
cionamiento del método.
5.4.1. Simplificación de las GIC

Hay diferentes formas de restringir el formato de las producciones sin mermar
por ello el poder generativo de una GIC. En determinadas situaciones nos intere-
sará trasformar una gramática en otra equivalente de forma que las producciones
cumplan ciertos requisitos que faciliten la construcción de un reconocedor para dicha
gramática. Podemos encontrar en las GIC tres defectos que es conveniente eliminar:
los prefijos comunes, la recursividad por la izquierda y la ambigüedad.
1. Eliminación de los prefijos comunes. Una gramática tiene prefijos comunes
cuando hay dos o más producciones que, teniendo la misma parte izquierda,
tienen algunos sı́mbolos coincidentes en el comienzo de la parte derecha de
la producción. La forma de eliminar los prefijos comunes es muy sencilla, se
pretende sacar factor común de los sı́mbolos que constituyen el prefijo común.
A esta operación se la llama factorizar por la izquierda.
En general, si nos encontramos con la siguiente situación:
A ::= δα1 |δα2 | . . . |δαn |β1 | . . . |βm considerando que n ≥ 2 y que |δ| > 0
Estas producciones se pueden sustituir por las siguientes, en las que ha sido
necesario añadir un nuevo sı́mbolo no terminal A� .
A ::= δA� |β1 | . . . |βm A� ::= α1 |α2 | . . . |αn
2. Eliminación de la recursividad por la izquierda. En una gramática es
muy frecuente encontrar producciones recursivas. Éstas tienen la forma X ::=
αXβ. Serán recursivas por la izquierda cuando su forma sea X ::= Xβ, y
recursivas por la derecha si son de la forma X ::= αX
Manuales Uex
La recursividad por la izquierda resulta perjudicial a la hora de construir re-

conocedores LL(1), por lo que la eliminaremos sustituyéndola por recursividad
por la derecha.
81
Considerando la siguiente situación: A ::= Aα1 |Aα2 | . . . |Aαn |β1 | . . . |βm
Estas producciones se pueden sustituir por las siguientes, en las que ha sido
necesario añadir un nuevo sı́mbolo no terminal A� :
A ::= β1 A� | . . . |βm A� A� ::= α1 A� |α2 A� | . . . |αn A� |λ
Ejemplo 5.5 Utilizaremos la gramática de las expresiones aritméticas presen-

tada en la página 78. Para representar de forma más compacta dicha gramática
utilizaremos letras mayúsculas para indicar cuales son los sı́mbolos no termi-
nales de acuerdo al siguiente criterio:
< expre >= E < f actor >= F < termino >= T
< op − adt >= A < op − mult >= M
De esta forma, representamos a continuación la gramática no ambigua original

a la izquierda y la nueva versión, a la que llamaremos G Exp 2, a la derecha.
En esta última versión de la gramática se ha eliminado la recursividad por la
izquierda. Como la recursividad por la izquierda aparece en las producciones
que tienen a E y a T en la parte izquierda, será necesario añadir dos nuevos
sı́mbolos no terminales a los que llamaremos E’ y T’.
G Exp 1 G Exp 2
1. E::=E A T 1. E::=T E’
2. |T 2. E’::=A T E’
3. T::=T M F 3. |λ
4. |F 4. T::=F T’
5. F::=(E) 5. T’ ::= M F T’
6. |id 6. |λ
7. |cte 7. F::=(E)
8. A::=+ 8. |id
9. |- 9. |cte
10. M::=* 10. A::=+
11. |/ 11. |-
12. M::=*
13. |/
Manuales Uex
3. Ambigüedad. No existe ningún algoritmo que nos permite eliminar la am-

bigüedad de forma sistemática. Sin embargo, y como vimos en el ejemplo de la
página 78, en ocasiones es posible resolver este problema analizando cuales son
sus causas.
82
5.4.2. Reconocedores LL(1)

En la construcción de los reconocedores LL(1) es muy importante el papel que
juegan los sı́mbolos directores de las producciones que, como su nombre indica, di-
rigirán el análisis de la cadena, es decir, indicarán cuál es la producción que ha de
utilizarse en cada paso de la construcción del árbol. Para llegar a la definición de
sı́mbolos directores de una producción será necesario conocer otras definiciones pre-
vias, todas ellas relativas a una GIC. Los ejemplos que aparecen en esta sección están
basados en la gramática G Exp 2.
Definición 5.1 (Cadena o palabra anulable)
Una cadena w ∈ Σ∗N es anulable si, a partir de ella, y utilizando algunas producciones
gramaticales se puede generar la palabra nula (λ).
Es evidente que no puede haber sı́mbolos terminales en una cadena anulable.
Ejemplos de cadenas anulables en G Exp 2: E � E � T � T � E �
Definición 5.2 (Producción anulable)
Una producción X ::= α es anulable si α es una cadena anulable.
Una producción anulable en modo alguno puede considerarse eliminable. Esto se debe
a que aunque a partir de una producción anulable es posible llegar a λ, también es
posible generar otras cadenas utilizando derivaciones diferentes. Las producciones no
generativas son, obviamente, anulables.
Ejemplos de producciones anulables en G Exp 2: Las producciones no 3
y 6.
Definición 5.3 (Sı́mbolos Iniciales)
Los sı́mbolos iniciales de una cadena w ∈ (ΣN ∪ ΣT )∗ son los sı́mbolos terminales por
los que pueden comenzar todas las palabras que podamos obtener a partir de ella.
∗
INIC(w) = {a ∈ ΣT / w −→ aβ, β ∈ Σ∗ }
Método para calcular los Sı́mbolos Iniciales Hay que tener en cuenta las
siguientes consideraciones:
1. Si w comienza por un sı́mbolo terminal es trivial: w = aβ, a ∈ ΣT =⇒
INIC(w) = {a}
2. Si w comienza por un sı́mbolo no terminal, hay que considerar la posibilidad
de que el sı́mbolo por el que comienza sea anulable y aplicar esta consideración
reiteradamente. w = Xβ, X ∈ ΣN =⇒
Manuales Uex
�
INIC(X) ∪ INIC(β) si X es anulable
INIC(w) =
INIC(X) si X no es anulable
83
3. Si X ::= α1 |α2 | . . . |αn entonces INIC(X) = INIC(α1 ) ∪ . . . ∪ INIC(αn )

Ejemplos de sı́mbolos iniciales: INIC(AT E � ) = {+, −}
INIC((E)) = {(} INIC(F T �) = {(, id, cte} INIC(MF T � ) = {∗, /}
Definición 5.4 (Forma sentencial)

Es una cadena w ∈ (ΣN ∪ ΣT )∗ que puede generarse a partir del sı́mbolo inicial de
una GIC utilizando un número indeterminado de producciones.
Definición 5.5 (Sı́mbolos Seguidores)
Los sı́mbolos seguidores de un sı́mbolo no terminal X, son los sı́mbolos terminales
que pueden aparecer inmediatamente a la derecha de X en una forma sentencial
∗
cualquiera. SEG(X) = {a ∈ ΣT / S −→ αXaβ α, β ∈ Σ∗ }
Ejemplos de sı́mbolos seguidores:
E → T E � → F T � E � → (E)T � E � =⇒) ∈ SEG(E)
E → T E � → F T � → idMF T � → idMcteT � =⇒ cte ∈ SEG(M)
Método para calcular los Sı́mbolos Seguidores de X. Este método se basa

en el examen de las producciones de la gramática. El método se divide en dos fases y
es necesario calcular simultáneamente los sı́mbolos seguidores de todos los sı́mbolos
no terminales.
Fase 1. En la primera fase examinaremos aquellas producciones en las que X aparece
en la parte derecha seguido por algún sı́mbolo gramatical.
Situación A. Si hay una producción de la forma: Y ::= αXaβ donde
a ∈ ΣT α, β ∈ Σ∗ =⇒ a ∈ SEG(X)
Situación B. Si hay una producción de la forma: Y ::= αXZβ donde
Z ∈ ΣN α, β ∈ Σ∗ =⇒ INIC(Z) ⊂ SEG(X)
Situación C. Si hay una producción de la forma: Y ::= αXδβ donde
δ ∈ Σ+N es anulable α, β ∈ Σ∗ =⇒ INIC(β) ⊂ SEG(X)
Una vez que han sido consideradas estas tres situaciones se obtiene una lista
provisional de sı́mbolos seguidores que es necesario ampliar con la segunda fase.
Fase 2. En esta segunda fase buscaremos producciones en las que X se encuentre al

final de la parte derecha.
Situación D. Si hay una producción de la forma: Y ::= αX donde

Manuales Uex
α ∈ Σ∗ =⇒ SEG(Y ) ⊂ SEG(X)
Situación E. Si hay una producción de la forma: Y ::= αXδ donde
δ ∈ Σ+ ∗
N es anulable y α ∈ Σ =⇒ SEG(Y ) ⊂ SEG(X)
84
Tras considerar las situaciones D y E con todas las producciones, se obtiene una
colección de relaciones de inclusión entre los conjuntos de sı́mbolos seguidores
previamente calculados. Si se consideran ordenadamente todas estas inclusiones,
tomando como punto de partida la lista provisional calculada en la fase 1, se
consigue la lista definitiva.
Si consideramos que el sı́mbolo $ aparece al final de cualquier cadena, hay que
tener en cuenta siempre que $ ∈ SEG(S)
Ejemplo 5.6 Los seguidores de los sı́mbolos no terminales para la gramática G Exp 2
son los siguientes:
Fase 1 Fase 2
E )$
E’ )$
T +- )$
T’ +-)$
F */ +-)$
A ( id cte
M ( id cte
Para llevar a cabo la segunda fase del método se han considerado las siguientes
relaciones de inclusión:
SEG(E) ⊂ SEG(E � ) ⊂ SEG(T ) ⊂ SEG(T � ) ⊂ SEG(F )
Definición 5.6 (Sı́mbolos directores de una producción)

El cálculo de los sı́mbolos directores de una producción (X ::= α) es inmediato.
Sabiendo calcular los Sı́mbolos Iniciales, los Seguidores y sabiendo identificar las
Cadenas anulables, basta con aplicar la siguiente fórmula:
�
INIC(α) si α no es anulable
DIR(X ::= α) =
INIC(α) ∪ SEG(X) si α es anulable
Cuando se está construyendo el árbol de derivación correspondiente a una palabra,

se analizan de izquierda a derecha los caracteres de dicha palabra y se decide cuál
es la producción que se va a utilizar. Para tomar esa decisión hay que considerar
que, en cada momento, se debe llevar a cabo la derivación por la izquierda siempre y
cuando el carácter que se está procesando en ese momento forme parte de los Sı́mbolos
Directores de la producción a utilizar.
Manuales Uex
Gramáticas LL(1)
Una gramática será LL(1) si es posible construir para ella un reconocedor LL(1)
determinista. Para que esto ocurra es necesario que la consulta del siguiente sı́mbolo
85
de la palabra que se está analizando permita determinar sin incertidumbre la pro-

ducción que se debe utilizar para proseguir con el análisis. Por lo tanto, para que
una gramática sea LL(1) es necesario que todas las producciones que tienen el mismo
sı́mbolo en la parte izquierda no tengan ningún Sı́mbolo Director en común. Es decir,
considerando que:
X ::= α1 |α2 | . . . |αn y que
D1 = DIR(X ::= α1 )
D2 = DIR(X ::= α2 )
...
Dn = DIR(X ::= αn )
La gramática será LL(1) si Di ∩ Dj = Ø, i �= j i, j ∈ {1, . . . , n}
Para que una GIC sea LL(1) es imprescindible que no sea ambigua, que no tenga
prefijos comunes, ni recursividad por la izquierda.
Ejemplo 5.7 Los sı́mbolos directores para las producciones de la gramática G Exp 2
son los siguientes:
DIR1 = DIR(E ::= T E � ) = {(, cte, id}
DIR2 = DIR(E � ::= AT E � ) = {+, −}
DIR3 = DIR(E � ::= λ) = SEG(E � ) = {), $}
DIR4 = DIR(T ::= F T �) = {(, cte, id}
DIR5 = DIR(T � ::= MF T � ) = {∗, /}
DIR6 = DIR(T � ::= λ) = SEG(T � ) = {+, −, ), $}
DIR7 = DIR(F ::= (E)) = {(}
DIR8 = DIR(F ::= id) = {id}
DIR9 = DIR(F ::= cte) = {cte}
DIR10 = DIR(A ::= +) = {+}
DIR11 = DIR(A ::= −) = {−}
DIR12 = DIR(M ::= ∗) = {∗}
DIR13 = DIR(M ::= /) = {/}
Es fácil comprobar que es una gramática LL(1) ya que:
DIR2 ∩ DIR3 = ∅ DIR5 ∩ DIR6 = ∅ DIR7 ∩ DIR8 ∩ DIR9 = ∅
DIR10 ∩ DIR11 = ∅ DIR12 ∩ DIR13 = ∅
Ejemplo 5.8 Gramática que no es LL(1). La gramática que se describe a contin-

uación permitirá representar la clásica estructura alternativa de cualquier lenguaje
de programación. Es una gramática ambigua y por ese motivo no es LL(1) como
comprobaremos a continuación.
Manuales Uex
ΣN = {S, E, R}
ΣT = {i, t, a, e, b}
Los sı́mbolos gramaticales tienen el siguiente significado:
S = Sentencia E = Expresión R = Resto de la sentencia
86
5.5. RECONOCIMIENTO ASCENDENTE 87
i = if t = then a = accion e = else b = boolean

 

 S ::= iEtSR 


 

 |a 
P = R ::= eS

 


 |λ 

 
E ::= b
Sı́mbolos seguidores:
Fase 1 Fase 2
S e$
R e$
E t
Sı́mbolos directores de las producciones:

DIR1 = DIR(S ::= iEtSR) = {i}
DIR2 = DIR(S ::= a) = {a}
DIR3 = DIR(R ::= eS) = {e}
DIR4 = DIR(R ::= λ) = SEG(R) = {e, $}
DIR5 = DIR(E ::= b) = {b}
Como DIR3 ∩ DIR4 = {e} podemos afirmar que la gramática no es LL(1)
5.5. Reconocimiento ascendente

El reconocimiento ascendente o análisis sintáctico ascendente se caracteriza por
construir el árbol de derivación de manera ascendente, es decir, desde las hojas hasta
la raı́z.
A continuación se describirá un reconocedor ascendente llamado LR(1) (Left-
Right(1)). En este nombre, L indica que la cadena se analiza de izquierda a derecha,
R indica que en cada paso se construye la derivación por la derecha en orden inverso, y
el 1 indica que sólo es necesario un carácter para que el reconocedor decida qué acción
se debe realizar.
Una gramática es LR(1) si es posible construir para ella un reconocedor LR(1)
determinista.
Algunas de las ventajas de los reconocedores LR(1):
Son más potentes que los reconocedores LL(1). Es decir, el conjunto de los
Manuales Uex
lenguajes LL(1) está contenido en el conjunto de los LR(1).
Un analizador LR(1) detecta un error en una cadena tan pronto como sea
posible.
87
Prácticamente todas las gramáticas que definen los lenguajes de programación

son LR(1).
La desventaja de los reconocedores LR(1) es que su construcción a mano es más

compleja. Sin embargo, existen herramientas (YACC) que permiten la construcción
automática de este tipo de reconocedores.
El funcionamiento de un reconocedor LR(1) depende de su Tabla de Acciones. En
esta tabla encontraremos dos tipos de procesos:
1. Desplazamientos. Indican la transición de un estado a otro. Se representan

como Di , donde i identifica el estado al que se va a pasar.
2. Reducciones. Esta acción se lleva a cabo cuando en el árbol aparece la parte

derecha de una producción y se añade la parte izquierda, subiendo un nivel en
la construcción del árbol. Se representa como Ri , donde i permite identificar la
producción utilizada en el proceso de reducción.
Los analizadores LR(1) también utilizan una pila en la que se van almacenando
los caracteres que se van procesando ası́ como los estados por los que el reconocedor
ha pasado.
Veamos con un sencillo ejemplo como funcionarı́a un reconocedor LR(1), conocien-
do su Tabla de Acciones. Posteriormente estudiaremos cómo construir dicha tabla.
Ejemplo 5.9 Sea la gramática definida con los siguientes sı́mbolos:

ΣT = {a, (, )} ΣN = {S, A} y las producciones:
1. S ::= A 2. A ::= a 3. A ::= (a)
Las acciones se definen en función del estado del autómata y del sı́mbolo de la
cadena de entrada que se procesa en cada momento. Hay que tener en cuenta que
las situaciones no definidas se consideran situaciones de error. La Tabla de Acciones
asociada a este ejemplo se muestra a continuación. En la tabla aparece el sı́mbolo $,
que indica el final de la cadena de entrada.
$ a ( ) A
q0 D2 D3 D1
q1 R1
q2 R2
q3 D4
q4 D5
Manuales Uex
q5 R3
Utilizando esta tabla veamos como se procesarı́a la cadena (a):
88
Entrada Pila Acción

(a)$ q0 Desplazar a q3
a)$ q0 (q3 Desplazar a q4
)$ q0 (q3 aq4 Desplazar a q5
$ q0 (q3 aq4 )q5 Reducir por la 3a producción A ::= (a)
$ q0 A Desplazar a q1
$ q0 Aq1 Reducir por S ::= A (el proceso termina)
Veamos cómo se procesarı́a una cadena incorrecta como a)

a)$ q0 Desplazar a q2
)$ q0 aq2 Error
Se produce un error ya que en el estado q2 no hay ninguna acción asociada al
sı́mbolo ).
5.5.1. Construcción de la Tabla de Acciones

La Tabla de Acciones se construye al mismo tiempo que se definen los estados.
Para llevar este trabajo a cabo es necesario introducir el concepto de LR-item que
indicará el progreso del análisis de la cadena.
Denominamos LR-item a una producción a la que se le coloca una marca (un
punto) en algún lugar de la parte derecha. Esta marca indica qué parte de la cadena
ha sido ya procesada y cuál es la que queda por analizar. Además, en los LR-items
hay un conjunto de sı́mbolos terminales (separados por una coma de la producción)
a los que se llama sı́mbolos directores del LR-item.
Ejemplo de un LR-item: [A ::= x.By, w1 , w2 ] (suponemos que A ::= xBy es una
producción de la gramática y w1 , w2 ∈ ΣT )
Los estados del analizador LR(1) serán conjuntos de LR-items y cada LR-item,
según la posición en la que se encuentre el punto, indicará la acción que se debe llevar
a cabo.
Si detrás de la marca hay algún sı́mbolo, la acción que se realizará será un

desplazamiento al estado que contenga un LR-item similar pero con la marca
desplazada en una posición a la derecha.
Es decir, si [A ::= x.By, w] ∈ p y [A ::= xB.y, w] ∈ q entonces
Acción(p,B)= Desplazamiento a q
Manuales Uex
Si la marca está situada al final de la producción, la acción a realizar será una

reducción por la producción que representa el LR-item, siempre y cuando el
carácter analizado sea uno de sus sı́mbolos directores.
89
Por ejemplo, si [A ::= xBy., w] ∈ p entonces

Acción(p,w)= Reducir por la producción A ::= xBy
En cada instante, el analizador va a tener una configuración (descripción ins-

tantánea) determinada que viene dada por el contenido de la pila y por el fragmento
de la cadena de entrada que aún no ha sido procesado. En la pila se almacenan los
estados por los que ha ido pasando el analizador ası́ como los sı́mbolos (terminales y
no terminales) que están ubicados en las zonas superiores del árbol de derivación.
Por ejemplo: (q0 X1 q1 . . . Xm qm , aj aj+1 . . . an $) qi ∈ Q Xi ∈ Σ ai ∈ ΣT
Veamos como varı́a la configuración del analizador en función de la acción que se
realice:
Desplazamiento Si Accion(qm , aj ) = Dr
La nueva configuración será: (q0 X1 q1 . . . Xm qm aj qr , aj+1 . . . an $)
Se añade a la pila el carácter procesado y el estado actual.
Reducción Si Accion(qm , aj ) = Ri y la producción i es A ::= β donde |β| = r

supondremos que los últimos r sı́mbolos almacenados en la pila coinciden con
β. Es decir, β = Xm−r+1 . . . Xm .
En este caso, se sustituyen los últimos r sı́mbolos de la pila (y los estados que
les acompañan) por A.
La nueva configuración será: (q0 X1 q1 . . . Xm−r qm−r Aqp , aj aj+1 . . . an ) donde
Accion(qm−r , A) = Dp
En este caso no ha sufrido ninguna modificación el fragmento de cadena que
aún queda por procesar. Aunque aj ha sido tenido en cuenta para decidir la
operación a realizar, no podemos considerar que haya sido procesado, es decir,
no forma parte de la pila ni tampoco del árbol de derivación.
Método para la construcción de los LR-items Los estados se van creando

en dos fases: en primer lugar se construye lo que podemos denominar el núcleo del
estado, posteriormente, y siempre que sea necesario, se añaden otros LR-items hasta
cerrar el estado.
Determinación del núcleo de q0 . Para cada una de las producciones que tienen
al sı́mbolo inicial en la parte izquierda (S::=x), añadir al estado q0 el LR-item
[S::= .x, $]
Manuales Uex
Cierre de un estado. Si [A::=x.By,w] ∈ q y B ∈ ΣN hay que añadir al estado q

LR-items construidos a partir de todas las producciones de la gramática que
tienen a B en la parte izquierda.
90
Para la producción B::=z, hay que añadir el LR-item [B::= .z, u] donde
u = INIC(yw).
Creación del núcleo de un nuevo estado. Si existe un LR-item de la forma [A::=x.Yz,w],

se crea un nuevo estado con el LR-item [A::=xY.z,w]
Ejemplo 5.10 Veamos cómo se crea la Tabla de Sı́mbolos para el ejemplo anterior:
1. Crear el núcleo del estado q0

[S::=.A, $] ∈ q0
2. Cerrar q0
q0 = {[S::=.A, $], [A::=.(a), $], [A::=.a, $]}
Analizando estos tres LR-items y los que se construyen después, es evidente
que:
Accion(q0 , A) = D1 Accion(q0 , () = D3 Accion(q0 , a) = D2
3. Crear nuevos estados (en este caso están ya cerrados)

q1 = {[S::=A., $]} Accion(q1 , $) = R1
q2 = {[A::=a., $]} Accion(q2 , $) = R2
q3 = {[A::=(.a), $]} Accion(q3 , a) = D4
q4 = {[A::=(a.), $]} Accion(q4 , )) = D5
q5 = {[A::=(a)., $]} Accion(q5 , $) = R3
Ejemplo 5.11 Cálculo del reconocedor LR(1) para la siguiente gramática:

ΣT = {a, b} ΣN = {S, A, B} y las producciones:
1. S ::= A 2. A ::= BA 4. B ::= aB
3. |λ 5. |b
Esta gramática genera el lenguaje (a∗ b)∗
Definición de los estados:
q0 = {[S::=.A, $],[A::=.BA, $],[A::=., $],[B::=.aB, a, b, $],[B::=.b, a, b,$]}
q1 = {[S::=A., $]}
q2 = {[A::=B.A,$], [A::=.BA,$], [A::=.,$], [B::=.aB,a,b,$], [B::=.b,a,b,$]}
q3 = {[B::=a.B, a, b, $], [B::=.aB, a, b, $], [B::=.b, a, b,$]}
q4 = {[B::=b., a, b,$]}
Manuales Uex
q5 = {[A::=BA., $]}
q6 = {[B::=aB., a, b, $]}
Analizando los LR-items de los estados se construye la siguiente tabla de acciones:
91
$ a b A B
q0 R3 D3 D4 D1 D2
q1 R1
q2 R3 D3 D4 D5 D2
q3 D3 D4 D6
q4 R5 R5 R5
q5 R2
q6 R4 R4 R4
Utilizando esta tabla, veamos como se procesarı́a la cadena ab:

ab$ q0 Desplazar a q3
b$ q0 aq3 Desplazar a q4
$ q0 aq3 bq4 Reducir por la 5a producción B ::= b (desp. q6 )
$ q0 aq3 Bq6 Reducir por la 4a producción B ::= aB (desp. q2 )
$ q0 Bq2 Reducir por la 3a producción A ::= λ (desp. q5 )
$ q0 Bq2 Aq5 Reducir por la 2a producción A ::= BA (desp. q1 )
$ q0 Aq1 Reducir por la 1a producción S ::= A (finaliza el proceso)
Veamos cómo se procesarı́a una cadena incorrecta como a
a$ q0 Desplazar a q3
$ q0 aq3 Error
Gramáticas LR(1)
Una gramática es LR(1) siempre que sea posible construir un reconocedor LR(1)
que sea determinista. Para que esto pueda ocurrir deben cumplirse las siguientes
condiciones:
1. La gramática debe ser aumentada, es decir, el sı́mbolo inicial no debe aparecer
nunca en la parte derecha de ninguna producción. Si no es ası́, basta con añadir
una producción como S’ ::= S, en la que S’ se convierte en el nuevo sı́mbolo
inicial de la gramática.
2. No deben aparecer conflictos a la hora de construir la tabla de acciones. Hay

tres tipos de conflicto:
a) Conflicto desplazamiento/desplazamiento. Aparece cuando en un es-

Manuales Uex
tado q hay dos items del siguiente tipo: [A ::= α.aβ, u1] y [B ::= γ.aδ, u2 ].
La acción asociada al estado q ante la llegada del sı́mbolo a podrı́a ser un
desplazamiento al estado que contiene al LR-item [A ::= αa.β, u1] o un
desplazamiento al que contiene a [B ::= γa.δ, u2 ].
92
5.6. PROPIEDADES DE LOS L.I.C. 93
b) Conflicto reducción/reducción. Aparece cuando en un estado q hay

dos items del siguiente tipo: [A ::= α., u] y [B ::= β., u]. La acción aso-
ciada al estado q ante la llegada del sı́mbolo u podrı́a ser una reducción
utilizando la producción A ::= α o una reducción utilizando la producción
B ::= β.
c) Conflicto desplazamiento/reducción. Aparece cuando en un estado
q hay dos items del siguiente tipo: [A ::= α.aβ, u1 ] y [B ::= β., a]. La
acción asociada al estado q ante la llegada del sı́mbolo a podrı́a ser un
desplazamiento al estado que contiene al LR-item [A ::= αa.β, u1] o una
reducción utilizando la producción B ::= β.
Ejemplo 5.12 Gramática que no es LR(1).

ΣT = {a, b, c} ΣN = {S, A, B} y las producciones:
1. S ::= cAB 3. A ::= Aa 5. B ::= Bb
2. |c 4. |a 6. |b
Esta gramática genera el lenguaje c + ca+ b+
Comenzamos la definición de los estados:
q0 = {[S::=.cAB, $], [S::=.c, $]}
q1 = {[S::=c.AB,$],[A::=.Aa, b],[A::=.a, b]}
q2 = {[S::=c., $]}
No es necesario continuar ya que con esta información el conflicto es evidente:
¿qué acción hay que realizar si estando en el estado q0 llega el sı́mbolo c? Si aten-
demos al primer LR-item deberı́amos desplazarnos a q1 pero si atendemos al segundo
el desplazamiento deberı́a hacerse a q2 , por lo tanto es imposible construir un recono-
cedor LR(1) determinista.
5.6. Propiedades de los L.I.C.

Teorema 5.1
El conjunto de los LIC está cerrado para la unión, la concatenación y el cierre de
Kleene.
Teorema 5.2
El conjunto de los LIC no está cerrado para la intersección ni para la comple-
mentación.
Manuales Uex
Ejemplo 5.13 Sean L1 = {an bn cn , n ≥ 0}, L2 = {an bn cm , n, m ≥ 0} y

L3 = {an bm cm , n, m ≥ 0}. L2 y L3 son independientes del contexto, sin embargo,
L1 = L2 ∩ L3 no lo es (se puede comprobar utilizando el lema del bombeo).
93
Como L1 ∩L2 = L1 ∪ L2 , si los LIC fueran cerrados para la complementación también

lo serı́an para la intersección y hemos comprobado en el ejemplo anterior que esto no
es cierto.
Teorema 5.3
Si L es un LIC y R es un Lenguaje regular, entonces L ∩ R es un LIC.
Ejemplo 5.14 Sea L1 = {an bm an bm , n, m ≥ 0}, L2 = {ww, w ∈ (0 + 1)∗ } y

L3 = a+ b+ a+ b+ . Tenemos que L1 = L2 ∩ L3 . Como L1 no es un LIC (se puede
demostrar con el lema del bombeo) y L3 es un lenguaje regular entonces, aplicando
el teorema anterior, se deduce que L2 tampoco es un LIC.
Definición 5.7 (Sustitución)

Sean Σ y Γ dos alfabetos, se define una sustitución como una función
s : Σ −→ P(Γ∗ ) tal que ∀a ∈ Σ s(a) es un LIC.
Esta función se puede extender a cadenas de caracteres y a lenguajes de forma
natural.
Definición 5.8 (Homomorfismo)

Un homomorfismo es un caso particular de sustitución en el que h : Σ −→ Γ∗
Teorema 5.4
El conjunto de los LIC está cerrado para las sustituciones y (como caso particular)
para los homomorfismos.
5.6.1. El lema del bombeo para LIC(pumping lemma)

El lema del bombeo enuncia una propiedad que deben cumplir todos los lenguajes
independientes del contexto. El hecho de comprobar que un lenguaje no cumple dicha
propiedad es suficiente para demostrar que no es independiente del contexto. Sin
embargo, en ningún caso este lema servirá para demostrar que un lenguaje es LIC.
Lema 5.1 (El lema del bombeo para LIC)

Sea L un lenguaje independiente del contexto, entonces existe una constante asociada
al lenguaje n > 0, de manera que ∀z ∈ L tal que |z| ≥ n, se cumple que z se puede
descomponer en cinco partes z = uvwxy que verifican:
1. |vx| ≥ 1
Manuales Uex
2. |vwx| ≤ n
3. ∀i ≥ 0 se cumple que uv iwxi y ∈ L
94
5.7. PROBLEMAS 95
5.7. Problemas
5.1 Construir un Autómata de Pila Vacı́a para los siguientes lenguajes definidos
sobre el alfabeto Σ = {a, b, c, 0, 1}
1. L1 = {a2n bn , n ≥ 0}
−
2. L2 = {awbw 1 c, w ∈ (0 + 1)∗ }
3. L3 = {ab∗ c}
4. L4 = {abn cdn , n ≥ 0}
5.2 Demuestra que cada una de las siguientes gramáticas de tipo 2 es ambigua y
encuentra otra gramática equivalente que no lo sea
1. S ::= A A ::= AA|a|b
2. S ::= A|B A ::= aAb|ab B ::= abB|λ
3. S ::= aB|Ab A ::= aA|λ B ::= bB|λ
5.3 Para cada una de las siguientes gramáticas de tipo 2 hay que comprobar si son
LL(1) y/o LR(1). Si lo son hay que construir el correspondiente reconocedor y si no
lo son hay que explicar el motivo
1. S ::= aA A ::= bA|λ
2. S ::= aA A ::= Ab|b
3. S � ::= S S ::= 0S0|A A ::= 1A|λ
4. S ::= A A ::= AB|λ B ::= aB|b
5. S ::= E E ::= E + T |T T ::= a|(E)
6. S ::= cAb A ::= aA|λ
5.4 Utliza el lema del bombeo para demostrar que los siguientes lenguajes no son
independientes del contexto
1. L1 = {an bn cn , n ≥ 0}
2. L2 = {an bn cm , m ≥ n ≥ 0}
Manuales Uex
3. L3 = {an bm cn dm , n, m ≥ 0}
4. L4 = {an bn cm , n �= m n, m ≥ 0}
95
5. L5 = {an bn cm , 0 ≤ n ≤ m ≤ 2n}
5.5 Demuestra que la gramática que aparece en el ejemplo 5.8 (página 86) es am-
bigua y no es LR(1)
5.6 Demuestra que una gramática LR(1) no puede ser ambigua
5.7 Demuestra que el lenguaje L = {an bm cm dn , n, m ≥ 0} es independiente del

contexto
5.8 Diseña una gramática que genere paréntesis anidados y demuestra que es LR(1)
5.9 Modifica la siguiente gramática de manera que sea LL(1) y demuestra que real-
mente lo es
ΣN = {D, T, L} S=D ΣT = {entero, real, id, ,}
D ::= T L T ::= entero|real L ::= L, id|id
Manuales Uex
96
Tema 6
Gramáticas Atribuidas
Contenido
6.1. Concepto de Semántica y de Gramática Atribuida . . . 97
6.2. Atributos heredados y sintetizados . . . . . . . . . . . . . 99
6.3. Gramáticas S-atribuidas y L-Atribuidas . . . . . . . . . . 100
6.4. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
Hasta ahora hemos visto como las gramáticas regulares (tipo 3) son adecuadas
para representar las caracterı́sticas morfológicas de los elementos básicos de un lengua-
je de programación. Igualmente, las gramáticas independientes del contexto (tipo 2)
lo son para representar las caracterı́sticas sintácticas. Sin embargo, dichas gramáticas
no son lo suficientemente potentes como para representar los aspectos semánticos de
un lenguaje de programación. Veremos, a lo largo de este tema, cómo las gramáticas
atribuidas pueden ser útiles para realizar esta labor.
6.1. Concepto de Semántica y de Gramática Atribui-

da
La semántica, considerada desde el punto de vista de los lenguajes de progra-
mación, se ocupa del significado que tienen las instrucciones de los programas escritos
en un determinado lenguaje.
Para poder realizar un análisis semántico de un programa éste debe ser correcto
tanto desde el punto de vista léxico como desde el sintáctico.
En la semántica de un lenguaje de programación pueden distinguirse dos aspectos:
Manuales Uex
estático y dinámico.
La semántica estática se ocupa de las condiciones que deben cumplir las
construcciones de un programa para que su significado sea correcto.
97
97
98 TEMA 6. GRAMÁTICAS ATRIBUIDAS
Ejemplo 6.1 Una sentencia de asignación en C como A := 5 + B es correcta

desde un punto de vista léxico y sintáctico, pero para que sea semánticamente
correcta la variable B debe ser de un tipo al que se le pueda aplicar el operador
+ y, además, el valor resultante de evaluar la expresión 5 + B debe ser de un
tipo compatible con el de la variable sobre la que se efectúa la asignación (A).
La semántica dinámica se ocupa del significado de una construcción con

objeto de que pueda ser traducido a código directamente ejecutable por la
máquina.
Ejemplo: A partir de una sentencia de asignación V ← Expresión debe
generarse código que permita:
1. obtener la dirección de memoria de la variable V

2. calcular el valor de la expresión asignada
3. almacenar el valor calculado en el paso 2 en la dirección de memoria obteni-
da en el paso 1
La semántica de un lenguaje de programación, en sus dos vertientes estática y

dinámica, es más difı́cil de especificar que los aspectos léxicos y sintácticos de un
lenguaje. Se podrı́a utilizar el lenguaje natural pero su falta de precisión provocarı́a
probablemente ambigüedad. También resultarı́a difı́cil confirmar que se ha realiza-
do una especificación completa de todas las caracterı́sticas semánticas del lenguaje.
Las gramáticas atribuidas son un buen mecanismo formal para dar solución a este
problema.
Las gramáticas atribuidas pueden considerarse como una ampliación de las inde-
pendientes del contexto que tiene por objeto dotar a la gramática de capacidad para
especificar correctamente la semántica de un lenguaje de programación. Para con-
seguirlo, a los sı́mbolos de la gramática se les asocian atributos que permiten definir
ciertas caracterı́sticas semánticas de los mismos, y a las producciones se les asocian
funciones semánticas que permiten calcular, evaluar y controlar dichos atributos.
Definición 6.1 (Gramática atribuida)
Si una Gramática Independiente del Contexto se define como
G= {ΣT , ΣN , S, P }
la gramática atribuida se define como

GA ={G, AS, F S}, donde
Manuales Uex
AS son los atributos semánticos asociados a los sı́mbolos de la gramática.
FS son las funciones semánticas asociadas a las producciones de la gramática.
98
6.2. ATRIBUTOS HEREDADOS Y SINTETIZADOS 99
De la misma forma que G permite definir los aspectos sintácticos de un lenguaje,

GA permite definir los aspectos semánticos.
Un mismo sı́mbolo de la gramática puede tener asociados varios atributos que
permitan representar diferentes aspectos de dicho sı́mbolo. Por ejemplo, un sı́mbolo
llamado X que representara variables de un lenguaje podrı́a tener dos atributos, uno
llamado tipo que podrı́a tener los valores: real, entero, lógico,. . . y otro llamado valor
cuyo valor dependerı́a del tipo mencionado anteriormente. Podrı́amos representarlo
ası́:
X.tipo X.valor
X
entero 534
Las funciones semánticas definen las relaciones que se cumplen entre los atributos
de los distintos sı́mbolos de la gramática. Estas relaciones permiten calcular los valores
de unos atributos en función de los valores de otros.
Cuando se desea describir las funciones semánticas asociadas a una producción,
éstas deben aparecen encerradas entre llaves al final o en algún punto intermedio
de la producción. Si un sı́mbolo aparece varias veces en la misma producción (por
ejemplo, en las producciones recursivas) se utilizan subı́ndices para distinguir unas
instancias de otras. El subı́ndice 0 se reserva para hacer referencia al sı́mbolo repetido
cuando éste aparece en la parte izquierda de la producción y los subı́ndices 1, 2, . . .
se utilizan en orden para las diferentes apariciones del sı́mbolo en la parte derecha
de la producción. Por ejemplo:
expr ::= expr + expr {expr0 .valor = expr1 .valor + expr2 .valor}
Esta producción indica que una expresión aritmética puede construirse como la
suma de otras dos expresiones más simples y, en este caso, la acción semántica indica
que el valor de la expresión resultante será la suma de las dos expresiones simples.
6.2. Atributos heredados y sintetizados

Una producción gramatical puede representarse gráficamente como un árbol. Por
ejemplo, la producción A ::= x y z se puede representar ası́:
A
� ��
x y z
Empleando la terminologı́a tı́pica de las estructuras arbóreas podemos decir que A es
Manuales Uex
el nodo padre de x, o que x es un nodo hermano de y. De acuerdo a esta terminologı́a

podemos distinguir dos tipos diferentes de atributos.
Los atributos pueden ser sintetizados y heredados. El valor de los atributos
sintetizados se calcula en función de los atributos de los nodos hijos. El valor de los
99
atributos heredados se calcula en función de los atributos de los nodos hermanos y/o
padre.
6.3. Gramáticas S-atribuidas y L-Atribuidas

En las gramáticas atribuidas el principal problema radica en la evaluación de los
atributos. Gráficamente se puede pensar en el árbol de derivación que representa la
estructura sintáctica de manera que los atributos están localizados en los diferentes
nodos del árbol. Ası́, un recorrido apropiado del árbol puede permitir calcular todos
lo atributos. Pero si no se imponen ciertas restricciones este proceso puede ser largo
y costoso.
En función de que los atributos de una gramática sean heredados o sintetizados se
pueden definir las gramáticas S o L atribuidas. Dependiendo del tipo de la gramática
atribuida resultará recomendable utilizar un determinado mecanismo para construir
y procesar el árbol sintáctico.
6.3.1. Gramáticas S-atribuidas

Las gramáticas S-atribuidas son aquellas cuyos sı́mbolos sólo tienen atributos
sintetizados.
Con las gramáticas S-atribuidas es muy eficaz utilizar un reconocedor ascendente
(por ejemplo, un reconocedor del tipo LR) ya que al mismo tiempo que se construye
el árbol sintáctico se pueden ir evaluando los atributos. El programa PCYACC genera
un reconocedor sintáctico-semántico que realiza esta tarea.
Ejemplo 6.2 El siguiente ejemplo de gramática S-atribuida se utiliza para generar

expresiones aritméticas. Por simplicidad, consideraremos que las únicas operaciones
que se pueden realizar son la suma y la multiplicación. Los sı́mbolos expr y num, que
representan las expresiones aritméticas y los números que aparecen en ellas respec-
tivamente, tienen ambos un atributo sintetizado llamado valor que permite calcular
el valor de las expresiones aritméticas analizadas. Por simplicidad, el sı́mbolo num
será considerado como terminal y su valor habrá sido obtenido en el proceso de análi-
sis léxico previo.
Las acciones semánticas de estas producciones permitirán obtener el valor de una
expresión aritmética a partir de los valores de expresiones más básicas.
expr ::= num {expr.valor = num.valor}
expr ::= expr + expr {expr0 .valor = expr1 .valor + expr2 .valor}
Manuales Uex
expr ::= expr ∗ expr {expr0 .valor = expr1 .valor ∗ expr2 .valor}
La figura 6.1 muestra el árbol de derivación de la expresión 9 + 7 * 5. Al mismo
tiempo que el árbol se construye de manera ascendente se calculan los atributos
100
6.3. GRAMÁTICAS S-ATRIBUIDAS Y L-ATRIBUIDAS 101
expr.valor
44
expr
expr.valor
expr.valor 35
expr expr
9
expr.valor expr.valor
expr expr 5
7
num.valor num num num.valor num num.valor
9 7 5
9 + 7 * 5
Figura 6.1: Gramática S-atribuida
sintetizados de todos los sı́mbolos. Finalmente se obtiene el valor de la expresión

completa.
6.3.2. Gramáticas L-atribuidas

Las gramáticas L-atribuidas tienen atributos sintetizados y heredados, pero a los
atributos heredados se les imponen algunas restricciones con objeto de facilitar el
diseño de un algoritmo que permita evaluar todos los atributos de la gramática. Los
atributos heredados sólo pueden depender de los atributos heredados del nodo padre
o de cualquier atributo de sus nodos hermanos, siempre que esos nodos hermanos
aparezcan a su izquierda en la producción. Es decir, si tenemos una producción
A ::= x1 x2 . . . xn
Los atributos heredados de xi solo pueden calcularse en función de :
1. los atributos heredados de A
2. cualquier atributo (heredado o sintetizado) de x1 . . . xi−1
Ejemplo 6.3 Veamos con un ejemplo abstracto cómo especificar claramente un frag-
mento de gramática L-atribuida. Supongamos que tenemos la producción
A ::= x y z
Manuales Uex
el sı́mbolo A tiene un atributo sintetizado(a1 ) y otro heredado (a2 )
el sı́mbolo x tiene sólo un atributo heredado (x1 )
101
el sı́mbolo y tiene un atributo sintetizado(y1 ) y otro heredado (y2 )
el sı́mbolo z tiene un atributo sintetizado(z1 )
Si deseamos representar los atributos de cada sı́mbolo dentro de la producción, lo

haremos de la siguiente forma:
A.a1 ↑ a2 ↓ ::= x.x1 ↓ y.y1 ↑ y2 ↓ z.z1 ↑
donde el sı́mbolo ↓ indica que el atributo es heredado y el sı́mbolo ↑ indica que

es sintetizado.
Si además se quisieran representar las acciones semánticas, éstas deberı́an aparecer

encerradas entre llaves y colocadas en el punto adecuado de la producción, siguiendo
las siguientes reglas:
1. Una acción semántica no podrá hacer referencia a un atributo sintetizado de

un sı́mbolo que se encuentra a la derecha de dicha acción.
2. Para calcular un atributo heredado de un sı́mbolo que está en la parte derecha

de una producción, la acción debe estar situada inmediatamente antes de ese
sı́mbolo.
3. Los atributos sintetizados de un sı́mbolo sólo se pueden calcular en una produc-

ción en la que dicho sı́mbolo se encuentre en la parte izquierda y una vez que
se hayan evaluado todos los atributos de los sı́mbolos que aparecen en la parte
derecha de la producción, por tanto, la acción correspondiente se ubicará al
final de la producción.
Veamos un ejemplo de cómo se aplicarı́an estas reglas en el ejemplo anterior:
A ::= {x.x1 ↓ = f (A.a2 ↓)} x {y.y2 ↓= g(x.x1 ↓)} y z {A.a1 ↑= h(y.y2 ↓, z.z1 ↑)}
No podemos asociar a esta producción acciones semánticas que evalúen los atri-
butos a2 (por ser heredado se evaluará en una producción en la que el sı́mbolo A
esté ubicado en la parte derecha), y1 y z1 (por ser atributos sintetizados se deben
Manuales Uex
evaluar en producciones en las que los sı́mbolos y y z aparezcan en la parte izquierda).

Las tres reglas vistas anteriormente tienen sentido si analizamos el algoritmo que
se utiliza para evaluar los atributos en una gramática L-atribuida al hacer un recorrido
en preorden de cada uno de los nodos que forman el árbol sintáctico.
102
6.3. GRAMÁTICAS S-ATRIBUIDAS Y L-ATRIBUIDAS 103
Algoritmo 6.1 Visitar (N)

Input: N es un nodo de un árbol sintáctico
Begin
for all H hijo del nodo N (de izquierda a derecha) do
Evaluar los atributos heredados del nodo H
Visitar (H)
end for
Evaluar los atributos sintetizados del nodo N
End
Ejemplo 6.4 La siguiente gramática L-atribuida permite generar una declaración

de variables siguiendo las pautas del lenguaje C. Los sı́mbolos no terminales D, T y
L representan los conceptos de declaración, tipo y lista de identificadores, respectiva-
mente. En este ejemplo, los atributos que tienen los diferentes sı́mbolos gramaticales
almacenan información que representa el tipo de las variables que se van a definir.
Además, el sı́mbolo terminal id tiene un atributo sintetizado que permite conocer el
nombre de la variable y que habrá sido calculado en el proceso de análisis léxico.
La semántica de estas instrucciones de declaración debe asociar a cada vari-
able su tipo correspondiente y además debe almacenar, utilizando el procedimiento
añadir tabla, la información asociada a cada variable en la tabla de sı́mbolos del com-
pilador.
D ::= T {L.tipoh = T.tipo} L

T ::= INT {T.tipo = 0}
T ::= REAL {T.tipo = 1}
L ::= {ID.tipoh = L.tipoh} ID
{añadir tabla(ID.nombre, ID.tipoh)}
L ::= {L1 .tipoh = L0 .tipoh} L, {ID.tipoh = L0 .tipoh} ID
{añadir tabla(ID.nombre, ID.tipoh)}
Manuales Uex
Los atributos de L y de ID son heredados, por eso los llamamos tipoh, el atributo
de T es sintetizado y se calcula en aquellas producciones que tienen a T en la parte
izquierda (la segunda y la tercera).
103
D
L.tipoh
T.tipo T L 0 2
1 0 L.tipoh id.tipoh
int L , id 0 9
3 0
c
L.tipoh id.tipoh
L , id 10 añadir_tabla(c,0)
4 0 7 0
id b
id.tipoh
8 añadir_tabla(b,0)
5 0 a
6 añadir_tabla (a,0)
Figura 6.2: Gramática L-atribuida
La figura 6.2 muestra el árbol de derivación de una declaración de variables como

int a, b, c , la numeración indica el orden en el que se realizarı́an las diferentes
acciones semánticas de acuerdo al algoritmo 6.1
6.4. Problemas
6.1 Dada la siguiente gramática atribuida:
ΣT = {id, cte, =, +} ΣN = {asig, expr} S = asig
1. asig ::= id = expr {id.valor = expr.valor}
2. expr ::= id {expr.valor = id.valor}
3. |cte {expr.valor = cte.valor}
4. |expr + expr {expr0 .valor = expr1 .valor + expr2 .valor}
¿Es esta gramática S-atribuida o L-atribuida?
Manuales Uex
104
Tema 7
Máquinas de Turing
Contenido
7.1. Introducción. Antecedentes históricos . . . . . . . . . . . 105
7.2. Definición y ejemplos de M.T.’s . . . . . . . . . . . . . . . 107
7.3. Restricciones a la M.T. . . . . . . . . . . . . . . . . . . . . 110
7.4. Modificaciones de la M.T. . . . . . . . . . . . . . . . . . . 113
7.5. Técnicas para la construcción de M.T. . . . . . . . . . . . 116
7.6. La M.T. Universal . . . . . . . . . . . . . . . . . . . . . . . 118
7.7. La M.T. como generadora de lenguajes . . . . . . . . . . 119
7.8. La tesis de Church-Turing . . . . . . . . . . . . . . . . . . 120
7.9. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
La máquina de Turing es un dispositivo teórico muy simple pero con una gran
capacidad computacional, es decir, permite resolver problemas de una gran compleji-
dad. Como veremos en los próximos temas, la máquina de Turing es una herramienta
formal muy útil para estudiar la teorı́a de la computabilidad.
7.1. Introducción. Antecedentes históricos

En la década de los 30, el inglés Allan Turing diseñó el modelo matemático de
una máquina teórica con un gran poder computacional, llamada Máquina de Turing
(M.T.). En los siguientes párrafos analizaremos los motivos cientı́ficos e históricos
que llevaron a Turing a diseñar esta máquina.
Manuales Uex
A finales del siglo XIX, la recién nacida Teorı́a de Conjuntos habı́a causado un
gran impacto entre los matemáticos. Sin embargo, algunos pensadores como Bertrand
Russell opinaban que dicha teorı́a no estaba bien formalizada ya que permitı́a enun-
ciados tan paradójicos como éste:
105
105
106 TEMA 7. MÁQUINAS DE TURING
Si R es el conjunto de todos los conjuntos que no son miembros de sı́ mis-

mo, ¿R ∈ R?
Para evitar este tipo de problemas, Russell y Whitehead desarrollaron un sistema

matemático de axiomas y reglas de inferencia altamente formalizado, cuyo propósito
era poder traducir a este esquema cualquier razonamiento matemático correcto. Las
reglas estaban cuidadosamente seleccionadas para evitar planteamientos que pudieran
llevar a conclusiones paradójicas.
Simultáneamente, el prestigioso matemático alemán David Hilbert comenzó la
tarea de establecer un esquema mucho más completo y manejable. Hilbert pretendı́a
demostrar que el sistema estaba libre de contradicciones. Nunca vaciló en proclamar
su convicción de que algún dı́a con este sistema se podrı́a resolver cualquier problema
matemático o demostrar que carece de solución. Aseguraba que existı́a un procedi-
miento por medio del cual era posible afirmar a priori si un problema podı́a o no
ser resuelto. Llamó a este problema Entscheidungsproblem (“el problema de la de-
cisión”). Sin embargo, un joven austriaco, llamado Kurt Gödel, publico en 1931 un
artı́culo titulado “Sobre proposiciones formalmente indecidibles de los fundamentos
de las matemáticas y sistemas relacionales”. En él, Gödel probó el Teorema de la
incompletitud en el que se afirmaban dos importantes cuestiones:
1. Si la teorı́a axiomática de conjuntos es consistente existen teoremas que no

pueden ser probados ni refutados.
2. No existe ningún procedimiento constructivo que pruebe que la teorı́a axiomá-

tica de conjuntos es consistente.
En la demostración de este teorema Gödel también propuso un interesante método

para enumerar objetos que originalmente no parecen ser enumerables. Utilizó para
ello el teorema fundamental de la Aritmética o teorema de factorización única que
afirma que todo entero positivo se puede representar de forma única como producto de
factores primos. Por ejemplo, 6936 = 23 ·31 ·172 y no hay ninguna otra factorización del
número 6936 en números primos. Esta idea es muy interesante y puede ser utilizada
para catalogar el conjunto de las M.T.’s como veremos en el siguiente tema. Veamos
su aplicación para enumerar, por ejemplo, las expresiones aritméticas.
En primer lugar es necesario enumerar todos los elementos que pueden formar
parte de una expresión aritmética ( operaciones y dı́gitos):
+ - * ÷ 0 1 2 3 4 5 6 7 8 9
1 2 3 4 5 6 7 8 9 10 11 12 13 14
Manuales Uex
De esta manera, una expresión como 3*5-2 podrı́a representarse mediante la

tupla (8-3-10-2-7) que puede asociarse con el número 28 · 33 · 510 · 72 · 117 . Debido
a la unicidad de la factorización en números primos podemos reconstruir la expresión
aritmética a partir de su código (número de orden) asociado.
106
7.2. DEFINICIÓN Y EJEMPLOS DE M.T.’S 107
Para los cientı́ficos mencionados anteriormente era fundamental el concepto de al-

goritmo o proceso efectivo, considerándolo como un método para resolver un problema
genérico en un número finito de pasos mediante operaciones conocidas y realizables.
Desde este punto de vista, Turing diseñó su máquina como un dispositivo capaz de
realizar un algoritmo. Apoyó las teorı́as de Gödel al demostrar que algunos problemas
no pueden resolverse con una M.T.
La gran ventaja de la M.T. es que, a pesar de su simplicidad, tiene un gran
poder computacional y no se ve limitada por las caracterı́sticas tecnológicas de una
computadora como la velocidad de procesamiento o la capacidad de la memoria. Por
esta razón, se la considera como un sı́mbolo invariante de la informática.
En esta misma época, Emil Post, ası́ como Church y Kleene, realizaron estudios
similares a los de Turing.
7.2. Definición y ejemplos de M.T.’s

La M.T. es un modelo matemático para representar a una máquina teórica. A
pesar de su simplicidad la M.T. tiene el mismo poder computacional que una com-
putadora de propósito general.
La M.T. es interesante, sobre todo, por el conjunto de lenguajes que permite re-
conocer y también generar (lenguajes recursivamente enumerables) y por el conjunto
de funciones que puede computar (funciones calculables).
El modelo básico de M.T. está formado por un autómata finito, con un dispositivo
de lectura/escritura que controla una cinta de longitud infinita. La cinta está dividida
en celdas en las que se almacena un único sı́mbolo o un espacio en blanco. Aunque
la longitud de la cinta es infinita, en cada momento sólo un número finito de celdas
contienen sı́mbolos diferentes al espacio en blanco, que pertenecen a un alfabeto
también finito. El dispositivo de lectura/escritura puede explorar(leer) el contenido
de una celda y grabar(escribir) un nuevo sı́mbolo sobre ella, seguidamente se desplaza
en una posición hacia la izquierda o hacia la derecha. Por tanto, la M.T. dependiendo
del sı́mbolo leı́do y del estado actual del autómata, realiza las siguientes operaciones:
1. Cambia de estado.
2. Escribe un sı́mbolo en la celda analizada.
3. Desplaza la cabeza de lectura/escritura a la izquierda o a la derecha en una

posición.
Manuales Uex
Con el siguiente esquema se representa una M.T. que se encuentra en un estado

llamado p y cuya cabeza de lectura/escritura señala a una celda que contiene al
sı́mbolo a
107
a
↑p
Definición 7.1 (Máquina de Turing)

Formalmente la M.T. se define como una tupla:
MT = {Q, Σ, Γ, f, q0 , b, F }
Q es el conjunto finito de estados
Σ es el alfabeto de la cadena de entrada
Γ es el alfabeto de la cinta
b es el espacio en blanco b ∈ Γ, pero b ∈

/Σ
F ⊂ Q es el conjunto de estados finales
f : Q × Γ −→ Q × Γ × {I, D}
Inicialmente, en la cinta hay una colección finita de sı́mbolos de Σ precedida y seguida

por blancos (b), el estado de la M.T. es q0 y la cabeza de lectura/escritura suele
apuntar al primer sı́mbolo distinto de b que hay en la cinta.
Definición 7.2 (Descripción Instantánea de una M.T.)

Llamaremos Descripción Instantánea(D.I.) de la M.T. a α1 qα2 donde q es el estado
actual de la máquina y α1 α2 ∈ Γ∗ es el contenido de la cinta. La cabeza de lec-
tura/escritura analiza en ese momento el primer sı́mbolo de α2 . Dentro de la cadena
α1 α2 podemos encontrar el carácter b, pero el primer carácter de α1 es el carácter
diferente de b más a la izquierda de la cinta y el último carácter de α2 es el carácter
diferente de b más a la derecha de la cinta.
Teniendo en cuenta el concepto de D.I. los movimientos de la M.T. pueden
definirse de la siguiente forma:
Sea una M.T. cuya D.I. es x1 . . . xi−1 qxi . . . xn
Si f (q, xi ) = (p, y, I) entonces la nueva D.I. es x1 . . . xi−2 pxi−1 yxi+1 . . . xn

Manuales Uex
Podemos representar la transición de la forma:

x1 . . . xi−1 qxi . . . xn −→ x1 . . . xi−2 pxi−1 yxi+1 . . . xn
108
7.2. DEFINICIÓN Y EJEMPLOS DE M.T.’S 109
Una representación más gráfica serı́a la siguiente:

x1 . . . xi−1 xi . . . xn −→ x1 . . . xi−1 y xi+1 . . . xn
↑q ↑p
∗
Se puede utilizar el sı́mbolo −→ para indicar que hemos pasado de una situación
a otra en uno o más pasos.
Definición 7.3 (Lenguaje aceptado por una M.T.)

Está formado por la cadenas definidas sobre el alfabeto Σ que hacen que la M.T.
llegue a un estado final, partiendo de una situación inicial en que la cadena está en
la cinta de entrada, q0 es el estado inicial y la cabeza de lectura/escritura apunta a
la celda ocupada por el primer carácter de dicha cadena.
L(MT ) = {w ∈ Σ∗ / q0 w −→
∗
α1 pα2 donde p ∈ F α1 , α2 ∈ Γ∗ }
Ejemplo 7.1 (Complemento binario) Esta M.T. obtiene el complemento binario

de un número binario almacenado en la cinta.
Q = {q0 , q1 } F = {q1 } Σ = {0, 1} Γ = {0, 1, b}
La función de transición se define en la siguiente tabla:
0 1 b
q0 q0 1D q0 0D q1 bI
Ejemplo 7.2 (Paridad) Esta M.T. calcula la paridad del número de 1’s que hay en
la cadena binaria de entrada. Al final del proceso, se añade a la derecha de la cadena
un 0 para indicar que hay un número par de 1’s y un 1 para indicar que el número
de 1’s es impar.
Q = {q0 , q1 , q2 } F = {q2 } Σ = {0, 1} Γ = {0, 1, b}
0 1 b
q0 q0 0D q1 1D q2 0I
q1 q1 0D q0 1D q2 1I
Ejemplo 7.3 (Duplicar) Esta M.T. recibe una cadena formada por 1’s en la cinta
de entrada y duplica su tamaño. El proceso comienza en el extremo derecho de
la cadena. Para llevar a cabo este trabajo, cada vez que encuentra un 1 lo marca
sustituyéndolo por un 0 y se desplaza hasta el final de la cadena donde añade otro
Manuales Uex
0 (que representa a un 1 marcado). Al final del proceso, en el estado q2 se cambian

todos los 0’s por 1’s para reconstruir la información.
Q = {q0 , q1 , q2 , q3 } F = {q3 } Σ = {1} Γ = {0, 1, b}
109
1 0 b
q0 q1 0D q0 0I q2 bD
q1 q1 1D q1 0D q0 0I
q2 q2 1D q3 bI
Ejemplo 7.4 (Imagen especular) Esta M.T. construye la imagen especular de un
número binario. Es decir, si recibe la cadena de entrada 100 al acabar el proceso la
información que hay en la cinta es 100001. Esta máquina es similar a la anterior con
la diferencia de que, en este caso, hay que duplicar dos tipos de sı́mbolos (0 y 1) en
lugar de uno. También en este caso los dı́gitos se procesarán de derecha a izquierda.
Los 0’s y 1’s son reemplazados por A’s y B’s respectivamente cada vez que se procesan
(duplican). Al final del proceso, en el estado q3 se reconstruye la cadena cambiando
las A’s y B’s por 0’s y 1’s.
Q = {q0 , q1 , q2 , q3 , q4 } F = {q4 } Σ = {0, 1} Γ = {0, 1, A, B, b}
0 1 A B b
q0 q1 AD q2 BD q0 AI q0 BI q3 bD
q1 q1 AD q1 BD q0 AI
q2 q2 AD q2 BD q0 BI
q3 q3 0D q3 1D q4 bI
Ejemplo 7.5 (Paréntesis anidados) Esta M.T. reconoce cadenas de paréntesis
anidados. Las parejas de paréntesis que se van procesado se marcan convirtiéndolos
en *. En este caso se dispone de dos estado finales f1 y f2 que indican respectiva-
mente si la cadena inicial es o no correcta, además, a pesar de ser algo redundante se
escribe en la cinta la letra ’S’ o ’N’ (si o no). Al final del proceso no se reconstruye la
información inicial que, por tanto, se pierde. Esta máquina puede reconocer cadenas
como éstas: ((())) o (()()) pero no reconocerı́a (()))(.
Q = {q0 , q1 , q2 , q3 , f1 , f2 } F = {f1 , f2 } Σ = {(, )} Γ = {(, ), ∗, S, N, b}
( ) * b
q0 q0 (D q1 ∗ I q0 ∗ D q2 bI marca un ) y pasa a q1
q1 q0 ∗ D q1 ∗ I f2 ND marca un ( y pasa a q0
q2 q3 ∗ I q2 ∗ I f1 SD al final, comprueba que no quedan (
q3 q3 ∗ I q3 ∗ I f2 ND se llega a q3 si hay más ( que )
7.3. Restricciones a la M.T.

Manuales Uex
La M.T. que se ha definido en la sección anterior es la más genérica posible.

Sin embargo, veremos a continuación que se le pueden imponer restricciones a la
definición sin que esto afecte a la potencia computacional de la máquina.
110
7.3. RESTRICCIONES A LA M.T. 111
Las restricciones se aplicarán sucesivamente a:

1. el alfabeto,
2. la estructura de la cinta, y
3. la capacidad de la máquina para realizar diferentes operaciones (escribir, des-
plazarse o cambiar de estado) en una sola transición.
7.3.1. M.T. con alfabeto binario

Cualquier M.T. es equivalente (esto significa que realiza la misma tarea) a una
M.T. con un alfabeto binario Γ = {0, 1, b}. Para conseguirlo, será necesario codificar
en binario los caracteres del alfabeto original. Cada transición original se desglosará en
varias transiciones de la máquina con alfabeto binario con el consiguiente incremento
de estados intermedios, como se indica en el siguiente ejemplo:
Sea Z una M.T. definida sobre el alfabeto Σ = {x, y, z, w}. Supongamos que
Z � es la M.T. definida sobre un alfabeto binario, equivalente a Z, que pretendemos
construir. Codificamos los sı́mbolos de Σ de la siguiente forma:
x = 00 y = 10 z = 01 w = 11
Supongamos que f (p, x) = (q, y, D) es una de las transiciones de Z. En la máquina
Z � esta transición se desglosarı́a en las siguientes:
f � (p, 0) = (p0 , 0, D) reconoce el primer 0 de x
f � (p0 , 0) = (px , 0, I) reconoce el segundo 0 de x
f � (px , 0) = (px0 , 1, D) cambia 00 por 10 (x por y)
f � (px0 , 0) = (q, 0, D) se desplaza a la derecha y pasa al estado q
Para conseguir en Z � transiciones equivalentes a la de Z ha sido necesario utilizar
tres nuevos estados p0 , px , px0 .
En general, si Z tiene un alfabeto de tamaño m será necesario buscar n ∈ N tal
que 2n−1 < m ≤ 2n de manera que todos los sı́mbolos del alfabeto de Z podrán ser
codificados mediante una cadena binaria de longitud n. El proceso que deberá llevar
a cabo Z � será el siguiente:
1. Analizar los n caracteres que representan a un sı́mbolo del alfabeto original. En

el peor de los casos serán necesarias n transiciones y 2n + 2n−1 + . . . + 20 nuevos
estados.
2. Una vez reconocido el sı́mbolo, Z � deberá retroceder como máximo n posiciones

con el fin de poder modificar la cadena de longitud n que acaba de analizar.
Manuales Uex
3. Finalmente la cabeza de lectura/escritura deberá desplazarse hasta llegar a la

posición adecuada.
111
7.3.2. M.T. con la cinta limitada en un sentido

Dada una M.T. con una cinta infinita en ambos sentidos, siempre existe una
máquina equivalente cuya cinta está limitada por un extremo pero es infinita por el
otro. Sea Z una M.T. con una cinta infinita en ambos sentidos. Se pueden numerar
las casillas de la siguiente forma:
-2 -1 1 2
Es posible construir una M.T. equivalente Z � cuya cinta tendrá la siguiente es-
tructura:
∗
0 1 -1 2 -2
En Z � existe una nueva casilla, numerada con el 0, que contiene un sı́mbolo nuevo
(∗). Además de añadir esta nueva casilla, se ha redistribuido la información de Z,
de manera que cada casilla de Z � contiene la misma información que su correspon-
diente casilla de Z (la que tiene la misma numeración). Veamos con un ejemplo el
funcionamiento de Z � .
Supongamos que f (p, x) = (q, y, D) es una de las transiciones de Z y supongamos
que x está almacenado en la casilla n(n > 0), después de realizar el cambio de
sı́mbolo hay que desplazarse a la casilla n + 1 (que ahora está situada dos posiciones
a la derecha de n). En la máquina Z � está transición se desglosarı́a en las siguientes:
f � (p, x) = (pD , y, D)
f � (pD , ?) = (q, ?, D) ? es un comodı́n que representa a cualquier sı́mbolo
El comportamiento de Z � serı́a diferente si la casilla ocupada por x fuera la eti-
quetada con −n ya que un desplazamiento a la derecha en Z supone un doble de-
splazamiento hacia la izquierda en Z � . La transición anterior se desglosarı́a en:
f � (p, x) = (p�D , y, I)
f � (p�D , ?) = (q, ?, I)
Si la posición ocupada por x fuera la -1, habrı́a que añadir una transición al pasar
por la posición 0. f � (q, ∗) = (q, ∗, D)
En general, la nueva máquina tiene un número de estados 6 veces mayor que Z
ya que cada estado q de Z se multiplica por 3 (q, qI , qD ) en la parte positiva de la
cinta y otro tanto ocurre con la parte negativa de la cinta (q � , qI� , qD
�
).
7.3.3. M.T. con restricciones en cuanto a las operaciones que

realiza simultáneamente
Manuales Uex
En el modelo original de M.T., se realizan tres operaciones en cada transición:

1. Escritura de un sı́mbolo
2. Cambio de estado
3. Movimiento de la cabeza de lectura/escritura
112
7.4. MODIFICACIONES DE LA M.T. 113
Veamos, con diferentes ejemplos, como, aumentando el número de estados, se

puede restringir el número de operaciones que se realizarán simultáneamente.
Imposibilidad para escribir y cambiar de estado simultáneamente
La transición f (p, x) = (q, y, D) se convierte en:
f � (p, x) = (pxD , x, P )
f � (pxD , x) = (pxD , y, P )
f � (pxD , y) = (q, y, D)
Imposibilidad para escribir y desplazarse simultáneamente
La transición f (p, x) = (q, y, D) se convierte en:
f � (p, x) = (pD , y, P )
f � (pD , y) = (q, y, D)
De forma análoga, dada una M.T. es posible construir otra equivalente a ella que
ejecute una sola operación en cada transición.
7.4. Modificaciones de la M.T.

Una de las razones de la gran aceptación de la M.T. como modelo general de
computación es que el modelo estándar definido al comienzo del tema es equivalente
a otras versiones de M.T. que, sin aumentar el poder computacional del dispositivo,
permiten resolver con más facilidad determinados problemas.
7.4.1. Almacenamiento de información en el control finito

Es posible utilizar el estado de control (perteneciente a un conjunto finito) para
almacenar una cantidad finita de información. Para ello cada estado se representa
como un par ordenado donde el primer elemento representa realmente al estado y el
segundo a la información que se pretende almacenar.
Veamos su utilidad con un ejemplo en el que se define una M.T. que reconoce
el lenguaje L = 01∗ + 10∗ . Como el primer sı́mbolo de la cadena no puede volver
a aparecer, se almacena con el estado de control. Las transiciones no definidas son
situaciones de error, es decir, la cadena no ha sido reconocida.
Q = {q0 , q1 } ∗ {0, 1, b} estado inicial = [q0 , b] F = {[q1 , b]}
Σ = {0, 1} Γ = {0, 1, b}
0 1 b
[q0 , b] [q1 , 0]0D [q1 , 1]1D
[q1 , 0] [q1 , 0]1D [q1 , b]0P este estado indica que la cadena comienza por 0
Manuales Uex
[q1 , 1] [q1 , 1]0D [q1 , b]0P este estado indica que la cadena comienza por 1
Es evidente que no se aumenta la potencia computacional del modelo ya que
simplemente se ha utilizado una notación diferente para designar a los estados.
113
7.4.2. Pistas múltiples

En este caso se considera que la cinta está dividida en un número k de pistas, de
manera que los sı́mbolos de la cinta se representan como k-tuplas. Tampoco en este
caso se aumenta la potencia del modelo ya que sólo hay un cambio en la representación
de los sı́mbolos de la M.T. En este sentido, es un caso análogo al anterior. Esta
variación de la M.T., concretamente con tres pistas, puede resultar muy útil para
resolver operaciones aritméticas con dos datos. Cada dato se almacena en una pista
y el resultado se almacena en la tercera (que inicialmente está vacı́a). Por ejemplo,
una M.T. que sume números binarios comenzarı́a con la siguiente información en la
cinta:
b 1 1 0 b
b 1 1 1 b
b b b b b
y finalmente la cinta quedarı́a ası́:
b 1 1 0 b
b 1 1 1 b
b 1 1 0 1 b
Ejemplos de transiciones para esta máquina:

       
0 0 0 0
f (q0 ,  1 ) = (q0 ,  1  , I) f (q0 ,  0 ) = (q0 ,  0  , I)
b 1 b 0
7.4.3. Sı́mbolos de chequeo

Como se ha visto en ejemplos anteriores, para resolver muchos problemas es im-
portante marcar aquellos sı́mbolos que se van procesando. Hasta ahora estos sı́mbolos
se marcaban sustituyéndolos por otros diferentes, sin embargo esta misma idea puede
llevarse a cabo de una forma más intuitiva y sencilla utilizando en la cinta una segun-
da pista en la que sólo se almacenan espacios en blanco y otro sı́mbolo (por ejemplo,
∗) que sólo aparece debajo del sı́mbolo de la primera pista (la original) que ha sido
procesado. Esto no es más que un caso particular de una M.T. con pistas múltiples.
Veamos en el siguiente ejemplo como se utilizarı́an estos sı́mbolos de chequeo para
resolver el problema planteado en el ejemplo 3 en el que la M.T. duplicaba el número
Manuales Uex
de 1’s que habı́a en la cinta inicialmente.
Ejemplo 7.6 (Duplicar - segunda versión) Q = {q0 , q1 , q2 } F = {q2 } Σ = {1}

Γ = {0, 1, b}
114
7.4. MODIFICACIONES DE LA M.T. 115
El proceso comienza en el extremo derecho de la cinta y la función de transición

se define en la siguiente tabla:
� � � � � �
1 1 b
�b� �∗ � �b�
1 1 b
q0 q1 D q0 I q2 D
∗ ∗
� � �b �
1 1
q1 q1 D q0 I
∗ ∗
7.4.4. Máquinas multicinta

En este caso la M.T. dispone de k cintas y k cabezas de lectura/escritura. Cada
cabeza trabaja (lee y escribe) sobre su cinta y se mueve con total independencia de
las demás. Para comprobar que este tipo de máquinas no aumenta el poder com-
putacional de la M.T. estándar se puede construir una máquina equivalente a ella
utilizando varias pistas y sı́mbolos de chequeo. Supongamos que la máquina Z dispone
de tres cintas y una situación concreta puede ser representada como se indica en el
siguiente esquema:
Ai
↑p
Bj
↑q
Ck
↑r
Es posible construir una nueva máquina multipista que sea equivalente a ella. Esta
nueva máquina tendrá un número de pistas igual al doble de las cintas de la máquina
original, en este caso seis. Las pistas pares almacenan un sı́mbolo de chequeo que sirve
para indicar qué celda de la pista inmediatamente superior se está procesando en ese
momento. Las pistas impares tienen la misma función que las correspondientes cintas
de la máquina original. Evidentemente, esta nueva M.T. tendrá más estados porque
tiene que ir procesando secuencialmente cada pareja de pistas buscado el sı́mbolo de
chequeo correspondiente.
Ai
∗
Manuales Uex
Bj
∗
Ck
∗
115
7.4.5. M.T. no determinista

Dado un estado y un sı́mbolo analizado, la M.T. no determinista tiene un número
finito de posibilidades entre las que elegir para realizar el siguiente movimiento. Ca-
da elección consiste en un nuevo estado, un sı́mbolo a grabar y una dirección de
movimiento de la cabeza. Por ejemplo:
f (q, a) = {(p1 , a, D), (p2 , b, I), (p3, a, I), . . .}

Como ocurrı́a con los Autómatas Finitos, el No Determinismo no añade más
potencia a la M.T., ni siquiera la combinación del No Determinismo con cualquiera
de las modificaciones previamente planteadas aumenta el poder computacional de la
M.T.
7.5. Técnicas para la construcción de M.T.

De la misma forma que al programar, al diseñar M.T.’s también es posible utilizar
técnicas de diseño modular que simplifican la tarea de su construcción. De hecho, una
M.T. puede simular el comportamiento de cualquier tipo de subrutina, incluyendo
procedimientos recursivos con cualquier mecanismo conocido de paso de parámetros.
Para que una M.T. actúe como subrutina de otra, la idea general es que su estado
final se convierta en un estado de retorno a la máquina que la ha llamado. La llamada
se efectúa, por tanto, a través del estado inicial de la subrutina y el retorno a través
de su estado final.
Veamos, en primer lugar, como encadenar dos M.T. M1 y M2 de manera que
primero trabaje M1 e inmediatamente después lo haga M2 utilizando como entrada la
salida de M1 . Para llevar a cabo este encadenamiento basta con realizar una transición
desde el estado final de M1 hasta el inicial de M2 . Es decir, si p1 y q1 son los estados
inicial y final, respectivamente de M1 y p2 y q2 son los estados inicial y final de M2 ,
hay que incluir la transición f (q1 , x) = (p2 , x, P ) ∀x ∈ Γ. Por ejemplo, si deseamos
construir una M.T.M que calcule la función f () = 2x2 , podrı́amos construir M1 que
calcule g(x) = x2 y M2 que calcule h(x) = 2x, ası́ M serı́a el resultado de encadenar
M1 con M2 .
En ocasiones sólo es deseable que trabaje M2 si el proceso de M1 ha terminado
a
bajo ciertas condiciones (simulación de una sentencia if ). Por ejemplo M1 −→ M2
indica que M2 sólo trabajará en el caso de que al acabar M1 , la cabeza de lect./esc.
a,b
esté situada sobre el sı́mbolo a. De la misma forma, M1 −→ M2 indica que M2 sólo
trabajará en el caso de que al acabar M1 la cabeza de lec./esc. esté situada sobre
Manuales Uex
una celda que contiene al sı́mbolo a o al sı́mbolo b. En este segundo caso, habrı́a que
añadir las siguientes transiciones:
f (q1 , a) = (p2 , a, P )
f (q1 , b) = (p2 , b, P )
116
7.5. TÉCNICAS PARA LA CONSTRUCCIÓN DE M.T. 117
f (q1 , x) = (f, x, P ) ∀x ∈ Γ\{a, b} donde f es un nuevo estado final.
a� M2
El esquema M1 indica que si al acabar el proceso, M1 está señalando
b� M3
a una celda que contiene el sı́mbolo a, la máquina M2 debe continuar el proceso, pero
si la casilla contiene el sı́mbolo b, será M3 la máquina que continuará trabajando. En
otro caso el proceso finaliza. Para materializar esta situación habrı́a que añadir las
transiciones:
f (q1 , a) = (p2 , a, P )
f (q1 , b) = (p3 , b, P )
f (q1 , x) = (f, x, P ) ∀x ∈ Γ\{a, b} donde f es un nuevo estado final.
Ejemplo 7.7 (Multiplicar) Este ejemplo servirá para ilustrar la utilización de una
M.T. como subrutina de otra. Se construirá una M.T. que multiplique números en-
teros, que se representan como cadenas de 1’s. Por ejemplo, un 4 se representa como
1111. Se utiliza el 0 como separador entre los datos iniciales. La M.T. se diseñará de
manera que si la entrada es 1m 01n 0 la salida deberá ser 1n×m . Básicamente, la M.T.
copiará al final de la cadena el segundo bloque de 1’s (1n ) tantas veces como 1’s haya
en el primer bloque (1m ), los 1’s de este primer bloque se van borrando (es una forma
sencilla de marcarlos).
En primer lugar, se diseña una M.T., llamada COPIAR que copia al final de la
cadena de entrada n 1’s. Es decir, si la situación inicial de la M.T. se describe
ası́ 1m 0q1 1n 01i, la situación final será 1m 0q5 1n 01i+n . Los 1’s (del segundo bloque)
que se van copiando se marcan cambiándolos temporalmente por un 2, y además se
procesan de izquierda a derecha.
La función de transición de COPIAR se define en la siguiente tabla, además q1 y q5
son respectivamente los estados inicial y final:
0 1 2 b
q1 q4 0I q2 2D cambia un 1 por un 2 y pasa a q2
q2 q2 0D q2 1D q3 1I se desplaza al extr. derecho y añade un 1
q3 q3 0I q3 1I q1 2D se desplaza hacia la izq. buscando un 2
q4 q5 0D q4 1I cambia los 2’s por 1’s
A continuación, se diseña la M.T. MULTIPLICAR que utiliza la máquina COPIAR

a modo de subrutina. La M.T. MULTIPLICAR va borrando los 1’s del primer dato
al mismo tiempo que, mediante la M.T. COPIAR, copia n 1’s al final de la cadena.
Manuales Uex
Cuando se han borrado todos los 1’s del primer dato se borran también los del segundo
ası́ como los 0’s que actúan de separadores de manera que finalmente en la cinta sólo
queda el resultado de la operación (1n×m ). En este caso los estados inicial y final son
q0 y q12 .
117
0 1 b
q0 q6 bD elimina un 1 del primer dato
q5 q7 1I
q6 q1 0D q6 1D llama a COPIAR
q7 q8 0I
q8 q9 1I q10 bD
q9 q9 1I q0 bD retrocede al extr. izq. para volver a empezar
q10 q11 bD borra un 0
q11 q12 bD q11 bD borra el segundo dato y un 0
7.6. La M.T. Universal

El concepto de M.T. es tan general y potente que es posible construir una M.T.
que sea capaz de simular el comportamiento de cualquier otra M.T., a esta máquina se
la llama Máquina de Turing Universal, y su forma de trabajar puede compararse con
la de un ordenador que se comporta de una u otra forma dependiendo del programa
que ejecuta en cada momento.
En primer lugar, veremos cómo se podrı́a representar toda la información necesaria
para simular el comportamiento de una M.T. llamada M.
Es necesario conocer la función de transición, el estado inicial, el contenido inicial
de la cinta y la posición de la cabeza de lectura/escritura. Sin perdida de genera-
lidad supondremos que M trabaja con un alfabeto binario y que necesitamos m
bits para codificar cada uno de sus estados. El movimiento de la cabeza se puede
codificar con un único bit (por ejemplo, 0=Derecha, 1=Izquierda). Ası́ cada transi-
ción f (p, a) = (q, b, D) puede codificarse con 2m + 3 sı́mbolos binarios de la forma
xx
� ��. . . x� a yy . . . y b0, donde xx . . . x es una codificación binaria del estado p y yy . . . y
� ��
m m
representa al estado q.
La M.T. M puede representarse de la siguiente forma:
dd . . . ∗ . . . d < q . . . qd > xx . . . xayy . . . yb0 > xx . . . xayy . . . yb0 > . . .
Los sı́mbolos < y > permiten delimitar los diferentes bloques que constituyen esta
cadena. El primer bloque(dd . . . ∗ . . . d) representa el contenido de la cinta de la M.T.
M, y el asterisco se coloca inmediatamente a la izquierda del sı́mbolo al que apunta
la cabeza de lectura/escritura. Esta información va cambiando a lo largo del proceso
Manuales Uex
representando en cada momento el contenido de la cinta de M. El segundo bloque

representa el estado actual de M (q . . . q) y el sı́mbolo al que apunta la cabeza (d),
que es el que está a la derecha del asterisco en el bloque anterior. Esta información
tiene longitud m + 1 y también cambia a lo largo del proceso. A partir de este punto,
118
7.7. LA M.T. COMO GENERADORA DE LENGUAJES 119
el resto de los bloques (de longitud 2m + 3) representan a los diferentes valores de la

función de transición.
Cada transición puede considerarse como un registro formado por dos partes: la
primera (xx . . . xa) es una etiqueta que identifica a la transición, la segunda (yy . . . yb0)
puede ser considerada como el dato de la transición. Por lo tanto, esta última parte de
la cadena (> xx . . . xayy . . . yb0 > . . .) puede ser vista como una colección de registros
formados cada uno de ellos por una etiqueta y un dato. Con estas consideraciones,
será necesario construir una M.T. localizadora de información cuya misión sea
buscar en esta colección de registros aquél que tenga una etiqueta determinada. Es
evidente que, conociendo el significado de los datos que hay en la cinta, el segundo
bloque de información (< q . . . qd >) constituye la etiqueta que es necesario buscar.
Una vez localizado el registro (transición) adecuado será necesario copiar el dato
(yy . . . yb) en el segundo bloque de la cinta, y modificar adecuadamente el primer
bloque. Básicamente, la M.T. Universal está constituida por una M.T. que localiza
información en la cinta y otra que copia información de una parte a otra de la cinta.
7.7. La M.T. como generadora de lenguajes

En los ejemplos de M.T. que hemos visto hasta ahora, éstas básicamente se ocu-
paban de reconocer lenguajes o de calcular funciones. Sin embargo, hay una tercera
forma de utilizar una M.T. y es como generadora de cadenas. Este tipo de M.T.’s
disponen de varias cintas de forma que en una de ellas llamada cinta de salida, ini-
cialmente vacı́a, sólo se llevan a cabo operaciones de escritura que van llenando la
cinta con las palabras del lenguaje. Es necesario utilizar un sı́mbolo, que no pertenece
al alfabeto sobre el que está definido el lenguaje, y que actúa como separador entre
una palabra y otra.
Por ejemplo, si se construyera una M.T. que generara el lenguaje formado por
todas las cadenas binarias y se utilizara como separador el sı́mbolo �, en un momento
determinado la información que habrı́a en la cinta de salida serı́a:
... b 0 � 1 � 0 0 � 0 1 � ...
Es evidente que este tipo de M.T.’s sólo para en el caso de que el lenguaje a
generar sea finito, por tanto, la máquina descrita en el ejemplo anterior no pararı́a
nunca.
Para los lenguajes de tipo 0, que se estudian con más detalle en el próximo tema,
siempre es posible construir una M.T. que los genere. Como veremos, dentro de este
Manuales Uex
conjunto de lenguajes existe un importante subconjunto que es el de los lenguajes

recursivos. En el caso de los lenguajes recursivos es posible construir una M.T. que
genere las palabras de dicho lenguaje en orden creciente de tamaños, es decir, el
tamaño de la palabra generada en la posición n + 1 es mayor o igual que el de la
119
generada en la posición n.
7.8. La tesis de Church-Turing

Podemos decir que una M.T. es un modelo general de computación y esto es
equivalente a decir que cualquier procedimiento algorı́tmico que sea ejecutable (por
una persona o una máquina) puede ser desarrollado por una M.T.
“La noción de procedimiento algorı́tmico que actúa sobre una secuencia de sı́mbo-
los es idéntica al concepto de un proceso que puede ser ejecutado por una M.T.” Esta
afirmación la formuló el lógico Alonzo Church a principios de la década de los 30 y
suele denominarse tesis de Church o tesis de Church-Turing. No es una afirma-
ción matemática exacta, ya que carecemos de una definición precisa para el término
procedimiento algorı́tmico y, por lo tanto, no es algo que pueda comprobarse. Sin
embargo esta tesis es aceptada de forma general, debido a diferentes motivos:
1. No se ha planteado ningún tipo de computo que pueda incluirse en la categorı́a

de procedimiento algorı́tmico y que no pueda ejecutarse en una M.T.
2. Se han propuesto mejoras al diseño de la M.T. original y en todos los casos

ha sido posible demostrar que el poder computacional de las M.T.’s no se veı́a
modificado.
3. Se han propuesto otros modelos teóricos de cómputo, que siempre son equiva-
lentes al de las M.T.’s
La tesis de Church-Turing no puede probarse de manera precisa debido justamente

a la imprecisión del término proceso algorı́tmico. Sin embargo, una vez adoptada esta
tesis, ya podemos darle un significado preciso al término: “un algoritmo es un proce-
dimiento que puede ser ejecutado por una M.T.” Esta definición nos proporciona
un punto de partida para analizar problemas que pueden o no resolverse con una
M.T. como veremos en los siguientes temas.
7.9. Problemas
7.1 Construir una M.T. que reciba como entrada dos cadenas de 1’s separadas por
el sı́mbolo � y que compruebe si tienen la misma longitud.
Manuales Uex
7.2 Construir una M.T. con tres pistas que reciba dos números binarios y que in-
dique cuál de los dos es mayor. Consideraremos que los datos están almacenados en
las dos primeras pistas y alineados a la derecha, es decir, los bits menos significativos
de ambos están situados en la misma columna. En la tercera pista se escribirá una
120
7.9. PROBLEMAS 121
G, una P o una I indicando respectivamente que el primer número es más grande,

más pequeño o igual que el segundo.
7.3 Construir una M.T. con tres pistas que sume dos números binarios. Considera-
remos que los datos están almacenados en las dos primeras pistas y alineados a la
derecha. El resultado se escribirá en la tercera pista que inicialmente está vacı́a.
7.4 Construir una M.T. para reconocer cada uno de los siguientes lenguajes
L1 = {0n 1n , n ∈ N}
L2 = {ww −1, w ∈ (0 + 1)∗ }
L3 = {wcw �/ w, w � ∈ (a + b)∗ w �= w � }
Manuales Uex
121
Tema 8
Gramáticas de tipo 0 y 1
Contenido
8.1. Gramáticas de tipo 0 . . . . . . . . . . . . . . . . . . . . . 123

8.2. Lenguajes de tipo 0 . . . . . . . . . . . . . . . . . . . . . . 124
8.3. El problema de la parada . . . . . . . . . . . . . . . . . . . 126
8.4. Lenguajes y gramáticas de tipo 1 . . . . . . . . . . . . . . 126
Este capı́tulo se dedica al estudio de las gramáticas menos restrictivas, las de tipo
0 y las de tipo 1. Los autómatas que reconocen estas gramáticas son las Máquinas de
Turing (estudiadas en el capı́tulo anterior) y los Autómatas Linealmente Acotados
respectivamente. La diferencia principal entre ambos autómatas está en el tamaño
de la cinta que utilizan. Mientras que la Máquina de Turing dispone de una cinta
teóricamente infinita, los Autómatas Linealmente Acotados utilizan una cinta finita,
aunque su longitud pueda ser tan grande como sea necesario en cada caso.
8.1. Gramáticas de tipo 0

Dentro de la jerarquı́a de Chomsky, el grupo más amplio de gramáticas, llamadas
gramáticas de tipo 0 y también gramáticas sin restricciones son aquellas cuyas pro-
ducciones tienen la siguiente forma:
u ::= v u ∈ Σ+ v ∈ Σ∗
además u = xAy donde A ∈ ΣN x, y ∈ Σ∗
Es decir, en la parte izquierda de las producciones hay, al menos, un sı́mbolo no
Manuales Uex
terminal.
Este conjunto de gramáticas es equivalente al de gramáticas con estructura de
frase, cuya definición es algo más restringida. Las producciones de las gramáticas con
estructura de frase son de la forma:
123
123
124 TEMA 8. GRAMÁTICAS DE TIPO 0 Y 1
xAy ::= xvy donde A ∈ ΣN x, y, v ∈ Σ∗
En estas gramáticas es posible que la parte derecha de la producción sea más

corta que la izquierda (cuando v = λ), en este caso se dice que es una producción
compresora. Una gramática compresora es la que tiene alguna regla compresora, en
este caso las derivaciones pueden ser decrecientes.
El conjunto de los lenguajes generados por las gramáticas de tipo 0 coincide
con el conjunto de los generados por las gramáticas con estructura de frase y se
llaman lenguajes recursivamente enumerables. Estos lenguajes son reconocidos
por Máquinas de Turing.
Ejemplo 8.1 La gramática de tipo 0 que se describe a continuación genera el lengua-

i
je L = {a2 } ΣN = {S, A, B, C, D, E} ΣT = {a}
 

 S ::= ACaB 


 


 Ca ::= aaC 


 

 CB ::= DB|E 
P = aD ::= Da

 


 AD ::= AC 


 


 aE ::= Ea 

 
AE ::= λ
Esta gramática no tiene estructura de frase (debido, por ejemplo, a la quinta y séptima
producciones), sin embargo es posible encontrar una gramática con estructura de frase
que sea equivalente a ella.
8.2. Lenguajes de tipo 0

Como ya sabemos, los lenguajes generados por las gramáticas de tipo 0 se llaman
lenguajes recursivamente enumerables y son los reconocidos por las Máquinas de
Turing. Pero, además, estos lenguajes también pueden ser generados por Máquinas
de Turing.
El nombre de recursivamente enumerables es debido a que sus palabras pueden ser
generadas ordenadamente por una Máquina de Turing. Dicho de otra forma, existe
un algoritmo que permite generar sus palabras una tras otra. Evidentemente, si el
lenguaje es infinito, la Máquina de Turing que lo genera no para nunca.
Manuales Uex
Este grupo de lenguajes incluye a algunos para los que no es posible saber si una
palabra no pertenece al lenguaje. Si L es uno de estos lenguajes, cualquier Máquina
de Turing que lo reconozca no parará cuando reciba como entrada algunas palabras
que no pertenecen a L. En este caso, si w ∈ L sabemos que la M.T. parará, pero si
124
8.2. LENGUAJES DE TIPO 0 125
la máquina no para, no podemos saber si el motivo es que la palabra no pertenece al

lenguaje o es que todavı́a no ha terminado el proceso de reconocimiento.
Teniendo en cuenta estas cuestiones es conveniente considerar un subconjunto de
los lenguajes recursivamente enumerables, a los que llamaremos lenguajes recur-
sivos, que son los aceptados por Máquinas de Turing que paran siempre, sea cual
sea la entrada que reciban. Por supuesto, la parada de la máquina debe ir precedida
por la aceptación o no de la palabra. En el caso de los lenguajes recursivos siempre
es posible diseñar una Máquina de Turing que genere las palabras del lenguaje según
un orden creciente de tamaño.
A continuación veremos unos resultados que, entre otras cosas, demuestran que
la unión es una operación cerrada para estos dos conjuntos de lenguajes.
Teorema 8.1
1. L es recusivo ⇐⇒ L y L son recursivamente enumerables
2. L es recursivo ⇐⇒ L es recursivo
3. L1 y L2 son recursivos =⇒ L1 ∪ L2 es recursivo
4. L1 y L2 son recursivamente enumerables =⇒ L1 ∪ L2 es recursivamente enume-

rable
Demostración.
1. Si L y L son recursivamente enumerables existen dos Máquinas de Turing M1

y M2 que reconocen respectivamente las palabras de L y L. A partir de M1 y
M2 es posible construir una nueva máquina M que se limitarı́a a anotar cuál de
las dos máquinas M1 o M2 acepta a la cadena de entrada. Evidentemente M
reconoce a L (y también a L) y además para, sea cual sea la entrada, por lo que
L (y también L) es un lenguaje recursivo. Si L no fuera recursivo, no podrı́amos
construir M, ya que tampoco podrı́amos construir M2 . M1 resulta insuficiente
para construir M, ya que, en el caso de que M1 no pare no es posible saber si la
máquina ha entrado en un bucle infinito o si necesita más tiempo para procesar
la cadena.
Si L es recursivo es evidente que también es recursivamente enumerable, además
podemos afirmar que L también es recursivamente enumerable ya que la M.T.
que reconoce a L también permitirı́a reconocer a L.
2. Si L es recursivo la misma M.T. que lo reconoce permite reconocer a L, basta

Manuales Uex
con intercambiar el significado de las salidas.
3. Si L y L son recursivos existen dos Máquinas de Turing M1 y M2 que reconocen

respectivamente las palabras de L y L. A partir de M1 y M2 es posible construir
125
una nueva máquina M que permita reconocer a las palabras de L1 ∪L2 . Además
esta máquina pararı́a siempre.
4. Si L y L son recursivamente enumerables existen dos Máquinas de Turing M1

y M2 que reconocen respectivamente las palabras de L y L. A partir de M1
y M2 es posible construir una nueva máquina M que permita reconocer a las
palabras de L1 ∪ L2 . No es posible asegurar que M parará cuando reciba como
entrada una palabra que no pertenezca a L1 ∪ L2 , ya que en ese caso es posible
que no paren ni M1 ni M2 . �
8.3. El problema de la parada

Dada una Máquina de Turing con un dato en la cinta de entrada, no existe ningún
algoritmo que permita conocer a priori si la máquina se detendrá o no. Este problema
es, por ese motivo, indecidible.
Este problema puede enunciarse de otra forma. Teniendo en cuenta que el conjunto
de las Máquinas de Turing puede enumerarse, es posible asociar a cada máquina un
número natural. ¿Es posible construir una Máquina de Turing H que tome como
datos de entrada al par (n, x) donde n representa a la máquina pn y x a un dato para
esa máquina, y devuelva 1 o 0 dependiendo de si la máquina pn para o no teniendo a
x como dato? La respuesta a esta pregunta es negativa, no es posible construir dicha
máquina.
Para demostrarlo utilizaremos la técnica de reducción al absurdo. Supongamos
que E es un lenguaje recursivamente enumerable pero no recursivo (sabemos que
existen). Sea M = pr la Máquina de Turing que reconoce a E, esta máquina no
para cuando recibe como entrada algunas de las palabras que no pertenecen a E. Por
hipótesis H deberı́a comportarse de la siguiente forma:
�
1 si M para con el dato α (esto ocurre si α ∈ E)
H(r, α) =
0 si M no para con el dato α (esto ocurre si α ∈
/ E)
De esta manera H permitirı́a reconocer las palabras del lenguaje E y además
pararı́a siempre, pero entonces E serı́a un lenguaje recursivo, lo cual es falso por
hipótesis. Por lo que podemos concluir que es imposible construir H.
8.4. Lenguajes y gramáticas de tipo 1

Manuales Uex
Las gramáticas de tipo 1 de la jerarquı́a de Chomsky, también llamadas gramáticas

dependientes (o sensibles) al contexto son aquellas cuyas producciones tienen la for-
ma:
126
8.4. LENGUAJES Y GRAMÁTICAS DE TIPO 1 127
xAy ::= xvy donde A ∈ ΣN x, y ∈ Σ∗ v ∈ Σ+

Es decir, en cada derivación, un sı́mbolo no terminal A se sustituye por una
cadena v (no nula), siempre que éste se encuentre en un determinado contexto. Se
puede incluir la producción S ::= λ, necesaria cuando λ pertenece al lenguaje. Es
evidente que el conjunto de las gramáticas de tipo 1 está incluido en el conjunto de
las gramáticas con estructura de frase y que no admiten producciones compresoras.
Los lenguajes de tipo 1 pueden ser reconocidos por Autómatas Linealmente Aco-
tados. Estos autómatas constituyen un caso particular de las Máquinas de Turing
en el que la cinta está acotada por ambos lados. Para ello, se definen dos sı́mbolos
de la cinta especiales (por ejemplo: < y >) que delimitan el principio y el final de
la zona útil de la cinta que puede ser manipulada. La cabeza de lectura/escritura
no podrá desplazarse más a la izquierda del sı́mbolo que indica el comienzo de dicha
zona útil ni más a la derecha del sı́mbolo que indica el final. Por tanto, los Autómatas
Linealmente Acotados disponen de una cinta finita pero con un tamaño que puede
ser tan grande como sea necesario para el proceso.
Manuales Uex
127
Tema 9
Computabilidad y Máquinas de
Turing
Contenido
9.1. Funciones calculables . . . . . . . . . . . . . . . . . . . . . 129
9.2. Funciones recursivas . . . . . . . . . . . . . . . . . . . . . . 131
9.3. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
En este tema abordaremos el concepto de computabilidad o calculabilidad que se

puede aplicar a aquellos problemas que pueden ser resueltos mediante un algoritmo.
A partir de la definición de máquina de Turing podremos plantear una definición
formal para este concepto. También estudiaremos el concepto de recursividad y su
relación con el de calculabilidad.
9.1. Funciones calculables

La Teorı́a de la Computabilidad parte de la idea inicial de hacer precisa la no-
ción intuitiva de función calculable, es decir, una función que pueda ser calculada
automáticamente mediante un algoritmo.
Dada una función f : Nr −→ N , a veces es posible construir una Máquina de
Turing Zf que se comporte como dicha función.
Es decir, si Zf inicia su funcionamiento con la siguiente información en la cinta
11
� ��. . 1� 0 �11 ��
. . . . 1� 0 . . . 0 11 . . . 1�, donde cada ristra de unos representa a un número
� ��
n1 n2 nr
Manuales Uex
natural, la máquina debe detenerse dejando en la cinta un número α de unos, siendo

f (n1 , n2 , . . . , nr ) = α.
Es posible que para una tupla concreta la máquina no se detenga, en ese caso la
función no estarı́a definida para esos valores.
129
129
130 TEMA 9. COMPUTABILIDAD Y MÁQUINAS DE TURING
Definición 9.1 (Función parcialmente calculable)

Se dice que una función f : D ⊂ Nr −→ N es parcialmente calculable si existe
una Máquina de Turing tal que para cada tupla t ∈ D, la máquina calcula f (t)
Definición 9.2 (Función calculable)

Se dice que una función es calculable si es parcialmente calculable y está definida
sobre todo Nr , es decir, D = Nr
Ejemplo 9.1 Funciones calculables y parcialmente calculables
1. f1 (n1 , n2 ) = n1 + n2 es calculable
2. f2 (n1 , n2 ) = n1 − n2 si n1 ≥ n2 es parcialmente calculable

�
n1 − n2 si n1 ≥ n2
3. f3 (n1 , n2 ) = es calculable
0 si n1 < n2
Las definiciones anteriores pueden ampliarse de forma natural a funciones definidas

sobre otros conjuntos, por ejemplo, definidas sobre cadenas de sı́mbolos. De esta for-
ma podemos establecer las siguientes relaciones entre lenguajes de tipo 0 y funciones
calculables o parcialmente calculables.
Dado un lenguaje L ⊆ Σ∗ , definimos su función caracterı́stica de la siguiente
forma:
fL : Σ∗ −→ N �
1 si w ∈ L
w −→ fL (w) =
0 si w ∈
/L
La función caracterı́stica de un lenguaje determina si una palabra pertenece o no
pertenece a dicho lenguaje. También es posible definir una función que sólo indique
si una palabra pertenece a un lenguaje, dicha función no estarı́a definida en todo el
dominio y se comportarı́a de la siguiente forma:
fL� : Σ∗ −→ N
w −→ fL� (w) = 1 si w ∈ L
Considerando estas definiciones, podemos afirmar que:
Manuales Uex
Si L es un lenguaje recursivo, su función caracterı́stica es calculable.
Si L es un lenguaje recursivamente enumerable, entonces es el dominio de una

función parcialmente calculable (fL� ).
130
9.2. FUNCIONES RECURSIVAS 131
Ejemplo 9.2 (Función no calculable) En este ejemplo no sólo presentaremos una

función no calculable sino también un lenguaje que no es recursivo y otro que ni
siquiera es recursivamente enumerable.
El conjunto de todas las Máquinas de Turing asociadas a funciones definidas de
N en N es infinito pero numerable, basta tener en cuenta que una M.T. cualquiera
puede describirse como una cadena finita de sı́mbolos (tal y como se explicó en la
definición de la Máquina de Turing Universal) ası́ como el método que Gödel propuso
para enumerar objetos que inicialmente no parecen ser enumerables (página 106).
Por tanto, podemos describir dicho conjunto de M.T.’s de la siguiente forma:
MT = {p0 , p1 , . . . , pn , . . .}
A partir de dicha lista de máquinas, podrı́amos definir la siguiente función:
f : N −→ N �
0 si pn no para con el dato n
n −→ f (n) =
k + 1 si pn para con el dato n y devuelve el valor k
Si suponemos que f es calculable, existe una Máquina de Turing que realiza el
mismo trabajo que f . Consideremos que pr sea esta máquina.
Si f (r) = 0 ⇒ pr no para con la entrada r
Si f (r) �= 0 ⇒ f (r) = k + 1 donde k es el resultado que devuelve la máquina pr
En cualquiera de los dos casos, la situación que se produce es absurda ya que f y
pr no tienen el mismo comportamiento, por lo tanto, la suposición inicial es falsa y
f no es una función calculable.
El conjunto L1 = {n ∈ N/ pn no para si recibe como dato a n} no es recursi-
vamente enumerable y además, el conjunto L2 = L1 es recursivamente enumerable
pero no es recursivo. Veamos, a continuación, como justificar estas afirmaciones. En
la sección 8.3 quedó demostrado que L1 no es un lenguaje recursivamente enume-
rable, ya que es imposible construir una M.T. que lo reconozca. Por otra parte,
L2 = {n ∈ N/ pn para si recibe como dato a n} es un lenguaje recursivamente enu-
merable porque la Máquina de Turing Universal permite saber si un número pertenece
a L2 y, por tanto, puede reconocer los elementos de L2 , sin embargo no es recursivo
ya que su complementario L2 = L1 no es recursivamente enumerable (teorema 8.1).
9.2. Funciones recursivas

Manuales Uex
La recursión consiste en definir un concepto en términos de si mismo. Esta idea

puede aplicarse a las definiciones de funciones, de conjuntos y, en particular, de
lenguajes.
131
A continuación veremos una primera definición de función recursiva.

Definición 9.3 (Función recursiva)
Una función f : Nn −→ N se considera recursiva si tiene los siguientes elementos:
Definiciones básicas que establecen de manera axiomática el valor que toma la
función para determinados valores del conjunto origen.
Por ejemplo, f act(0) = 1.
Una o más reglas recursivas que permiten calcular nuevos valores de la función
a partir de otros valores conocidos.
Por ejemplo, f act(n) = n × f act(n − 1), n≥1
Aplicar las definiciones básicas y las recursivas un número finito de veces debe
ser suficiente para calcular cualquier valor de la función.
A pesar de que esta definición es muy intuitiva no es lo suficientemente estricta
como para definir los casos más complejos de recursividad. Por este motivo, se in-
troducirán en las siguientes secciones, los conceptos de función recursiva primitiva y
función µ-recursiva.
Diremos que una función recursiva es total si está definida para todos los valores
del conjunto origen y parcial si lo está sólo para un subconjunto propio del conjunto
origen.
Para definir un conjunto de manera recursiva se especifican ciertos objetos del
conjunto y luego se describen uno o más métodos generales que permiten obtener
nuevos elementos a partir de los existentes.
Por ejemplo, podemos definir recursivamente el lenguaje Σ∗ ası́:
λ ∈ Σ∗
Para cada w ∈ Σ∗ y cada a ∈ Σ tenemos que aw ∈ Σ∗
9.2.1. Funciones recursivas primitivas

Es posible definir las funciones recursivas utilizando sólo funciones básicas y cier-
tas reglas que permiten mezclar funciones para construir otras más complejas.
Las funciones consideradas básicas (Kleene) son las siguientes:
Función constante 0 Su valor es independiente del argumento.
C(x) = 0, ∀x ∈ N
Manuales Uex
Función sucesor A cada número natural le hace corresponder su sucesor siguiendo

el orden habitual, de menor a mayor. Por ejemplo, S(5) = 6, S(22) = 23. Hay
que hacer notar que la suma no se ha definido formalmente, por eso no puede
ser utilizada en esta definición.
132
9.2. FUNCIONES RECURSIVAS 133
Funciones de proyección Reciben n argumentos y devuelven el argumento i-esimo,

es decir la proyección sobre la dimensión i. Pin (x1 , . . . , xn ) = xi
A continuación veremos dos reglas que nos permitirán construir funciones más
complejas a partir de las básicas.
Definición 9.4 (Regla de composición)

Dadas las siguientes funciones: α1 , . . . , αm , β definidas como
αi : Nn −→ N β : Nm −→ N
Se define la composición de estas m + 1 funciones como φ : Nn −→ N tal que,
φ(x1 , . . . , xn ) = β(α1 (x1 , . . . , xn ), . . . , αm (x1 , . . . , xn ))
Definición 9.5 (Regla de recursión primitiva)

Dadas dos funciones: α, β definidas como α : Nn −→ N β : Nn+2 −→ N
Se puede definir a partir de ellas, una nueva función φ : Nn+1 −→ N tal que,
φ(0, x1 , . . . , xn ) = α(x1 , . . . , xn )
φ(y + 1, x1 , . . . , xn ) = β(y, φ(y, x1, . . . , xn ), x1 , . . . , xn )

En el caso particular de que n = 0, φ se define ası́:
φ(0) = k
φ(y + 1) = β(y, φ(y))
Definición 9.6
Decimos que una función es recursiva primitiva si se puede definir a partir de las
funciones básicas mediante cero o más aplicaciones de las reglas de composición y de
recursión primitiva.
Aunque el número de funciones recursivas primitivas es muy amplio, existen al-
gunas funciones recursivas que no son primitivas. Un ejemplo es la función de Acker-
mann, que se define de la siguiente forma:
A(0, x) = x + 1
A(n + 1, 0) = A(n, 1)
A(n + 1, x + 1) = A(n, A(n + 1, x))
Manuales Uex
Por este motivo debemos incluir otra regla para la generación de funciones recur-
sivas que nos permitirá ampliar su número, de esta manera llegamos a la definición
de función µ-recursiva.
133
9.2.2. Funciones µ-recursivas

Para ampliar el número de funciones que podemos generar a partir de las funciones
recursivas primitivas, añadiremos una nueva regla de composición: la minimización.
Definición 9.7 (Regla de minimización)

Dada la función: α : Nn+1 −→ N se define la función de minimización
φ : Nn −→ N tal que,
φ(x1 , . . . , xn ) = min{y/α(x1 , . . . , xn , y) = 0 ∧ ∀z < y, φ(x1, . . . , xn , y)está definida}
En otras palabras, φ hace corresponder a cada entrada x el menor entero que cumple
que α(x, y) = 0.
Definición 9.8 (Función µ-recursiva)

Decimos que una función es µ-recursiva, o simplemente recursiva, si se puede definir
a partir de las funciones básicas mediante cero o más aplicaciones sucesivas de las
reglas de composición, recursión primitiva y minimización.
El concepto de recursividad está ı́ntimamente unido al de computabilidad, ya
que toda función computable es µ-recursiva. Además, el conjunto de las máquinas
de Turing es equivalente al de las funciones µ-recursivas. Es decir un problema se
puede resolver mediante máquinas de Turing si y sólo si se puede plantear utilizando
funciones recursivas.
9.3. Problemas
9.1 Define recursivamente las siguientes funciones:
1. La suma de dos números enteros
2. La multiplicación de dos números enteros
9.2 Define recursivamente los siguientes lenguajes:
1. L1 = {ww − 1/w ∈ (0 + 1)∗ }
2. L2 = {0n 1n /n ≥ 0}
3. Dado el alfabeto Σ = {i, (, ), +, −}, considera el lenguaje formado por expre-

siones aritméticas que pueden o no tener paréntesis. Por ejemplo:
Manuales Uex
(i + i), i + i, (i + i) − (i + i), etc.
9.3 Demuestra que las siguientes funciones son recursivas primitivas:
134
9.3. PROBLEMAS 135
1. La función constante K(x)= k
2. La función predecesor,
�
x−1 x>1
P (x) =
0 x=0
3. La función suma
4. La función producto
5. La función sustracción propia,

�
x−y x>y
sp(x, y) =
0 x≤y
6. La función sustracción absoluta, sa(x, y) = |x − y|
7. Las funciones máximo y mı́nimo
8. La función signo,
�
1 x>0
sg(x) =
0 x=0
Manuales Uex
135
Tema 10
Introducción a la Complejidad
Computacional
Contenido
10.1. Complejidad y Máquinas de Turing . . . . . . . . . . . . 137

10.2. Medidas de complejidad algorı́tmica . . . . . . . . . . . . 138
10.3. Problemas P, NP y NP-completos . . . . . . . . . . . . . 141
De entre todos los problemas que pueden plantearse, el conjunto de aquellos que
son computables, es decir, que pueden ser resueltos aplicando un algoritmo, es muy
pequeño. Sin embargo, no todos los problemas computables son factibles en la realidad
por requerir a veces demasiados recursos, ya sean de espacio de memoria o de tiempo.
La teorı́a de la complejidad algorı́tmica es la encargada de definir los criterios básicos
para saber si un problema computable es factible, dicho de otro modo, si existe un
algoritmo eficiente para su resolución y en este caso cuál es su grado de eficiencia.
10.1. Complejidad y Máquinas de Turing

Hasta este momento hemos analizado si los problemas son solubles o insolubles,
es decir, si pueden o no ser resueltos mediante una máquina de Turing (un algorit-
mo). Sin embargo, en la vida real los recursos de computo disponibles son limitados y
por tanto podemos encontrarnos con problemas que son solubles, pero que podemos
Manuales Uex
considerar intratables debido a la gran cantidad de tiempo y memoria que son ne-
cesarios para resolverlos. En esta sección introduciremos una terminologı́a que nos
permitirá analizar preguntas como ¿cuánto tiempo tardaremos en resolver un proble-
ma?
137
137
138 TEMA 10. INTRODUCCIÓN A LA COMPLEJIDAD COMPUTACIONAL
A priori, establecer un criterio universal para poder saber cuán eficiente es un

algoritmo no es sencillo porque un mismo problema puede resolverse sobre diferentes
tipos de máquinas, con diferentes grados de eficiencia. La eficiencia de un algoritmo
está en función del tiempo y de la cantidad de memoria que se necesite para ejecutar
el programa, y esto a su vez depende del hardware utilizado.
Sin embargo, la Máquina de Turing permite que nos liberemos de la mayor parte
de estas ligaduras materiales. Recordemos que al estudiar la Máquina de Turing no
se impuso ningún lı́mite de espacio ni de tiempo, es decir, la Máquina de Turing
no padece limitaciones en cuanto a la longitud de la cinta utilizada ni en cuanto al
número de movimientos que realiza (tiempo de ejecución). Por esta razón utilizaremos
la Máquina de Turing para medir la complejidad de un algoritmo.
10.2. Medidas de complejidad algorı́tmica

La complejidad de una computación se mide por la cantidad de espacio y de
tiempo que consume. Las computaciones eficientes tienen unas exigencias de recursos
pequeñas (este calificativo debe ser considerado de una manera relativa). Los recursos
que necesita una computación que acepta cadenas de algún lenguaje, suelen depender
del tamaño (longitud) de la cadena de entrada.
En los siguientes párrafos consideraremos, en primer lugar, los recursos espaciales
y después los temporales.
Si M es una máquina de Turing, denotaremos por L(M) al lenguaje que reconoce
dicha máquina.
Definición 10.1 (Complejidad espacial)
La máquina M con k pistas tiene una complejidad espacial S(n), si para cualquier
entrada de longitud n, consulta como máximo S(n) casillas. También podemos decir
que M es una Máquina de Turing espacialmente acotada por S(n), o que L(M) es un
lenguaje con complejidad espacial S(n).
Se cumple siempre que S(n) ≥ 1
Teorema 10.1
Si una Máquina de Turing con k pistas y cota espacial S(n) acepta al lenguaje L,
entonces existe una Máquina de Turing con una sola pista y cota espacial S(n) que
también lo acepta.
Es decir, el número de pistas de trabajo utilizadas para aceptar un lenguaje no
afecta a la complejidad espacial de L.
Manuales Uex
Definición 10.2 (Clases de complejidad espacial)

La familia de los lenguajes aceptados por Máquinas de Turing deterministas con
complejidad espacial S(n) se llama ESPACIOD(S(n)). La familia de los lenguajes
138
10.2. MEDIDAS DE COMPLEJIDAD ALGORÍTMICA 139
aceptados por Máquinas de Turing no deterministas con esa misma complejidad es-
pacial se llama ESPACION(S(n)). Estas clases se conocen como clases de complejidad
espacial.
Teorema 10.2
Sean S1 , S2 y S funciones de N en N. Supongamos que S1 (n) ≤ S2 (n), para todo n ∈
N, y que c > 0. Entonces se cumple:
1. ESPACIOD(S1 (n)) ⊆ ESPACIOD(S2 (n))
2. ESPACION(S1 (n))⊆ ESPACION(S2 (n))
3. ESPACIOD(S(n)) ⊆ ESPACION(S(n))
4. ESPACIOD(S(n)) = ESPACIOD(cS(n))
5. ESPACION(S(n)) ⊆ ESPACIOD(S(n)2 )
Aunque el espacio es un recurso importante de cualquier Máquina de Turing, el

tiempo de computación también lo es. Consideraremos que la complejidad temporal
se mide por el número de movimientos que hace la máquina.
Definición 10.3 (Complejidad temporal)

Supongamos que M es una máquina de Turing que realiza como máximo T(n) movimien-
tos sobre una cadena de longitud n, entonces se dice que M tiene una complejidad
temporal T(n) o que es una máquina con una cota temporal T(n). También se dice
que L(M) es un lenguaje temporalmente acotado por T(n).
Siempre se cumple que T(n) ≥ n+1 (ya que n+1 es el número mı́nimo de movimien-
tos necesarios para leer todos los sı́mbolos que inicialmente hay en la cinta)
Definición 10.4 (Clases de complejidad temporal)

La familia de los lenguajes aceptados por Máquinas de Turing deterministas con
complejidad temporal T(n), es TIEMPOD(T(n)). La familia de los lenguajes acep-
tados por Máquinas de Turing no deterministas con complejidad temporal T(n) es
TIEMPON(T(n)). Estas clases se conocen como clases de complejidad temporal.
Teorema 10.3
Sean T1 , T2 y T funciones de N en N. Supongamos que T1 (n) ≤ T2 (n), para todo n ∈
N . Entonces se cumple:
1. TIEMPOD(T1 (n)) ⊆ TIEMPOD(T2 (n))

Manuales Uex
2. TIEMPON(T1 (n)) ⊆ TIEMPON(T2 (n))
3. TIEMPOD(T(n)) ⊆ TIEMPON(T(n))
139
Teorema 10.4
Si L ∈ TIEMPOD(f(n)) entonces, L ∈ ESPACIOD(f(n))
Demostración. Supongamos que M es la Máquina de Turing que reconoce a L

y que realiza, como máximo, f (n) movimientos sobre la cadena de longitud n. Es
evidente que puede inspeccionar un máximo de 1 + f (n) celdas, por tanto, L ∈
ESPACIOD(f(n)+1) ⇒ L ∈ ESPACIOD(f(n)). �
Las funciones S(n) y T(n) que hemos utilizado no tienen porque ser una función
exacta, sino sólo un indicador de la forma de variación del espacio o del tiempo
ocupado, en función de la longitud de la entrada de datos. Habitualmente nos interesa
poder comparar estas funciones con otras (habitualmente más simples) de manera que
las tasas de crecimiento sean análogas.
Veamos a continuación la notación que se utiliza para comparar tasas de creci-
miento.
Definición 10.5
Sean dos funciones f, g : N → R. Se dice que:
f = O(g) si existen dos constantes C y k tales que ∀x ≥ k, f (x) ≤ Cg(x)
f = o(g) si para cada constante C, existe k tal que ∀x ≥ k, f (x) ≤ Cg(x)
f = θ(g) si f = O(g) y g = O(f )
La expresión f = O(g) quiere decir que para valores suficientemente grandes de

x, la función f (x) es menor o igual a una función proporcional a g. La constante de
proporcionalidad C puede ser muy grande de forma que el valor real de f (x) puede
ser mayor que g(x), sin embargo la tasa de crecimiento de f no es mayor que la de g.
Si f = θ(g) las dos funciones tienen la misma tasa de crecimiento, es decir, los
dos valores son aproximadamente equivalentes, con valores grandes de x.
Si f = o(g) la tasa de crecimiento de f es menor que la de g, es decir, f (x) será en
última instancia menor que g(x), pero no sabemos cuán grande tiene que ser x para
que esto ocurra.
Por ejemplo, si pretendemos estudiar la eficiencia de un algoritmo ejecutado por
una Máquina de Turing M, no existe una gran diferencia, a efectos prácticos, entre
que su tiempo de ejecución T(n) sea 14n2 + 25n − 4 o que sea 3n2 , ya que en ambos
casos podemos decir que su tasa de crecimiento no es mayor que la de n2 , es decir,
Manuales Uex
T = O(n2 ). Diremos que la máquina es de complejidad temporal n2 , o (n2 )-limitada

en el tiempo. Las funciones anteriores tienden (cuando n → ∞) a las ası́ntotas 14n2
y 3n2 respectivamente, que son funciones del tipo cn2 . Ası́ pues estamos hablando de
complejidad en términos asintóticos.
140
10.3. PROBLEMAS P, NP Y NP-COMPLETOS 141
Cuando queremos hacer referencia al crecimiento de los recursos necesarios para

la ejecución de un determinado algoritmo utilizaremos la notación O(f(n)), que re-
presenta su comportamiento asintótico. Ası́ un tiempo de ejecución 14n2 + 25n − 4,
se resume en que la complejidad del algoritmo es O(n2 ).
Los algoritmos cuya complejidad del tipo O(n), O(n2 ), O(n3 ), en general O(nc ),
se llaman algoritmos polinómicos, o de complejidad polinómica. Los algoritmos que
se comportan como 2n (en general cn ) son algoritmos exponenciales, o de complejidad
exponencial.
Otro aspecto diferente y muy importante dentro de la Teorı́a de la Complejidad
es el que se refiere, no a la complejidad del algoritmo, sino a la complejidad del
problema. Esto nos obliga a comparar todos los algoritmos posibles para resolver
un determinado problema. Se conoce como cota superior a la complejidad de un
problema a la complejidad del mejor algoritmo que se haya podido encontrar para
resolverlo. Es posible probar, a veces, que no existe algoritmo que pueda resolver un
determinado problema sin emplear como mı́nimo una cierta cantidad de recursos, a
la que se llama cota inferior.
10.3. Problemas P, NP y NP-completos

Diremos que un algoritmo es eficiente si existe una Máquina de Turing deter-
minista que lo ejecute con una complejidad temporal polinómica. A la clase de los
algoritmos (o de los problemas que estos algoritmos resuelven) eficientes se la deno-
mina clase P .
Existen algoritmos no deterministas que no siguen un flujo fijo, sino que actúan en
función de una serie de decisiones tomadas en tiempo real. De entre los algoritmos no
deterministas existe un amplio conjunto de ellos que pueden considerarse eficientes,
pero es indemostrable que estén en P, debido precisamente a que no son deterministas.
A esta clase de problemas se les llama NP.
Cualquier problema se puede plantear como un lenguaje formado por todas las
soluciones posibles para ese problema. Un algoritmo que reconozca al lenguaje tam-
bién servirá para resolver el problema. Por esta razón resulta equivalente considerar
que P y NP son clases de problemas o clases de lenguajes.
Definición 10.6 (Clases P y NP)

La clase P de lenguajes esta compuesta por todos los lenguajes que acepta alguna
Máquina de Turing determinista que tiene una cota temporal polinómica. La clase
NP se compone por todos los lenguajes que acepta alguna Máquina de Turing no
Manuales Uex
determinista con una cota temporal polinómica.
Un ejemplo de problema NP es el conocido problema de Hamilton: dado un con-

junto de puntos, ¿puede encontrase un camino que pase una sola vez por cada uno de
141
los puntos?. Un algoritmo determinista para resolver el problema es muy costoso, sin
embargo dada una posible solución, resulta muy sencillo comprobar que es válida.
En este terreno el problema principal que podemos plantearnos es el siguiente: ¿es
el conjunto NP igual al conjunto P? Este es el llamado problema P-NP, y todavı́a
no tiene solución. Es evidente que P ⊂ NP, pero para poder demostrar que la igualdad
se cumple habrı́a que demostrar que todo problema NP es también P, es decir, habrı́a
que encontrar una forma de transformar una Máquina de Turing no determinista con
cota temporal polinómica en una Máquina de Turing determinista con cota temporal
también polinómica. Por otro lado, tampoco se ha podido demostrar la desigualdad
entre los dos conjuntos, para ello habrı́a que encontrar un lenguaje que pertenezca a
NP y que no pertenezca a P.
Dentro de la clase NP hay un cierto número de problemas que pueden catalogarse
entre los más duros, en el siguiente sentido: si se encontrase un algoritmo de tiempo
polinómico para cualquiera de ellos habrı́a un algoritmo de tiempo polinómico para
todo problema en NP. Se dice que cualquier problema de esta categorı́a es NP-
completo.
Definición 10.7
Se dice que un lenguaje L1 es reducible en tiempo polinómico a un lenguaje L2 si hay
una función f computable en tiempo polinómico para la cual f(u) ∈ L2 sii u ∈ L1 .
Se utiliza la notación <p para indicar que L1 es reducible en tiempo polinómico
a L2 . Observar que si L1 <p L2 entonces determinar si w ∈ L1 no es más difı́cil
que determinar si f(w) ∈ L2 . Basándonos en la misma idea podemos decir que un
problema es reducible en tiempo polinómico a otro.
Definición 10.8 (Problemas NP-completos)
Un problema P ∈ NP es NP-completo si todos los demás problemas de la clase NP
se pueden reducir a él en tiempo polinómico.
Esta clase de problemas es importante porque si pudiéramos encontrar una solu-
ción en tiempo polinómico en una máquina de Turing determinista para un solo
problema NP-completo habrı́amos demostrado que P=NP.
Ejemplos de problemas NP-completos

SAT Dada una expresión lógica, por ejemplo: p ∧ (q ∨ ¬p), hay que determinar si es
posible satisfacerla, es decir, si es posible encontrar valores para los predicados
p y q que hagan que la expresión tenga un valor verdadero.
CV - cobertura de vértices Dado un grafo G con un conjunto de vértices V y un
Manuales Uex
conjunto de arcos E, y dado un número k, se trata de averiguar si existe un

subconjunto V’ de V, con no más de k elementos, tal que para todo arco de E
alguno de los nodos unidos por este arco pertenece a V’.
142
Apéndice A
Generadores automáticos de
analizadores léxicos y sintácticos
Contenido
A.1. Generador de analizadores léxicos . . . . . . . . . . . . . 143

A.2. Generador de analizadores sintácticos . . . . . . . . . . . 149
Existen herramientas que generan analizadores léxicos a partir de la definición de

una serie de expresiones regulares. Estos analizadores llevan a cabo el procesamiento
secuencial de una colección de caracteres de manera que al encontrar una cadena que
encaja con una de las expresiones definidas realiza las acciones que se hayan indicado
previamente. Internamente, los analizadores léxicos se comportan como Autómatas
Finitos que reconocen expresiones regulares. Los analizadores léxicos constituyen una
parte fundamental de cualquier compilador pero también pueden ser utilizados con
otros objetivos, por ejemplo, para modificar la estructura de un fichero de texto.
Análogamente, existen herramientas que generan analizadores sintácticos a partir
de la definición de una gramática independiente del contexto. Concretamente, generan
un reconocedor ascendente del tipo LR(1).
La utilización conjunta de ambas herramientas simplificará el proceso de diseño y
construcción de traductores para un determinado lenguaje formal. Esta será una de
sus principales aplicaciones en el ámbito de esta asignatura.
A.1. Generador de analizadores léxicos

Manuales Uex
Existen diferentes programas que, con un comportamiento similar, permiten ge-

nerar automáticamente analizadores léxicos. Entre los más utilizados están PCLEX,
LEX y FLEX, estos dos últimos son utilizados en entorno UNIX/LINUX. Todos ellos
143
143
144 APÉNDICE A. GENERACIÓN AUTOMÁTICA DE ANALIZADORES
traducen la descripción de un analizador léxico, realizada en un metalenguaje al que

llamaremos Lex, a un programa escrito en C. Utilizando las opciones adecuadas es
posible generar dicho programa escrito en otros lenguajes de alto nivel como C++,
Java, Pascal, etc.
Lex es un lenguaje de alto nivel de propósito especı́fico, diseñado para representar
expresiones regulares. Además, el código puede extenderse con secciones escritas en
C o en el lenguaje de programación correspondiente.
A.1.1. Cómo utilizar PCLEX

PCLEX se ejecuta en lı́nea de comandos, de la siguiente forma:
PCLEX [opciones] nombre fichero
nombre fichero es el nombre del fichero que contiene la especificación del anali-
zador léxico en Lex. Por claridad, se recomienda que el nombre de estos ficheros
tenga extensión .l. Por defecto se generará un fichero con el mismo nombre y con
extensión .c. Por ejemplo, si el fichero de entrada se llama ejemplo.l, el de salida se
llamará ejemplo.c.
Se pueden utilizar las siguientes opciones a la hora de ejecutar PCLEX:
-c el fichero de salida tiene el nombre yylex.c
-C<nom fichero> el fichero de salida tiene el nombre que indica
<nom fichero>
-h muestra una pantalla de ayuda
-i construye un analizador insensible a la diferencia
mayúsculas/minúsculas
-n suprime las directivas “#line” en el fichero de salida
-p<nom fichero> utiliza <nom fichero> como fichero esqueleto para cons-
truir el fichero de salida, en lugar de utilizar el fichero
por defecto
-s suprime la regla por defecto, es decir, las entradas que
no encajen con ninguna regla provocan la salida del pro-
grama con el mensaje : pclex scanner jammed
Los demás programas anteriormente mencionados se utilizan de forma similar
aunque el significado de las opciones puede variar.
A.1.2. Estructura de un programa Lex

Manuales Uex
Un programa Lex se divide en tres partes, cada una de ellas se separa de la

siguiente utilizando el delimitador % %. Es decir, el programa tendrı́a el siguiente
aspecto:
144
A.1. GENERADOR DE ANALIZADORES LÉXICOS 145
zona de definiciones
%%
zona de reglas
%%
procedimientos del programador
Zona de definiciones En esta parte del programa se pueden definir expresiones

regulares que se utilizarán posteriormente. También se pueden incluir todas las defini-
ciones en C que sean necesarias. Las definiciones en C, deberán ir encerradas entre
los delimitadores %{ y %}. Por ejemplo:
%{
#include "stdlib.h"
int x,y;
%}
Las definiciones de expresiones regulares, tendrán el siguiente formato:
nombre expresión regular

A partir de este momento cada vez que deseemos utilizar esa expresión podemos
hacerlo escribiendo su nombre entre llaves. En el siguiente ejemplo, se define una
expresión regular llamada digito, que representa a un dı́gito cualquiera y otra, llamada
entero, que representa a una colección de dı́gitos, o sea a un número entero y positivo:
digito [0 − 9]
entero {digito}+
Zona de reglas Cada regla está formada por una expresión regular seguida por
una serie de acciones (codificadas en C) que serán las que el analizador léxico ejecute
cuando encuentre una cadena de caracteres que encaje con la expresión regular. Por
ejemplo:
ab* {printf("hola");}
Procedimientos del programador En esta parte del programa se incluye el pro-

grama C que el usuario haya diseñado. En el caso más sencillo, en el que sólo se
desee generar un analizador léxico, el programa principal deberá incluir al menos una
llamada al procedimiento yylex. Es decir:
void main() {
Manuales Uex
yylex();
}
yylex es el procedimiento que actúa como analizador léxico y cuyo código C es
generado a partir de las especificaciones que aparecen en la zona de reglas. El
145
programa principal puede ser mucho más complejo e incluir todos los procedimientos
que se deseen.
A.1.3. Cómo representar una expresión regular

Para describir las expresiones regulares que pueden aparecer en la zona de defini-
ciones o en la zona de reglas, hay que seguir las siguientes normas:
La concatenación entre sı́mbolos se representa escribiéndolos uno junto a otro

sin utilizar ningún sı́mbolo especial. Por ejemplo:
int
char
while
representarı́an palabras reservadas de C.
El punto (.) es un comodı́n y representa a cualquier carácter (sólo a uno) del

código ASCII salvo a la marca fin de lı́nea (representada por \n). Por ejemplo:
a. representa a la letra a seguida por cualquier otro carácter.
Podemos utilizar los corchetes para representar la unión entre varios sı́mbolos
y el guión para representar un rango de valores:
[a-z] representa a cualquier letra minúscula
[Ff][Oo][Rr] representa a la palabra for escrita utilizando letras
mayúsculas o minúsculas (serı́a la manera de representar
palabras reservadas en un lenguaje como Pascal)
Las repeticiones de sı́mbolos, o de conjuntos de sı́mbolos, se pueden representar

utilizando diferentes operadores:
operador no de repeticiones ejemplo cadenas válidas
∗ 0, 1, . . . ab* a, ab, abb, . . .
+ 1, 2, . . . ab+ ab, abb, . . .
{n} n ab{3} abbb
{n,m} n, . . .,m ab{3,5} abbb, abbbb, abbbbb
? 0,1 ab? a, ab
Manuales Uex
La barra vertical (|) representa la unión entre expresiones regulares. Por ejem-
plo:
ab|cd representa a la cadena ab o a la cadena cd
146
A.1. GENERADOR DE ANALIZADORES LÉXICOS 147
Marcas de contexto Si utilizamos ˆ al comienzo de una expresión, ésta sólo se

tendrá en cuenta en el caso de que la cadena analizada esté al comienzo de una lı́nea.
Si utilizamos $ al final de una expresión, ésta sólo se tendrá en cuenta en el caso
de que la cadena analizada esté al final de una lı́nea.
Si utilizamos / entre dos expresiones, sólo se tendrá en cuenta la primera de ellas
en el caso de que aparezca seguida por la segunda. Ejemplos:
âb la cadena ab debe aparecer al comienzo de la lı́nea
ab$ la cadena ab debe aparecer al final de la lı́nea
ab/cd la cadena ab debe aparecer seguida por la cadena cd
Prioridades Los operadores que hemos visto tienen diferentes prioridades. Apare-
cen listados a continuación, de mayor a menor prioridad:
() paréntesis
[] unión entre sı́mbolos
*+?{} repeticiones
ee concatenación
| unión de expr. regulares
ˆ$ indicadores de contexto
A.1.4. Variables y procedimientos predefinidos

yylex() es el procedimiento principal a partir de las expresiones regulares definidas,
actúa como un analizador léxico.
yytext es una variable de tipo cadena de caracteres y almacena la cadena que acaba
de ser analizada por el scanner.
yyleng es una variable entera que almacena la longitud de yytext.
yyin, yyout son los nombres de los ficheros de entrada y de salida del analizador
léxico.
ECHO es una acción predefinida que escribe la cadena analizada en el fichero de

salida, por tanto, es equivalente a la instrucción
{fprintf(yyout," %s",yytext);}
Manuales Uex
REJECT hace que el scanner analice por segunda vez la misma cadena. En este
segundo análisis, la regla que contiene a REJECT no será tenida en cuenta.
147
A.1.5. Condiciones de comienzo

Las condiciones de comienzo se pueden activar o desactivar dependiendo de la
llegada de algún sı́mbolo o cadena de sı́mbolos. Existen dos tipos, las exclusivas y
las no exclusivas.
Se definen en la primera zona del programa utilizando las palabras reservadas %s, %S
o %Star para las no exclusivas, y %x para las exclusivas. Después deberán escribirse
los nombres de las condiciones que se vayan a utilizar. Por ejemplo:
%s nombre1 nombre2 . . .
Para activarlas se utilizará la acción BEGIN(nombre) y para desactivarlas BEGIN(0).
Se utilizan colocando su nombre, encerrado entre los sı́mbolos <>, delante de una
regla. Por ejemplo:
<nombre>ab* ECHO;
Esta regla sólo se tendrá en cuenta si la condición nombre está activa.
Las condiciones de comienzo exclusivas se caracterizan porque las reglas que no

llevan su nombre delante sólo se tienen en cuenta si la condición está desactivada. En
el caso de las condiciones no exclusivas, estas reglas se tienen en cuenta en cualquier
caso.
El siguiente ejemplo permite eliminar los comentarios del fichero de entrada.

Suponemos que existen dos tipos diferentes de comentarios, unos encerrados entre
llaves y otros entre (* y *).
%x coment1 coment2
%%
"{" BEGIN(coment1)
<coment1>"}" BEGIN(0)
"(*" BEGIN(coment2)
<coment2>"*)" BEGIN(0)
<coment1,coment2>. ;
A.1.6. Acciones
Cuando el analizador léxico encuentra una cadena de caracteres que encaja con
alguna de las expresiones regulares definidas, ejecuta las acciones asociadas a esta
expresión. Estás acciones pueden ser las predefinidas ECHO o REJECT, o cualquier
Manuales Uex
instrucción escrita en C. A continuación se describen algunas situaciones especiales:
Si los caracteres de la entrada pueden encajar con diferentes expresiones regu-

lares, se elegirá aquella que valide la cadena más larga.
148
A.2. GENERADOR DE ANALIZADORES SINTÁCTICOS 149
ab acción1
ab+ acción2
Teniendo en cuenta el ejemplo anterior, si en el fichero de entrada está incluida
la cadena abb se ejecutará la acción2, ya que la primera regla solo validarı́a 2
caracteres y la segunda validarı́a 3.
En el caso de que dos reglas diferentes validen cadenas de la misma longitud, se
elegirá la que aparezca en primer lugar. Por ejemplo, si la cadena hola aparece
en el fichero de entrada y se han definido las dos reglas siguientes:
hola acción1
[a-z]+ acción2
Se ejecutará la acción1 simplemente porque está escrita en primer lugar.
La acción que se ejecuta por defecto cuando un carácter (o cadena de caracteres)

no encaja con ninguna de las expresiones definidas, consiste en escribir dicho
carácter en el fichero de salida (yyout); salvo que se haya utilizado la opción -s
al ejecutar PCLEX.
Si detrás de una expresión regular sólo escribimos el sı́mbolo |, la acción aso-

ciada a esta expresión es la misma que la asociada a la siguiente. Los siguiente
ejemplos son, por tanto, equivalentes:
hola | hola acción
[a-z]+ acción [a-z]+ acción
Si detrás de una expresión regular sólo escribimos el sı́mbolo ; no hay ninguna

acción asociada a esta expresión, ni siquiera escribir la cadena validada en el
fichero de salida, podrı́a entenderse como no hacer nada.
A.2. Generador de analizadores sintácticos

Existen programas como YACC (Yet Another Compiler-Compiler), PCYACC o
BISON, este último para entornos LINUX, que permiten generar automáticamente
analizadores sintácticos de tipo LR(1), a partir de la definición de una gramática in-
dependiente del contexto descrita con una notación similar a la BNF(Backus Normal
Form).
Concretamente, se genera una función, llamada yyparse, que reconocerá progra-
mas escritos en el lenguaje definido por la gramática y detectará los errores si los
Manuales Uex
hubiera.
La función yyparse(), llama repetidamente al analizador léxico yylex() que
convierte cadenas de caracteres del fichero de entrada en sı́mbolos terminales de la
gramática (llamados tokens). Utilizando una terminologı́a anglosajona, al analizador
149
léxico se le denomina scanner y al sintáctico se le denomina parser. La forma

convencional por la que el scanner envı́a al parser información adicional sobre los
tokens es a través de la variable yylval. Por defecto esta variable es de tipo int pero,
como veremos, esto se puede cambiar.
A.2.1. Cómo utilizar PCYACC

PCYACC se ejecuta en lı́nea de comandos, de la siguiente forma:
PCYACC [opciones] nombre fichero
nombre fichero es el nombre del fichero que contiene la especificación de la gramática,

por claridad se recomienda que el nombre de estos ficheros tenga extensión .y. Por
defecto se generará un fichero con el mismo nombre y con extensión .c. Por ejemplo,
si el fichero de entrada se llama ejemplo.y, el de salida se llamará ejemplo.c.
Se pueden utilizar las siguientes opciones a la hora de ejecutar PCYACC:
-c el fichero de salida tiene el nombre yytab.c

-C<nom fichero> el fichero de salida tiene el nombre que indica
<nom fichero>
-d se genera un fichero cabecera llamado yytab.h
-D<nom fichero> se genera un fichero cabecera con el nombre que indica
<nom fichero>
-h muestra una pantalla de ayuda
-n suprime las directivas “#line” en el fichero de salida
-p<nom fichero> utiliza <nom fichero> como fichero esqueleto para cons-
truir el fichero de salida, en lugar de utilizar el fichero por
defecto (yaccpar.c)
-r informa durante la ejecución
-s genera vectores internos cuyos elementos son de tipo short
int
-S el programa se para después de realizar la fase de análisis
sintáctico
-t construye un árbol parser y lo almacena en el fichero yy.ast
-T<nom fichero> construye un árbol parser y lo almacena en el fichero
<nom fichero>
-v genera un fichero llamado yy.lrt con información sobre el
proceso y la tabla parser
Manuales Uex
-V<nom fichero> genera el fichero de la opción anterior pero con el nombre

<nom fichero>
Otros programas como YACC o BISON se utilizan de forma similar aunque el
significado de las opciones pueda variar.
150
A.2.2. Estructura de un programa para YACC

Un programa para YACC tiene la misma estructura que un programa para LEX.
Es decir, tiene tres partes, con el mismo significado que en el caso anterior.
1. En la primera parte, la zona de definiciones, se pueden incluir declaraciones
en C, de la misma forma que se hacı́a con LEX.
Además, es necesario realizar algunas definiciones que necesita conocer el par-
ser, para ello se utilizan palabras reservadas (todas comienzan por %).
La definición del sı́mbolo inicial de la gramática se realiza utilizando la
palabra reservada %start. Por ejemplo:
%start programa
La definición de los sı́mbolos terminales de la gramática se realiza utilizan-
do la palabra reservada %token. Por ejemplo:
%token NUMERO IDENTIFICADOR
2. En la segunda parte, la zona de las reglas, se describe la G.I.C. siguiendo la
siguiente notación:
El sı́mbolo : se utiliza para separar la parte izquierda de una producción

de la parte derecha.
Todas las reglas que tienen la misma parte izquierda se pueden separar con
el sı́mbolo |, sin necesidad de repetir la parte izquierda. Una colección de
producciones con la misma parte izquierda debe acabar con ;. Por ejemplo,
las siguientes definiciones son equivalentes:
lista var: lista var var lista var: lista var var
lista var: var |var
; ;
Los sı́mbolos de la gramática que no hayan sido declarados como tokens,
se considerarán sı́mbolos no terminales, excepto los caracteres simples,
encerrados entre comillas que también se consideran sı́mbolos terminales.
Por ejemplo: ’+’,’*’.
3. En la tercera parte del programa, procedimientos del programador es nece-
sario, como mı́nimo llamar al procedimiento yyparse(). También es necesario
que el programador defina la rutina yyerror. Esta rutina será llamada por el
analizador cada vez que encuentre un error sintáctico. Un ejemplo de definición
de yyerror puede ser:
Manuales Uex
void yyerror(char *s) {

printf(" %s"\n,s);
}
151
A.2.3. Gramáticas atribuidas

En ocasiones es necesario trabajar con información adicional sobre determinados
sı́mbolos de la gramática. Diremos que estos sı́mbolos tienen atributos. Esta informa-
ción se almacena en una variable predefinida llamada yylval que es de tipo YYSTYPE.
Como hemos comentado anteriormente, por defecto, ese tipo es int, pero en ocasiones
puede resultar útil cambiar su definición.
Este cambio en la definición de YYSTYPE se realiza en la zona de definiciones
y se puede llevar a cabo de diferentes formas. La más sencilla consiste en utilizar la
palabra reservada %union, de la siguiente forma:
%union {
int num;
char cadena[10];
}
Suponiendo que YYSTYPE ha sido definido según el ejemplo anterior, es nece-

sario especificar que sı́mbolos de la gramática van a tener atributos y de que
tipo van a ser. Esto se realiza con la palabra reservada %type. Por ejemplo:
%type <num> NUMERO expresion
%type <cadena> IDENTIFICADOR
En el caso de los sı́mbolos terminales, esto mismo se puede definir con %token.
Por ejemplo:
%token <num> NUMERO
%token <cadena> IDENTIFICADOR
En la parte derecha de una producción es posible insertar acciones escritas en

C que serán ejecutadas cuando el analizador sintáctico llegue a ese punto del
análisis. Estas acciones deberán ir encerradas entre llaves.
Cuando queramos utilizar los atributos asociados a algunos sı́mbolos de una
producción, utilizaremos $$, $1, $2, . . .
$$ es el atributo del sı́mbolo que aparece en la parte izquierda de la producción.
$1 es el atributo del primer sı́mbolo de la parte derecha, $2 el del segundo
sı́mbolo, etc. Por ejemplo:
expr:expr’+’expr {$$=$1+$2;}
Manuales Uex
A.2.4. Prioridad y asociatividad de operadores

YACC permite especificar la prioridad y la asociatividad de determinados sı́mbo-
los de la gramática (utilizados normalmente como operadores).
152
Utilizando las palabras reservadas %left, %right, %nonassoc, podemos definir

el tipo de asociatividad que tienen los sı́mbolos gramaticales. Además, la prioridad de
los sı́mbolos queda implı́cita al especificar su asociatividad. Los sı́mbolos que aparecen
en la misma lı́nea tienen la misma prioridad entre si, y la prioridad será más alta
cuanto más tarde(en el texto) haya sido definida la asociatividad. Por ejemplo:
%left ’+’, ’-’
%left ’∗’, ’/’
Estas definiciones indican que la suma y la resta tienen la misma prioridad, ambas
tienen asociatividad por la izquierda y, además, tienen una prioridad menor que la
multiplicación y la división.
Manuales Uex
153
Bibliografı́a
[1] Hopcroft J. E. y Motwani R. y Ullman J. D. Teorı́a de Autómatas, Lenguajes y

Computación. Pearson-Addison Wesley, 2008.
[2] Alfonseca E. y Alfonseca M. y Moriyón R. Teorı́a de Autómatas y Lenguajes

Formales. McGraw-Hill, 2007.
[3] Isasi P. y Martı́nez P. y Borrajo D. Lenguajes, Gramáticas y Autómatas. Un

enfoque práctico. Addison Wesley, 2001.
[4] Alfonseca M. y Sancho y Orga. Teorı́a de Lenguajes, Gramáticas y Autómatas.

Ed. Universidad, 1993.
[5] Martin J. Lenguajes Formales y Teorı́a de la Computación. McGraw-Hill, 2003.
[6] Brookshear. Teorı́a de la Computación. Lenguajes Formales, Autómatas y Com-

plejidad. Addison Wesley, 1993.
[7] Kelley D. Teorı́a Autómatas y Lenguajes Formales. Prentice Hall, 1995.
[8] Apple A. Modern Compiler Implementation in Java/C. Cambridge University

Press, 1998.
[9] Aho A.V. y Sethi R. y Ullman J.D. Compilers: Principles, Techniques and Tools.
Addison Wesley, 1986.
[10] Alfonseca y de la Cruz y Ortega y Pulido. Compiladores e Intérpretes: Teorı́a y

Práctica. Prentice-Hall, 2006.
Manuales Uex
155
155
Índice alfabético
Árbol de derivación, 21, 77 Complejidad

espacial, 138
Alfabeto, 15 temporal, 139
de entrada, 40 Concatenación
de sı́mbolos no terminales, 22 de un lenguaje, 18
de sı́mbolos terminales, 22 de una palabra, 16
Analizador
léxico, 11, 143 Derivación, 20
semántico, 12 directa, 20
sintáctico, 12, 149 Descripción instantánea
Atributos semánticos, 98 de un autómata de pila, 75
heredados, 99 de un reconocedor LR(1), 90
sintetizados, 99 de una máquina de Turing, 108
Autómata, 6 Desplazamiento, 88
conexo, 42
Ensamblador, 10
equivalente, 45
Estado
incompleto, 41 muerto, 41
minimización, 43 final, 40
de pila, 74 inicial, 40
finito determinista, 40 Expresión regular, 33
finito no determinista, 47
linealmente acotado, 127 Forma sentencial, 84
Función
Bombeo µ-recursiva, 134
lema para gr. de tipo 2, 94 calculable, 130
lema para gr. de tipo 3, 65 caracterı́stica de un lenguaje, 130
de transición, 40
Chomsky, 7 parcialmente calculable, 130
jerarquı́a de, 8, 24 recursiva, 134
Church-Turing, tesis, 120 recursiva primitiva, 133
Manuales Uex
Cierre
de Kleene, 18 Gödel, 6, 106
positivo, 19 Gramática, 6, 22
Compilador, 10 bien formada, 29
156
157
ÍNDICE ALFABÉTICO 157
equivalente, 26 NP-completo, 142

limpia, 28 Producción, 19
ambigua, 78 compresora, 20
atribuida, 98 de redenominación, 28
L-atribuida, 101 innecesaria, 27
S-atribuida, 100 no generativa, 28
compresora, 124 anulable, 83
con estructura de frase, 25, 123 con prefijos comunes, 81
dependiente del contexto, 25, 126 con recursividad por la izquierda, 81
independiente del contexto, 25, 74
lineal, 35 Reconocedor
LL(1), 85 ascendente, 87
LR(1), 92 descendente, 80
recursiva, 24 LL(1), 81
recursivamente enumerable, 24, 123 LR(1 ), 87
regular, 26, 35 Reducción, 88
Reflexión
Hilbert, 6 de un lenguaje, 19
Homomorfismo, 94 de una palabra, 17
Intérprete, 10 Sı́mbolo
Inversa de una palabra, 17 inaccesible, 27
no generativo, 27
Lenguaje, 6, 16 director
universal, 16 de una producción, 85
recursivamente enumerable, 124 del LR-item, 89
recursivo, 125 inicial
Lex, 143 de una cadena, 83
LR-item, 89 de una gramática, 22
seguidor, 84
Máquina de Turing, 107
Semántica, 97
universal, 118
Shannon, 7
Myhill-Nerode, teorema, 66
Sustitución, 94
Palabra, 16
Tabla
vacı́a, 16
de acciones, 88, 89
anulable, 83
de sı́mbolos, 13
Potencia
Turing, 6, 105
de un lenguaje, 18
Manuales Uex
de una palabra, 17 Unión de lenguajes, 17

Problema
de clase NP, 141 Yacc, 149
de clase P, 141
158

Teoriaautomatas y Len..

Cargado por

Copyright:

Formatos disponibles

Teoriaautomatas y Len..

Cargado por

Información del documento

Descripción original:

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Teoriaautomatas y Len..

Cargado por

Copyright:

Formatos disponibles

50

• Álgebra lineal y Geometría

Universidad de Extremadura. Servicio de Publicaciones

Edición electrónica: Pedro Cid, S.A.

El estudio de la teorı́a de autómatas y de los lenguajes formales se puede ubicar

los alumnos de Ingenierı́a Informática y de Ingenierı́a Técnica en Informática de Sis-

Elena Jurado Málaga

Perﬁles (y subperﬁles) profesionales de la titulación

I. Perﬁl Profesional de Desarrollo Software

Competencias Especı́ﬁcas de la Titulación (y perﬁles rela-

3. Comprender la responsabilidad social, ética y profesional, y civil en su caso, de

4. Concebir y llevar a cabo proyectos informáticos utilizando los principios y

5. Diseñar, desarrollar, evaluar y asegurar la accesibilidad, ergonomı́a, usabilidad

6. Deﬁnir, evaluar y seleccionar plataformas hardware y software para el desarrollo

7. Disponer de los fundamentos matemáticos, fı́sicos, económicos y sociológicos

8. Concebir, desarrollar y mantener sistemas y aplicaciones software empleando

9. Concebir y desarrollar sistemas o arquitecturas informáticas centralizadas o

10. Proponer, analizar, validar, interpretar, instalar y mantener soluciones informáticas

11. Concebir, desplegar, organizar y gestionar sistemas y servicios informáticos en

II. Objetivos. Competencias Especı́ﬁcas de la Ma-

2. El concepto de complejidad algorı́tmica se ha tratado en asignaturas como

3. La asignatura de Teorı́a de Autómatas y Lenguajes Formales debe sentar las

IV. Metodologı́a docente y plan de trabajo del es-

Tema 1. Preliminares (Objetivos: 1,7)

Explicación, discusión y ejempliﬁcación en clase(GG): 3h.

Tema 2. Lenguajes y Gramáticas Formales (Objetivos: 1,2)

Lectura y estudio (previo y/o posterior)(NP): 2h.

Tema 3. Expresiones y gramáticas regulares (Objetivos: 1,3,8,10,12,11)

Tema 4. Autómatas Finitos (Objetivos: 3,4,5,8,6,12,11)

Tema 5. Gramáticas Independientes del Contexto (GIC) y Autómatas de Pila

Tema 6. Gramáticas Atribuidas (Objetivos: 7,8,10,12,11)

Explicación de cuestiones y ejercicios relacionados con la teorı́a(GG): 2h.

Tema 7. Máquinas de Turing(MT) (Objetivos: 4,5)

Tema 8. Gramáticas de tipo 0 y 1 (Objetivos: 3)

Tema 9. Computabilidad y Máquinas de Turing (Objetivos: 13,14,15)

Tema 10. Introducción a la Complejidad Computacional (Objetivos: 16)

relacionados con el diseño de autómatas y gramáticas.

a) Deﬁnir formalmente un lenguaje.

b) Ser capaz de determinar el tipo al que pertenece un lenguaje.

2. Diseñar un lenguaje formal y construir, utilizando las herramientas adecuadas,

Actividades e instrumentos de evaluación

Examen ﬁnal Prueba de desarrollo escrito con 1 pregunta dirigida a la compren-

Seminarios y Tutorı́as ECTS Revisión y análisis del trabajo no presencial del

1. Revisión de ejercicios prácticos a realizar por el alumno durante los Semi-

2. Lenguajes y Gramáticas Formales 15

3. Expresiones y gramáticas regulares 33

3.2. Álgebra de las expresiones regulares . . . . . . . . . . . . . . . . . . . 34

5. G.I.C y Autómatas de Pila 73

6.3. Gramáticas S-atribuidas y L-Atribuidas . . . . . . . . . . . . . . . . . 100

7. Máquinas de Turing 105

8. Gramáticas de tipo 0 y 1 123

9. Computabilidad y Máquinas de Turing 129

10.Introducción a la Complejidad Computacional 137

A. Generación automática de analizadores 143

A.1.3. Cómo representar una expresión regular . . . . . . . . . . . . 146

En este primer tema de la asignatura pretendemos sentar las bases de la misma

1.1. Antecedentes históricos y conceptos básicos

jes Formales). Esta materia se ha desarrollado gracias a la conﬂuencia de campos

axiomáticos y los procesos computacionales.