Mecanica Cuantica UNED 2022 PDF

Mecánica Cuántica
Apuntes UNED
Departamento de Física Fundamental

Copyright © 2021, 2022, UNED
http://uned.es
Coordinador: Javier Rodríguez Laguna. Autores: José Enrique Alvarellos, Eva María Fer-
nández, Pablo García González, Javier García Sanz, Begoña Mula Martín.
Distribuido bajo licencia Creative Commons Attribution-NonCommercial 3.0. Este docu-

mento puede ser compartido y adaptado libremente, siempre que se atribuya correctamente
su autoría y no se emplee con fines comerciales.
http://creativecommons.org/licenses/by-nc/3.0.
Primera edición, Septiembre de 2021.

Segunda edición, Marzo de 2022.
Contenidos
Prólogo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
I Sistemas discretos
1 Mecánica cuántica en sistemas discretos . . . . . . . . . . . . . . . . . . . . . 11

1.1 Qué es un estado 11
1.2 Qué es un observable 21
1.3 Qué es medir 33
1.4 Evolución temporal 37
1.A Problemas 43
1.B Cálculo numérico en sistemas discretos 45
2 Matriz densidad y entrelazamiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

2.1 El formalismo de la matriz densidad 47
2.2 Información y termodinámica 52
2.3 Sistemas compuestos 55
2.4 Matriz densidad reducida y entrelazamiento 59
2.5 Medidas y estados mezcla 73
2.6 Medida y entrelazamiento 75
2.A Problemas 78
3 Tecnologías cuánticas de la información . . . . . . . . . . . . . . . . . . . . . . 81

3.1 Circuitos clásicos y cuánticos 81
3.2 Comunicación clásica y cuántica 86
3.3 Computación clásica y cuántica 89
3.4 Implementaciones físicas 99
3.A Problemas 100
Apuntes Mecánica Cuántica UNED 2022

II Sistemas continuos
4 Mecánica cuántica en sistemas continuos . . . . . . . . . . . . . . . . . . . . 103
4.1 Sistemas continuos 103
4.2 Traslación y Momento 110
4.3 Simetrías en Mecánica Cuántica 116
4.4 Rotaciones y Momento Angular 121
4.5 Ecuación de Schrödinger 126
4.A Problemas 132
5 Algunos sistemas cuánticos continuos . . . . . . . . . . . . . . . . . . . . . . . . 133

5.1 Repaso de los sistemas cuánticos básicos 133
5.2 Partícula en campo electromagnético 140
5.3 Teoría de colisiones 145
5.A Problemas 150
6 El límite clásico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153

6.1 La Acción Clásica y Cuántica 154
6.2 Aproximación semiclásica o WKB 156
6.3 Integración sobre Caminos 159
6.A Problemas 163
7 Mecánica cuántica relativista . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165

7.1 Ecuación de Klein-Gordon 166
7.2 Ecuación de Dirac 169
7.3 Hacia la teoría cuántica de campos 173
7.A Problemas 176
¿Y ahora qué? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179
Bibliografía . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
Libros 181
Artículos 182
Índice alfabético . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183

Prólogo
Este documento contiene el material básico de la asignatura Mecánica Cuántica, opta-

tiva del cuarto curso del Grado en Física en la UNED.
En las asignaturas Física Cuántica I y Física Cuántica II en el tercer curso del Grado se
han puesto las bases del formalismo y se han considerado algunas aplicaciones de la física
cuántica. En esta asignatura se avanza en el formalismo, enfatizando sus desarrollos más
recientes y preparando a los/as estudiantes para aplicaciones más sofisticadas a nivel de
máster, desde la física de la materia condensada a las tecnologías cuánticas o la física de
altas energías.
Al tratarse de un tercer cuatrimestre de Mecánica Cuántica, nuestro enfoque será más

formal y abstracto, mostrando siempre la correspondencia entre las sutilezas matemáticas
y las físicas. Al fin y al cabo, el libro de la Naturaleza está escrito en lenguaje matemático,
como dijo Galileo. El curso está dividido en dos partes. En la primera parte considerare-
mos los sistemas cuánticos discretos, es decir, formados por un número finito de estados
distinguibles, que nos servirán para repasar los conceptos básicos de Mecánica Cuántica
con un nivel de sofisticación superior, así como introducir conceptos nuevos esenciales: sis-
temas compuestos, matriz densidad y, sobre todo, el entrelazamiento. Terminaremos esa
primera parte con una introducción a las modernas tecnologías cuánticas basadas en el
entrelazamiento, con especial énfasis en la comunicación y la computación cuánticas.
La segunda parte aborda los sistemas cuánticos continuos, en los que el número de esta-
dos distinguibles es infinito. Tras repasar el formalismo, de nuevo a un nivel de sofisticación
más elevado, recorreremos los conceptos nuevos: la aplicación de los grupos de simetría, la
interacción de una partícula cuántica con el campo electromagnético, el límite clásico y la
suma sobre caminos y una introducción a la mecánica cuántica relativista que culminará
mostrando la necesidad de construir una teoría cuántica de campos.
Cada parte está dividida en capítulos, cada uno de los cuales termina con una colección
de problemas. Los párrafos en letra pequeña marcados con una letra C denotan comen-
tarios, notas al pie que pueden omitirse en una primera lectura, pero que esperamos que
ayuden a los/as estudiantes a mejorar su perspectiva sobre la asignatura. Al final de cada
sección hay un breve resumen con los resultados más importantes. No hace falta recordar
a estudiantes de cuarto curso que no basta con conocer el contenido de los resúmenes para
dominar la asignatura.
Para abordar esta asignatura con éxito, el/la estudiante debe tener bien asentados
los conocimientos que se adquieren en las dos asignaturas previas de Física Cuántica,
que se imparten en el tercer curso del Grado. También tiene que estar perfectamente
familiarizado/a con los contenidos de Álgebra Lineal y de Análisis Matemático, con la

6
resolución de ecuaciones diferenciales ordinarias y con los fundamentos de la teoría de

funciones de variable compleja. Además, debe conocer bien la estructura de los espacios de
Hilbert y manejar con soltura suficiente la transformada de Fourier (conceptos que se han
estudiado en las asignaturas de Métodos Matemáticos, y que se han utilizado extensamente
en Física Cuántica I y II).
Dado que es prácticamente imposible que estas notas estén libres de erratas, se ruega a
los/as estudiantes que usen el foro específico del Curso virtual de la asignatura para advertir
de las mismas a sus compañeros y al equipo docente. Por ello, invitamos a participar
activamente en el curso virtual, y a publicar en los foros soluciones o demostraciones
alternativas, o comentarios críticos a las soluciones de los problemas presentados en este
Material.
Por último, deseamos mencionar que estos apuntes son el resultado de la colaboración
de muchas personas que han formado parte del equipo docente de la asignatura en el
pasado, algunos de los cuales ya no están entre nosotros. Deseamos dedicar un recuerdo
especial al profesor Javier García Sanz, y destacar el esfuerzo de los profesores José Enrique
Alvarellos y Pablo García González. La presente compilación ha sido llevada a cabo por el
actual equipo docente: Eva María Fernández, Begoña Mula y Javier Rodríguez Laguna.
Madrid, 23 de junio de 2021.

El Equipo Docente.

7
Existe una gran variedad de libros de texto que cubren el material de esta asignatura, si
bien no existe ninguno que lo haga por completo. Recomendamos vivamente a los/as estu-
diantes a que se familiaricen con la literatura, tanto en libros como en artículos científicos.
Cada tema tendrá sus recomendaciones específicas, pero aquí queremos presentar una rela-
ción breve de textos básicos en Mecánica Cuántica en los que profundizar los conocimientos
adquiridos.
T. Banks, Quantum mechanics: an introduction, CRC Press (2019). Un enfoque mo-
derno, muy completo y próximo a la investigación contemporánea.
C. Cohen-Tannoudji, B. Liu, F. Laloë, Quantum mechanics, Wiley interscience (1977).
Aunque es algo antiguo, es un libro especialmente didáctico, con muchos ejemplos resueltos.
Recientemente se ha publicado un tercer volumen que trata el tema del entrelazamiento.
L.E. Ballentine, Quantum mechanics: a modern development, World Scientific (1998).
Un libro didáctico que pone un especial énfasis en el problema de la medición.
R. Shankar, Principles of quantum mechanics, Plenum Press (1994). Proporciona una
introducción muy interesante al formalismo, límite clásico, simetrías, WKB y teoría cuán-
tica relativista.
P. García González, J.E. Alvarellos, J.J. García Sanz, Introducción al formalismo de
la mecánica cuántica, Cuadernos de la UNED (2007). Proporciona un valioso refuerzo del
marco matemático de la mecánica cuántica.
L. de la Peña, Introducción a la mecánica cuántica, Fondo de Cultura Económica (2006).
Uno de los libros de mecánica cuántica más completos en lengua castellana. Algo heterodoxo
en temas de interpretación. Contiene gran cantidad de problemas resueltos.
M.A. Nielsen, I.L. Chuang, Quantum information and quantum computation, Cambrid-
ge Univ. Press (2000). Aunque centrado en información y computación cuántica, ofrece una
exposición muy interesante de la matriz densidad y el entrelazamiento, con muchos ejem-
plos resueltos.
M. Le Bellac, A short introduction to quantum information and quantum computation,
Cambridge Univ. Press (2006). Una exposición sencilla de los temas de información y
computación cuántica.
También podemos recomendar estos libros a nivel divulgativo o histórico:

R.P. Feynman, Electrodinámica cuántica: la extraña teoría de la luz y la materia, Alian-
za Universidad (2004). Una introducción maravillosa a la integral de camino, que cubre
esa parte del tema 6.
R.P. Feynman, Física, volumen III, Addison Wesley (2000). Aunque fuera inicialmente
un libro dirigido a estudiantes de primeros cursos, en la práctica es a partir de este nivel
cuando se puede apreciar su increíblemente rico nivel teórico.
A.D. Aczel, Entrelazamiento, Ed. Crítica (2004). Un libro ameno que introduce muchos
conceptos modernos con perspectiva histórica.
L. Susskind, A. Friedman, Quantum Mechanics, the theoretical minimum, Basic Books
(2014). Parte del conocido “mínimo teórico” de Leonard Susskind, una gran introducción
a los conceptos básicos de la mecánica cuántica.
J.S. Bell, Speakable and unspeakable in quantum mechanics, Cambridge Univ. Press
(2004). Colección de artículos clave en la creación de la moderna visión de la mecánica
cuántica. Hay traducción al castellano, J.S. Bell, Lo decible y lo indecible en mecánica
cuántica, en Alianza Editorial.
Asimismo recomendamos seguir ciertos foros de divulgación científica, tales como el
canal de Youtube del Instituto de Física Teórica (UAM-CSIC), en el que colabora parte
de este equipo docente.

I
Sistemas discretos
1 Mecánica cuántica en sistemas discretos . . . 11

1.1 Qué es un estado
1.2 Qué es un observable
1.3 Qué es medir
1.4 Evolución temporal
1.A Problemas
1.B Cálculo numérico en sistemas discretos
2 Matriz densidad y entrelazamiento . . . . . . . . . . 47

2.1 El formalismo de la matriz densidad
2.2 Información y termodinámica
2.3 Sistemas compuestos
2.4 Matriz densidad reducida y entrelazamiento
2.5 Medidas y estados mezcla
2.6 Medida y entrelazamiento
2.A Problemas
3 Tecnologías cuánticas de la información . . . . 81

3.1 Circuitos clásicos y cuánticos
3.2 Comunicación clásica y cuántica
3.3 Computación clásica y cuántica
3.4 Implementaciones físicas
3.A Problemas
1. Mecánica cuántica en sistemas discretos
Nuestra inmersión en la mecánica cuántica se inicia con los sistemas más sencillos, es
decir, los que pueden ser descritos mediante un número finito de estados distinguibles.
Solemos llamarlos sistemas discretos. ¿Y cuáles serán estos sistemas? Pues la variedad es
enorme: estados de espín o de polarización, orbitales ocupados o vacíos o estados confi-
guracionales de una molécula. De hecho, este curso subiremos un peldaño en la escala de
abstracción y, en muchos casos, consideraremos que estos estados son arbitrarios. Cuando
sean dos, sean los que sean, hablaremos de un qubit, en analogía con los bits clásicos.
¿Y qué sistemas son los que dejamos fuera en esta primera parte? Pues aquéllos en
los que los estados distinguibles forman un continuo, en los que tenemos en principio una
cantidad infinita no numerable de estados distinguibles, tales como las posibles posiciones
de una partícula en el espacio.
Sorprendentemente, el estudio de sistemas discretos no es tan restrictivo como parece
a primera vista. Los cálculos reales en mecánica cuántica, como en el análisis de moléculas
o electrones en sólidos, se realizan con mucha frecuencia limitando el conjunto de estados
a un sistema discreto. Además, muchas de las propiedades más fascinantes de la mecánica
cuántica pueden ilustrarse con mayor facilidad sobre sistemas discretos, como es el caso
del entrelazamiento. Por último, los cálculos detrás de las modernas tecnologías cuánticas
están basados con frecuencia sobre sistemas discretos.
Este tema recorre contenidos ya conocidos de Física Cuántica I y II, pero mostrados
con un grado mayor de madurez: qué es un estado, qué es un observable, qué es medir y
cómo se describe la evolución temporal de un estado cuántico.
1.1 Qué es un estado

En esta primera sección aprenderemos a describir matemáticamente los estados posi-
bles de un sistema cuántico como vectores de un espacio de Hilbert, e introduciremos las
nociones de distinguibilidad y fidelidad. También repasaremos algunos ejemplos relevantes
de sistemas cuánticos.
1.1.1 Estados distinguibles

Cuando consideramos un nuevo sistema físico es conveniente empezar describiendo los
estados diferentes en los que puede hallarse, es decir, debemos identificar el conjunto de
estados posibles del sistema. Por ejemplo, los estados posibles de un péndulo clásico forman
un continuo parametrizado por un único grado de libertad, que es el ángulo que forma el
hilo con la vertical.
C La elección del espacio de estados siempre implica un cierto grado de aproximación.

Así, por ejemplo, describir el péndulo a través de un ángulo desprecia la posibilidad

12 Capítulo 1. Mecánica cuántica en sistemas discretos
de que el hilo se estire o se curve. Es decir: siempre hay grados de libertad que
suponemos congelados, y que no afectan a la dinámica.
Si nuestra descripción del sistema es clásica asumimos que todos los estados del mismo
son distinguibles. Pero cuando la descripción es cuántica no siempre lo son. ¿Qué queremos
decir con este término? Diremos que dos estados de un sistema son distinguibles si existe
un aparato que los distingue con certeza en un solo experimento.
C En física es siempre conveniente dar definiciones operacionales de los términos, es

decir, basadas en el resultado de experientos factibles, al menos en principio. Es la
mejor forma de evitar discusiones confusas.
Llamaremos espacio de configuraciones de un sistema, Ω, a cualquier conjunto ma-

ximal de estados distinguibles. Con maximal queremos decir que no cabe ningún estado
distinguible más. En física clásica todos los estados son distinguibles, de manera que el
espacio de estados coincide con el espacio de configuraciones. Pero, como veremos a con-
tinuación, la mecánica cuántica considera la posibilidad de que existan estados que no
puedan ser distinguidos entre sí con certeza.
Veamos algún ejemplo clásico, para comenzar. El espacio de configuraciones de una
moneda caída sobre el suelo es el más pequeño concebible, pues consta sólo de dos opciones
discretas: cara y cruz. Escribiremos que Ω = {Cara, Cruz}. De la misma manera, el espacio
de configuraciones de un péndulo se puede describir matemáticamente como Ω = [0, 2π),
aunque más propiamente deberíamos decir que Ω = S 1 , es decir, la esfera de dimensión 1
o circunferencia.
Y ahora procedamos a dar nuestro primer ejemplo realmente cuántico. El estado de
polarización de un fotón es un vector unitario ~u en la dirección del campo eléctrico, que
debe ser perpendicular a la dirección de propagación. Así, de manera ingenua, podríamos
pensar que Ω = S 1 , al igual que con el péndulo. Sin embargo, ese razonamiento es errado
porque esos infinitos estados no son distinguibles. Veamos por qué.
Un polarizador es un aparato que deja pasar fotones cuyo estado de polarización coincide
con un determinado eje y aniquila los fotones cuyo estado de polarización sea perpendicular
a él. ¿Y qué ocurre con los demás fotones? Pues pese a todos los esfuerzos realizados no
hemos conseguido una descripción determinista que nos permita entender lo que sucede
con ellos. Nuestra mejor descripción es probabilista: si lanzamos un fotón cuyo vector po-
larización es ~u1 a través de un polarizador cuyo eje apunta en la dirección ~u2 , éste pasará
con una probabilidad P = |~u1 · ~u2 |2 = cos2 θ, donde θ es el ángulo formado por los dos
vectores.
Pero recordemos que la definición de distinguibilidad exige certezas. Así concluimos que
dos estados de polarización sólo son distinguibles si son ortogonales. En ese caso existe un
aparato (el polarizador) que distingue los dos tipos de fotones con certeza: pasa o no pasa,
no hay medias tintas. Podemos, por tanto, conjeturar que el espacio de configuraciones
para la polarización de un fotón es discreto.
C ¿No podría existir un aparato desconocido que distinga con certeza entre todos los
ángulos de polarización? Por supuesto. La física es una ciencia, y la ciencia avanza
siempre sobre certezas parciales. Hasta donde sabemos, la física de la polarización se
describe en base a dos estados distinguibles.
C Consideremos dos estados de polarización que forman, entre sí, 45º. Por tanto, la
probabilidad de confundirlos es cos2 (45) = 1/2. Uno podría pensar que se pueden

distinguir repitiendo el experimento muchas veces. Es cierto: si realizamos 100 ex-

perimentos tratando de diferenciarlos, en torno a la mitad de ellos dirán que son el
mismo y la otra mitad dirán que no. Eso significa, claro, que no son el mismo estado.
Pero eso no implica que los estados sean distinguibles, ya que la distinguibilidad debe
poder ser determinada con certeza y en un solo experimento.
Dada una dirección de propagación, la polarización de un fotón sólo puede estar en

dos estados distinguibles. ¿Qué dos estados elegir? Da exactamente igual, mientras sean
ortogonales. Elijamos dos, los que sea, y llamémoslos eje X y eje Y . Pero esto nos crea una
duda. Supongamos que una observadora, Alicia, afirma que el espacio de configuraciones
para la polarización de un fotón está compuesto por dos estados, Ω = {X, Y }, mientras
que su colega Beatriz ha elegido otros dos ejes ortogonales diferentes, Ω = {X 0 , Y 0 }. ¿Sería
eso posible? Claro. Esto nos lleva a concluir que los estados distinguibles que usamos
para describir el espacio de configuración pueden variar, pero su estructura será siempre la
misma.
1.1.2 Principio de superposición

La mecánica cuántica (MQ) nos proporciona una regla para construir el espacio
de estados a partir del espacio de configuraciones, Ω = {a1 , a2 , · · · , an }. Construimos un
espacio vectorial complejo, H = Cn , de dimensión n, y llamamos ~ai al i-ésimo vector
de la base canónica, A = {~ai }ni=1 . La relación entre la estructura física y la estructura
matemática viene establecida a través del principio de superposición, que dicta que
todos los estados posibles del sistema cuántico se pueden representar como vectores de H,
es decir, todo estado tiene la forma
n
X
~u = u1~a1 + u2~a2 + · · · + un~an = ui~ai , (1.1)
i=1
donde los ui ∈ C suelen denominarse componentes del vector. No existe ningún estado
posible que no sea representable en esta forma. La expresión (1.1) es la base para construir
toda la MQ, pero la reescribiremos empleando la notación de Dirac. Cada vector se
escribe en forma de ket. Así, la base canónica pasa a ser |a1 i, |a2 i, etc. El conjunto de
estos estados se denominará una base: A = {|ai i}ni=1 , y representamos el estado genérico
como
n
X
|ui = u1 |a1 i + u2 |a2 i + · · · + un |an i = ui |ai i , (1.2)
i=1
donde los ui ∈ C pueden seguir llamándose componentes, pero también serán denominados
amplitudes de probabilidad por razones que veremos después. En cualquier caso, los kets no
son más que vectores. La notación de Dirac tiene alguna ventaja sobre la notación usual de
álgebra lineal, pero, con franqueza, la diferencia más notable es que nos permite reconocer
los libros de MQ con sólo abrirlos.
Hemos dicho que todo estado físico posible es representable como un ket con la forma
(1.2). Pero cabe preguntarnos: ¿dos vectores (kets) diferentes siempre representan estados
diferentes? La respuesta es no. Si dos vectores (kets) son proporcionales diremos que re-
presentan el mismo estado físico: |ui y K |ui (con K ∈ C) son vectores diferentes, pero
representan al mismo estado. Es decir: los estados físicos se corresponden con las direccio-
nes del espacio vectorial H. En términos matemáticos diremos que el espacio de estados
tiene naturaleza proyectiva.

C ¿Y por qué números complejos? ¿No podría construirse la mecánica cuántica úni-
camente con números reales? En principio, sí, pero sería mucho más complicada y
menos elegante. Hablaremos más de ello a lo largo del tema.
1.1.3 Fidelidad y detectores

Hagamos un breve repaso de los espacios vectoriales reales. En geometría, para poder
medir longitudes y ángulos entre vectores debemos dotar a nuestro espacio vectorial H con
un producto escalar, que es una función que toma dos vectores y nos devuelve un número
real (es decir, una función H × H 7→ R) lineal en ambos argumentos (es decir, bilineal).
Precisamente debido a esa linealidad conocemos el producto escalar entre dos vectores
cualesquiera cuando conocemos el producto escalar entre todas las parejas de vectores
de la base. Elijamos la base con inteligencia, por ejemplo, haciendo ~ai · ~aj = δij , que es
la definición de unaPbase ortonormal. Entonces tendremos que el producto escalar entre
~u = i ui~ai y ~v = i vi~ai , donde ui y vi ∈ R, viene dado por ~u · ~v = i,j ui vj (~ai · ~aj ) =
P P
ui vj δij = i ui vi . De aquí llegamos a definir la norma de cada vector, k~uk2 = ~u · ~u =

P P
i,j
i ui .
P 2
La desigualdad de Cauchy-Schwarz, |~u · ~v | ≤ k~ukk~v k nos permite definir el coseno del

ángulo que forman ~u y ~v ,
~u · ~v
cos(~u, ~v ) = , (1.3)
k~uk k~v k
Un espacio vectorial de dimensión finita con producto escalar es un espacio de Hilbert,
y ésta es precisamente la estructura que necesitaremos para poder describir los estados de
un sistema cuántico (discreto).
C Es muy notable que la geometría euclídea, que se desarrolló para describir el espacio
tridimensional en el que nos movemos, constituya una estructura útil para describir
un mundo tan alejado de ella como la mecánica cuántica. Cuando David Hilbert desa-
rrolló su geometría abstracta estaba convencido de que no tendría ninguna aplicación
práctica. La verdad es que es complicado que un área de las matemáticas no termine
siendo aplicada en física.
Pero falta un aspecto importante: en MQ necesitamos un espacio de Hilbert complejo,

es decir, los coeficientes permitidos en las combinaciones lineales son números complejos,
ui y vi ∈ C, y el producto escalar es una función H × H 7→ C. Eso nos lleva a una
diferencia importante en la estructura del producto escalar, que en matemáticas pasa a
llamarse producto hermítico (en física lo llamamos también producto escalar). En términos
formales, las propiedades que debe cumplir todo producto hermítico que se precie son
Linealidad en el segundo argumento, ~u · (α~v + β w)
~ = α~u · ~v + β~u · w,
~
Conjugación, ~u · ~v = (~v · ~u)∗ y
Ser definido positivo, ~u · ~u ≥ 0.
En una base ortonormal se calcula como
X
~u · ~v = u∗i vi . (1.4)
i
donde u∗i denota el complejo conjugado de ui , y vemos que cumple las tres propiedades
definitorias. Sobre todo, ~u · ~u = k~uk2 , que debe ser necesariamente real para poder ser
interpretado como una longitud.

C En matemáticas se clasifican los espacios en función de las estructuras que impone-

mos sobre ellos. Un espacio vectorial es aquél en el que podemos sumar elementos
entre sí y multiplicarlos por números de un determinado cuerpo (los complejos, en
nuestro caso). Un espacio de Hilbert requiere además un producto escalar que nos
permita definir longitudes y ángulos. Además hay otra restricción técnica: deben po-
der tomarse límites de sucesiones de manera razonable. Esta última propiedad tendrá
relevancia en la segunda parte del curso, cuando tratemos con espacios de dimensión
infinita. Existen otros tipos de espacios, con menos estructura. Así, por ejemplo, un
espacio topológico es aquél en el que podemos definir vecindades con sentido.
• • •
Volvamos a la MQ y a nuestra notación de Dirac. El producto escalar entre dos estados

|ui y |vi, se denotará por hu|vi. Consideremos dos estados propiamente normalizados (como
será siempre el caso). Entonces, |hu|vi|2 se interpreta físicamente como la fidelidad entre
ellos, es decir, la probabilidad de confundirlos. Para cualquier estado se debe cumplir que
|hu|ui|2 = 1, porque todo estado de seguro se confunde consigo mismo. Si los estados
son distinguibles, debemos tener hu|vi = 0, es decir: la distinguibilidad física se traduce
como ortogonalidad matemática. De esta manera entendemos que un conjunto maximal de
estados distinguibles Ω = {ai } se traduce en una base ortonormal del espacio de Hilbert:
. En ese caso, todo estado se puede escribir como i i i i y |vi =
P
ha
Pi j|a i = δij |ui = u |a
i vi |ai i, y así
X
hu|vi = u∗i vi , (1.5)
i
y su módulo al cuadrado |hu|vi|2 se corresponde con el coseno al cuadrado del ángulo

que forman y con su fidelidad, la probabilidad de confundir estos estados en un único
experimento. También llamaremos a veces a la fidelidad F(u, v), pero no será lo más usual.
C Esta idea de confundir estados requiere algo más de explicación. Consideremos que
nos piden construir un aparato que nos permita detectar el estado |ui y ningún otro.
El aparato debe decir SÍ cuando lo aplicamos sobre un sistema cuántico que está
en el estado |ui, y NO si está en cualquier otro estado |vi 6= |ui. ¿Es eso posible?
La respuesta es no. Lo mejor que podemos conseguir cuando lo aplicamos sobre un
estado arbitrario |vi es que el aparato responda SÍ con una probabilidad |hu|vi|2 .
• • •
Existe una manera alternativa de considerar el producto escalar que nos resultará de
mucha utilidad. Dado un vector ~u definimos su dual o adjunto, Fu , como una forma, es
decir, una función lineal que toma vectores y devuelve números (complejos, si es menester).
Es decir, si ~u ∈ H, Fu : H 7→ C, de tal manera que Fu (v) = ~u · ~v .
De la misma manera, dado un estado, |ui, definimos su dual, adjunto o bra asociado hu|
como una forma, es decir, una función lineal que, cuando actúa sobre un ket cualquiera, |vi,
nos devuelve el producto escalar de ambos, hu|vi, o bra-ket 1 . ¿Y cuál es su interpretación
física? Un bra es un detector de estados. El bra hu| sirve para encontrar al estado |ui. Si
aplicamos el bra hu| a distintos estados nos da cero cuando el estado sobre el que actuamos
1
Sí, es un chiste. Sí, es horrible.

es distinguible de |ui y uno cuando hemos dado con el mismo |ui. En casos intermedios,
nos da valores complejos intermedios que nos informan sobre la medida en la que se parece
el estado al estado deseado, |ui.
Recordemos que, por ser un producto hermítico, se cumple necesariamente que hu|vi =
hv|ui∗ , y justamente por ello hu|ui = hu|ui∗ es siempre real.
1.1.4 Ejemplos de sistemas cuánticos discretos

Ejemplo 1.1 Consideremos el estado de polarización de un fotón que se propaga en la
dirección del eje Z. El espacio de configuraciones es Ω = {X, Y }, es decir, polarización hori-

zontal y vertical, para dos ejes ortogonales y perpendiculares a la dirección de propagación.
Un estado arbitrario será
|Ψi = α |Xi + β |Y i , (1.6)
con α, β ∈ C y |α|2 + |β 2 | = 1. Si α y β son reales, entonces estamos denotando un vector

del plano, que apunta en la dirección real de polarización. √
Pero,√¿qué ocurre si son números complejos? ¿Cómo podemos entender que α = 1/ 2
y β = i/ 2, por ejemplo? En ese caso la polarización es circular. Veamos por qué. Con-
sideremos un campo eléctrico en forma de onda plana que viaja a lo largo del eje Z. En
notación compleja,
E0,x ei(kz−ωt+φx )
   iφx 
e cos θ
~ r) = E0,y ei(kz−ωt+φy )  = E0 ei(kz−ωt)  eiφy sin θ  ,
E(~ (1.7)
0 0
donde E0,x = E0 cos θ y E0,y = E0 sin θ, y φx y φy son los desfases de cada una de las
componentes. Las componentes X e Y de ese último vector se denominan vector de Jones√de
√ y se corresponden con α y β en nuestro problema. Tenemos que cos θ = 1/ 2,
polarización,
sin θ = 1/ 2, de manera que θ = π/4. Asimismo, eiφx = 1 y eiφy = i, así que podemos
tomar φx = 0 y φy = π/2, y nos quedan ambas componentes desfasadas π/2 radianes,
dando lugar a una polarización circular.
Ejemplo 1.2 Consideremos ahora un espín 1/2. Es decir, el estado de espín de una
única partícula (por ejemplo, un electrón), haciendo abstracción de sus grados de libertad
espaciales. En este caso, los experimentos de Stern-Gerlach muestran que los estados dis-
tinguibles, a diferencia de la polarización fotónica, se corresponden a direcciones opuestas.
Por ejemplo, podemos elegir como estados distinguibles Z+ y Z− , así que Ω = {Z+ , Z− }.
Estos estados suelen escribirse a veces como + y −, o como ↑ y ↓. Así, un estado arbitrario
puede escribirse como
|Ψi = α |Z+ i + β |Z− i = α |+i + β |−i = α |↑i + β |↓i . (1.8)
La matemática del espín 1/2 es intrigante: estamos usando dos estados para representar
una dirección en tres dimensiones. ¿Cómo es eso posible? Los experimentos de Stern-
Gerlach nos dicen que si preparamos un espín 1/2 apuntando en la dirección del eje X+ y
otro apuntando en la dirección Z+ , ambos pueden confundirse con una probabilidad 1/2.
Es decir,
|hX+ |Z+ i|2 = 1/2. (1.9)

Pero el eje X+ no tiene nada de especial, así que debe ser cierto que |hY+ |Z+ i|2 = 1/2, e
incluso que |hX+ |Y+ i|2 = 1/2, e igual con X− , Y− y Z− , por supuesto. Vamos a demostrar
que necesitamos números complejos para representar esta situación.
Una posibilidad que nos garantiza que la fidelidad entre X+ y Z+ sea 1/2 es
1
|X+ i = √ (|Z+ i + |Z− i) , (1.10)
2
es decir: para un espín 1/2, apuntar a la derecha significa apuntar hacia arriba y hacia
abajo a la vez. Pero, ¿qué será apuntar hacia la izquierda? Recordemos que ese estado debe
ser distinguible de apuntar a la derecha, es decir: hX+ |X− i = 0. Proponemos entonces
1
|X− i = √ (|Z+ i − |Z− i) . (1.11)
2
Estos estados son ortogonales. Vamos por buen camino. ¿Y qué sucede con el eje Y+ y Y− ?
Pues no tendrían cabida sin hacer uso de números complejos. Proponemos
1
|Y+ i = √ (|Z+ i + i |Z− i) ,
2
1
|Y− i = √ (|Z+ i − i |Z− i) , (1.12)
2
Y podemos comprobar que se cumple que |hY+ |Z+ i|2 = |hY+ |Z− i|2 = 1/2. Un poco de
álgebra nos convencerá de que también se cumple que |hY+ |X+ i|2 = |hY+ |X− i|2 = 1/2.
Ejemplo 1.3 Llamaremos un qubit a cualquier sistema cuántico de dos estados, repre-
sentando uno de ellos por 0 y el otro por 1, en analogía con los bits (binary digits) que se
usan en computación. Un estado de un qubit será
|Ψi = α |0i + β |1i . (1.13)
El término análogo para tres estados es qutrit, y en general se llama qudit al cualquier
sistema cuántico con pocos estados, cuando va a ser empleado de manera abstracta. Sin
embargo, estos últimos términos son mucho menos empleados.
Ejemplo 1.4 Un sistema de espín 1 genérico está caracterizado por tres estados distin-
guibles. Una vez fijado un eje, pongamos el eje Z, existen estados con espín hacia arriba,
nulo o hacia abajo, que llamaremos |Z+ i, |Z0 i y |Z− i y que escribiremos como |+i, |0i y
|−i si el eje está claro. En general, un sistema de espín j tendrá como estados distinguibles
|Z−j i , · · · , |Z+j i, a lo largo del eje Z.
Cabe preguntarse qué sucede en otros ejes. En el caso de espín 1 tendremos siempre
tres estados, sea cual sea el eje seleccionado, pero la comparativa entre estados en uno y
otro eje será pospuesta hasta la sección próxima.
Ejemplo 1.5 Desde el punto de vista de las interacciones nucleares, el protón y el neutrón
pueden considerarse como dos estados de la misma partícula, que meramente se diferencian
en su isospín, que tiene propiedades análogas al espín 1/2. Por convención diremos que el
protón tiene isospín +1/2 y el neutrón −1/2. Asi, un nucleón es en realidad un sistema de
dos estados, |pi y |ni, distinguibles cuánticamente, y puede existir en cualquier combinación
lineal de ambos.

Ejemplo 1.6 La molécula de NH3 a baja energía puede existir en dos estados configura-
cionales. Los tres hidrógenos están en el mismo plano, que consideraremos el plano XY ,
y el nitrógeno puede estar localizado en su posición de equilibrio en el eje Z+ o en el
Z− . Ambos estados son distinguibles, pero el estado cuántico de la molécula es puede ser
descrito mediante una combinación lineal de ambos.
Ejemplo 1.7 Consideremos una cadena de n átomos fijados en posiciones equiespaciadas,
y un electrón que puede ocupar el orbital 1s de cada uno de ellos. Si los átomos no están
demasiado cerca entre sí, es legítimo asumir que el electrón situado en el átomo i-ésimo
es un estado distinguible del electrón situado en el átomo j-ésimo, si i 6= j. Es decir,
Ω = {1, 2, · · · , n}, y representamos el estado a través del índice del átomo sobre el que está
el electrón. Un estado arbitrario se puede escribir como una combinación lineal de esos
estados:
n
X
|Ψi = Ci |ni . (1.14)
i=1
Este electrón estará, en general, deslocalizado, y tendrá una probabilidad de ser encontrado
sobre el átomo i dada por probabilidad de ser confundido con el estado |ii, es decir,
Pi = |hi|Ψi|2 = |Ci |2 .
Por ejemplo, si Ci = δi,1 , entonces el electrón está totalmente localizado en el primer
átomo. Y si Ci = n−1/2 para todo i, entonces el electrón está totalmente deslocalizado, con
la misma probabilidad de ser encontrado en todos los átomos: Pi = |hi|Ψi|2 = |Ci |2 = 1/n.

1.1.5 Cambios de base

Como hemos visto, el espacio de configuraciones nunca es único. Por ejemplo, en el caso
de un espín 1/2, Ω = {Z+ , Z− }, pero también podríamos haber hecho Ω = {X+ , X− }, o
en cualquier otra dirección. El espacio de configuraciones elegido nos determina la base
ortogonal del espacio de Hilbert que vamos a emplear para expresar los estados cuánticos.
Diferentes elecciones de estados distinguibles nos darán lugar a diferentes bases ortogonales,
y es importante saber trasladar nuestros resultados de una a otra.
Consideremos dos observadoras, Alicia y Beatriz, que han elegido espacios de configu-
ración diferentes. ¿Pueden aún comparar sus expresiones para los estados? Por supuesto,
pero deben hacer uso de ciertas matrices de cambio de base. Sea A = {|ai i} la base de
Alicia, y B = {|bi i} el de Beatriz. Ambas observan el mismo estado cuántico |Ψi, que se
expresa de maneras diferentes en ambas bases:
n
X n
X
|Ψi = αi |ai i = βj |bj i . (1.15)
i=1 j=1
Las componentes de ambas, {αi } y {βj } se denominan amplitudes de probabilidad debido

a que sus módulos al cuadrado son probabilidades. El mismo estado, por tanto, tiene
diferentes representaciones en diferentes bases. En una analogía lingüística, el vector sería
como un concepto abstracto (por ejemplo, una casa) y las representaciones serían sus
expresiones en distintas lenguas: house, maison, Haus, casa, etc. Supongamos que nos
dan la representación de un vector en una cierta base y deseamos traducirla a otra base
diferente. Para ello debemos formar nuestro diccionario, es decir, expresar cada estado de la

primera base como combinación lineal de los elementos de la segunda. Por ejemplo, Alicia
expresa sus estados en la base de Beatriz y los escribe de la siguiente forma,
|a1 i = U11 |b1 i + U21 |b2 i + · · · + Un1 |bn i

..
.
|an i = U1n |b1 i + U2n |b2 i + · · · + Unn |bn i (1.16)
o, en forma resumida,
n
X
|ai i = Uji |bj i . (1.17)
j=1
¿Cómo puede Alicia determinar este diccionario, es decir, los coeficientes Uji ? Tomemos la
primera ecuación y multipliquémosla por la izquierda por el bra hb1 |. Obtenemos
hb1 |a1 i = U11 hb1 |b1 i + U21 hb1 |b2 i + · · · + Un1 hbn |b1 i, (1.18)
pero recordemos que los estados {|bi i} son distingibles, es decir, ortogonales: hbi |bj i = δij .
Así, todos los términos de la derecha son nulos salvo el primero,
hb1 |a1 i = U11 , (1.19)
y por eso es importante la amplitud de probabilidad, no sólo la probabilidad. Razonando

de la misma manera concluimos que
hbi |aj i = Uji . (1.20)
Insertando las expresiones (1.16) en la ecuación (1.15) llegamos a
X X X XX X
αi |ai i = αi Uji |bj i = αi Uji |bj i = βj |bj i , (1.21)
i i j j i j
y de ahí deducimos que
X
βj = Uji αi , (1.22)
i
En notación matricial,
β~ = U α
~, (1.23)
y comprobamos que la matriz U traduce las amplitudes de Alicia al lenguaje de Beatriz.

¿Y si queremos proceder al revés? Necesitaremos una matriz V tal que
α ~
~ = V β, (1.24)

pero echando un vistazo a la ecuación (1.20) se nos ocurre que la solución no debe ser
difícil:
Vij = haj |bi i = hbi |aj i∗ = Uji

∗
. (1.25)
Claramente, aplicar las dos matrices de cambio de base sucesivamente es lo mismo que no
hacer nada, U V = V U = I, donde I es la identidad. De aquí deducimos que las matrices
de cambio de base cumplen
U U † = U † U = I, (1.26)
donde U † denota la matriz hermítica conjugada de U , es decir: transpuesta y compleja con-

jugada, (U † )ij = Uji
∗ . Las matrices que cumplen la ecuación (1.26) se denominan matrices
unitarias. En otros términos: su inversa es su hermítica conjugada.
C Los cambios de base pueden ser confusos: la misma matriz U que nos sirve para
transformar los estados de Alicia en estados de Beatriz, ec. (1.17), también nos sirve
para transformar las componentes de Beatriz en componentes de Alicia, ec. (1.23). La
razón intuitiva es sencilla: si yo me muevo hacia la izquierda, todos los objetos desde
mi perspectiva se mueven hacia la derecha. La transformación que realizamos sobre
una base es la inversa de la que realizamos sobre las componentes de los vectores
expresados en ella. Ante un problema práctico recomendamos que no se aprenda de
memoria ninguna de estas expresiones, sino que se exprese el cambio de base entre
los vectores (antiguos en función de nuevos es siempre lo más útil) y que a partir de
ahí se obtenga la transformación entre las componentes de los vectores.
Ejemplo 1.8 Consideremos de nuevo los estados de espín 1/2 y tres bases distintas de
entre todas las posibles: {|X+ i , |X− i}, {|Y+ i , |Y− i}, {|Z+ i , |Z− i}. Veamos si podemos
escribir la matriz que traduce las amplitudes X a amplitudes Z. Partamos de un estado
único, que escribimos en las tres bases,
|Ψi = αz |Z+ i + βz |Z− i = αx |X+ i + βx |X− i = αy |Y+ i + βy |Y− i , (1.27)
Conociendo la expresión de los estados |X± i en función de los |Z± i, usando las ecuaciones
(1.10) y (1.11) podemos escribir

hZ+ |X+ i hZ+ |X− i 1 1 1
UX→Z = =√ , (1.28)
hZ− |X+ i hZ− |X− i 2 1 −1
y esta matriz puede ser usada así:

αx αz
UX→Z = . (1.29)
βx βz
En el caso del eje Y tenemos, usando

hZ+ |Y+ i hZ+ |Y− i 1 1 1
UY →Z = =√ . (1.30)
hZ− |Y+ i hZ− |Y− i 2 i −i

Es fácil comprobar que ambas son unitarias.

Veamos un ejemplo de uso. La base Y está compuesta por los estados |Y+ i y |Y− i,
expresados como los vectores2 de la base canónica (1, 0)T y (0, 1)T . Al actuar sobre cada
uno de esos vectores con UY →Z obtendremos las componentes de esos estados en la base
Z:

1 1 1
UY →Z =√ , (1.31)
0 2 i
es decir: |Y+ i = √1 (|Z+ i

2
+ i |Z− i).
C Es preciso distinguir estado, ket, vector y componentes o amplitudes de probabilidad.

Un estado es siempre algo físico, que es representado matemáticamente mediante un
ket o un vector (a veces, también se dice vector de ondas o función de ondas), que
son objetos matemáticos que viven en un espacio de Hilbert. Este vector tiene una
representación en cada base posible, con unas ciertas componentes o amplitudes de
probabilidad. Por abuso de lenguaje, a veces llamaremos vector a lo que en rigor es
la representación de un vector en una base.
Resumen 1.1. Todo estado cuántico puro se puede representar como un vector o ket
normalizado de un espacio de Hilbert complejo H. El espacio de Hilbert se construye
escogiendo un conjunto completo de estados físicos distinguibles y asignando a cada uno
un vector de una base ortogonal. Llamaremos fidelidad entre dos estados a la probabi-
lidad de confundirlos, que está dada por el cuadrado de su producto escalar, |hΦ|Ψi|2 .
Sean A = {|ai i} y B = {|bi i} dos bases ortogonales,P y sean {α Pi } y {βi } las com-
ponentes de un mismo vector en ambas bases, |ψi = αi |ai i = j |bj i. La matriz
βP
Uij = hbi |aj i transforma los vectores de B en vectores de A, |ai i = j Uji |bj i y las
componentes en A a componentes en B, es decir, βi = j Uij αj . Es una matriz unitaria
P
U U † = U † U = I.
1.2 Qué es un observable

La descripción matemática de los observables cuánticos es complicada, puesto que con-
ducen al uso de operadores de distintos tipos sobre espacios de Hilbert, y no es fácil
comprender por qué necesitamos operadores para describir observables. En este capítulo
introduciremos los observables de una manera más constructiva, que nos permitirá alcanzar
un grado de abstracción más elevado sin perder el contacto con la física.
1.2.1 Descripción física

Hacer física es trabajar con observables: longitudes, tiempos, energías, momentos an-
gulares, etc. Un observable es una pregunta que podemos hacer a un estado, a la que se
responde a través de una magnitud representable como un número real. En mecánica clási-
ca, un observable se representa matemáticamente como una función que mapea los estados
en los números reales. La MQ nos obliga a un mayor nivel de sutileza conceptual. Si hace-
mos una pregunta a un estado, éste puede responder de manera aleatoria. Por ejemplo, al
2
Usaremos la notación (a1 , a2 , · · · )T para denotar el vector ~a porque es lo más riguroso, pero deseamos
recordar que no siempre se emplea.

medir la energía de un estado, el resultado varía de un experimento al siguiente, y hasta

el momento no hemos averiguado ninguna receta para saber con certeza qué valor vamos a
obtener. Sin embargo, las probabilidades con las que se obtiene cada valor son conocidas,
y vamos a tratar de comprender de dónde surgen.
Afortunadamente, cada observable tiene asociada una serie de estados en los que la
respuesta es segura, no está sujeta a ningún tipo de aleatoriedad. Lógicamente, esos estados
deben ser distinguibles entre sí, así que estarán representados por vectores ortogonales
del espacio de Hilbert. Los llamaremos estados propios o autoestados del observable, y
los emplearemos para caracterizarlos. Un observable de un sistema físico de dimensión n
está completamente caracterizado cuando tenemos una lista de n autoestados junto con
los valores que toma en ellos, que denominaremos autovalores o valores propios, y que
constituye su espectro.
• • •
Un observable, Â, viene especificado por una base ortogonal de autoestados {|ai i}ni=1
con su conjunto de autovalores asociados, {ai }. Cuando se mide Â sobre el estado |ak i la
respuesta es ak con certeza. ¿Y qué sucede cuando medimos un observable sobre un estado
que no es uno de sus autoestados? Eso queda para la siguiente sección, y constituye el
conocido problema de la medida.
Ejemplo 1.9 Consideremos el observable asociado a la componente Z del momento an-
gular de una partícula de espín 1/2, que llamaremos Ŝz . Si el estado es Z+ , el valor del
observable Ŝz es +~/2, con certeza. Y si el estado es Z− , el valor del observable será −~/2,
también con certeza. Dichos estados son necesariamente distinguibles, ya que la medición
de Ŝz los distingue con certeza. Por lo tanto, sus vectores asociados en el espacio de Hilbert
deben ser ortogonales. En efecto, hZ+ |Z− i = 0. Sin embargo, si elegimos como observable
la componente X del momento angular de la misma partícula, los estados propios son X+
y X− , y sigue cumpliéndose que hX+ |X− i = 0.
Como vemos, diferentes observables tienen diferentes vectores de respuesta segura, es

decir, diferentes autovectores. Eso es lo que hace el trabajo en mecánica cuántica más
complicado, pero también más divertido.
C Es importante destacar que no todas las cosas que podemos medir en el laboratorio son
observables. La posición, velocidad, energía, momento angular, espín, carga eléctrica,
etc. lo son. Pero el tiempo, por ejemplo, no es un observable en el formalismo que
estamos describiendo, sino un parámetro externo. La temperatura o la entropía, por
otro lado, no pueden ser asociados a un estado cuántico, sino a una colectividad
estadística de ellos, de modo que tampoco vienen descritas por observables en el
sentido que les damos aquí.
1.2.2 Operadores
Consideremos el conjunto de operadores lineales sobre el espacio de Hilbert, H, que
denotaremos como L(H). Como veremos, es posible asociar a cada observable un opera-
dor, pero es conveniente realizar la construcción paso a paso para poder comprenderla en
profundidad. Cuando convenga distinguir los operadores de otros objetos usaremos gorros
sobre letras mayúsculas: M̂ , Ŝz . Abusando de la notación, también aplicaremos esta regla a
los observables representados por dichos operadores, aunque se trata de objetos diferentes:
el observable tiene carácter físico y el operador es su representación matemática.
• • •

Un operador lineal siempre puede ser representado en forma matricial en una determi-
nada base. Sea A = {|ai i} nuestra base canónica. Los elementos de matriz de un operador
son equivalentes a las componentes de un vector: nos facilitan el trabajo, pero dependen
de la base. Recordemos que la mejor forma de construir la matriz de un operador es escri-
biéndola por columnas: la columna k-ésima de la matriz asociada a un operador M̂ en una
cierta base son las componentes del vector que resulta al actuar con M̂ sobre el k-ésimo
vector de la base.
Veamos un ejemplo. Consideremos un operador descrito como M̂ = |ak i hal |, con k y
l dados. ¿Cómo interpretar su actuación? El bra hal | actúa como detector de entrada y el
ket |ak i como emisor de salida. Cuando el operador actúa sobre un estado, primero detecta
cuánto se parece a al , y luego produce ak en la misma medida. Concretamente, cuando
actúa sobre el vector de la base |al i nos devuelve |ak i, y cuando actúa sobre cualquier otro
estado de la base, el resultado es cero. Eso implica que en su representación matricial la
única columna no nula será la l-ésima, y en ella sólo la k-ésima entrada será igual a uno,
mientras que las demás serán cero. Es decir, Mkl A = 1 y el resto serán valores nulos. Eso
nos conduce a que todo operador puede escribirse como
X
M̂ = MijA |ai i haj | , (1.32)
i,j
donde los valores complejos MijA se denominan elementos de matriz de M̂ en la base A. Si

conocemos los elementos de matriz en una cierta base podemos construir el operador. Si,
por el contrario, conocemos la actuación del operador, podemos obtener sus elementos de
matriz haciendo
MijA = hai | M̂ |aj i , (1.33)
que naturalmente dependen de la base elegida.
• • •
Supongamos que conocemos los elementos de matriz de M̂ en la base A, ecuación (1.33),

y queremosPaveriguar su expresión en la base PB = {|bi i}, también ortonormal, sabiendo
que |ai i = j Uij |bj i y, por lo tanto, hai | = j Uij∗ hbj |. Tenemos que
! !
X X X X X
M̂ = MijA |ai i haj | = MijA Uik |bk i Uil∗ hbl | = B
Mkl |bk i hbl | , (1.34)
ij ij k l kl
donde Mkl
B = MijA Uik Uil∗ , que se puede expresar de forma matricial como
P
ij
M B = U † M A U. (1.35)
Ésa es la ecuación que debemos usar para cambiar las representaciones matriciales de base.
C Un consejo general cuando se desee cambiar un objeto cualquiera de base. Es siempre

mejor expresar los elementos de la base antigua en términos de la base nueva. De esa
forma es fácil tomar la expresión original, en términos de la base antigua, y sustituir
cada elemento de la base por su equivalente en términos de la base nueva. Los cambios
de base pueden resultar confusos hasta que se adquiere experiencia.

• • •
Aprovechamos para recordar dos conceptos esenciales de álgebra lineal. Uno es el de

traza de un operador, que se define como el funcional lineal Tr : L(H) 7→ C (nótese que
no actúa sobre H sino sobre el espacio de todos los operadores lineales sobre H que hemos
denotado L(H)) que cumple que
Tr|aihb| = hb|ai, (1.36)
para cualquier par de estados |ai, |bi ∈ H. Esta definición no es la más habitual, pero es
muy útil. Usando la linealidad llegamos a la definición más estándar:
X X X X X
TrM̂ = Tr MijA |ai i haj | = MijA Tr|ai ihaj | = MijA haj |ai i = MijA δij = MiiA ,
ij ij ij ij i
(1.37)
es decir, la suma de los elementos de matriz diagonales,
n
X
TrM̂ = hai |M̂ |ai i, (1.38)
i=1
donde debemos destacar que este resultado es independiente de la base empleada. Por lo
tanto, la traza también puede calcularse en la base propia del operador, correspondiendo
a la suma de sus autovalores. Otra propiedad esencial de la traza, cuya prueba dejamos
como ejercicio, es que
Tr(Â1 Â2 · · · Âm ) = Tr(Â2 · · · Âm Â1 ), (1.39)
que se conoce como propiedad cíclica de la traza.
C ¿Por qué nos interesa tanto la traza? Porque nos sirve para sumar sobre todos los
estados, y esa operación es muy usual tanto en mecánica cuántica como en mecánica
estadística. De hecho, la función de partición, Z, de la que se extraen todas las
propiedades de un sistema en equilibrio no es más que la traza del operador apropiado.
1.2.3 Operadores adjuntos y autoadjuntos

Dado un operador M̂ , definimos su adjunto o hermítico conjugado, M̂ † de manera que
hu|M̂ |vi = hv|M̂ † |ui∗ , (1.40)
para cualquier pareja de estados |ui y |vi. Intuitivamente, es el operador que intercambia
los papeles de entrada y salida. Sabemos que todo operador se puede escribir en la forma
(1.32), es decir, una suma de términos |ai i haj | que tienen un bra detector y un ket emisor.
En cada uno de ellos podemos intercambiar esos roles, y tenemos
X
M̂ † = (MijA )∗ |aj i hai | , (1.41)
i,j

donde hemos añadido el complejo conjugado. Nótese que este expresión depende de la
base elegida, pero es fácil mostrar que el operador M̂ † puede calcularse de esta forma
en cualquier base ortonormal. La operación de tomar el operador adjunto cumple varias
propiedades relevantes, como que
†
P̂ Q̂ = Q̂† P̂ † , (1.42)
cuya prueba dejaremos como ejercicio.
C El operador adjunto intercambia la salida y la entrada de un operador lineal, pero

eso no significa que se corresponda con el operador inverso. Eso sólo ocurre cuando
el operador es unitario.
• • •
Cuando M̂ † = M̂ decimos que el operador es autoadjunto. Necesariamente, en cual-

quier base, se cumplirá que MijA = (Mji
A )∗ . El teorema espectral de álgebra lineal nos dice
que el espectro de los operadores autoadjuntos es real y que se puede formar una base or-
tonormal con sus autoestados. El teorema también se puede leer al revés: si los autovalores
de un operador son reales y sus autoestados ortogonales, el operador es autoadjunto.
C Tomar el adjunto se parece mucho a tomar el complejo conjugado de un número

complejo. Así, por ejemplo, si un número complejo es igual que su conjugado, z = z ∗ ,
entonces z ∈ R, que se corresponde con un operador autoadjunto. Al mismo tiempo,
sabemos que z ∗ z = |z|2 es real y positivo, y también es cierto que Â† Â es siempre
un operador autoadjunto con autovalores positivos.
Siempre que un operador es autoadjunto, M̂ = M̂ † , existe una base {|mi i} en la que
X
M̂ = mi |mi i hmi | , (1.43)
i
es decir, el operador es diagonal en la base {|mi i}, con espectro {mi }. En efecto, cada |mk i
es autoestado de M̂ , como podemos comprobar fácilmente:
X X
M̂ |mk i = mi |mi i hmi |mk i = mi |mi i δik = mk |mk i . (1.44)
i i
Supongamos que conocemos los elementos de matriz de M̂ en la base A, es decir, MijA =

hai |M̂ |aj i. Podemos diagonalizar esta matriz, M A = U DM U † , donde DM es la matriz
diagonal que contiene los autovalores, y las columnas de U forman una base ortonormal
de autovectores. Por lo tanto, U es unitaria. Así tendremos
X
|mk i = Uki |ai i . (1.45)
i
• • •

Uno de los primeros usos de la forma diagonal de un operador es poder calcular fácil-
mente sus potencias. En efecto, es fácil mostrar que M̂ = ij (M )pij |ai i haj |, y sabemos
p A
P
que (M A )pij = (U DM U † )p = U DM
p
U † debido a que U † U = I. De esta manera tenemos que
mpi |mi i hmi | .

X
(M̂ )p = (1.46)
i
Esto nos permite definir el uso de una función analítica sobre un operador, es decir, un
objeto P
del tipo f (M̂ ) donde f : C 7→ C viene expresada por una serie de potencias,
f (z) = n an z n . En ese caso podemos decir que
X
f (M̂ ) ≡ f (mi ) |mi i hmi | , (1.47)
i
es decir: para hacer actuar una función analítica sobre un operador basta con hacerla actuar
sobre sus autovalores, dejando los autovectores intactos.
1.2.4 Observables como operadores

Como hemos explicado, un observable es un conjunto de estados distinguibles, {|ai i}
y sus valores correspondientes, {ai }. Una forma compacta de almacenarlos es como un
operador diagonal en la base de autoestados:
X
Â = ai |ai i hai |. (1.48)
i
¿Qué ventaja tiene representar los observables como operadores? El trabajo cotidiano en
MQ consiste en hacer álgebra con los operadores, es decir: tomamos un puñado de ob-
servables cuyos operadores tienen un espectro conocido y los sumamos, multiplicamos o
aplicamos funciones sobre ellos para construir operadores que corresponden a observables
más complejos, con frecuencia la energía. Al hacerlo, el operador resultado tendrá unos
autovalores diferentes, pero sobre todo unos autoestados diferentes de los autoestados de
los operadores de los que proviene, por lo general de una forma difícil de predecir. Y aquí
reside la riqueza y la dificultad de la MQ.
Por conveniencia, solemos asumir que los valores propios de un observable están or-
denados, a1 ≤ a2 ≤ · · · ≤ an (o alternativamente, ordenados de forma decreciente). Un
observable tiene autovalores degenerados si ai = ai+1 para algún i. En ese caso es im-
portante notar que el estado α |ai i + β |ai+1 i también es autoestado de Â, con el mismo
autovalor. El observable no duda sobre cuál debe ser el resultado de la medición. Nótese,
por tanto, que cuando hay autovalores degenerados, el número de estados propios es infi-
nito. Sin embargo, el número de estados propios distinguibles (ortogonales) sigue siendo el
mismo.
ˆ tiene un único autovalor, 1, y cualquier estado es
Por ejemplo, el operador identidad, I,
autoestado. Veremos ejemplos más interesantes de operadores con autovalores degenerados
en la siguiente sección.
Ejemplo 1.10 Construyamos nuestros primeros operadores simples, los asociados a las
componentes del espín a lo largo de los tres ejes coordenados, Ŝx , Ŝy y Ŝz . En su base
propia, los tres son diagonales y con autovalores ±~/2,
~ ~
Ŝz = |Z+ i hZ+ | − |Z− i hZ− | , (1.49)
2 2

ordenando los estados como |u1 i = |Z+ i, |u2 i = |Z− i, tenemos la representación matricial
X
Ŝz = (Sz )ij |ui i huj | , (1.50)
i,j
donde los elementos de matriz son

~ +1 0 ~
Sz = ≡ σz , (1.51)
2 0 −1 2
y σz es una de las matrices sigma de Pauli. Las otras se obtienen con facilidad cuando
consideramos los estados apropiados:
~ ~ ~ ~
Ŝx = |X+ i hX+ | − |X− i hX− | , Ŝy = |Y+ i hY+ | − |Y− i hY− | , (1.52)
2 2 2 2
que tras un poco de álgebra podemos expresar en la base de {|Z+ i , |Z− i},
~ ~ ~ ~
Ŝx = |Z− i hZ+ | + |Z+ i hZ− | , Ŝy = i |Z− i hZ+ | − i |Z+ i hZ− | . (1.53)
2 2 2 2
Esto nos permite escribir las representaciones matriciales de ambos operadores en la base
de Ŝz ,

~ 0 1 ~ ~ 0 −i ~
Sx = ≡ σx , Sy = ≡ σy , (1.54)
2 1 0 2 2 +i 0 2
que también podrían haber sido obtenidas haciendo (Sx )ij = hui | Ŝx |uj i. Nótese que re-
servamos la notación Ŝz para el operador en el espacio de Hilbert, no para la matriz que
lo representa en una base fijada.
Ejemplo 1.11 Consideremos el observable formado por la componente del espín a lo largo
de un eje genérico, Ŝ~n , donde |~n| = 1, en un sistema de espín 1/2, que se construye haciendo
uso de la regla natural:
Ŝ~n = nx Ŝx + ny Ŝy + nz Ŝz . (1.55)
Sabemos que los autovalores son ±~/2 y que sus autoestados serán |~n+ i y |~n− i. Pero esa
respuesta es tan correcta como inútil. Para que nos pueda ser de utilidad, debemos ser
capaces de representar esos estados en una base conocida, como la de los autoestados de
Ŝz . Para ello construimos la representación matricial,

~ nz nx − iny
S~n = , (1.56)
2 nx + iny −nz
y diagonalizamos esta matriz. Los autovalores son, en efecto ±~/2 y los autoestados quedan
como ejercicio.

Ejemplo 1.12 Sea un sistema de espín s, y sean {s, s−1, · · · , −s+1, −s} los (2s+1) estados
distinguibles, etiquetados por su componente a lo largo del eje Z, es decir, Ŝz |mi = ~m |mi.
Todos los estados cumplen que Ŝ 2 |mi = ~s(s+1) |mi. Las reglas generales de construcción
de los operadores de espín s arbitrario son las siguientes dos ecuaciones:
(1.57)
p
Ŝ± |mi = ~ s(s + 1) − m(m ± 1) |m ± 1i ,
y además sabemos que
Ŝ± = Ŝx ± iŜy . (1.58)
A partir de aquí podemos construir las matrices asociadas a las tres componentes del
espín en un sistema de espín 1, en la base |+i, |0i, |−i asociada al eje Z,
√ √
Ŝ+ |−i = ~ 2 |0i , Ŝ+ |0i = ~ 2 |+i , Ŝ+ |+i = 0
√ √
Ŝ− |+i = ~ 2 |0i , Ŝ− |0i = ~ 2 |−i , Ŝ− |−i = 0. (1.59)
Y esto nos lleva a la expresión de las matrices de espín en esta base:
     
0 1 0 0 −i 0 1 0 0
~  ~ 
Sx = √ 1 0 1 , Sy = √ i 0 −i , Sz = ~ 0 0 0  .
2 0 1 0 2 0 i 0 0 0 −1
(1.60)
Los autoestados se obtienen diagonalizando estas matrices, pero dejamos esa tarea para
los problemas.
1.2.5 Proyectores
Un proyector es un operador que filtra una serie de estados y desecha los demás. Si
i=1 , con m ≤ n, es un conjunto de estados ortonormales, entonces podemos
U = {|ui i}m
escribir
m
X
P̂U = |ui i hui | . (1.61)
i=1
Veamos cómo leer esta expresión para darle un sentido físico. Cada bra hui | es un detector,
que nos dice en qué medida el estado sobre el que actuamos se parece a |ui i. Y, justo en esa
medida, creamos un |ui i nuevo, mediante el ket que va a su izquierda. También diremos
que P̂U es el proyector sobre el subespacio expandido por los vectores de U .
Veamos cómo actúa sobre cualquier estado |Ψi. Para ello, completemos el conjunto U
hasta convertirlo en una base ortonormal del espacio de Hilbert, UT = U ∪ {|ui i}ni=m+1 =
{|ui i}ni=1 , de forma que los primeros m vectores
Pn sean los de U . Y después descompongamos
nuestro estado en esta nueva base, |Ψi = k=1 αk |uk i:
n
X n
X m
X n
X m
X m
X
P̂U |Ψi = P̂U αk |uk i = αk |ui i hui |uk i = αk |ui i δi,k = αi |ui i , (1.62)
k=1 k=1 i=1 k=1 i=1 i=1

donde hemos usado la ortogonalidad de los estados |uk i. De esta manera podemos observar
que el operador P̂U filtra las componentes del estado |Ψi a lo largo de las direcciones de U
y desecha las demás.
Geométricamente, P̂U nos da la proyección ortogonal de cualquier vector sobre el subes-
pacio expandido por U . Toda proyección ortogonal tiene que cumplir ciertas propiedades:
(a) un proyector es un operador autoadjunto, (b) su espectro sólo está formado por 0 y
1, (c) su cuadrado es siempre él mismo, es decir, es idempotente. Podemos ver cómo el
operador P̂U cumple todas esas propiedades.
Es un operador autoadjunto. En efecto, si intercambiamos salida y entrada, el ope-
rador queda igual, así que P̂U† = P̂U .
Su espectro sólo está formado por 0 y 1. Fijémonos en que el operador tiene ya la
forma (1.43). Podemos comprobar que cualquier vector |ui i con i ≤ m es autovector
con autovalor 1. ¿Y los autovalores cero? El resto, con m < i ≤ n.
Es idempotente. En efecto,
m
X m
X m
X
P̂U2 = P̂U P̂U = |ui ihui |uj ihuj | = |ui iδi,j huj | = |ui ihui | = P̂U . (1.63)
i,j i,j i
Pm
Ejemplo 1.13 ¿Cuándo la suma de dos proyectores es un proyector? Sean P̂A = i=1 |ai i hai |
Pp
y P̂B = i=1 |bi i hbi |. La suma,
m
X p
X m+p
X
P̂A + P̂B = |ai i hai | + |bi i hbi | ≡ |ci i hci | , (1.64)
i=1 j=1 i=1
donde definimos |ci i como |ai i si i ≤ m y |bi−m i si m ≤ i ≤ m + p. Es fácil comprobar que

la suma es un proyector si y sólo si los estados {|ci i} son ortonormales, es decir, si todos
los |bi i son ortogonales a todos los |ai i. En otras palabras, si P̂A |bi i = 0 y P̂B |ai i = 0 para
todo i posible.
1.2.6 Descomposición espectral

Un proyector siempre representa a un observable, pero uno de un tipo especial que
llamamos dicotómico,Pdado que sólo da como respuesta 0 ó 1, sí o no, pertenece o no
pertenece. Sea P̂U = m i=1 |ui i hui |. Si medimos
Pmese observable sobre un estado que sea una
combinación lineal de estados de U , |Ψi = i=1 ψi |ui i, el resultado será 1. Si medimos
sobre un estado que pertenece al subespacio ortogonal a U , el resultado será cero.
Como veremos, todo observable puede describirse como una combinación lineal de ob-
servables dicotómicos. Tomemos, por ejemplo Ŝz , y creemos dos operadores dicotómicos
complementarios: P̂+ = |Z+ i hZ+ | y P̂− = |Z− i hZ− |, cada uno de ellos diseñado para de-
tectar (responder sí, o 1) cuando le presentamos el estado asociado, |Z+ i ó |Z− i. Podemos
escribir Ŝz = ~2 P̂+ − ~2 P̂− .
Consideremos un observable representado por el operador Â, cuyo espectro es {ai }.
Definamos P̂i como el proyector sobre los autoestados de autovalor ai . Si el autovalor no es
degenerado, entonces P̂i = |ai i hai |. Pero si es degenerado, tenemos que tener más cuidado.
Supongamos que {|ai,j i} es una base ortogonal del subespacio propio asociado a ai , con
j = 1, · · · , deg(i), entonces haremos
X
P̂i = |ai,j i hai,j | , (1.65)
j

y entonces nos damos cuenta de que podemos expresar el observable Â en forma de des-
composición espectral:
X
Â = ai P̂i , (1.66)
i
es decir, una combinación lineal de proyectores con pesos dados por los autovalores. Cual-
quier expresión de la forma (1.66) representa un observable válido con la condición de que
los P̂i proyecten sobre subespacios que sean ortogonales entre sí y entre todos recompongan
el espacio entero. Es decir, si se cumple que P̂i P̂j = 0 si i 6= j y además
ˆ
X
P̂i = I, (1.67)
i
es decir, si los proyectores forman una descomposición espectral de la identidad o relación

de cierre.
1.2.7 Observable energía

Sin duda alguna, el observable más relevante para el trabajo en MQ es la energía. El
operador asociado se conoce como Hamiltoniano, Ĥ, y cumple el papel de generador de la
dinámica, como veremos en unas pocas páginas.
Llamaremos estado fundamental al autoestado de Ĥ con menor autovalor, y tendrá
una importancia especial en las aplicaciones. Además, definiremos el gap energético como
la diferencia entre los dos autovalores más bajos. Es decir, si E1 ≤ E2 ≤ · · · ≤ En son los
autovalores de Ĥ (pueden estar repetidos), el estado fundamental es el autoestado asociado
a E1 , y el gap energético es ∆E = E2 − E1 .
Ejemplo 1.14 Consideremos nuestro sistema de espín 1/2 en interacción con un campo
magnético externo, de forma que el observable energía venga representado por
Γ
Ĥ = − Ŝz , (1.68)
~
donde Γ es proporcional al módulo del campo. Sus valores posibles son ±Γ/2, y sus autoes-
tados son |Z± i. Evidentemente, podemos definir el Hamiltoniano usando otra componente
cualquiera del espín, y también podemos sumarle un término proporcional a la identidad,
es decir,
Γ ˆ
Ĥ = − Ŝ~n + E0 I. (1.69)
~
Es interesante darse cuenta de que (1.69) constituye el Hamiltoniano más general posible
para un sistema de espín 1/2. Dejamos la prueba como ejercicio.
Ejemplo 1.15 En el caso de una partícula de espín 1 tenemos más observables que pueden
servir para determinar la energía, ya que Ŝz2 no es proporcional a la identidad. Así, tenemos
como posibilidad
Γ Λ
Ĥ = − Ŝz − 2 Ŝz2 , (1.70)
~ ~

y podemos interpretar este operador al hacerlo actuar sobre los elementos de la base, |+i,
|0i y |−i,
Ĥ |+i = −(Γ + Λ) |+i , Ĥ |0i = 0, Ĥ |−i = −(Γ − Λ) |−i , (1.71)
de manera que Ĥ es diagonal en la base de Ŝz , pero los estados |±i son más favorables
energéticamente a causa el segundo término, mientras que el primero sólo favorece a |+i
3.
Ejemplo 1.16 Regresemos al caso de la cadena atómica, ejemplo 1.7, y veamos cómo cons-
truir un Hamiltoniano razonable. Aceptaremos que todos los átomos están equiespaciados,
y que sólo hay un estado distinguible por átomo, correspondiente a un orbital fijado, de
forma que el conjunto {|ii} constituye una base. La matriz del Hamiltoniano se construye
de la forma Hij = hi|Ĥ|ji. Los elementos diagonales nos dan la energía de un electrón
localizado en su orbital, Hii = ε0 , que supondremos conocido. Los elementos no diagonales
nos dan los llamados términos de salto (en inglés, hopping), que tienen que ver físicamente
con la amplitud de probabilidad de que el electrón salte de un átomo a otro. Parece una
aproximación razonable suponer que el electrón sólo podrá saltar entre átomos vecinos,
es decir, Hi,j = ε0 δi,j + ε1 δi,j±1 , que supondremos siempre real. La matriz completa nos
queda
 
ε0 ε1 0 ··· 0
 ε1 ε0 ε1
 ··· 0 
H =  0 ε1 ε0
 ··· 0 , (1.72)
 .. .. .. .. .. 
. . . . .
0 0 0 ··· ε0
es decir, es una matriz tridiagonal que puede ser diagonalizada de manera exacta. La
ecuación de autovalores se escribe como
H~u = E~u, (1.73)
donde hemos adoptado una notación vectorial estándar, pero las componentes de ~u, {ui },
deben interpretarse
P como las amplitudes de probabilidad de los estados |ii en el estado
general: |ui = i ui |ii. El sistema (1.73) consta de n ecuaciones, elegimos la j-ésima,
donde 2 ≤ j ≤ n − 1. Observando la ecuación (1.72) con detenimiento llegamos a
ε1 uj−1 + ε0 uj + ε1 uj+1 = Euj , (1.74)
y ahora recurrimos a un Ansatz exponencial, uj = Aeijk , que denominaremos como ondas

planas, donde k es un cierto número de onda o momento real, que no conocemos, y A es
la amplitud. Sustituyendo en la ecuación (1.74) llegamos a
ε1 Aei(j−1)k + ε0 Aeijk + ε1 Aei(j+1)k = EAeijk , (1.75)

3
Aunque resulte paradójico, consideramos que un estado está favorecido energéticamente cuando su
energía es más baja.

y eliminando el factor constante Aeijk de ambos lados nos queda
E = ε0 + 2ε1 cos(k), (1.76)

Y de aquí deducimos que el valor k y el valor −k nos dan la misma energía, lo cual es
lógico. Pero aún no hemos determinado realmente los autovalores de Ĥ, porque no sabemos
qué valores puede tomar k. Eso dependerá de las condiciones de contorno, es decir, de las
ecuaciones inicial y final, que no hemos empleado aún. Pero dejaremos este último paso
para los problemas.
C El ejemplo anterior es muy empleado en física del estado sólido y química cuántica,
donde se conoce como el modelo del enlazado fuerte, o tight-binding model. Asimismo
se emplea en átomos fríos en redes ópticas, donde los átomos pueden ser reales o me-
ramente corresponder a distintos niveles energéticos del mismo átomo. Por ejemplo,
los niveles hiperfinos de un átomo de alto espín nuclear, usando láseres de frecuencias
apropiadas se pueden convertir en una cadena artificial.
C De nuevo debemos distinguir entre observable, que es físico, operador, que es un objeto
matemático abstracto, y matriz, que es un objeto matemático concreto. Nótese que
estamos reservando la notación Ĥ para observables y sus operadores asociados, pero
la representación matricial se escribe como H.
Resumen 1.2. El proyector sobre un subespacio es un operador lineal que devuelve la

componente del vector que pertenece a él. Si U = {|ui i}m i=1 con
P hui |uj i = δij , entonces
el proyector sobre el subespacio expandido por U es P̂U = m i=1 |ui i hui |. Los proyec-
tores son autoadjuntos, P̂ = P̂ e idempontentes, P̂ = P̂ . Sus autovalores son 1 (con
† 2
degeneración m) y 0P (con degeneración n − m). El proyector sobre el espacio completo

ˆ
es la identidad, I = k |ai i hai |, expresión que conocemos como relación de cierre.
Un observable Â viene descrito por una serie completa de estados propios ortogonales
{|ak i} y sus valores propios correspondientes {ak }, con ak ∈ R. Al medir el observable
sobre uno de los autoestados el resultado será, con certeza, elP autovalor correspondien-
te. Todo observable tiene asociado un operador lineal Â = k ak P̂k , donde P̂k es el
proyector sobre el subespacio asociado al autovalor ak . El operador de un observable
es necesariamente autoadjunto, Â† = Â. El teorema espectral nos garantiza que todo
operador autoadjunto tiene espectro real y que existe una base ortogonal formada por
autovectores.
Todo operador tiene una representación matricial Â = ij AU ij |ui i huj |, con Aij =
U
P
hui |Â|uj i, que suelen denominarse elementos de matriz. Sea una segunda base V = {|vi i}
y Wij = hvi |uj i. Entonces AVij = W AU W † . La matriz asociada a un observable en su
base propia es siempre diagonal: Â = i ai |ai i hai |.
P
Dado un operador Â y una función real f : R 7→ R, definimos f (Â) como el operador

que tiene la misma base propia, {|ai i}, pero sus autovalores son {f (ai )}.
Todo sistema físico tiene un observable energía, cuyo operador suele llamarse Hamil-
toniano, Ĥ. Sean E1 ≤ E2 ≤ · · · ≤ En sus autovalores y {|En i} sus autovectores. El
estado |E1 i se denomina estado fundamental y el resto se llaman estados excitados. El

salto de energía entre el fundamental y el primer excitado, ∆E = E2 − E1 se llama gap

de energía.
1.3 Qué es medir

1.3.1 Proceso de medida
¿Qué sucede cuando preguntamos a un estado por un observable del que no es autoes-
tado? Cuando la pregunta es la correcta para ese estado, la respuesta es segura. Pero si la
pregunta no es la correcta, la respuesta es aleatoria. Eso sí: aleatorio no es lo mismo que
sin reglas.
Consideremos el caso más sencillo, un observable Â = i ai |ai i hai |, cuyos autoestados
P
son no degenerados. Medimos Â sobre el estado |Ψi. La medida dará como resultado el
valor ai con probabilidad p(ai ) = |hai |Ψi|2 , relación que conocemos como la regla de
Born. Es decir: el observable compara el estado ofrecido con sus autoestados, y elige uno
al azar con unas probabilidades determinadas por la semejanza entre ellos y el estado. Tras
la medición, el estado pasa a ser |ai i, de forma que si repetimos la medición inmediatamente
después, el resultado será ai con certeza.
Ejemplo 1.17 En un sistema de espín 1/2, el observable Ŝx tiene como estados pro-
pios {|X+ i , |X− i}, con autovalores {+~/2, −~/2}. Si medimos Ŝx sobre el estado |Ψi =
α |X+ i + β |X− i (normalizado), obtendremos el valor +~/2 con probabilidad |hX+ |Ψi|2 =
|α|2 , y el valor −~/2 con probabilidad |hX− |Ψi|2 = |β|2 .
C Éste es el llamado problema de la medición en mecánica cuántica, que aún hoy es

fruto de intensos debates en la intersección entre la física y la filosofía. En esta sección
estamos describiendo el proceso de acuerdo con la llamada interpretación de Copen-
hague, que popularizó Niels Bohr y resulta extremadamente útil en el laboratorio. En
el siguiente tema consideraremos cómo surgen estas reglas a partir de la interacción
entre el sistema cuántico y el aparato de medida. En concreto, el entrelazamiento
entre ambos será clave para comprender el proceso de medición.
¿Qué sucede cuando los autovalores son degenerados? Hay una manera sencilla de
entenderlo, partiendo de un espectro completamente no-degenerado, con autovalores {ai }.
La probabilidad de obtener el autovalor ai al medir sobre el estado |Ψi es |hai |Ψi|2 . Ahora
supongamos que los valores a1 , a2 , · · · , am se acercan entre sí hasta hacerse indistinguibles,
a1 = · · · = am , formando un único estado m veces degenerado. La probabilidad de obtener
este estado
P será, lógicamente, la suma de las probabilidades de cada uno de los estados,
p(ai ) = m i=1 |hai |Ψi|2.
Sin embargo, es más conveniente emplear un formalismo basado en proyectores, puesto

que incluye de manera natural muchos otros casos. Propondremos la expresión
p(ai ) = hΨ|P̂i |Ψi, (1.77)
donde P̂i es el operador proyector sobre el subespacio asociado al resultado ai de la medida.

En efecto, P̂i = m i=1 i i hai |, obteniendo
P
|a
m m m
!
X X X
p(ai ) = hΨ| |ai i hai | Ψi = hΨ|ai ihai |Ψi = |hai |Ψi|2 , (1.78)
i=1 i=1 i=1

como queríamos demostrar. Si nos preguntan la probabilidad de que la medida caiga en

determinado sector ai ∈ [x0 , x1 ], eso es equivalente a considerar un nuevo observable fuer-
temente degenerado que toma el valor 1 para todos los estados que cumplen la condición
y 0 para los demás. Es decir: un proyector. Y el procedimiento es siempre el mismo:
p([x0 , x1 ]) = hΨ|P̂[x0 ,x1 ] |Ψi.
• • •
¿Y cuál es el estado tras la medición? Sean {ai } los autoestados de Â, posiblemente
degenerados, cada uno de los cuales tiene un proyector P̂i . Medimos sobre el estado |Ψi y
obtenemos el resultado ak . Inmediatamente tras la medición, el estado será proporcional a
P̂k |Ψi, es decir: el estado se proyecta sobre el resultado de la medida. Desafortunadamente,
ese estado no está normalizado, así que debe ser normalizado apropiadamente,
P̂k |Ψi
|Ψi 7→ . (1.79)
hΨ|P̂k |Ψi
Nótese que el denominador es la probabilidad de haber obtenido el valor ak que hemos

obtenido realmente, y justo por ello no puede ser nula.
C Este proceso tiene un cierto parecido al mecanismo clásico de adquisición de infor-

mación. En efecto, consideremos una distribución de probabilidad {pi }, y cómo debe
actualizarse cuando nos informan de que, con certeza, i ∈ A. La regla es
(
0 si i 6∈ A,
pi 7→ (1.80)
pi /p(A) si i ∈ A,
donde p(A) es la probabilidad original de que i estuviera en A.
C Es tradicional explicar la MQ en base a unos ciertos postulados, varios de los cuales se

refieren al proceso de medición. En este texto hemos preferido no hacerlo así debido
a que esos postulados de medición constituyen resultados demostrables en el marco
de la MQ, y en los que se está profundizando activamente en estos momentos.
1.3.2 Valores esperados y varianzas

Dado un observable Â y un estado |Ψi podemos, por tanto, obtener el histograma com-
pleto para los valores posibles de una medida, p(ai ) = hΨ|P̂i |Ψi. Siempre que tenemos un
histograma nos interesa obtener sus parámetros estadísticos, como la media o la desviación.
El valor esperado de las medidas se obtiene haciendo
X X
µA ≡ ai p(ai ) = ai hΨ|P̂i |Ψi, (1.81)
i i
pero como Â = i ai P̂i , tenemos que

P
µA = hΨ|Â|Ψi, (1.82)

y encontramos que el valor esperado de Â en el estado |Ψi se corresponde con el elemento

de matriz de Â en |Ψi. Podemos dar una expresión alternativa para el valor esperado,
µA = Tr(P̂ψ Â), (1.83)
es decir, la traza del producto del operador Â por el proyector sobre el estado. Comprobe-
mos que es cierto,
Tr(P̂ψ Â) = Tr(|Ψi hΨ| Â)

X X X
= hai |ΨihΨ|Â|ai i = hai |ΨihΨ|ai |ai i = ai |hai |Ψi|2 = µA . (1.84)
i i i
De la misma manera podemos medir la varianza,
X X X
2
σA = (ai − µA )2 P (ai ) = a2i hΨ|P̂i |Ψi−µ2A P (ai ) = hΨ|Â2 |Ψi−hΨ|Â|Ψi2 . (1.85)
i i i
Nótese que se emplea el mismo símbolo para la desviación de una medida y para las
matrices de Pauli, y esperamos que el contexto sirva para distinguir ambos usos.
1.3.3 Observables compatibles

¿Qué ocurre
P cuando deseamos medir dos observables diferentes, Â y B̂? Expresémoslos
como Â = i ai P̂iA y B̂ = i bi P̂iB , donde P̂iA y P̂iB son proyectores. Sabemos que existe
P
una base de estados en los que una medida de Â da un resultado seguro, y lo mismo sucede
con B̂. ¿Qué pasará si tratamos de medir los dos? ¿Existirá una base de estados en los que
ambos darán un resultado seguro? Es decir, ¿existe una base de autovectores comunes a
los dos? Si es así, los observables son compatibles.
Vamos a relacionar esa propiedad física con una propiedad matemática de los operado-
res. Probaremos que dos observables son compatibles si y sólo si sus operadores conmutan,
es decir
[Â, B̂] = ÂB̂ − B̂ Â = 0. (1.86)
Aceptemos entonces, que Â y B̂ conmutan, y que |ai i es un autovector de Â con autova-

lor ai . Entonces, comenzaremos señalando que B̂ |ai i es también autovector de Â, y con
el mismo autovalor. Lo podemos ver con facilidad: ÂB̂ |ai i = B̂ Â |ai i = ai B̂ |ai i. Por lo
tanto, los elementos de matriz de B̂ entre autoestados de Â con diferente autovalor son
nulos. Es decir, si ai 6= aj , entonces hai |B̂|aj i = 0. Eso significa que, en la base de auto-
estados de Â, la matriz del operador B̂ tiene una forma diagonal por cajas, cada una de
las cuales corresponde a un autovalor diferente de Â. Si diagonalizamos cada una de esas
cajas encontraremos una base de autoestados comunes a Â y a B̂.
• • •
Cuando dos observables son compatibles se pueden medir de manera simultánea. Eso
significa que el resultado de una medida de Â seguida inmediatamente de una medida
de B̂ es (estadísticamente) indistinguible de una realizada en el orden opuesto. Si ambos
observables tienen espectro no degenerado, la afirmación es evidente. En cambio, cuando

tienen espectro degenerado la situación se complica un poco más. Notemos, para empezar,
que los valores exactos que toman los autovalores de ambos operadores son irrelevantes,
son meras etiquetas. Importa sólo la estructura de los subespacios asociados a cada uno de
ellos, que están codificados en los proyectores {P̂iA } y {P̂jB }. Tenemos que
X
0 = ÂB̂ − B̂ Â = ai bj P̂iA P̂jB − P̂jB P̂iA , (1.87)
i,j
y de aquí concluimos que para que Â y B̂ conmuten deben hacerlo sus proyectores asociados.
¿Cuándo conmutan dos proyectores? Cuando existe una base común de autovectores, y en
ese caso el producto de los dos proyectores es otro proyector sobre el subespacio intersección.
• • •
Sabemos que si dos observables son compatibles sus operadores asociados conmutan.
¿Y qué sucede en caso contrario? No existe una base de autoestados comunes, y eso implica
que, en general, si uno de los observables nos da una medida segura el otro nos puede dar
medida con alta varianza. Esa intuición se ve reflejada en el principio de incertidumbre,
formulado en un caso particular por Heisenberg y generalizado por Robinson y Schrödinger,
que dicta que
1
σA σB ≥ |hψ|[Â, B̂]|ψi|, (1.88)
2
donde las desviaciones σA y σB están calculadas en el mismo estado, |ψi. La demostración
queda como ejercicio.
1.3.4 Preparaciones
¿Cómo preparar un sistema cuántico, para asegurarnos de que esté en un estado co-
nocido? Supongamos que nos dan un sistema en un estado desconocido, |φi. Si medimos
sobre él un observable Â que tiene todos los autovalores sin degenerar, entonces una sola
medida nos dejará el sistema en un estado conocido, |ai i para algún i. Sin embargo, cuando
el observable tenga autovalores degenerados, una medida no bastará para conocer el estado
con certeza. Será preciso medir un segundo observable, que sea compatible con él, para que
nos distinga entre los diferentes autovalores en los que puede estar el estado. ¿Y quizá haga
falta un tercero? En general, llamamos un conjunto completo de observables com-
patibles, CCOC a un conjunto de observables (compatibles, claro) cuya medida sucesiva
nos deja al sistema en un estado conocido, del que no tenemos duda. Toda degeneración
ha sido finalmente resuelta. La medición de un CCOC sobre un estado arbitrario nos dará
siempre un estado conocido, y se llama también una preparación.
Medir todos los observables de un CCOC {Âk }m k=1 es equivalente a medir un único
observable global Ω̂ no degenerado. Construimos la (única) base Pde autovectores comunes
a todos los observables del CCOC, {|ωi i} y construimos Ω̂ = i ωi |ωi i hωi |, donde ωi es
un autovalor combinado que reúne la información de los autovalores de cada uno de los
observables Âk en un solo número asegurándonos de que no se repite ningún valor.
Ejemplo 1.18 Así, por ejemplo, consideremos un sistema de tres estados, |1i, |2i y |3i,
y los operadores Â1 = |1i h1| y Â2 = |2i h2|. Los dos observables conmutan y probaremos
que forman un CCOC. En efecto, tomando la base canónica, los autovalores de Â1 son
a1 = {1, 0, 0} y los de Â2 son a2 = {0, 1, 0}. Si realizamos las medidas consecutivas de Â1

y Â2 , los dos resultados nos determinan unívocamente el estado, que podemos sintetizar
en un único observable Ω̂ no degenerado, cuyos autovalores sean ω = a1 + 2a2 . Nótese que
si ω = a1 + a2 el observable vuelve a ser degenerado y no funciona.
1.3.5 Teorema de Hellmann-Feynman

Se trata de un resultado exacto que nos ayuda a estimar cómo varía el valor esperado
de la energía en el estado fundamental de un Hamiltoniano que depende de un paráme-
tro, H(λ). Necesitamos recordar que la derivada de todo vector unitario es perpendicular
a él mismo. Supongamos que el estado fundamental de H(λ) es |ψ(λ)i, que debe estar
normalizado, hψ(λ)|ψ(λ)i = 1, de modo que
dhψ(λ)|ψ(λ)i dhψ(λ)| d |ψ(λ)i

0= = |ψ(λ)i + hψ(λ)| . (1.89)
dλ dλ dλ
Ahora definimos E(λ) = hψ(λ)|H|ψ(λ)i y calculamos
dE(λ) dhψ(λ)| dH(λ) d |ψ(λ)i

= H(λ) |ψ(λ)i + hψ(λ)| |ψ(λ)i + hψ(λ)|H(λ) . (1.90)
dλ dλ dλ dλ
pero como H(λ) |ψ(λ)i = E(λ) |ψ(λ)i, el primer y el tercer término se simplifican
dE(λ) dhψ(λ)| dH(λ) d |ψ(λ)i

= E(λ) |ψ(λ)i + hψ(λ)| |ψ(λ)i + E(λ)hψ(λ)| , (1.91)
dλ dλ dλ dλ
y el primer y tercer término se anulan, así que nos queda

dE(λ) dH(λ)
= ψ(λ)
ψ(λ) . (1.92)
dλ dλ
Resumen 1.3. Al medir un observable con operador Â = i ai P̂i sobre un estado

P
arbitrario |Ψi, la probabilidad de obtener el autovalor ai es p(ai ) = hΨ|P̂i |Ψi. Inme-

diatamente tras la medida, el estado es proporcional a P̂i |Ψi, donde i es el índice del
autovalor obtenido en la medida.
El valor esperado de la medida vendrá dado por µA = hÂi = hΨ|Â|Ψi = i p(ai )ai ,
P
y su varianza estadística vendrá dada por σA

2 = hÂ2 i − hÂi2 .
Dos observables, Â y B̂ son compatibles si la medida de uno no afecta a las probabi-

lidades de una medida del otro. En ese caso existe una base de autoestados comunes a
ambos y su conmutador debe anularse, [Â, B̂] = ÂB̂ − B̂ Â
= 0. La relación de incerti-
dumbre de Heisenberg afirma que σA σB ≥ 2 hψ|[Â, B̂]|ψi.
1
1.4 Evolución temporal

1.4.1 Operador evolución
Hasta ahora hemos considerado estados cuánticos estáticos. ¿Cómo evolucionan, cómo
interactúan? ¿De qué maneras se puede actuar sobre ellos? Llamemos Û a una cierta

transformación física, que convierte unos estados en otros, y asumamos por simplicidad
que se puede representar como un operador lineal, Û ∈ L(H) ¿Cómo son los Û que son
físicamente razonables? Para empezar, su acción sobre un estado físico nos debe dar siempre
otro estado físico: Si Û |φi = |φ0 i y hφ|φi = 1, entonces hφ0 |φ0 i = 1 también. Como eso
debe cumplirse para todo estado, entonces hφ| Û † = hφ0 |, y de ahí llegamos a hφ|Û † Û |φi =
hφ0 |φ0 i = 1 para todo estado |φi. Eso implica que Û † Û = I es la identidad, y por tanto
Û † = Û −1 . En otras palabras: en mecánica cuántica los estados sólo pueden evolucionar
de manera unitaria.
C Pero el operador Û podría ser no lineal, ¿verdad? Matemáticamente, sí. Pero física-
mente no se ha encontrado ningún caso de evolución cuántica que venga representada
por un operador no lineal. De hecho, una mínima no linealidad en la mecánica cuánti-
ca tendría unas consecuencias devastadoras para la teoría, cambiándola radicalmente
y volviéndola esencialmente clásica [16].
C En la sección anterior hemos dicho que tras una medición el estado se transforma
en uno de los autoestados del observable en cuestión. ¿Es eso un proceso lineal y
unitario? Aparentemente no, pero sí lo es. No es unitario desde el punto de vista del
sistema, pero cuando consideremos el sistema combinado con el aparato de medida
veremos que es una transformación unitaria perfectamente válida. No hay dos tipos
de evolución en mecánica cuántica, sólo una y es unitaria. Pero es importante saber
cuál es el sistema al que aplicamos esta transformación.
Llamaremos a Û un operador evolución. Hay varias maneras posibles para cons-

truirlo. Por
P ejemplo, podemos conocer cómo evolucionan todos los vectores de una base,
Û |ai i = j Uij |aj i. En ese caso, la matriz Uij representa al operador en la base {|ai i}.
Pero, tras lo que hemos visto en la sección anterior, sabemos que los observables se carac-
terizan mejor por el conjunto de sus autoestados, es decir,
Û |uk i = αk |uk i , (1.93)
y nos preguntamos qué podemos afirmar sobre estos autoestados {|uk i} y sus autovalores
αk . El resultado principal es el siguiente teorema cuya demostración puede ser seguida en
[12]: Los autovalores de un operador unitario Û tienen siempre módulo unidad. Además, los
autovectores correspondientes a autovalores distintos son necesariamente ortogonales. En
otras palabras: αk = eiφk , con φk ∈ R, y huk |uk0 i = δk,k0 . Es decir: los autovalores son fases,
y los autoestados son siempre estados distinguibles. Eso hace que los operadores evolución
se parezcan mucho a los observables, pero tienen una diferencia esencial: sus autovalores
no tienen por qué ser reales.
Ejemplo 1.19 Consideremos un espín 1/2 en el que actuamos con un operador evolución
de forma que Û |0i = |1i y Û |1i = |0i. La base {|0i , |1i} se transforma en la base {|1i , |0i},
que evidentemente es también ortogonal. ¿Cuáles son los autoestados y los autovalores del
operador evolución? La matriz asociada es

0 1
U= , (1.94)
1 0
es decir, U = σx . Los autovalores son ±1, con lo que nos damos cuenta de que este operador
es tanto unitario como hermítico. Es decir, puede ser interpretado como un observable y
como un operador evolución. Además, |u± i = 2−1/2 (|0i ± |1i).

1.4.2 Ecuación de Schrödinger

Toda evolución temporal vendrá dada por la acción de un operador evolución para-
metrizado, |ψ(t0 )i = Û (t0 , t) |ψ(t)i. Usaremos la notación Û (final,inicial) porque es la más
conveniente, pero si el tiempo inicial es t = 0 y no cabe duda de eso, haremos Û (t, 0) ≡ Û (t)
por simplicidad. Nótese que el operador evolución parametrizado debe cumplir las relacio-
nes de grupo:
Û (t + t0 , 0) = Û (t + t0 , t)Û (t, 0),

Û (0, 0) = I,ˆ
Û (0, t) = Û (t, 0)−1 = Û (t, 0)† , (1.95)
donde esta última relación implica que también podemos viajar hacia atrás en el tiempo,
con sólo aplicar el operador evolución inverso, que debe coincidir con su hermítico.
• • •
Nos dicen desde la escuela que la energía ni se crea ni se destruye, sólo se transforma.
Pero en MQ medir la energía es un proceso probabilístico, de tal manera que el principio
de conservación debe ser clarificado. No podemos asegurar que el valor de la energía me-
dido se preserve, pero exigiremos que la distribución de probabilidad del resultado de la
medida lo haga. Eso implica que los autoestados de la energía son siempre autoestados del
operador evolución, es decir, si {Ek } es el espectro de energías y {|Ek i} son los autoestados
correspondientes,
Û (t) |Ek i = f (Ek , t) |Ek i , (1.96)

donde f (Ek , t) es cierta función de la energía. Necesariamente, |f (Ek , t)| = 1. Además,
tiene que cumplirse la condición de grupo, f (Ek , 0) = 1 y f (Ek , t + t0 ) = f (Ek , t) · f (Ek , t0 ),
y eso nos deja como opción
Û (t) |Ek i = e−iEk t/~ |Ek i , (1.97)

donde ~ es la constante de Planck, que sirve para adimensionalizar el argumento de la
exponencial imaginaria, y hemos elegido el signo menos por conveniencia.
C El análisis dimensional es mucho más útil de lo que uno cree en física. En cual-
quier ley física bien formulada, el argumento de toda función trascendente (como
la exponencial compleja, logaritmos, senos, cosenos, etc.) ha de ser necesariamente
adimensional. La constante de Planck, ~, tiene unidades de acción, es decir, de ener-
gía × tiempo o bien de longitud × momento. Es muy natural elegir un sistema de
unidades naturales en el que ~ = 1.
Consideremos |ψ(t)i = A tiempos cortos, exp(−iEk δt/~) ≈ 1 − iEk δt/~,

P
k ck (t) |Ek i.
así que tenemos
|ψ(t + δt)i = Û (t + δt, t) |ψ(t)i

−iEk δt

X X Ek δt
= ck (t) exp |Ek i ≈ ck (t) 1 − i |Ek i
~ ~
k k
iX i
= |ψ(t)i − δt ck (t)Ek |Ek i = |ψ(t)i − δt Ĥ |ψ(t)i , (1.98)
~ ~
k

y haciendo un desarrollo de Taylor del lado izquierdo
d |ψ(t)i
|ψ(t + δt)i ≈ |ψ(t)i + δt . (1.99)
dt
Llegamos así a una ecuación diferencial que debe cumplir el estado,
d i
|ψ(t)i = − Ĥ |ψ(t)i , (1.100)
dt ~
que es la conocida ecuación de Schrödinger. Notemos que, de manera formal, podemos
escribir
!
−iĤt −iEk t
X
Û (t) = exp = exp |Ek ihEk |. (1.101)
~ ~
k
Diferenciando con respecto al tiempo,
dÛ (t) X −iEk −iEk t

= exp |Ek ihEk |, (1.102)
dt ~ ~
k
como Ĥ y Û tienen los mismos autovectores, podemos escribir
dÛ (t) i
= − Ĥ Û , (1.103)
dt ~
que es la ecuación de Schrödinger que cumple el operador evolución.
Ejemplo 1.20 Consideremos un qubit o espín 1/2 en el que realizamos la identificación
usual: |0i ≡ |Z+ i y |1i = |Z− i. El qubit se encuentra en el estado inicial |ψ(0)i = |0i. Actúa
sobre él el Hamiltoniano Ĥ = Γσ̂x , y deseamos obtener el estado para todo tiempo. Para
ello diagonalizamos el Hamiltoniano, que tiene autovalores E± = ±Γ, con autoestados
1 1
|φ+ i = √ (|0i + |1i) , |φ− i = √ (|0i − |1i) . (1.104)
2 2
Descomponemos el estado inicial en la base de autoestados, obteniendo
1 1
|ψ(0)i = √ |φ+ i + √ |φ− i . (1.105)
2 2
Ahora sólo tenemos que multiplicar cada autoestado por su factor de fase correspondiente,
e−iEk t/~ , y obtenemos
1 1
|ψ(t)i = √ e−iΓt/~ |φ+ i + √ eiΓt/~ |φ− i , (1.106)
2 2
Y podemos regresar a la base canónica, obteniendo
|ψ(t)i = cos(Γt/~) |0i − i sin(Γt/~) |1i . (1.107)


Ejemplo 1.21 En el ejemplo anterior, medimos la energía tras un tiempo t. ¿Cuál es la

probabilidad de obtener cada valor posible? La respuesta fácil es: la misma que al principio.
Vemos que el estado en función del tiempo es, según la ecuación (1.106), una combinación
lineal de los autoestados de la energía cuyos coeficientes no varían de módulo. En términos
más formales,
X
|ψ(t)i = ck e−iEk t/~ |Ek i , (1.108)
k
así que para todo tiempo la probabilidad de obtener el valor Ek en una medición de la
energía será |ck |2 (si el valor no es degenerado, o la suma de los valores correspondientes
si lo es). Destacamos por tanto que no sólo el valor esperado de la energía no cambia, sino
que tampoco cambia la desviación de las medidas. El histograma completo de valores de
la energía permanece invariable.
1.4.3 Ecuaciones de Ehrenfest

¿Cómo evolucionan los valores esperados de los observables? Consideremos un obser-
vable Â. Definimos a(t) ≡ hψ(t)|Â|ψ(t)i, y calculamos
da(t) d
= hψ(t)|Â|ψ(t)i. (1.109)
dt dt
Empleando la regla del producto para las derivadas tenemos

da(t) d d
= hψ(t)| Â |ψ(t)i + hψ(t)| Â |ψ(t)i . (1.110)
dt dt dt
Hacemos uso de la ecuación de Schrödinger y su dual para bras,
d i d i
|ψ(t)i = − Ĥ |ψ(t)i , hψ(t)| = + hψ(t)| Ĥ, (1.111)
dt ~ dt ~
donde no ponemos Ĥ † por ser autoadjunto. Así, tenemos
da(t) i i
= hψ(t)|Ĥ Â|ψ(t)i − hψ(t)|ÂĤ|ψ(t)i, (1.112)
dt ~ ~
y reconocemos el conmutador de Â con Ĥ. Podemos escribir esta ecuación de forma com-
pacta como
dhÂi i
= − h[Ĥ, Â]i. (1.113)
dt ~
que se conocen como ecuaciones de Ehrenfest.
C El observable Â(t) puede depender explícitamente del tiempo. En ese caso, la derivada
del producto incluye un término más, y nos queda la ecuación de Ehrenfest completa:
* +
dhÂ(t)i i ∂ Â(t)
= − h[Ĥ, Â]i + , (1.114)
dt ~ dt
donde ∂ Â(t)/∂t es la derivada temporal del operador Â(t).

• • •
Consideremos un observable que no depende explícitamente del tiempo y que conmuta

con el Hamiltoniano, [Ĥ, Â] = 0. En ese caso, su valor esperado se conserva, da(t)/dt = 0.
Llamaremos a un observable así una constante del movimiento.
Vemos, por tanto, una segunda aparición del concepto de conmutador. En la sección
anterior comprobamos que dos observables que conmutan comparten un conjunto completo
de estados propios, y por lo tanto pueden ser medidos simultáneamente sin incertidumbre.
Ahora comprobamos que cuando un observable conmuta con la energía es una constante
del movimiento. En realidad, ambas situaciones físicas son más similares de lo que parece.
Al cumplirse que [Ĥ, Â] sabemos que existe una base de autoestados comunes a ambos,
{|φk i} tal que Â |φk i = ak |φk i y Ĥ |φk i = Ek |φk i. Es decir: si la energía es Ek con certeza,
el valor de Â será ak con certeza4 . Sabemos que la energía se conserva en el tiempo de
manera fuerte, es decir, la distribución de probabilidad pE (Ek ) se mantiene en el tiempo.
Por lo tanto, lo mismo debe suceder a la distribución de probabilidad de los valores propios
de Â, pA (ak ). Y, por lo tanto, el valor esperado de Â se mantendrá en el tiempo.
1.4.4 Imagen de Schrödinger e imagen de Heisenberg

La evolución temporal de los valores esperados de un observable Â cumple que
a(t) ≡ hψ(t)|Â|ψ(t)i = hψ(0)|Û † (t, 0)Â Û (t, 0)|ψ(0)i, (1.115)
de donde nos damos cuenta que podemos absorber la evolución temporal en los observables,
si queremos. Podemos definir ÂH (t) = Û † (t, 0)Â Û (t, 0) y entonces el valor esperado en
función del tiempo se calculará como
a(t) = hψ(0)|ÂH (t)|ψ(0)i. (1.116)
Ambas formas de pensar llevan a los mismos resultados. Podemos:

Considerar que el estado evoluciona, |ψ(t)i, mientras que el observable es siempre el
mismo. Llamamos a este enfoque imagen de Schrödinger.
O consideramos que el estado es siempre el mismo, |ψ(0)i, mientras que el obser-
vable evoluciona, ÂH (t) = Û † (t, 0)Â Û (t, 0). Este enfoque se denomina imagen de
Heisenberg.
Al resolver problemas reales elegiremos una u otra únicamente por conveniencia de
cálculo, los resultados deben ser siempre exactamente los mismos. Notemos que la ecuación
ÂH (t) = Û (t, 0)† ÂÛ (t, 0) significa que la acción de Â en el tiempo t se puede averiguar de
la siguiente forma:
Evoluciona el estado desde t = 0 hasta el tiempo final t, usando Û (t, 0).
Actúa con el operador Â.
Haz regresar el resultado desde el tiempo t hasta el tiempo t = 0, usando Û † (t, 0).
De hecho, podemos escribir una ecuación de tipo Schrödinger para los operadores en
imagen de Heisenberg. Derivamos
dÂH (t) dÛ † (t, 0) dÛ (t, 0)

= Â Û (t, 0) + Û † (t, 0)Â , (1.117)
dt dt dt
4
Si ambos observables son no degenerados, pero es fácil generalizar el razonamiento.

1.A Problemas 43
y es fácil comprobar que la primera derivada es (iĤ(t)/~)Û † (t, 0) mientras que la segunda
es −(iĤ(t)/~)Û (t, 0), así que obtenemos
dÂH (t) i
= [Ĥ, ÂH (t)], (1.118)
dt ~
que debemos destacar que tiene el signo cambiado respecto a la ecuación de Ehrenfest
(1.113). La razón, claro está, es que hacer avanzar los operadores es, de alguna manera, lo
opuesto a hacer avanzar el estado.
C Una vez concluido el tema debemos remarcar algo importante: en el formalismo cuán-
tico mostrado, el tiempo no es un observable, sino un parámetro externo. No existe
ningún operador autoadjunto cuyo espectro se corresponde a las medidas temporales
que podemos realizar. Sin embargo, eso sí que ocurrirá con la posición. ¿Es correcto
tratar el tiempo y el espacio como esencialmente diferentes en nuestro formalismo?
La respuesta es no. Pero ese aspecto es sutil y será considerado en nuestro tema final,
dedicado a cuántica y relatividad.
Resumen 1.4. La evolución temporal de un estado cuántico viene dictada por la

ecuación de Schrödinger, i~∂t |Ψ(t)i = Ĥ |Ψ(t)i, donde ~ es la constante de Planck.
Los autoestados de la energía evolucionan con una fase: si |Ψ(0)i = |Ek i entonces
|Ψ(t)i = exp(−iEk t/~) |Ek i.
La solución formal de la ecuación de Schrödinger se puede escribir como |Ψ(t)i =
Û (t, t0 ) |Ψ(t0 )i, donde Û (t, t0 ) es un operador unitario que se denomina operador evolu-
ción. Si el sistema es autónomo (el Hamiltoniano no depende explícitamente del tiempo)
tenemos que Û (t, 0) = exp(−iHt/~).
Los valores esperados evolucionan según la ecuación de Ehrenfest, dhÂ(t)i

dt = − ~i h[Ĥ, Â]i.
Si el observable conmuta con el Hamiltoniano, constituye una constante del movimiento.
La evolución temporal también puede asociarse a los operadores en lugar de sobre
los estados, dando lugar a la imagen de Heisenberg. En efecto, afirmar que |Ψ(t)i =
Û (t, 0) |Ψ(0)i con Â constante es indistinguible de afirmar que |Ψ(0)i es constante y
ÂH (t) = Û † (t, t0 )Â Û (t, 0).
1.A Problemas
A continuación proporcionamos una serie de enunciados de problemas asociados a este
tema que esperamos sean objeto de discusión en los foros del curso.
1.1. Demostrar que, si Â es un operador autoadjunto, entonces Û = exp(iÂ) es un operador

unitario.
1.2. Consideremos un sistema de espín 1/2.

(a) Demuestre que el estado más general se puede escribir como |ψi = cos(θ/2) |Z+ i +
eiφ sin(θ/2) |Z− i.
(b) Encuentre el valor esperado de las tres componentes del espín sobre este estado.
(c) Demuestre que |ψi es autoestado del operador que mide la componente del espín a lo
largo de la dirección ~n = (sin θ cos φ, sin θ sin φ, cos θ).

1.3. Consideremos de nuevo el sistema de espín 1/2.

(a) Obtenga el conmutador entre σx y σy .
(b) Exprese la relación de incertidumbre de Heisenberg entre los observables Ŝx y Ŝy en
un sistema de espín 1/2.
(c) Compruebe la validez de dicha relación de incertidumbre sobre el estado genérico del
ejercicio anterior.
1.4. Demuestre que:

(a) [ÂB̂, Ĉ] = Â[B̂, Ĉ] + [Â, Ĉ]B̂.
(b) La identidad de Jacobi: [Â, [B̂, Ĉ]] + [B̂, [Ĉ, Â]] + [Ĉ, [Â, B̂]] = 0.
1.5. Demostrar el principio variacional. Si tenemos una familia de estados |ψ(λ)i y

encontramos el valor esperado de la energía, hE(λ)i = hψ(λ)|Ĥ|ψ(λ)i, entonces el mínimo
de E(λ) será una cota superior a la energía.
1.6. Demostrar la desigualdad de Temple. Sea Ĥ el Hamiltoniano del sistema, y sean

E0 , E1 , · · · sus autovalores. Sea hφ|Ĥ|φi < E1 . Demostrar que, tomando los valores espe-
rados sobre este estado,
2
σH
E0 ≥ hĤi − . (1.119)
E1 − hĤi
1.7. Usando el teorema de Hellmann-Feynman encuentre la expresión para la corrección

de los autovalores a primer orden de perturbaciones en el Hamiltoniano Ĥ = Ĥ0 + λV̂ ,
donde el espectro y los autoestados de Ĥ0 son conocidos.
1.8. Encontrar el espectro completo para el electrón en la cadena atómica definida en los
ejemplos 1.7 y 1.16. Para ello, considere una combinación lineal de las soluciones encon-
tradas con k y −k, es decir, uj = Aeijk + Be−ijk , y aplíquela sobre el primer y el último
sitios. Observe cómo cambia la situación cuando la cadena es periódica, introduciendo un
elemento de matriz H1n = Hn1 = ε1 .
1.9. Obtenga los autoestados de Ŝx , Ŝy y Ŝz para una partícula de espín 1, que llamaremos
|Z+ i, |Z0 i, |Z− i, etc. ¿Cuál es la fidelidad entre los estados |X0 i, |Y0 i y |Z0 i?
1.10. Diagonalice el Hamiltoniano de espín 1 descrito por

Γ Λ
Ĥ = − Ŝz − 2 Ŝx2 , (1.120)
~ ~
y obtenga el valor esperado de la energía y su varianza en los tres autoestados de Ŝz .
1.11. Considérese un haz de fotones que viaja en la dirección del eje Z, con la polariza-
ción en el eje X. Encuentran a su paso una serie de n polarizadores, P1 a Pn , cada uno
permitiendo el paso de los fotones polarizados a lo largo de un eje que forma un ángulo
θi = i∆θ medido desde la horizontal. Calcular la probabilidad de que el fotón sobreviva a
los n polarizadores. Particularizar para el caso en el que n → ∞ y ∆θ → 0 pero de forma
que n∆θ = π/2.
1.12. Demostrar la desigualdad de Robinson-Schrödinger, también conocida como el prin-

cipio de incertidumbre generalizado, ecuación (1.88). Para ello, se recomienda seguir estos
pasos.

1.B Cálculo numérico en sistemas discretos 45
(a) Definir |ai = (Â − hÂi) |ψi, y un vector equivalente para B̂.
(b) Escribir σA2 σ 2 como el producto de las normas de esos dos vectores.
B
(c) Aplicar la desigualdad de Cauchy-Schwartz, ha|aihb|bi ≥ |ha|bi|2 y desarrollar el resul-
tado.
1.B Cálculo numérico en sistemas discretos

En la práctica, el estudio de la mecánica cuántica y su aplicación a sistemas físicos
reales implica la realización de cálculo numérico, con especial énfasis en dos procesos: la
diagonalización de matrices y la resolución de ecuaciones diferenciales. En esta sección
desearíamos recordar las bases prácticas de cálculo en el primer caso.
Así como es conveniente escribir nuestro propio código para realizar la mayor parte de
los algoritmos, en el caso de la diagonalización de matrices esto no es recomendable. La
razón es que los algoritmos desarrollados por especialistas en el área son extremadamente
sofisticados y, además, están publicados como software libre. Los algoritmos más eficientes
están siempre disponibles a través de las librerías BLAS y LAPACK [13], que está escrita
en Fortran, y que puede ser accedida desde muchos otros lenguajes, tales como C, C++
[14] o MATLAB/Octave [15].
Nos gustaría brevemente recordar cómo diagonalizar una matriz usando Octave, debido
a que se trata de un programa de código abierto disponible para la mayor parte de las
plataformas. Es tan sencillo como hacer lo siguiente:
A=[1 2 3; 3 2 3; 3 2 1]
nos generará la matriz, descrita a través de sus filas.
[U,D]=eig(A)
nos devolverá en U la matriz cuyas columnas contienen los autovectores, mientras que D es
una matriz diagonal cuyas entradas serán los autovalores de A.
• • •
Presentamos aquí un pequeño proyecto que requiere de cálculo numérico. No es obli-

gatorio para seguir el curso, pero resulta muy conveniente. El proyecto entero se refiere al
problema del electrón en la cadena atómica escrito en los ejemplos 1.7 y 1.16.
(a) Obtener el espectro numéricamente usando ε0 = 0 y ε1 = −1, y comprobar el

resultado del problema 1.8.
(b) Considerar ahora un estado |ψ(0)i = |n/2i. Calcular su evolución temporal resol-
viendo la ecuación de Schrödinger, usando ε0 = 0, ε1 = −1 y ~ = 1. Dibujar las cur-
vas que muestran la distribución de probabilidad de encontrar el electrón en cada átomo
pi (t) = |hi|ψ(t)i|2 en función del tiempo, comprobando que suman siempre la unidad.
(c) Obtener la fidelidad con el estado inicial en función del tiempo, |hψ(t)|ψ(0)i|2 ,
también conocida como eco de Loschmidt. Encontrar los tiempos para los que el eco
tiene un máximo. Interpretar el sentido físico de dichos valores.

2. Matriz densidad y entrelazamiento
Éste es el primer tema realmente novedoso del curso. Introduce un nuevo formalismo
para la mecánica cuántica especialmente diseñado para los estados mezcla, es decir: los
casos en los que el estado (puro) del sistema no es conocido con certeza, sino meramente
con ciertas probabilidades. Esto es evidentemente útil para la física estadística, pero hay
una sorpresa más. Si tenemos un sistema cuántico compuesto por varias partes y sólo
observamos una de ellas, no es posible en general describirlo como un estado puro, sino
como un estado mezcla. Al restringirnos a una parte del sistema hemos perdido información,
y esta información desconocida se llama entrelazamiento.
C En el tema anterior hemos sido muy cuidadosos al poner los gorros sobre los observa-
bles y operadores. En este tema seguiremos la práctica habitual de no hacerlo, pero
recomendamos a los/as lectores/as que tengan siempre en cuenta qué tipo de objeto
es denotado con cada símbolo.
2.1 El formalismo de la matriz densidad

Disponemos de un átomo de espín 1/2. Lanzamos una moneda al aire, si sale cara lo
preparamos en el estado |0i ≡ |Z+ i y si sale cruz lo preparamos en el estado |1i ≡ |Z− i.
¿Podríamos escribir su estado cuántico como 2−1/2 (|0i + |1i)? Como argumento a favor
podemos decir que las probabilidades de encontrar al espín en los estados |0i y |1i son
ambas 1/2. Pero también lo serían si el estado del espín fuera 2−1/2 |0i + eiφ |1i , con φ
una fase arbitraria. ¿Qué valor de φ deberíamos usar para describir el estado? La respuesta
es ninguno. Consideremos φ = 0. Si medimos σx veremos que obtenemos +1 con certeza.
Pero eso no será cierto en el caso probabilístico propuesto: tanto si sale cara como si sale
cruz, una medida de σx sobre el espín nos dará un 50 % de las veces +1 y un 50 % de las
veces −1.
El estado del espín es un estado mezcla, es decir, desconocemos cuál es el estado (puro)
en el que está el sistema físico. Un estado mezcla está totalmente especificado si podemos
dar una lista de estados (puros) con sus probabilidades. En nuestro caso, por ejemplo,
{|0i , 1/2; |1i , 1/2}. Un estado mezcla, por lo tanto, es una colectividad estadística de
estados puros, junto con sus probabilidades asociadas. En un estado mezcla tenemos un
nivel clásico de probabilidades por encima del nivel cuántico.
C El experimento del gato de Schrödinger es ya parte del folklore científico general,

y los medios de comunicación hacen referencias y bromas con él. Sin embargo, el
experimento suele explicarse mal, pues lo que normalmente se describe no es más
que un estado mezcla, en el que el gato tiene un 50 % de probabilidades de estar vivo
o muerto, pero no existe una superposición real de estados.

48 Capítulo 2. Matriz densidad y entrelazamiento
Ya hemos discutido en el tema anterior dos usos de los operadores en MQ. El primero
es como representación matemática de los observables. Todo observable, afirmábamos,
está especificado a partir de una serie de estados distinguibles (es decir, ortogonales) y
sus autovalores correspondientes. El segundo uso era como actuadores sobre un estado
cuántico, es decir, como operadores evolución. Ahora introducimos un tercer uso distinto:
para representar estados mezcla, a partir de lo que llamamos un operador densidad o
matriz densidad.
• • •
Formalmente, si tenemos m estados {|φi i}, no necesariamente ortogonales, con proba-

bilidades {pi }, el operador densidad asociado se construye como
m
X
ρ= pi |φi i hφi | . (2.1)
i=1
De aquí leemos inmediatamente que el operador densidad es necesariamente autoadjunto,

por ser una suma de proyectores (con pesos),
m
X
ρ= p i Pi , (2.2)
i=1
donde Pi = |φi i hφi | es el proyector sobre el estado |φi i. Nótese que, si los estados |φi i
son ortogonales (es decir, distinguibles), éstos constituirán los autovectores de la matriz
densidad, y los autovalores serán las probabilidades pi .
Cada proyector Pi sobre un único estado se puede interpretar como la matriz densidad
asociada a un estado en el que |φi i tiene probabilidad 1 y todos los demás estados tienen
probabilidad cero. Es decir: podemos asociar una matriz densidad a cada estado puro,
que será simplemente el proyector sobre el estado. En otras palabras: la matriz densidad
asociada al estado puro |Ψi es ρ = |ΨihΨ|.
• • •
La suma de las probabilidades debe ser la unidad, i pi = 1. De aquí podemos probar

P
que la traza del operador densidad es también la unidad. Cuando los estados |φi i son
ortogonales, este hecho se demuestra fácilmente: los pi son los autovalores de ρ y la traza
es la suma de los autovalores. En el caso de que los estados no sean ortogonales podemos
aplicar el hecho de que la traza es una operación lineal:
m
X m
X
Trρ = pi Tr |φi i hφi | = pi = 1, (2.3)
i=1 i=1
haciendo uso de la definición de traza, ecuación (1.36), que afirma que Tr |ui hv| = hu|vi.
• • •
¿Por qué definimos este operador así? Porque nos resulta extremadmente útil para
calcular valores esperados de observables sobre estados mezcla. Consideremos un observable

A del que podemos calcular el valor esperado en cualquier estado puro. Entonces, cuando
estamos en el estado mezcla ρ, tendremos
m
X
hAiρ = pi hφi |A|φi i, (2.4)
i=1
es decir: el valor esperado sobre el estado mezcla será una media ponderada de los va-
lores esperados sobre cada uno de los estados puros. Vamos a demostrar una expresión
alternativa:
hAiρ = Tr[Aρ], (2.5)
Veamos cómo demostrarlo expandiendo el lado derecho mediante la expresión (2.2)
m m m
" #
X X X
hAiρ = Tr[Aρ] = Tr A p i Pi = pi Tr[APi ] = pi hφi |A|φi i, (2.6)
i=1 i=1 i=1
porque reconocemos que Tr[APi ] es el valor esperado de A en el estado |φi i, como probamos
en la ecuación (1.83). Además, teniendo en cuenta que Pi es la matriz densidad asociada al
estado puro |φi i, podemos obtener la relación hφi |A|φi i = Tr[APi ] al aplicar de la ecuación
(2.5) a un estado puro.
Ejemplo 2.1 Podemos escribir la matriz densidad del estado mezcla descrito desde el
principio: espín 1/2 que está en |0i con una probabilidad 1/2, y en |1i con 1/2:
m
X 1 1 1/2 0 I
ρ= pi |φi i hφi | = |0i h0| + |1i h1| = = , (2.7)
2 2 0 1/2 2
i=1
es decir: la matriz densidad es proporcional a la identidad. Como veremos, eso significa que
tenemos una ignorancia máxima sobre el estado. Eso lo podemos comprobar calculando
los valores esperados de las componentes del espín a lo largo de cualquier dirección:

I 0 1/2
hσx i = Tr σx = Tr = 0, (2.8)
2 1/2 0

I 0 −i/2
hσy i = Tr σx = Tr = 0, (2.9)
2 i/2 0

I 1/2 0
hσz i = Tr σz = Tr = 0, (2.10)
2 0 −1/2
lo que demuestra que el valor esperado de la componente del espín a lo largo de cualquier
eje es nula.
La matriz densidad es autoadjunta, y eso implica que se puede diagonalizar ortogonal-

mente:
m
X n
X
ρ= pi |φi i hφi | = λk |ψk i hψk | , (2.11)
i=1 k=1

donde {λk } son los autovalores de ρ, que asumiremos que están en orden descendiente,
λ1 ≥ λ2 ≥ · · · ≥ λn , y |ψk i son los autovectores. Notemos que n es la dimensión del
espacio de Hilbert, mientras que m puede tomar cualquier valor natural. Asimismo, los
|ψk i deben ser ortogonales, mientras que los |φi i no tienen por qué serlo. ¿Qué significan
los autovalores y autovectores de la matriz densidad? Los autoestados de ρ son estados
distinguibles del espacio de Hilbert que tienen una probabilidad bien definida de aparecer,
que es λk . Nótese que los |φi i no tenían por qué ser distinguibles.
Ejemplo 2.2 Consideremos el estado mezcla en el que obtenemos |0i con probabilidad
1/2, y 2−1/2 (|0i + |1i) también con probabilidad 1/2. En este caso los dos estados no son
distinguibles (su producto escalar no es cero). Aun así, la matriz densidad se escribe de la
misma manera:
m
X 1 1 1 1
ρ= pi |φi i hφi | = |0ih0| + √ (|0i + |1i) √ (h0| + h1|)
2 2 2 2
i=1

1 1 3/4 1/4
= |0ih0| + |0ih0| + |0ih1| + |1ih0| + |1ih1| = . (2.12)
2 4 1/4 1/4
√
Cuando diagonalizamos esta matriz obtenemos dos autovalores, λk = (2 ± 2)/4, es
decir λ1 ≈ 0.854 y λ2 ≈ 0.146, asociados a dos estados ortogonales, es decir, distinguibles.
El valor esperado de la componente del espín a lo largo de un eje arbitrario ya no es cero,
como se puede comprobar fácilmente.
Ejemplo 2.3 Un polarizador tiene una eficiencia de un 90 %. Eso significa que cada fotón
que pasa tiene una probabilidad (clásica) de p = 0.9 de sufrir el proceso de polarización y
una probabilidad de 1 − p = 0.1 de no sufrir ningún cambio. Si introducimos un fotón con
polarización arbitraria |φi = α|Xi + β|Y i, con |α|2 + |β|2 = 1, donde |Xi es la polarización
seleccionada, el estado se mantendrá invariante con una probabilidad (1−p), y se polarizará
en el estado |Xi con una probabilidad p|α|2 . Nótese que hay una probabilidad finita, p|β|2
de que el fotón sea absorbido y desaparezca. La matriz densidad puede escribirse como
|α|2 (1 − p)α∗ β

2
ρ = p|α| |Xi hX| + (1 − p) |φi hφ| = , (2.13)
(1 − p)αβ ∗ (1 − p)|β|2
donde notamos que, de manera excepcional, la traza de la matriz densidad no es uno, sino
1 − p|β|2 , porque la probabilidad de absorción es p|β|2 . Para ser matemáticamente más
correctos deberíamos introducir un tercer estado, |∅i, que denotara el vacío. En este espacio
de tres estados la matriz densidad sí tendrá traza unidad.
¿Cómo distinguir un estado puro de un estado mezcla, si nos dan la matriz densidad
asociada ρ? La manera más directa es obtener su espectro: si λ1 = 1 el estado es puro.
Alternativamente, cuando el estado es puro, ρ = |φi hφ| es un proyector, y sabemos que el
cuadrado de un proyector es igual a sí mismo: ρ2 = ρ. Esta condición es por tanto suficiente
para que Pun estado sea puro, ¿pero es necesaria? Comprobemos que así es. Supongamos
que ρ = k λk |ψk i hψk |, con λ1 6= 1. Entonces, ρP
2 =
k |. Tendremos ρ = ρ
P 2 2
λ
k k |ψk i hψ
cuando λ2k = λk para todo k. Dado que la suma k λk = 1, la única forma en la que eso
puede suceder es que λ1 = 1 y el resto sea cero.
• • •
Como ya vimos en el capítulo anterior, la noción de fidelidad es muy útil en mecánica

cuántica. ¿Cuál es la probabilidad de confundir el estado mezcla ρ con cualquiera de sus

autoestados |ψk i? Pues es el autovalor correspondiente, Fρ,ψk = λkP . ¿Y si se trata de un

estado arbitrario |wi? Para averiguarlo lo descomponemos |wi = k wk |ψk i en la base
de autovectores. La probabilidad de confundir |wi con |ψk i es Fw,φk = |wk |2 , así que la
probabilidad de confundir ρ con |wi esPla suma de las probabilidades de confundirlo con
cada uno de los autoestados: Fρ,w = k λk |wk |2 = hw|ρ|wi, con lo que hemos dado un
significado físico al valor esperado de ρ en cualquier estado. Extraemos una conclusión más:
como la fidelidad debe ser positiva o cero, el operador ρ debe ser definido positivo.
• • •
Consideremos un sistema cuántico cuyo estado viene descrito por una matriz densidad,
pero no sabemos exactamente cuál, teniendo una probabilidad wk de que la matriz densidad
sea la ρk , con k ∈ {1, · · · , p}. ¿Necesitamos una estructura matemática nueva para describir
esta situación? No. Basta con afirmar que el estado es mezcla, con matriz densidad dada
por la media ponderada de todas ellas
p
X
ρ= wk ρk , (2.14)
k=1
que también llamaremos una combinación convexa de matrices densidad. No hay estados
más generales que las matrices densidad.
Una combinaciónP convexa de objetos Qk es una combinación lineal X = k αk Qk

P
C
con αk ∈ [0, 1] y k αk = 1. El nombre se debe a que si Qk son unos puntos en el
plano, el conjunto de combinaciones convexas rellenará el polígono convexo definido
por ellos, también llamado envolvente convexa (en inglés, convex hull).
• • •
¿Cómo evolucionan los estados mezcla? La respuesta inmediata es que cada estado puro
que forma parte de él lo hace de manera independiente. Pero podemos hacer algo mejor: dar
una ecuación de evolución para la matriz densidad. Recordemos que la evolución temporal
siempre viene dada por una transformación unitaria, U (t). Así, tenemos que
m
X
ρ(t) = pi U (t) |φi i hφi | U † (t) = U (t)ρ U † (t), (2.15)
i=1
es decir, el operador densidad se transforma como cualquier otro operador bajo la evolu-
ción temporal. Y, podemos añadir de paso, bajo cualquier otra operación unitaria. Ahora
procedemos a encontrar la ecuación diferencial que describe el movimiento, derivando con
respecto a t y teniendo en cuenta que ∂t U = − ~i HU ,
i i i
∂t ρ(t) = − HU ρU † + U ρU † H = − [H, ρ(t)], (2.16)
~ ~ ~
que se conoce como ecuación de von Neumann, y es el equivalente de la ecuación de
Schrödinger para estados mezcla.

Resumen 2.1. Un estado mezcla es una colectividad estadística de estados puros.

Viene descrito por una serie de estados distinguibles {|ψk i} y las probabilidades clási-
cas asociadas a cada uno pk , representándose en forma de operador densidad como
ρ = k pk Pk , donde Pk = |ψk i hψk | es el proyector sobre el estado k-ésimo. El opera-
P
dor densidad es siempre hermítico y de traza unidad. El valor esperado de cualquier
observable Â en este estado es hAiρ = Tr(Aρ) = Tr(ρA). La evolución temporal de un
estado descrito por un operador densidad viene dada por la ecuación de von Neumann:
i~ ∂t ρ = [H, ρ].
2.2 Información y termodinámica

En 1948, Claude Shannon abrió el campo de la teoría clásica de la información consi-
derando el siguiente problema [17]. Se ha elegido un número natural k al azar según una
distribución de probabilidad P = {pk }nk=1 y se nos pide averiguar k con el menor número
posible de preguntas sí/no, NQ . En otras palabras: ¿cuántos bits (valores 0-1) de infor-
mación necesitaremos para averiguar el valor k obtenido? Cualquier número entero entre
1 y n puede codificarse con NQ = log2 (n) bits, así que ahí tenemos una posible respuesta.
Pero imaginemos que la probabilidad de que k = 1 sea mucho más alta que las demás.
Entonces podemos seguir una estrategia más inteligente. Nuestra primera pregunta debería
ser ¿ha salido k = 1? Si nos responden que sí, hemos terminado y el número de preguntas
es NQ = 1. Si es que no, entonces haremos más preguntas.
Shannon encontró una estrategia óptima basada en este principio, y demostró que
el número promedio de preguntas que debemos hacer está dado por una magnitud que
conocemos como entropía de Shannon:
n
X
S[P ] = − pk log pk . (2.17)
k=1
C ¿Logaritmo natural o logaritmo en base 2? No importa mucho, puesto que ambas

definiciones de la entropía sólo difieren en un factor constante log(2).
Veamos los casos límite más interesantes. Si pk = 1/n para todos los valores k, entonces
tenemos
n
X 1 1
S[P ] = − log = log(n), (2.18)
n n
k=1
que se corresponde con nuestra estrategia inicial: si todos los valores son igual de proba-
bles, un número entre 1 y n se codifica con log(n) bits. Ahora veamos el caso opuesto de
concentración total, de modo que p1 = 1 y el resto de los valores sean cero. En este caso
debemos operar con cuidado, porque “0 · log 0” es una indeterminación. Tomando límites,
S[P ] = −1 log(1) − (n − 1) lı́m (x log x) = 0, (2.19)

x→0+
como se puede demostrar por L’Hôpital.

2.2 Información y termodinámica 53
C El artículo de Shannon de 1948 [17] es una maravilla científica: escrito en un lenguaje

claro y accesible, conduce a los resultados de una manera increíblemente natural. No
entraremos en más detalles sobre el origen matemático de la definición de entropía,
pero recomendamos fervientemente su lectura.
Los autovalores de la matriz densidad, Λ = {λk } constituyen una distribución discreta

de probabilidad, así que podemos calcular su entropía de Shannon. Pero como somos físicos,
le daremos un nombre diferente: entropía de von Neumann:
n
X
S[ρ] = −Tr[ρ log ρ] = − λk log λk , (2.20)
k=1
que viene a responder la pregunta: ¿cuánta información precisamos para elegir uno de los
estados puros distinguibles que constituyen el estado mezcla? Si el estado es puro, entonces
λ1 = 1 y el resto son nulos, de modo que S[ρ] = 0. Por otra parte, si el estado mezcla
consta de m estados equiprobables, entonces S[ρ] = log(m). Así que podemos reformular
la pregunta de manera intuitiva (aunque poco rigurosa): exp(S) es el número de estados
distinguibles dentro de ρ.
• • •
¿Tiene algo que ver la entropía de von Neumann con la entropía en termodinámica
y en mecánica estadística? Sí, son la misma magnitud. Boltzmann escribió la expresión
S = kB log W , donde kB es una constante, que es equivalente a nuestro S = log(m), como
iremos viendo.
C La constante de Boltzmann, kB = 1.38 · 10−23 J/K es meramente un accidente

histórico debido al hecho de que no medimos la temperatura en unidades de energía,
como deberíamos. En el sistema de unidades naturales, kB = ~ = c = 1.
En mecánica estadística cuántica definimos la colectividad canónica como un estado

mezcla en el que cada autoestado del Hamiltoniano tiene una probabilidad proporcional al
llamado factor de Boltzmann, exp(−βE), donde E es su energía, y β = (kB T )−1 . Es decir,
si H |ψk i = Ek |ψk i, entonces
1 X 1
ρ= exp(−βEk ) |ψk i hψk | = exp(−βH), (2.21)
Z Z
k
donde Z no es más que una constante de normalización,
X
Z= exp(−βEk ), (2.22)
k
que suele llamarse función de partición.

Ejemplo 2.4 Consideremos un espín 1/2 en un campo magnético externo, sometido al
Hamiltoniano H = −Γσz . Nos piden obtener el valor esperado de la magnetización en
función de la temperatura, asumiendo que se rige por la colectividad canónica.

El estado será ρ = exp((Γ/T )σz )/Z (usamos kB = 1). Para calcular la función de un
operador hermítico basta con aplicar la función sobre sus autovalores, y así tenemos
−Γ/T
1 e 0
ρ= , (2.23)
Z 0 eΓ/T
donde Z = e−Γ/T + eΓ/T = 2 cosh(Γ/T ). A partir de aquí obtenemos el valor esperado de

cualquier operador,
−e−Γ/T + eΓ/T

Γ
hσz iρ = Tr[ρσz ] = = tanh . (2.24)
e−Γ/T + eΓ/T T

C El análisis dimensional es siempre clave al chequear el resultado de un problema de

física. Trabajaremos siempre con kB = 1, es decir, con la temperatura en unidades
de energía. Como ya hemos comentado, el argumento de todas las funciones tras-
cendentes debe ser siempre adimensional. En nuestro caso está bien, porque tanto Γ
como T tienen unidades de energia.
• • •
Las leyes de la termodinámica son universales, y su validez se extiende desde el mundo

microscópico hasta los cúmulos de galaxias. Pero aún así es preciso comprender cómo se
aplican. Consideremos un sistema cuántico con el Hamiltoniano H, a temperatura finita
T , descrito en equilibrio por la matriz densidad ρ = exp(−βH)/Z, y el valor esperado de
la energía vendrá dado por hHi = Tr[Hρ]. Entonces la entropía será
e−βH e−βH

1
S[ρ] = −Tr log = Tr[e−βH (log(Z) + βH)] = log(Z) + βhHi. (2.25)
Z Z Z
lo cual nos permite definir la energía libre F ≡ −T log(Z) = hHi − T S.
Consideremos las dos formas siguientes de variar la energía del sistema. Por un lado
podemos dejar fijo ρ y cambiar H, variando los niveles de energía. En ese caso, decimos
que el flujo de energía toma la forma de trabajo. Por ejemplo, aumentar el volumen de
una caja disminuye los niveles de energía de las partículas en el interior. Alternativamente,
podemos variar ρ cambiando las probabilidades de los distintos estados, mantiendo H fijo.
En ese caso, diremos que el flujo de energía toma la forma de calor. Estas observaciones
dan origen al campo de la termodinámica cuántica.
Resumen 2.2. Dada una distribución de probabilidad discreta, P = {pk }, su entropía

de Shannon viene definida por S[P ] = − k pk log pk . La entropía de von Neumann
P
asociada a un estado mezcla
P es la entropía de Shannon de sus autovalores, es decir,
S[ρ] = −Tr(ρ log ρ) = − k λk log λk , donde {λk } son los autovalores de ρ. Cuando un
estado es puro, S[ρ] = 0. El número de estados distinguibles en la colectividad dada por
ρ es ≈ exp(S).
Un estado térmico (colectividad canónica) con Hamiltoniano H viene descrito por el
estado mezcla de operador densidad ρ = Z −1 exp(−βH), donde β = 1/(kB T ) y Z es la

función de partición que sirve como normalización. La entropía de von Neumann de ρ

se corresponde con la entropía termodinámica.
2.3 Sistemas compuestos

Consideremos un sistema formado por dos subsistemas A y B. El término sistema
debe entenderse aquí en un sentido amplio: A y B pueden ser dos partículas diferentes,
pero también pueden ser componentes del estado de una misma partícula, como la parte
espacial y el espín. Sean {|ai i} y {|bi i} sendas bases de los espacios de Hilbert HA y HB ,
de dimensiones nA y nB . El sistema compuesto se describe por el producto tensorial
de los espacios de Hilbert de cada sistema: H = HA ⊗ HB , cuya base está formada por el
producto cartesiano de las dos bases: {|ai i ⊗ |bj i} que tiene n = nA × nB componentes.
Cualquier estado de este espacio total puede entonces escribirse como
X
|Ψi = Cij |ai i ⊗ |bj i . (2.26)
i,j
Para una mayor simplicidad notacional denotaremos los estados de todo el sistema com-
puesto por mayúsculas griegas (e.g. |Ψi o |Φi), y simplificaremos los productos tensoriales
cuando sea preciso: |ai i ⊗ |bj i = |ai i |bj i = |ai bj i.
C ¿Qué sucede cuando tenemos tres sistemas cuánticos o más? Tendremos un espacio
de Hilbert cuya dimensión será nA × nB × nC × · · · . Por lo tanto, la dimensión
del espacio de Hilbert resultante crece muy deprisa con el número de sistemas. Así,
por ejemplo, una red de n espines 1/2 vendrá descrita por un espacio de dimensión
2 × 2 × 2 · · · = 2n . Ésta es la razón principal por la que el estudio de la mecánica
cuántica de muchos cuerpos es complicada y requiere una combinación inteligente de
métodos analíticos y cálculo numérico.
• • •
¿Cómo son los operadores que actúan sobre el sistema compuesto? Consideremos el
operador RA , que actúa sobre HA . Definimos una extensión R = RA ⊗ IB a todo el espacio
producto H = HA ⊗ HB , donde IB es la identidad sobre B. Recordemos que todo operador
lineal se puede definir a través de su actuación sobre los elementos de la base:
R (|ai i ⊗ |bj i) = (RA ⊗ IB ) (|ai i ⊗ |bj i) = (RA |ai i) ⊗ (IB |bj i) = (RA |ai i) ⊗ |bj i . (2.27)
Nótese que, aunque los autoestados de RA no estén degenerados en HA los autoestados
de su extensión R sí están degenerados en H. Así, es posible comprobar que la mínima
degeneración de un autoestado de R será nB . Análogamente, para un operador SB que
actúa en HB existe una extensión S = IA ⊗ SB en H = HA ⊗ HB ,
S (|ai i ⊗ |bj i) = (IA ⊗ SB ) (|ai i ⊗ |bj i) = (IA |ai i) ⊗ (SB |bj i) = |ai i ⊗ (SB |bj i) . (2.28)
Y también podemos escribir el producto tensorial de dos operadores, M = RA ⊗ SB , que
se define de la misma manera por su actuación sobre los vectores de una base:
X
M |Ψi = cij (RA |ai i) ⊗ (SB |bj i) . (2.29)
i,j

¿Podemos escribir el operador M en forma matricial? El procedimiento es siempre el

mismo: se hace actuar el operador sobre el k-ésimo elemento de la base y se disponen las
componentes del vector resultante como la k-ésima columna de la matriz. Por simplicidad,
consideremos que nA = nB = 2, y que

r11 r12 s11 s12
RA = SB = . (2.30)
r21 r22 s21 s22
Calculemos, por ejemplo,
(RA ⊗ SB ) |a1 b1 i = (r11 |a1 i + r21 |a2 i) ⊗ (s11 |b1 i + s21 |b2 i)
= r11 s11 |a1 b1 i + r11 s21 |a1 b2 i + r21 s11 |a2 b1 i + r21 s21 |a2 b2 i .
Si ordenamos los estados de la base tensorial de manera lexicográfica, e.g. {|a1 b1 i, |a1 b2 i,
|a2 b1 i y |a2 b2 i} comprendemos que la representación matricial de M tiene dimensión 4, y
que su primera columna es, precisamente, r11 s11 , r11 s21 , r21 s11 y r21 s21 . Construyamos La
matriz completa queda como ejercicio:
 
r11 s11 r11 s12 r12 s11 r12 s12
r11 s21 r11 s22 r12 s21 r12 s22 
M̂ =   = r11 SB r12 SB .
r21 s11 r21 s12 r22 s11 r22 s12  r21 SB r22 SB
r21 s21 r21 s22 r22 s21 r22 s22
donde la última identificación es formal, es decir, expresa de manera taquigráfica la estruc-

tura de la matriz producto tensorial1 .
• • •
Definimos un estado puro del espacio total como factorizable cuando se puede escribir
como el producto tensorial de un estado de cada uno de los subsistemas. Así, por ejemplo,
|a1 i ⊗ |b1 i es obviamente factorizable, pero también lo es |Ψi = |ui ⊗ |vi si |ui = u1 |a1 i +
u2 |a2 i y |vi = v1 |b1 i + v2 |b2 i. Podemos calcular fácilmente el valor esperado de RA ⊗ SB
sobre un estado factorizable, como |Ψi = |ui ⊗ |vi:
hΨ| (RA ⊗ SB ) |Ψi = hΨ| (RA |ui) ⊗ (SB |vi) = hu| RA |ui hv| SA |vi . (2.31)
Los estados factorizables se comportan como si los dos sistemas A y B fueran independien-
tes. Un estado puede ser factorizable aunque aparente no serlo, por ejemplo, consideremos
1
|Ψi = (|a1 b1 i + |a1 b2 i + |a2 b1 i + |a2 b2 i) . (2.32)
2
No es difícil comprobar que ese estado puede reescribirse como
1 1
|Ψi = √ (|a1 i + |a2 i) ⊗ √ (|b1 i + |b2 i) . (2.33)
2 2
1
Cada cual debe desarrollar sus trucos mnemotécnicos, pero uno que nos ha resultado útil es pensar
que el sistema B corre más rápido.

Ejemplo 2.5 Consideremos una pareja de espines 1/2. Escribiremos las matrices asociadas
a la componente z del espín en cada uno de ellos, σ1z y σ2z . El espacio de Hilbert H = H1 ⊗H2
tendrá dimensión 4 y elegimos siempre la base lexicográfica: {|↑↑i, |↑↓i, |↓↑i y |↓↓i}, donde
usamos la notación simplificada |↑i ≡ |Z+ i y |↓i ≡ |Z− i. Ahora podemos obtener la acción
de σ1z y σ2z sobre cada uno de ellos:
σ1z |↑↑i = + |↑↑i , σ1z |↑↓i = + |↑↓i , σ1z |↓↑i = − |↓↑i , σ1z |↓↓i = − |↓↓i ,
σ2z |↑↑i = + |↑↑i , σ2z |↑↓i = − |↑↓i , σ2z |↓↑i = + |↓↑i , σ2z |↓↓i = − |↓↓i ,
así que ambas matrices son diagonales,
↑↑ ↑↓ ↓↑ ↓↓ ↑↑ ↑↓ ↓↑ ↓↓
   
↑↑ +1 0 0 0 ↑↑ +1 0 0 0
↑↓ 0 +1 0 0  ↑↓  0 −1 0 0 
σ1z =  σ2z =  (2.34)

, ,
↓↑  0 0 −1 0  ↓↑  0 0 +1 0 
↓↓ 0 0 0 −1 ↓↓ 0 0 0 −1
De la misma manera podemos obtener estas matrices mediante un producto tensorial con
la identidad:
 
1 0 1 0
+1 · 0·
+1 0 1 0 0 1 0 1 
σ1z = σz ⊗ I = (2.35)

⊗ = ,
0 −1 0 1  1 0 1 0 
0· −1 ·
0 1 0 1
 
+1 0 +1 0
1 · 0 −1 0·

z 1 0 +1 0 0 −1 , (2.36)

σ2 = I ⊗ σz = ⊗ =

0 1 0 −1 +1 0 +1 0 
0· 1·
0 −1 0 −1
y vemos que coinciden. De la misma manera se puede encontrar la representación matricial
de otros operadores del sistema compuesto, como por ejemplo
   
1 0 1 0 0 0 1 0
0· 1·
0 1 1 0 0 1 0 1 0 0 0 1
 , (2.37)
σ1x = σx ⊗I =

⊗ = =
1 0 0 1  1 0 1 0  1 0 0 0
1· 0·
0 1 0 1 0 1 0 0
   
0 1 0 1 0 1 0 0
1 · 1 0·

1 0 0 1 0 1 0 1 0 0 0
 , (2.38)
σ2x = I ⊗σx = ⊗ = =
0 1 1 0  0 1 0 1  0 0 0 1
0· 1·
1 0 1 0 0 0 1 0
que se puede comprobar mediante la acción sobre los elementos de la base:
σ1x |↓↓i = |↑↓i , σ1x |↓↑i = |↑↑i , σ1x |↑↓i = |↓↓i , σ1x |↑↑i = |↓↑i ,
σ2x |↓↓i = |↓↑i , σ2x |↓↑i = |↓↓i , σ2x |↑↓i = |↑↑i , σ2x |↑↑i = |↑↓i .

Un último ejemplo, calculamos la matriz de σ1x σ2x ,
   
0 1 0 1 0 0 0 1
0 · 1 1·

0 1 0 1 0 1 0 0 0 1 0
 . (2.39)
σx ⊗ σx = ⊗ = =
1 0 1 0  0 1 0 1  0 1 0 0
1· 0·
1 0 1 0 1 0 0 0
Esta última matriz puede calcularse de varias formas equivalentes:
σ1x σ2x = (σx ⊗ I)(I ⊗ σx ) = σx ⊗ σx . (2.40)
C Nos gustaría dar un aviso en cuanto a la notación. Es tan normal encontrar los
subsistemas llamados A y B como 1 y 2, y la segunda opción es más normal cuando
hay más de dos. Sin embargo, en la exposición inicial nos ha parecido mejor usar A y
B para distinguir los subíndices referidos a subsistemas de los referidos a estados. Por
otro lado, en ocasiones se usa la notación RA para un operadores local y R = RA ⊗ I
para un operador extendido al sistema total, mientras que en otras ocasiones se usa la
notación σ1x para referirse a este último operador, σx ⊗I. Ambas opciones son válidas,
lo importante es mantener la coherencia. Os sugerimos prestar mucha atención a la
definición exacta de cada símbolo en las distintas aplicaciones.
C ¿Por qué podríamos necesitar operadores del tipo σ1x σ2x ? Porque son los que sirven
para construir el Hamiltoniano de sistemas de muchos cuerpos, que son la clave para
la mecánica cuántica de sistemas complejos, desde los átomos y moléculas, hasta los
sólidos y los dispositivos cuánticos artificiales tales como los computadores cuánticos.
Uno
Pn−1 de los modelos simples para estudiar estos sistemas es el Hamiltoniano tipo Ising,
i=1 σi σi+1 .
x x
Ejemplo 2.6 Consideremos la cadena atómica del ejemplo 1.7, en la que un electrón
podía estar en un orbital situado en cada uno de los átomos de la cadena, que llamábamos
{|ii}ni=1 . Ahora vamos a tener en cuenta el espín del electrón. El espacio de Hilbert en este
caso es el producto tensorial del los estados espaciales y los estados de espín. Dicho de otra
forma: los estados distinguibles se duplican: Ω = {|i, σi}, donde i ∈ {1, · · · , n} y σ ∈ {↓, ↑}
son los dos estados de espín del electrón.
2.3.1 Imposibilidad de clonación

Un teorema central en MQ cuya importancia suele pasar desapercibida es la imposibili-
dad de clonación. Supongamos que tenemos un qubit desconocido, |ui, y un qubit virgen2
que supondremos en el estado |0i. Nos piden copiar el estado |ui en el qubit virgen sin
perder el original. Probaremos que esa tarea es, simplemente, imposible.
Llamemos U al operador de clonación deseado, cuya inexistencia probaremos. Debería
ser capaz de actuar sobre el estado inicial |ui ⊗ |0i y convertirlo en el estado final |ui ⊗ |ui.
Es decir,
U (|ui ⊗ |0i) = |ui ⊗ |ui . (2.41)

2
En el mismo sentido que las tablillas de cera babilónicas o, para los que somos de otra generación, las
cintas de cassette.

Pero esa operación debe poder ejecutarse con un estado arbitrario. Supongamos que par-
timos de otro estado diferente, |vi. Entonces,
U (|vi ⊗ |0i) = |vi ⊗ |vi . (2.42)
Perfecto. Pero una operación unitaria debe preservar el producto escalar, de manera que
(hu| ⊗ h0|) (|vi ⊗ |0i) = (hu| ⊗ hu|) (|vi ⊗ |vi) , (2.43)
es decir,
hu|vih0|0i = hu|vihu|vi, (2.44)
y tenemos que hu|vi = hu|vi2 , que sólo es cierto cuando hu|vi = 0 o 1. Es decir: no podemos
clonar estados cualesquiera. Pero sí podemos clonar estados distinguibles. Si sabemos que
nuestro estado es uno de entre una serie de estados distinguibles, podemos clonarlo sin
problemas.
¿Por qué es relevante el teorema de no clonación? Porque hace que tenga sentido la
noción de distinguibilidad, para empezar. Dijimos que dos estados son distinguibles cuando
un solo experimento nos determina con certeza si son o no son el mismo. Si se pudiera
clonar estados, entonces esa definición carecería de interés: bastaría con clonar un estado
centenares de veces y hacer experimentos sobre las copias para encontrar si es o no es
igual que otro estado dado. De la misma manera, el teorema de no clonación protege a
la relación de incertidumbre. Si pudiéramos hacer un número arbitrario de copias de un
estado, podríamos medir el valor esperado de observables no compatibles con precisión
arbitraria.
Resumen 2.3. Cuando combinamos dos estados cuánticos, el conjunto de estados dis-
tinguibles es el producto cartesiano de los de ambos sistemas, ΩT = ΩA ×ΩB . El espacio
de Hilbert compuesto tiene dimensión nT = nA nB y se conoce como producto tensorial
de ambos estados: HT = HA ⊗ HB . La base tensorial se escribe como {|ai i ⊗ |bj i}i,j o
bien {|ai , bj i}. Nótese que el orden es importante.
Podemos extender un operador definido sobre uno de los subsistemas para que actúe
sobre el sistema compuesto, haciendo R = RA ⊗I o bien S = I⊗SB . Sus representaciones
matriciales son Ri1 ,i2 ;j1 ,j2 = (RA )i1 ,j1 δi2 ,j2 y Si1 ,i2 ;j1 ,j2 = δi1 ,j1 (SB )i2 , j2 . Los índices
compuestos pueden contraerse a un índice único I = (i1 − 1)nB + i2 que va de 1 a
nA nB .
Teorema de imposibilidad de clonación: ninguna evolución unitaria puede llevar un
estado genérico |ui ⊗ |0i al estado |ui ⊗ |ui.
2.4 Matriz densidad reducida y entrelazamiento

Consideremos dos qubits en el estado
1
|Φi = (|00i − |01i + |10i − |11i) . (2.45)
2

Es fácil mostrar que este estado es factorizable, es decir, se puede expresar como un estado
producto:
1 1
|Φi = |ui ⊗ |vi = √ (|0i + |1i) ⊗ √ (|0i − |1i) . (2.46)
2 2
En cambio, el estado
1
|Ψi = √ (|01i + |10i) , (2.47)
2
no se puede expresar como el producto de dos estados de un qubit. Supongamos que
|Ψi = |ui ⊗ |vi, con |ui = u0 |0i + u1 |1i y |vi = v0 |0i + v1 |1i. Su producto es
|ui ⊗ |vi = u0 v0 |00i + u0 v1 |01i + u1 v0 |10i + u1 v1 |11i , (2.48)
y eso nos lleva a un sistema de ecuaciones:
u0 v0 = 0, u0 v1 = 1, u1 v0 = 1, u1 v1 = 0, (2.49)
que es incompatible. Al no ser factorizable, decimos que el estado |Ψi está entrelazado.
• • •
¿Qué diferencias hay entre un estado factorizable y un estado entrelazado? Pues, por
ejemplo, el valor esperado de un observable como M = RA ⊗SB sobre un estado factorizable
|Φi = |ui ⊗ |vi es especialmente sencillo:
hΦ|RA ⊗ SB |Φi = hu|RA |uihv|SB |vi = hΦ|R|ΦihΦ|S|Φi, (2.50)
donde R = RA ⊗IB y S = IA ⊗SB . ¿Qué ocurre en los estados entrelazados? Consideremos

RA = SB = σz actuando sobre |Ψi,
hΨ|σz ⊗ σz |Ψi = −1, hΨ|σz ⊗ I|Ψi = 0, hΨ|I ⊗ σz |Ψi = 0, (2.51)
Cuando hRA ⊗ SB i 6= hRihSi se dice que las medidas RA y SB están correlacionadas en

ese estado. Dicho de otra manera: medir RA y SB por separado no nos sirve para predecir
el resultado de medir RA ⊗ SB . Si se nos permite medir lo que deseemos sobre uno de los
subsistemas de un sistema entrelazado, pero sin poder acceder al otro, necesariamente nos
faltará información. En nuestro caso, los espines del estado |Ψi están anti-correlacionados,
pero eso jamás lo lograremos ver accediendo sólo a uno de ellos. Esa pérdida de información
la llamamos entropía de entrelazamiento. Veamos cómo surge.
• • •
¿Cómo podemos describir por separado el estado cuántico de cada espín de un sistema
de dos espines? Si el estado global es factorizable, el estado de cada uno de ellos será
un estado puro. Sin embargo, si el estado global está entrelazado el estado que describe

cada uno de los espines no se corresponderá con ningún estado puro, sino que será preciso
describirlo como un estado mezcla. En el estado |Ψi, como veremos, el primer espín está
en el estado |0i con una probabilidad de 1/2, y en el estado |1i con otro 1/2. La matriz
densidad que describe parte de un sistema se conoce como matriz densidad reducida.
Veamos cómo se calcula en general.
Consideremos el ejemplo del estado |Ψi y un observable de HA , R = RA ⊗ IB , con

r00 r01
RA = , (2.52)
r10 r11
es decir: la acción de RA es RA |0i = r00 |0i + r10 |1i y RA |1i = r01 |0i + r11 |1i. Calculemos
el valor esperado de R en |Ψi:
1
hΨ| R |Ψi = hΨ| (RA ⊗ IB ) √ (|01i + |10i)
2
1
= √ hΦ| (r00 |01i + r10 |11i + r01 |00i + r11 |10i)
2
1
= (h01| + h10|) (r00 |01i + r10 |11i + r01 |00i + r11 |10i)
2
1 1
= (r00 + r11 ) = Tr(RA ). (2.53)
2 2
Y eso es cierto para todo operador que actúe sólo en el primer qubit. En general, si el qubit
estuviera en el estado mezcla ρA , entonces el valor esperado de R sería
hRi = Tr [ρA RA ] . (2.54)
y podemos obtener la Ec. (2.53) con sólo suponer que

1/2 0
ρA = . (2.55)
0 1/2
Nótese que es una matriz densidad perfectamente válida: autoadjunta, de traza unidad y
todos sus autovalores son positivos. Más aún: representa un estado mezcla máximamente
indeterminado. El primer qubit puede estar en sus dos estados, |0i y |1i con la misma
probabilidad, 1/2.
• • •
Hagamos un receso para definir una operación muy útil al tratar con sistemas compues-
tos, la traza parcial. Se trata de una transformación lineal que mapea operadores sobre
H = HA ⊗ HB en operadores sobre HA o sobre HB , es decir, TrB : L(HA ⊗ HB ) 7→ L(HA )
y TrA : L(HA ⊗ HB ) 7→ L(HB ). En el primer caso diremos que hacemos la traceamos el
subsistema B y nos quedamos con el A, y en el segundo lo opuesto: traceamos el subsistema
A y nos quedamos con el B. Las ecuaciones definitorias son
TrB (RA ⊗ SB ) = RA Tr(SB ), TrA (RA ⊗ SB ) = Tr(RA )SB . (2.56)

¿Cómo se obtienen las trazas parciales en la práctica? Sea {|ai i} una base ortogonal de
HA , de dimensión nA , y {|bi i} una base ortogonal de HB , de dimensión nB . El espacio
compuesto es H = HA ⊗ HB , de dimensión nA nB . Todo operador lineal del espacio de
Hilbert compuesto puede escribirse como
X
O= Oi1 j1 ,i2 j2 (|ai1 i ⊗ |bj1 i) (hai2 | ⊗ hbj2 |)
i1 ,j1 ,i2 ,j1
X
= Oi1 j1 ,i2 j2 (|ai1 ihai2 |) ⊗ (|bj1 ihbj2 |) . (2.57)
i1 ,j1 ,i2 ,j2
Para leer esta expresión consideremos que los Oi1 j1 ,i2 j2 se deben leer como una matriz cuyo
índice de entrada (columnas) es i2 j2 y el índice de salida (filas) es i1 j1 . A su vez, cada
uno de esos índices son compuestos y recorren los valores desde 1 hasta nA nB . Asimismo
también es posible entender Oi1 j1 ,i2 j2 como un tensor de cuatro índices, y alternaremos
entre ambas lecturas según nos convenga.
Aplicando la definición de traza parcial y la linealidad tenemos
X
TrB O = Oi1 j1 ,i2 j2 |ai1 ihai2 |Tr (|bj1 ihbj2 |)
i1 ,j1 ,i2 ,j2
X
= Oi1 j1 ,i2 j2 |ai1 ihai2 |hbj1 |bj2 i
i1 ,j1 ,i2 ,j2
X
= Oi1 j1 ,i2 j2 |ai1 ihai2 |δj1 ,j2
i1 ,j1 ,i2 ,j2
 
X X
=  Oi1 j,i2 j  |ai1 ihai2 |, (2.58)
i1 ,i2 j
es decir, TrB O es un operador en HA cuyos elementos de matriz se obtienen como
X
(TrB O)i1 ,i2 = Oi1 j,i2 j , (2.59)
j
y de la misma manera obtenemos
X
(TrA O)j1 ,j2 = Oij1 ,ij2 . (2.60)
i
Veremos ejemplos de cálculo al final de esta sección. De momento basta con tener claro el
concepto base.
• • •
La traza parcial nos va a ser de mucha utilidad para describir las partes de un sistema
cuántico compuesto. Sea un estado cuántico general en H = HA ⊗ HB ,
X X
|Ψi = Cij |ai i ⊗ |bj i = Cij |ai bj i , (2.61)
i,j i,j

que en general estará entrelazado. Deseamos construir una matriz densidad reducida, ρA ∈
L(HA ), definida de forma que el valor esperado de todos los observables RA ∈ L(HA )
coincida con el calculado sobre |Ψi, es decir
Tr (ρA RA ) = hΨ| (RA ⊗ I) |Ψi . (2.62)
Comencemos determinando la matriz densidad asociada al estado global, |Ψi, que es

el proyector sobre el estado, ρ = |Ψi hΨ|. Los elementos de matriz pueden escribirse así
ρi1 j1 ,i2 j2 = hai1 bj1 | ρ |ai2 bj2 i = Ci∗1 j1 Ci2 j2 . (2.63)
Ahora definimos una matriz densidad reducida, ρA , como la traza parcial sobre el
subsistema B de esta matriz densidad,
ρA ≡ TrB ρ = TrB |Ψi hΨ| , (2.64)
y obtenemos sus elementos de matriz a través de la ecuación (2.59)
X X
(ρA )i1 ,i2 = ρi1 j,i2 j = Ci∗1 j Ci2 j . (2.65)
j j
Debemos comprobar, por supuesto, que nuestra definición cumple lo prometido, es decir,
que ρA es realmente una matriz densidad, y que cumple la ecuación (2.62). Comencemos
calculando la traza de ρA , que debe de ser uno.
X X
TrρA = (ρA )i,i = ρij,ij = Trρ = 1. (2.66)
i i,j
Comprobemos, a continuación, que los valores esperados para R = RA ⊗I con |Ψi coinciden
con los valores esperados para RA obtenidos con ρA , es decir, ecuación (2.62):
X
hΨ| R |Ψi =Tr (ρR) = hai bj | ρR |ai bj i
ij
XX

= hai bj | ρ ai0 bj 0 ai0 bj 0 R |ai bj i
ij i0 j 0
XX
= (ρ)ij,i0 j 0 hai0 | RA |ai i hbj 0 |bj i
ij i0 j 0
XX
= (ρ)ij,i0 j ri0 ,i
ij i0 j
X X
= (ρA )i,i0 ri0 ,i = (ρA RA )i,i = Tr (ρA RA ) . (2.67)
i,i0 i
Así, pues, el operador ρA nos permite calcular los valores esperados de las magnitudes del
subsistema A. Y lo mismo es válido para ρB = TrA ρ y el subsistema B.
Un estado puro está entrelazado cuando sus matrices densidad reducidas correspondan
a estados mezcla. Supongamos que deseamos saber si un estado |Ψi ∈ HA ⊗ HB está entre-
lazado. Una manera de saberlo es obtener la matriz densidad reducida para el subsistema

A (o el subsistema B), ρA y comprobar si corresponde a un estado puro o mezcla. La

manera más rápida de hacerlo averiguar si ρ2A = ρA . En caso positivo, ρA es un proyector,
se puede escribir como |ui hu| y el estado |Ψi es factorizable.
Ejemplo 2.7 Veamos un ejemplo, con el estado |Φi = α |00i + β |11i de dos qubits, con
|α|2 + |β|2 = 1. Es decir, ψ00 = α y ψ11 = β. Entonces, la matriz densidad del sistema es
ρ = |Φi hΦ| = (α |00i + β |11i)(α∗ h00| + β ∗ h11|)

=|α|2 |00ih00| + β ∗ α|00ih11| + α∗ β|11ih00| + |β|2 |11ih11|, (2.68)
que podemos escribir en forma de matriz
00 01 10 11
|α|2 β∗α
 
00 0 0
01  0 0 0 0 
ρ=  , (2.69)
10  0 0 0 0 
11 α∗ β 0 0 |β|2
donde hemos etiquetado las filas y las columnas para una mejor comprensión. Para calcular
la matriz densidadP reducida sobre cada uno de los qubits, aplicamos la definición de la traza
parcial, (ρA )i,i0 = j ρij,i0 j , llegando a
X
(ρA )11 = ρ1j,1j = ρ11,11 + ρ12,12 = |α|2 ,
j
X
(ρA )12 = ρ1j,2j = ρ11,21 + ρ12,22 = 0,
j
X
(ρA )21 = ρ2j,1j = ρ21,11 + ρ22,12 = 0,
j
X
(ρA )22 = ρ2j,2j = ρ21,21 + ρ22,22 = |β|2 , (2.70)
j
y vemos que la matriz densidad es diagonal, con pesos |α|2 y |β|2 . Hay un truco para
calcular rápido ρA en este caso: dividir mentalmente la matriz ρ en cuatro cuadrantes y
calcular la traza de cada uno. Si queremos calcular ρB calculamos también la traza parcial:
X
(ρB )11 = ρi1,i1 = ρ11,11 + ρ21,21 = |α|2 ,
i
X
(ρB )12 = ρi1,i2 = ρ11,12 + ρ21,22 = 0,
i
X
(ρB )21 = ρi2,i1 = ρ12,11 + ρ22,21 = 0,
i
X
(ρB )22 = ρi2,i2 = ρ12,12 + ρ22,22 = |β|2 , (2.71)
i
que nos da la misma matriz.
• • •

Notemos que las amplitudes de probabilidad de |Ψi = ij Cij |ai bj i se pueden escribir
P
de manera natural en una matriz rectangular Cij , de dimensión nA × nB , que no tiene que
ser ni autoadjunta ni nada similar. Sin embargo, es P una matriz interesante. Si el estado
es factorizable, entonces |Ψi = |ui ⊗ |vi, con |ui = i ui |ai i y |vi = j vj |bj i, así que
P
Cij = ui vj∗ . Las matrices de esta forma tienen siempre rango unidad.
C Veamos cómo probarlo. Como recordaréis de álgebra lineal, el rango es el número de

filas o columnas linealmente independientes de la matriz. La columna j-ésima será
vj multiplicada por el vector ~u, que siempre es el mismo. Por lo tanto, el número
máximo de columnas linealmente independientes es uno. Lo mismo sucede con las
filas.
Podemos por tanto conjeturar que un estado está entrelazado si y sólo si la matriz de
sus amplitudes tiene rango mayor que uno. En efecto, eso es cierto, pero podremos probar
algo más interesante, utilizando un elemento más del álgebra lineal.
Toda matriz rectangular C, de dimensión nA × nB , puede ser reescrita mediante una
descomposición en valores singulares (en inglés, singular value decomposition, SVD)3 ,
C = U ΣV † , (2.72)
donde U y V son matrices unitarias de dimensiones nA × nA y nB × nB respectivamente,

y Σ es una matriz de dimensión nA × nB cuyos únicos elementos no nulos están en la
diagonal, Σkk = σk ∈ R+ , son todos reales y positivos y se llaman valores singulares de
la matriz C. Así, podemos reescribir la matriz de coeficientes, Cij , de dimensión nA × nB
como
mı́n(nA ,nB )
X
∗
Cij = Uik σk Vkj , (2.73)
k=1
que puede ser insertada en la expresión original del estado |Ψi:
!  
XX X X X
∗ ∗
|Ψi = Uik σk Vkj |ai bj i = σk Uik |ai i ⊗ Vkj |bj i . (2.74)
ij k k i j
Definamos |αk i = |ai i y |βk i = ∗ |b i. Así, podemos escribir nuestro estado

P P
i Uik j Vkj j
como
mı́n(nA ,nB )
X
|Ψi = σk |αk i ⊗ |βk i , (2.75)
k=1
expresión que se conoce como descomposición de Schmidt de un estado puro en H =

HA ⊗ HB . Supongamos que los valores singulares σk se ordenan de manera descendente,
de manera que sólo los primeros nS sean diferentes de cero. La suma puede extenderse
3
La SVD es tremendamente útil, no sólo en esta aplicación. Por ejemplo, se emplea mucho en estadística
y en el desarrollo de algoritmos de aprendizaje automático (machine learning). Existen algoritmos muy
eficientes para su cálculo a través de paquetes de software libre, como LAPACK.

sólo hasta ese valor, que suele conocerse como número de Schmidt. Si nS = 1, el estado es
factorizable, y tenemos |Ψi = |α1 i ⊗ |β1 i. Si nS > 1, el estado está entrelazado.
• • •
Partiendo de la descomposición de Schmidt, ecuación (2.75), es sencillo obtener las

matrices densidad reducidas de cada una de las partes:
nS
X
ρA =TrB |Ψi hΨ| = TrB σk σk0 |αk i ⊗ |βk i hαk0 | ⊗ hβk0 |
k,k0 =1
nS
X
= σk σk0 TrB (|αk i hαk0 | ⊗ |βk i hβk0 |)
k,k0 =1
XnS
= σk σk0 (|αk i hαk0 |) Tr (|βk i hβk0 |)
k,k0 =1
XnS
= σk σk0 |αk i hαk0 | δk,k0
k,k0 =1
nS
X
= σk2 |αk i hαk | , (2.76)
k=1
El resultado final nos dice que la matriz densidad reducida ρA es diagonal en la base de
los {|αk i}, con autovalores dados por σk2 . Recordemos que la mejor manera de caracterizar
una matriz densidad es a partir de sus autovectores y autovalores: el subsistema A está
en el estado puro |αi i con probabilidad σi2 . De la misma manera podemos operar con la
matriz densidad reducida de la parte B, obteniendo
X
ρB = σk2 |βk i hβk | , (2.77)
k
y llegamos a un resultado clave: las dos matrices densidad reducidas, ρA y ρB , correspon-

dientes a las dos partes en las que se divide un sistema en un estado puro tienen el mismo
espectro (descontando valores nulos). El espectro de la matriz densidad reducida, {σk2 },
(descontando ceros) se conoce como espectro de entrelazamiento.
C ¿Qué ocurre cuando el sistema está compuesto por más de dos subsistemas? Supon-
gamos que H = H1 ⊗ H2 ⊗ · · · ⊗ HN , que puede servirnos para describir e.g. cada
átomo de un sólido, o distintos modos de un sistema óptico. En este caso, existen
muchas posibles biparticiones del sistema en dos partes, e.g. podemos llamar parte A
a las partes 1, 3 y 16, y parte B a las demás. En ese caso, el entrelazamiento depen-
de de la bipartición que elijamos. Consideremos por ejemplo una cadena de espines
1/2, en la que el espín i-ésimo viene descrito por Hi = C2 . Podemos preguntarnos
por el entrelazamiento entre los primeros m espines y los N − m espines finales,
pero también podemos preguntarnos por el entrelazamiento entre los espines pares
y los impares, o cualquier otra bipartición que se nos ocurra. Ambos valores tienen
relevancia tanto teórica como para aplicaciones prácticas.
• • •

Supongamos que nos proporcionan una matriz densidad ρA , sobre HA , con autovalores
{λk } y autovectores {|ψk i}, y nos preguntamos si existe un estado puro |Ψi de un sistema
más grande que la tenga por matriz densidad reducida. Lo que deseamos se conoce como
una purificación del estado mezcla ρA . Una manera sencilla de obtener una purificación
es considerar una copia del espacio de Hilbert, H = HA ⊗ HB con HB = HA y escribir
Xp
|Ψi = λk |ψk i ⊗ |ψk i . (2.78)
k
Es fácil comprobar que la matriz densidad reducida TrB |Ψi hΨ| se corresponde con la ρA
deseada.
• • •
¿Cómo cuantificamos el entrelazamiento? Nos gustaría tener una magnitud que fuera
nula para estados factorizables y no nula para los estados entrelazados. Y, más aún, nos
interesaría que esta magnitud permaneciera invariante cuando realizamos operaciones uni-
tarias sobre cada uno de los subsistemas por separado. La más sencilla de las magnitudes
que cumplen estas condiciones es la entropía de entrelazamiento, que es la entropía de
von Neumann de cualquiera de las dos matrices densidad reducidas, ρA o ρB ,
nS
X
Sent = −Tr (ρA log ρA ) = −Tr (ρB log ρB ) = − σk2 log σk2 . (2.79)
k=1
donde es fácil ver que el resultado debe ser el mismo calculando sobre ρA y sobre ρB , ya
que el espectro de entrelazamiento es el mismo.
Comprobemos las propiedades que hemos exigido a la entropía de entrelazamiento. Si
el estado no está entrelazado, entonces σ1 = 1 y todos los demás son nulos, llegando así a
Sent = 0. En cambio, si tenemos más de un autovalor no nulo siempre tendremos Sent > 0.
Además, cualquier operación unitaria que actúe sobre uno de los subsistemas debe dejar
invariante el espectro de entrelazamiento, manteniendo así el valor de la entropía. Como
ejercicio, demuéstrese este último punto.
El máximo entrelazamiento posible se obtiene cuando los autovalores σk2 de la matriz
densidad están máximamente dispersos, es decir: σk2 = 1/m, donde m = mı́n(nA , nB ).
Asumamos que nA ≤ nB por conveniencia. Entonces, la matriz densidad reducida ρA es
proporcional a la identidad sobre HA , mientras que ρB tendrá nA autovalores no nulos (e
iguales) y nB − nA autovalores nulos. Así, podemos comprobar que la entropía de entrela-
zamiento es
m
X 1 1 m
Sent =− log = log(m) = log(m). (2.80)
m m m
k=1
Recordemos la expresión original de Boltzmann, S = log Ω, la entropía es el logaritmo del

número de estados. Podemos dar la vuelta a dicha expresión, y definir el número de estados
relevantes como la exponencial de la entropía. En este caso, máximamente entrelazado,
vemos que Sent = log(m), así que el número de estados relevantes será el máximo posible,
m.
Consideremos un sistema fuertemente entrelazado. Si tenemos acceso a uno solo de
los subsistemas, las medidas nos parecerán aleatorias porque la matriz densidad reducida

tiene una alta entropía. En cambio, si tenemos acceso al sistema completo, las medidas
muestran unas regularidades profundas, con correlaciones fuertes entre los dos subsistemas.
Esto tendrá mucha importancia en los protocolos de comunicación cuántica, como veremos
en el próximo capítulo. En estos protocolos se utilizan estados máximamente entrelazados
de dos partículas, de modo que aunque alguien pueda acceder al estado de una de ellas no
pueda extraer la información almacenada, porque está contenida en las correlaciones entre
las dos.
Ejemplo 2.8 Consideremos el siguiente estado de tres qubits,
1
|Ψi = √ (|000i + |001i + |110i) . (2.81)
3
Se nos pide obtener la entropía de entrelazamiento del primer qubit con respecto a los otros
dos. En este caso el subsistema A estará formado por el primer qubit y el subsistema B
por el segundo y el tercero. Veamos cómo resolver este problema siguiendo todos los pasos.
La matriz densidad global se escribe como
1
ρ = |Ψi hΨ| = (|000i + |001i + |110i) (h000| + h001| + h110|) , (2.82)
3
que nos da nueve términos cuando la escribimos por completo. Afortunadamente podemos
saltarnos ese paso y pasar directamente a la matriz densidad global, que escribiremos de
la siguiente forma:
000 001 010 011 100 101 110 111
1/3 1/3 0 0 0 0 1/3 0

 
000
001
 1/3 1/3 0 0 0 0 1/3 0
 

010  0 0 0 0 0 0 0 0 
 
011
 0 0 0 0 0 0 0 0
(2.83)
 
ρ= ,
100  0 0 0 0 0 0 0 0 
 
101
 0 0 0 0 0 0 0 0 
 
110
 1/3 1/3 0 0 0 0 1/3 0 
111 0 0 0 0 0 0 0 0
donde hemos orlado la matriz para que sea más fácil reconocer el patrón: los elementos de
matriz no nulos son aquellos cuya fila y columnaP correspondan a un elemento no nulo del
estado original. Es decir, si el estado es |Ψi = i Ci |ii entonces ρij = Ci∗ Cj .
Ahora extraemos la matriz densidad reducida correspondiente al primer qubit. La forma
rápida es dividir la matriz en cuatro cuadrantes y sacar la traza de cada uno, pero vamos
a hacerlo más despacio en esta ocasión, a través de la ecuación (2.65)
X
(ρA )i1 ,i2 = ρi1 j,i2 j , (2.84)
j
donde j recorre todos los estados del subsistema 2: {00, 01, 10, 11}. Así tenemos:

X
(ρA )0,0 = ρ0j,0j = ρ000,000 + ρ001,001 + ρ010,010 + ρ011,011 = 1/3 + 1/3 + 0 + 0 = 2/3,
j
X
(ρA )0,1 = ρ0j,1j = ρ000,100 + ρ001,101 + ρ010,110 + ρ011,111 = 0 + 0 + 0 + 0 = 0,
j
X
(ρA )1,0 = ρ1j,0j = ρ100,000 + ρ101,001 + ρ110,010 + ρ111,011 = 0 + 0 + 0 + 0 = 0,
j
X
(ρA )0,1 = ρ0j,1j = ρ100,100 + ρ101,101 + ρ110,110 + ρ111,111 = 0 + 0 + 1/3 + 0 = 1/3,
j
(2.85)
de donde extraemos la matriz densidad reducida completa,

2/3 0
ρA = , (2.86)
0 1/3
que ya es diagonal, así que el espectro de entrelazamiento es el conjunto {1/3, 2/3} y la

entropía de entrelazamiento viene dada por

X 1 1 2 2 2
S=− pk log pk = − log − log = log(3) − log(2) ≈ 0.637. (2.87)
3 3 3 3 3
k
Ejemplo 2.9 Vamos a realizar un problema muy detallado, mostrando cómo el entre-
lazamiento entre dos espines evoluciona en el tiempo cuando interactúa con un cierto
Hamiltoniano. Consideremos un sistema formado por dos espines 1/2, inicialmente en el
estado:
1
|Ψi = √ (|++i + |−+i) , (2.88)
2
usando la notación |+i ≡ |Z+ i y |−i ≡ |Z− i. A continuación proponemos dos rutas de
evolución. La ruta (a) consiste en aplicar un campo magnético diferente en cada espín,
según el Hamiltoniano
H (a) = σz,1 ⊗ I + I ⊗ σx,2 . (2.89)
mientras que la (b) consiste en aplicar un Hamiltoniano de interacción tipo espín-espín

(también llamado un término de Ising):
H (b) = σz,1 ⊗ σx,2 . (2.90)
Se nos pide determinar la evolución de la entropía de entrelazamiento entre los dos espines
en función del tiempo, a lo largo de las dos rutas.
Comencemos determinando el entrelazamiento del estado antes de comenzar cualquiera

de los protocolos. Podemos realizar el procedimiento estándar, obteniendo las matrices

densidad reducidas de cada uno de los espines y procediendo a diagonalizarlas. Pero es

más rápido considerar que el estado se puede reescribir como
1
|Ψi = √ (|+i + |−i) ⊗ |+i , (2.91)
2
es decir, el estado está factorizado y, por tanto, su entropía de entrelazamiento es nula.
Aun así, es relevante hacer el cálculo completo. Partimos de la matriz densidad completa
del estado:
1
ρ = |Ψi hΨ| = (|++i h++| + |++i h−+| + |−+i h++| + |−+i h−+|) . (2.92)
2
Ahora traceamos sobre el segundo espín para obtener las componentes de la matriz densidad
reducida del primer espín, ρA . Recordemos que debe tener dimensión 2 × 2.
X
(ρA )+,+ = ρ+k,+k = 1/2,
k
X
(ρA )+,− = ρ+k,−k = 1/2,
k
X
(ρA )−,+ = ρ−k,+k = 1/2,
k
X
(ρA )−,− = ρ−k,−k = 1/2, (2.93)
k
y es fácil comprobar que los autovalores de esa matriz son 1 y 0, dejando una entropía de
entrelazamiento nula.
El Hamiltoniano de la ruta (a) actúa de manera independiente sobre los dos espines.
A partir de aquí podemos deducir que el operador evolución total podrá descomponerse
como un producto de operadores evolución actuando sobre cada uno de los espines. Veamos
cómo. Haciendo (como solemos) ~ = 1,
U (t) = exp(−iH (a) t) = exp(−i(HA ⊗ I)t − i(I ⊗ HB )t), (2.94)
donde HA y HB son los Hamiltonianos que actúan sobre cada una de las partículas. Es
fácil comprobar que los operadores HA ⊗ I y I ⊗ HB conmutan, de manera que escribimos
U (t) = exp(−i(HA ⊗ I)t) exp(−i(I ⊗ HB )t)

= (exp(−iHA t) ⊗ I) (I ⊗ exp(−iHB t))
= exp(−iHA t) ⊗ exp(−iHB t). (2.95)
De aquí deducimos que cada espín evoluciona independientemente del otro. ¿Cómo actúa un
operador de evolución unitario sobre una matriz densidad? Supongamos que, para tiempo
t = 0, la matriz densidad del primer espín es ρA (0). Entonces, a tiempo t tendremos
ρA (t) = exp(−iHA t)ρA (0) exp(iHA t), (2.96)

que es una transformación de similaridad que preserva el espectro. Por lo tanto, deducimos
que los autovalores de ρA (t) y los de ρB (t) deben ser constantes del movimiento. Y, por lo
tanto, la entropía de entrelazamiento (que se calcula en base a ellos) a lo largo del protocolo
de evolución (a) debe permanecer constante.
Consideremos el protocolo de evolución (b), en el que el Hamiltoniano combina ambos

espines de manera no trivial. En este caso no podemos hacer uso del resultado anterior. Ante
todo, buscamos los autoestados del Hamiltoniano H (b) . Es fácil ver que serán los productos
tensoriales de los autoestados de σz,1 y σx,2 , pero imaginemos que no nos hemos dado
cuenta de ello y calculémolos de la manera lenta. Contruyamos la matriz del Hamiltoniano
H (b) = σz,1 ⊗ σx,2 en la base {|++i , |+−i , |−+i , |−−i}:
H (b) |++i = |+−i ,

H (b) |+−i = |++i ,
H (b) |−+i = − |−−i ,
H (b) |−−i = − |−+i , (2.97)
(2.98)
que nos lleva a una matriz
 
0 1 0 0
1 0 0 0
H (b) = . (2.99)
0 0 0 −1
0 0 −1 0
y los autoestados se pueden obtener diagonalizando las dos cajas 2 × 2:
1
|u1 i = √ (|++i + |+−i) , E1 = 1,
2
1
|u2 i = √ (|++i − |+−i) , E2 = −1,
2
1
|u3 i = √ (|−+i + |−−i) , E3 = −1,
2
1
|u4 i = √ (|−+i − |−−i) , E4 = 1, (2.100)
2
El siguiente paso es descomponer el estado |Ψi en la base de autovectores. Compruébese

que
1
|Ψ(0)i = (|u1 i + |u2 i + |u3 i + |u4 i) . (2.101)
2
que nos lleva a una evolución temporal de tipo
1
(|u1 i + |u4 i) e−it + (|u2 i + |u3 i) eit . (2.102)

|Ψ(t)i =
2

que, en la base original, se escribe como (tras un poco de álgebra)
1
|Ψ(t)i = √ (cos(t) |++i − i sin(t) |+−i + cos(t) |−+i + i sin(t) |−−i) , (2.103)
2
La matriz densidad reducida sobre el primer espín se calcula igual que antes. Escribamos
la matriz densidad total
1
ρ = |Ψi hΨ| = (cos(t) |++i − i sin(t) |+−i + cos(t) |−+i + i sin(t) |−−i)
2
(cos(t) h++| + i sin(t) h+−| + cos(t) h−+| − i sin(t) h−−|) , (2.104)
que nos lleva a
X
(ρA )+,+ = ρ+k,+k = (cos2 (t) + sin2 (t))/2 = 1/2,
k
X
(ρA )+,− = ρ+k,−k = (cos2 (t) − sin2 (t))/2 = cos(2t)/2,
k
X
(ρA )−,+ = ρ−k,+k = (cos2 (t) − sin2 (t))/2 = cos(2t)/2,
k
X
(ρA )−,− = ρ−k,−k = (cos2 (t) + sin2 (t))/2 = 1/2. (2.105)
k
Si diagonalizamos esa matriz densidad reducida encontraremos los autovalores
1
1 ± cos2 (2t) , (2.106)

λ± =
2
y la entropía valdrá
1 + cos2 (2t) 1 + cos2 (2t) 1 − cos2 (2t) 1 − cos2 (2t)

S(t) = − log − log . (2.107)
2 2 2 2
Nótese que la entropía está acotada entre 0 y log 2, y que pasa por dos extremos periódi-
camente.
Resumen 2.4. Todo estado puro de un sistema compuesto, PNS H = HA ⊗ HB puede ser
escrito como una descomposición de Schmidt, |Ψi = k=1 σk |ak i ⊗ |bk i, donde {|ak i}
y {|bk i} son dos conjuntos de estados
Portogonales de HA y HB y NS ≤ mı́n(nA , nB ) es
el número de Schmidt, σk ∈ R+ y k σk2 = 1. El subsistema A por sí solo puede ser
descrito mediante un estado mezcla,P Scon 2una matriz densidad reducida ρA = TrB (ρ)
que se puede escribir como ρA = N k=1 σk |ak i hak |. El espectro de ρA se conoce como
espectro de entrelazamiento, que se preserva bajo cualquier operación unitaria que sólo
actúe sobre A o sobre B. Llamamos entropía de entrelazamiento a S[ρA ] = S[ρB ].

2.5 Medidas y estados mezcla 73
2.5 Medidas y estados mezcla

2.5.1 Entrelazamiento entre sistema y aparato
En los primeros tiempos de la cuántica era común hablar de colapso de la función
de ondas cuando se realizaba una medición. Ese lenguaje está en desuso debido a que
comprendemos mejor la naturaleza del proceso. La clave para comprender cómo opera una
medición es el entrelazamiento entre el sistema y el aparato de medida.
P Consideremos la medición de un observable A = i ai |ai ihai | sobre el estado |ψi =
P
i αi |ai i, donde los {ai } son no degenerados por sencillez. Tras la medida el estado final
será alguno de los |ai i, con probabilidad dada por P (ai ) = |αi |2 . Supongamos que no
observamos el valor de la medida. En ese caso es apropiado describir elPestado del sistema
como una mezcla de los estados |ai i con pesos P (ai ), es decir: ρ̃ = i |αi |2 |ai i hai |. La
medición ha convertido el estado puro en mezcla.
¿Cómo es posible? La evolución unitaria jamás puede hacer eso. La razón es que el
sistema interactúa con el aparato de medida, de forma que no tiene sentido estudiar el
sistema por sí solo. Siendo más específicos, el sistema se entrelaza con el aparato de medida,
de forma que si nos empeñamos en describir cada uno de ellos por separado debemos
hacerlo en términos de una matriz densidad reducida. Ése es el origen del estado mezcla
que observamos tras la medición.
Sea H el espacio de Hilbert del sistema considerado, y sea A el espacio de Hilbert que
describe los posibles estados del aparato de medida, en el que para cada autovalor del
observable ai existe un estado puntero, |Ai i. El espacio de Hilbert P global es, claro, H ⊗ A.
Supongamos que, inicialmente, el sistema esté en el estado |ψi = i αi |ai i, y asumamos
que estos autovalores son no degenerados para mayor sencillez. El sistema + aparato estará
en un estado producto, |Ψi = |ψi ⊗ |0i. El proceso de medición es un proceso físico a través
del cual el sistema se entrelaza con el aparato de medida, pasando a
E X
Ψ̃ = αi |ai i ⊗ |Ai i , (2.108)

i
y llegamos a que el estado del sistema debe ser descrito mediante la matriz densidad
reducida
X
ρ̃ = |αi |2 |ai i hai | , (2.109)
i
tal como habíamos adelantado.
2.5.2 Medidas sobre estados mezcla

Consideremos ahora que el estado del sistema está descrito por la matriz densidad
k |, y nos preguntan cuál es la probabilidad P (ai ) de obtener el valor
P
ρ = p |u
k k k ihu
ai como resultado de la medida. Supongamos que el estado puro real fuera |uk i. En ese
caso, la probabilidad de obtener el autovalor ai sería Wik = |hui |ak i|2 . Sabiendo que la
probabilidad de que el estado sea |uk i es pk llegamos a
X
P (ai ) = pk Wik , (2.110)
k
es decir, la probabilidad de obtener el autovalor ai es una combinación convexa de las

probabilidades de obtenerlo en cada uno de los estados puros, Wik .

Aunque la expresión (2.110) es perfectamente correcta, es más conveniente seguir un

enfoque algebraico que sólo requiera conocer los operadores A y ρ. Teniendo en cuenta
la posibilidadPde que los autovalores
P de A sean degenerados nos resulta más conveniente
escribir A = ai Pi , donde Pi = m |ai,m ihai,m | es el proyector sobre el subespacio propio
completo. En ese caso,
P (ai ) = Tr(Pi ρPi ), (2.111)
como probaremos a continuación. En efecto, usando la linealidad de la traza, tenemos
X
P (ai ) = pk Tr (Pi |uk ihuk |Pi )
k
 
X X
= pk Tr  |ai,m ihai,m |uk ihuk |ai,m0 ihai,m0 |
k m,m0
X X
Tr hai,m0 |ai,m ihai,m |uk ihuk |ai,m0 i

= pk
k m,m0
X X
= pk hai,m0 |ai,m ihai,m |uk ihuk |ai,m0 i
k m,m0
X
= pk δm,m0 hai,m |uk ihuk |ai,m0 i
k,m.m0
X
= pk |hai,m |uk i|2 , (2.112)
k,m
que es la generalización apropiada de la expresión (2.110) para el caso en el que los auto-
valores de A sean degenerados4 .
¿Qué sucede con el estado tras la medición? Aquí debemos hacer una distinción im-
portante: si el autovalor ai observado no es degenerado, el estado final será necesariamente
puro. En efecto, si observamos ai al medir A, tras la medición el estado será necesaria-
mente |ai i, sea cual sea el estado inicial, sea puro o sea mezcla. Pero si el autoestado es
degenerado, esto ya no es cierto. De hecho, sabemos que el estado final está contenido
necesariamente en el subespacio propio de ai , pero este estado no tiene por qué ser puro.
El estado mezcla general se convierte en un estado mezcla que combina únicamente estados
del subespacio propio de ai .
Si el estado inicial fuera el |uk i, el estado final se obtiene proyectando sobre el subespacio
propio, es decir, Pi |uk i (a falta de normalizar). El estado final tras la medición deberá ser
un estado mezcla compuesto por estados de la forma |ũk i = Pi |uk i para todo k, con pesos
pk . Es decir:
X X
ρ̃i ∝ pk |ũk ihũk | = pk Pi |uk i huk |Pi = Pi ρPi (2.113)
k k
Este estado mezcla aún debe ser normalizado apropiadamente, dividiendo entre la traza:
1
ρ̃i = Pi ρPi , (2.114)
Tr(Pi ρPi )
4
Nótese que hemos hecho uso de la expresión Tr(|uihv|) = hv|ui.

Consideremos ahora otra posibilidad: realizamos la medida del observable A sobre el

estado ρ, pero no observamos el resultado de la medición. Podemos obtener fácilmente la
matriz densidad del estado mezcla resultante mezclando las matrices densidad que obte-
níamos cuando conocíamos el autoestado en una sola combinación convexa:
X X Tr(Pi ρPi ) X
ρ̃ = P (ai )ρ̃i = Pi ρPi = Pi ρPi . (2.115)
Tr(Pi ρPi )
i i i
C El proceso descrito en las ecuaciones (2.114) y (2.115) se conoce como una medida
espectral o medida basada en proyectores (en inglés, projector-based measure, PVM),
que exigen conocer el conjunto de proyectores Pi tales que i Pi = I. Este formalis-
P
mo asume que las mediciones son ideales, en el sentido de que detectan con precisión
sus estados correspondientes y, cuando se repiten siempre se obtiene el mismo resul-
tado. En general, las mediciones no siempre cumplen eso, y es preciso extender el
formalismo. La forma más general de medición es la llamada medida basada en ope-
radores positivos (positive-operator valued measure, POVM), en la que levantamos
la restricción de que los operadores Pi sean proyectores, y sólo exigimos que sean
autoadjuntos y P que sus autovalores sean reales y positivos, además de la partición
de la identidad i Pi = I. Las expresiones (2.114) y (2.115) se aplican de la misma
manera.
C El proceso según el cual pasamos de una combinación lineal α |ai + β |bi a una matriz
densidad de pesos |α|2 y |β|2 se suele llamar decoherencia. La fase relativa entre α y
β suele llamarse coherencia, y es la información que se pierde en el proceso.
Resumen 2.5. El proceso de medida entrelaza el sistema con el aparato de medida, y

de esta manera convierte un estado puro en un estado mezcla, descrito por una matriz
densidad reducida.
Sea un observable A = k ak Pk , donde Pk son proyectores, y ρ una matriz
P densidad.
P
Tras una medida de A sobre el estado ρ el estado vendrá dado por ρ̃ = k Pk ρPk . Si
sabemos que la medida ha dado como resultado el valor ak , el estado será proporcional
a Pk ρPk . La probabilidad de obtener la medida ak es pk = Tr(Pk ρPk ).
2.6 Medida y entrelazamiento

Consideremos un sistema entrelazado, H = HA ⊗ HB , y un estado arbitrario cuya
descomposición de Schmidt es |Ψi = k σk |αk i ⊗ |βk i. Una medición sobre A puede tener
P
un efecto sobre el resultado de una medida posterior sobre B, como podemos comprobar
con un ejemplo sencillo.
2.6.1 La paradoja de EPR

En 1935, Einstein, Podolsky y Rosen propusieron la famosa paradoja de EPR, con el
objetivo de poner a prueba la coherencia interna de la mecánica cuántica. En esta sección
describiremos el contenido físico del artículo original, pero usando un sistema simplificado
que debemos a J.S. Bell. Sea un estado singlete de dos espines 1/2,
1
|Ψi = √ (|01i − |10i) , (2.116)
2

que como sabemos tiene un entrelazamiento máximo, S = log 2, ver ecuación (2.80). Uno
de los espines se lo queda Alicia, y el otro se lo lleva Beatriz, a miles de años luz. Alicia
mide σz sobre su espín, observando el resultado. Los valores posibles son ±1, con proba-
bilidad 1/2. Cuando Beatriz mide σz sobre el otro espín, el valor será necesariamente el
opuesto. En otras palabras, las medidas de σz sobre ambos espines están perfectamente
anti-correlacionadas, pese a la distancia. Es decir: el resultado de la primera medida parece
viajar de manera instantánea de un espín al otro. Sin embargo, si la distancia entre Alicia y
Beatriz es suficientemente grande, la información sobre una de las medidas no puede afectar
al resultado de la otra. ¿Se viola entonces la teoría especial de la relatividad? No, debido a
que los valores observados son aleatorios. Es decir: el entrelazamiento anti-correlaciona los
resultados de las medidas, pero no hay forma de usar ese hecho para que Alicia transmita
un mensaje a Beatriz.
Podríamos pensar que los espines eligieron valor cuando aún estaban juntos, y que
simplemente se acuerdan de los valores que escogieron. Eso es lo que se conoce como una
teoría de variables ocultas: el resultado de la medida no se decide en el acto de medir, sino
que siempre estuvo presente en el estado cuántico, aunque oculta. Es posible construir una
teoría alternativa a la mecánica cuántica basada en la existencia de variables ocultas, pero
tendrá un problema: la teoría no será local. Veamos por qué.
Consideremos qué ocurre si Alicia y Beatriz pueden elegir la componente del espín que
deseen, σn = ~n ·~σ . Es posible demostrar que el estado singlete (2.116) tiene la misma forma
escrito en la base de autoestados de σn , sea cual sea ~n. Supongamos que Alicia elige el
eje X para su medición. Si Beatriz elige también el eje X encontrará una anti-correlación
perfecta entre sus medidas. Sin embargo, si elige otro eje la anti-correlación será menor,
y si elige un eje ortogonal las medidas estarán descorrelacionadas. Asumiendo que Alicia
y Beatriz son libres para elegir el eje que deseen para medir el espín, concluimos que una
teoría de variables ocultas que diera cuenta de los experimentos tendría que ser capaz de
comunicar al espín de Beatriz cuál es el eje que eligió Alicia. Es decir, tendría que violar
el principio de causalidad.
C Deseamos destacar que los estados EPR no vulneran el principio de causalidad gracias
al teorema de no clonación. En efecto, si Alicia y Beatriz pudieran hacer tantas copias
como quisieran de su estado, entonces sí que podrían conocer cuál es el eje en el que
la otra ha medido su qubit, violando el principio de causalidad. El teorema de no
clonación desemboca en el teorema de no-signaling, según el cual el entrelazamiento
no puede ser utilizado para transmitir información superlumínica.
C Existen teorías de variables ocultas que dan las mismas predicciones que la mecánica
cuántica en su rango de validez, pero deben violar el principio de causalidad para
explicar los experimentos. Por ejemplo, la mecánica de Bohm o la mecánica estocástica
de Nelson. Ambas teorías asumen que existe una función de onda extendida en el
espacio, y que las partículas reales son clásicas y se mueven en un potencial creado
por dicha función de onda. Para la mecánica de Bohm la aleatoriedad cuántica es
aparente, y proviene del hecho de que las trayectorias de estas partículas clásicas
son caóticas, mientras que la mecánica estocástica de Nelson asume que siguen un
movimiento browniano dirigido. Ambas pueden ser útiles para realizar cálculos en
ciertas situaciones muy determinadas, y ambas proporcionan predicciones diferentes
de las de la mecánica cuántica a escalas temporales mucho más pequeñas, que han sido
consideradas como explicación posible para las fluctuaciones del universo primitivo.

2.6.2 Entrelazamiento y operaciones locales

Alicia y Beatriz reciben sendos espines que forman un estado puro entrelazado, estando
separadas miles de años luz. ¿Qué puede suceder con ese entrelazamiento en el futuro? Si
Alicia y Beatriz sólo pueden realizar operaciones unitarias sobre cada uno de sus espines,
entonces podemos demostrar que el espectro de entrelazamiento debe preservarse. La de-
mostración es sencilla: si Alicia realizara una operación unitaria sobre su espín, la matriz
densidad reducida del mismo pasará a ser ρ̃ = U ρU † , es decir, una operación de similaridad
que preserva el espectro.
Supongamos que ambas pueden realizar la operación local que deseen sobre sus espines,
ya sean operaciones unitarias o medidas, y además pueden comunicarse los resultados de
sus mediciones a través de un canal de comunicación clásico, siempre manteniendo un
estado puro global para los dos espines. Hablamos entonces de un esquema de operaciones
locales y comunicación clásica (local operations and classical communication, LOCC). El
entrelazamiento entre sus espines no puede aumentar. Más aún, existe un teorema que no
probaremos aquí [10] que afirma lo siguiente: el espectro de entrelazamiento inicial debe
mayorar al espectro de entrelazamiento futuro. Eso significa que si pasamos de un espectro
{λk } a un espectro {λ0k }, entonces λk ≥ λ0k para todo k.
Es decir: mientras que Alicia y Beatriz mantengan sus espines separados el entrelaza-
miento entre ellos sólo puede reducirse. El entrelazamiento se produce siempre debido al
contacto, pero sólo si somos cuidadosos puede sobrevivir a la distancia. En el tema próximo
veremos que el entrelazamiento puede considerarse un recurso a nivel tecnológico.
2.6.3 Desigualdades de Bell

El interés en el entrelazamiento decayó desde 1935 hasta los años 60, cuando John S. Bell
rescató el concepto al encontrar una desigualdad clásica sencilla e intuitiva que la mecánica
cuántica viola, precisamente mostrando lo anti-intuitivo que resulta el entrelazamiento.
Consideremos tres propiedades que un objeto puede o puede no tener. Llamémoslas Z,
N y X. El evento Z será poseer la propiedad Z, y el evento Z̄, corresponderá a no poseerla.
Asimismo, denotaremos p(Z) como la probabilidad de cada evento. El evento XZ denotará
la conjunción, es decir: X y Z. Observemos entonces que p(Z) = p(ZX)+p(Z X̄): el número
de casos en los que tenemos Z es la suma de los casos en los que tenemos Z y X más los
casos en los que tenemos Z pero no X. Ahora escribamos
p(Z N̄ X) + p(N X̄ Z̄) ≥ 0, (2.117)
que es trivial porque las probabilidades son positivas. Sumemos a la izquierda y a la derecha
p(Z X̄N ) + p(Z X̄ N̄ ), obteniendo
p(Z N̄ X) + p(N X̄ Z̄) + p(Z X̄N ) + p(Z X̄ N̄ ) ≥ p(Z X̄N ) + p(Z X̄ N̄ ), (2.118)
y ahora nos damos cuenta de que los dos sumandos del lado derecho se pueden agrupar,
dando p(Z X̄). También nos damos cuenta de que el primer y el cuarto sumando de la
izquierda se pueden agrupar, así como el segundo y el tercero. Nos queda:
p(Z N̄ ) + p(N X̄) ≥ p(Z X̄), (2.119)
que es la desigualdad de Bell. Podemos ver que se trata de una mera relación clásica entre
conjuntos, que se puede mostrar en un diagrama de Venn.

La parte interesante comienza cuando le damos una interpretación cuántica a la de-

sigualdad de Bell. Supongamos que tenemos dos espines en un estado singlete, ecuación
(2.116). Supongamos que Alicia mide la componente a del espín y Beatriz la componente
b. La probabilidad de que ambas obtengan un valor +1 es P (a, b) = sin2 (θ(a, b)/2). Es
decir: si θ(a, b) = 0, la probabilidad es cero, pero si θ(a, b) = π, la probabilidad es 1,
porque ambos espines están totalmente anti-correlacionados. Regresando a la desigualdad
de Bell, tenemos
θ(k, −n) θ(n, −i) θ(k, −i)

1
sin2
+ sin 2 2
≥ sin = . (2.120)
2 2 2 2
Supongamos que n está en el plano XZ, formando un ángulo α con i. Entonces tenemos
π α π α 1 1
sin2 + + sin2 − = (1 + sin α) + cos2 (α/2) ≥ , (2.121)
4 2 2 2 2 2
y esa desigualdad se viola en el tercer cuadrante: α ∈ [−π, −π/2].
Resumen 2.6. En un estado entrelazado la medida sobre una parte del sistema afecta
a ulteriores medidas sobre el resto del mismo, aunque estén en lugares lejanos. Este
hecho no viola el principio de localidad.
2.A Problemas
2.1. Dos espines 1/2 interactúan mediante el Hamiltoniano de Heisenberg, H = J~σ1 · ~σ2 =
J(σ1x σ2x +σ1y σ2y +σ1z σ2z ). Encontrar la expresión matricial de este operador y su espectro.
2.2. Dada una matriz densidad reducida ρA definimos el Hamiltoniano de entrelazamiento

HA de forma que ρA = exp(−HA ), es decir, es el Hamiltoniano que nos daría esa matriz
densidad
√ reducida como una matriz térmica a temperatura kB T = 1. Sea el estado |Ψi =
(1/ 3) (|++i + |+−i + |−−i). Encontrar la matriz densidad reducida del primer espín y
su Hamiltoniano de entrelazamiento.
2.3. Definimos la información mutua entre dos partes de un sistema cuántico, A y B,

I(A : B) = SA +SB −SAB . La información mutua es siempre positiva, pero la demostración
general no es sencilla. Por ello, en este problema se pide realizarlo para un sistema de tres
espines 1/2, A, B y C.
2.4. Considerar un estado arcoiris o rainbow, en inglés, de cuatro espines:
1
|Ψi = (|0011i + |0101i + |1010i + |1100i) . (2.122)
2
Encontrar el entrelazamiento de todas las parejas de espines, y buscar una posible inter-
pretación del término arcoiris.
2.5. Considerar el electrón en la cadena atómica de los ejemplos 1.16 y 2.6, en los que
cada orbital puede estar ocupado por dos electrones de espines opuestos. Consideremos un
Hamiltonano de la forma
n−1
X X
H0 = −ε1 (|i, si hi + 1, s| + |i + 1, si hi, s|) . (2.123)
i=1 s=±

2.A Problemas 79
Describir su espectro, y las diferencias que encontramos debidas a que el sistema tenga
espín.
2.6. En el sistema anterior podemos añadir un campo magnético,
n
X
H = H0 − Γ σz,i . (2.124)
i=1
Calcular el espectro en este caso.
2.7. Incluyamos una interacción más en el sistema anterior, permitiendo transiciones entre
las dos polarizaciones del espín,
n
X
H = H0 − Λ (|i, ↑i hi, ↓| + |i, ↓i hi, ↑|) . (2.125)
i=1
Obtener el espectro en esta situación.
2.8. Aunque el espacio de Hilbert crece enormemente con el tamaño del sistema, muchas
veces es posible considerar un subespacio relevante de dimensión pequeña, y restringir a él
nuestra búsqueda del estado fundamental. Esto constituye el método de Rayleigh-Ritz, o
método variacional restringido a un subespacio. Consideremos el Hamiltoniano de n espines
1/2,
n
X n
X
H = −J σi,z σi+1,z − Γ σi,x , (2.126)
i=1 i=1
también conocido como el modelo de Ising con campo transverso. Diagonalizar numéri-
camente la matriz correspondiente a H para un valor de n > 100 es un problema fuera
del alcance de los superordenadores más potentes. Afortunadamente, hay otras rutas más
inteligentes que el uso de la fuerza bruta. En este problema exploraremos una muy sencilla.
(a) Considerar el límite J → 0, obtener el estado fundamental y su energía de manera
exacta.
(b) Considerar el límite Γ → 0, y repetir el proceso.
(c) Considerar el subespacio formado por ambos estados fundamentales, teniendo en cuen-
ta que no son ortogonales. Obtener el estado fundamental del sistema en el subespacio
expandido por ellos.

3. Tecnologías cuánticas de la información
La mecánica cuántica ha sido esencial para la creación de una gran cantidad de tec-
nologías a lo largo del siglo XX: el efecto fotoeléctrico, los semiconductores, el diseño de
nuevos materiales, el láser o la superconductividad. Todas esas tecnologías se discuten en
cursos especializados de física del estado sólido o de óptica cuántica. Sin embargo, en estos
momentos se está desarrollando una serie de tecnologías cuánticas de la información, que
tienen en común la capacidad para controlar el entrelazamiento cuántico.
Una función de onda de n qubits está caracterizada por 2n amplitudes de probabilidad,
lo que dificulta enormemente nuestra capacidad de cálculo y de predicción. Pero preci-
samente esta dificultad debemos verla como una oportunidad: los sistemas cuánticos de
muchos cuerpos poseen una riqueza de comportamiento enorme, y unas gran capacidad
para el tratamiento de la información. Si un sistema físico puede ser controlado con to-
tal precisión y aun así su comportamiento no puede ser predicho, quizá sea un candidato
interesante para encriptar información o para realizar cálculos.
En los últimos treinta años las tecnologías cuánticas basadas en el entrelazamiento
han tenido un crecimiento enorme, debido a los desarrollos tanto teóricos (teoría de la
información y de la comunicación cuántica) como experimentales (átomos fríos en redes
ópticas, qubits superconductores, iones atrapados). En este capítulo introducimos algunos
de los conceptos más relevantes asociados con este tema.
3.1 Circuitos clásicos y cuánticos

3.1.1 Puertas lógicas y circuitos booleanos
En esta sección recorreremos la parte de teoría clásica de la información precisa para
comprender los avances que suponen los algoritmos cuánticos. Haremos abstracción de las
implementaciones físicas, aunque son muy interesantes, dado que se estudian en cursos de
electrónica y de física del estado sólido.
• • •
En aritmética binaria cualquier número natural N puede representarse mediante una

cadena de ceros y unos de longitud n = dlog2 N e, donde dxe denota el menor entero mayor
o igual que x. Representaremos N como (xn−1 , xn−2 , · · · , x1 , x0 )2 , con xi ∈ {0, 1}, si
n−1
X
N= xi 2i , (3.1)
i=0
y cada uno de estos valores xi se llama un bit. En efecto, podemos representar 2n alterna-
tivas diferentes con n bits, que pueden corresponder con los primeros 2n números enteros.

82 Capítulo 3. Tecnologías cuánticas de la información
Los bits se procesan mediante diferentes operadores booleanos (es decir, referidos al álgebra
de Boole, o álgebra lógica de bits) o puertas lógicas. Su acción sobre los bits es la siguiente:
NOT o negación, representado como x̄ ó ¬x. Su tabla de verdad, es decir, la especi-

ficación completa de su acción, es sencilla: 1̄ = 0 y 0̄ = 1.
XOR o suma binaria, x ⊕ y = x + y mód 2. Su tabla de verdad es: 0 ⊕ 0 = 0,
0 ⊕ 1 = 1 ⊕ 0 = 1 y 1 ⊕ 1 = 0.
AND o producto binario, representado mediante x ∧ y, x · y o meramente xy. Su
tabla de verdad es: 0 ∧ 0 = 0 ∧ 1 = 1 ∧ 0 = 0 y 1 ∧ 1 = 1.
OR, representado como x∨y. Su tabla de verdad es: 0∨0 = 0, 0∨1 = 1∨0 = 1∨1 = 1.
C Es interesante conocer que existe una puerta que, empleada de manera inteligente,
permite generar todas las demás: la puerta NAND, definida por NAND(x, y) ≡
(x ∧ y) = 1 ⊕ xy, es decir: 1 en todos los casos salvo si x = y = 1, que da cero. Todos
los circuitos lógicos, por complejos que sean, pueden construirse usando únicamente
la puerta NAND, y por eso se dice que es una puerta universal.
También es interesante notar que todas las puertas lógicas de dos bits descritas son
irreversibles, en el sentido de que no es posible reconstruir la entrada a partir de la salida,
dado que tiene menor información. En otras palabras: la función asociada no es inyectiva.
Esta irreversibilidad implica que la acción de todas estas puertas, cuando se implementan
físicamente, deben aumentar la entropía del sistema. Según el principio de Landauer, la
desaparición o borrado de un bit de información del sistema implica la generación de una
entropía que como mínimo será de ∆S = kB T log 2 [18].
Por supuesto, es posible emplear sólo puertas reversibles, que necesariamente toman
dos bits y devuelven otros dos. Por ejemplo, la puerta CNOT, o controlled-not, definida
como (x, y) 7→ (x, x ⊕ y), cuya tabla de verdad es la siguiente:
x y s1 s2
0 0 0 0
0 1 0 1
1 0 1 1
1 1 1 0
Es decir, el primer bit queda invariante, y el segundo es negado cuando el primero

está a 1. También es reversible la llamada puerta de Toffoli, o controlled-controlled-not,
(x, y, z) 7→ (x, y, z ⊕ xy). Es decir, si x e y son ambos 1, entonces z se transforma en z̄, y
en caso contrario se mantiene invariante.
• • •
Consideremos una función booleana genérica, f : {0, 1}n 7→ {0, 1}. Por ejemplo, la
paridad, que nos devuelve si el número de unos en la entrada es par (0) o impar (1),
P (x1 , · · · , xn ) = x1 ⊕ x2 ⊕ · · · ⊕ xn . Toda función booleana se puede construir físicamente
mediante la aplicación de un número suficiente de puertas lógicas, que se denomina el
tamaño del circuito. Como muchas de las puertas pueden actuar en paralelo, es conveniente
también definir la profundidad de un circuito, como el número de puertas máximo por el
que pasa un bit inicial. En teoría de la computación uno de los problemas centrales es la
estimación de la complejidad del circuito mínimo que permite calcular una función booleana
dada, definida tanto en términos de tamaño como de profundidad.

|0i H
|0i H Z
|0i H Z
|0i H Z
Figura 3.1: Ejemplo de circuito cuántico. Consta de cuatro qubits, cuya historia debe leerse
de izquierda a derecha. Inicialmente, todos están sometidos a una puerta de Hadamard,
H. Después, aplicamos una puerta control-Z entre el primer y el segundo qubit. Después,
entre el segundo y el tercero. Y, para terminar, entre el tercero y el cuarto. Finalmente,
medimos el valor de todos los qubits.
3.1.2 Puertas cuánticas y circuitos cuánticos

Un bit clásico es un sistema clásico de dos estados, y un qubit es un sistema cuántico
de dos estados. Como en el caso de los bits, en esta sección haremos abstracción de las
realizaciones físicas, aunque son muy interesantes. Los discutiremos en la sección final.
Los avances tecnológicos recientes han conducido a la posibilidad de manipular qubits
de manera individual, aplicando transformaciones unitarias y mediciones, y se puede repre-
sentar gráficamente empleando circuitos cuánticos. Un circuito cuántico es un diagrama
en el que representamos la historia del sistema, con el tiempo avanzando a lo largo de la
horizontal. Cada qubit se representa mediante una línea horizontal, y a lo largo de esa línea
marcamos la presencia de puertas lógicas cuánticas, que son transformaciones unitarias
que afectan a un grupo de qubits, y de mediciones, que afectan normalmente a los qubits
individualmente. Vemos un ejemplo en la figura 3.1. Regresaremos a esta figura al final de
la sección, cuando hayamos descrito todos los elementos precisos.
Una puerta lógica cuántica es una operación unitaria (y, en consecuencia, reversible)
que opera sobre un número pequeño de qubits. Típicamente, uno o dos. Comenzaremos
describiendo las puertas más usuales de un qubit.
La puerta de un qubit más sencilla es la puerta NOT, que actúa igual que su análoga
clásica, NOT|0i = |1i y NOT|1i = |0i. De esta forma, NOT(α |0i + β |1i) = α |1i + β |0i.
Nótese que su acción se corresponde con la de σx , por lo que también se la llama puerta
X. Nótese que NOT2 = I.
La puerta de Hadamard, H, está definida por la transformación

1 1 1 1
H= √ = √ (σx + σz ). (3.2)
2 1 −1 2
Es decir,
1 1
H |0i = √ (|0i + |1i), H |1i = √ (|0i − |1i), (3.3)
2 2
y es fácil ver que H2 = I, es decir, H−1 = H. Una manera útil de expresar la acción de

esta puerta, aunque parezca rebuscada, es
1 1 X
H |xi = √ (|0i + (−1)x |1i) = √ (−1)xy |yi . (3.4)
2 2 y=0,1
Es interesante observar qué ocurre cuando actuamos con puertas de Hadamard sobre
una serie de qubits. Definamos la puerta H⊗n ≡ H ⊗ · · · ⊗ H, y apliquémosla al estado
|0n i ≡ |0i ⊗ · · · ⊗ |0i (ambos, n veces),
H⊗n |0n i = H |0i ⊗ H |0i ⊗ · · · ⊗ H |0i

1
= √ (|0i + |1i) ⊗ (|0i + |1i) ⊗ · · · ⊗ (|0i + |1i)
2n
1
= n/2 (|00 · · · 00i + |00 · · · 01i + · · · + |11 · · · 11i)
2
2n −1
1 X
= n/2 |xi , (3.5)
2 x=0
donde hemos empleado una notación según la cual el ket |x1 x2 · · · xn i se representa me-
diante el número binario formado por esos bits, x = (x1 x2 · · · xn )2 . Así, p.ej., |0101i = |5i
y |1100i = |12i. Se dice que estos estados forman la base computacional.
También podemos calcular la acción de H⊗n sobre un estado arbitrario de la base,
|xi = |x1 x2 · · · xn i,
H⊗n |xi = H |x1 i ⊗ H |xn i ⊗ · · · ⊗ H |0i

1
= √ (|0i + (−1)x1 |1i) ⊗ (|0i + (−1)x2 |1i) ⊗ · · · ⊗ (|0i + (−1)xn |1i)
2n
 
n
1 Y X
= n/2 (−1)xi yi |yi i
2 i=1 y =0,1 i
n −1
2X n −1
2X
1 1 P
= (−1) x1 y1 +x2 y2 +···+xn yn
|yi = (−1) i xi yi
|yi , (3.6)
2n/2 y=0
2n/2 y=0
Por último nos gustaría hacer notar que (H⊗n )2 = I.

La puerta de fase o puerta R(θ) actúa multiplicando el estado |1i por eiθ . Por motivos
históricos, algunas de estas puertas de fase tienen un nombre especial. Así, a R(π) se le
denomina puerta Z o σz , y multiplica el estado |1i por (−1). La puerta S=R(π/2) y
multiplica el estado |1i por i. Y la puerta T=R(π/4).
Cualquier matriz unitaria nos sirve en principio como puerta. Así, por ejemplo, todas
las matrices de Pauli, de la que nos falta mencionar σy , o puerta Y.
• • •
La mayor parte de las puertas de dos qubits y tres qubits emplean el esquema de control.
Eso significa que uno de los qubits nunca se ve afectado, pero controla lo que sucede al
otro. Si el primer qubit es |0i, al segundo no le sucede nada. En cambio, si el primer qubit
es |1i, el segundo (y tercero, en su caso) se ve afectado de la manera convenida.

Figura 3.2: Símbolos para las puertas cuánticas más empleadas. Fuente: [19].
Así, por ejemplo, la puerta CNOT o CX actúa sobre dos qubits de forma que si el
primero es |0i, el segundo se queda igual, pero si el primero es |1i, el segundo se ve afectado
por una puerta NOT. De la misma manera tenemos la puerta CH, o control-Hadamard,
o en general la puerta control-U, en la que la acción sobre el segundo qubit es una uni-
taria arbitraria U . La puerta de Toffoli también responde a este esquema, escribiéndose
normalmente como la puerta CCNOT, o control-control-NOT.
Otra puerta interesante es la puerta SWAP, que intercambia dos qubits, o la puerta
CSWAP, o control-SWAP, que intercambia dos qubits siempre que un tercero, el qubit
de control, esté a 1. En la figura 3.2 se encuentra una tabla con los símbolos empleados
para las puertas cuánticas.
Es de destacar que algunas acciones corrientes en circuitos clásicos son imposibles en

un circuito cuántico. Así, por ejemplo, un qubit no puede ser clonado, de manera que una
línea no puede ser duplicada. El proceso de duplicación de una línea se denomina fanout,
y no está cuánticamente permitido.
• • •
Explicaremos a continuación la notación de los circuitos cuánticos. Como hemos comen-

tado, cada línea horizontal se corresponde con un qubit, numerados en orden descendente,
y el proceso transcurre de izquierda a derecha. A no ser que se especifique otra cosa, todos
los qubits comienzan en el estado |0i.
Es esencial comprender que un circuito cuántico expresa una operación unitaria com-
pleja, y que para escribir dicha operación debemos proceder de derecha a izquierda. Así,
tomando la fig. 3.1, vemos que tenemos el estado |0i⊗4 sobre el que actúan 4 puertas de

Hadamard en paralelo, H⊗4 , y a continuación 3 puertas control-Z. Por último, medimos

σz en los 4 qubits. Por lo tanto, el operador unitario global será
U = CZ34 CZ23 CZ12 H⊗4 , (3.7)
y el estado final será ese el resultado de la actuación de ese operador sobre el estado inicial,
es decir, |φi = U |0i⊗4 .
Resumen 3.1. Un circuito cuántico es un proceso a través del cual se hace actuar a
una serie de puertas cuánticas sobre una serie de qubits. Las puertas son normalmente
de uno o dos qubits (excepcionalmente de tres). Es importante saber leer la operación
de un circuito cuántico.
3.2 Comunicación clásica y cuántica

3.2.1 Comunicación segura
A lo largo de la Historia se han ideado centenares de formas de encriptar la información
para que sólo llegue a su destinatario legítimo y no pueda ser interceptada por terceras
personas [20]. Los encriptadores se han esforzado enormemente en mejorar sus técnicas,
y los criptoanalistas han trabajado denodadamente para volverlas inútiles. La MQ ha
contribuido a escribir el último capítulo de esta historia de siglos.
¿Qué ventajas puede tener la transmisión de información de forma cuántica? Suponga-
mos que Alicia quiere enviar un mensaje a Beatriz, y para ello le envía partículas de espín
1/2 a través de un canal que considera privado, y supondremos que mantienen su coheren-
cia cuántica a lo largo del proceso. Estos espines están polarizados a lo largo del eje Z, y
Alicia prepara un estado |Z+ i por cada 0 y un estado |Z− i por cada 1 (por ejemplo). Sin
embargo, el canal ha sido pinchado, y una espía llamada Eva 1 interactúa con los espines
durante su camino. Si Eva sabe que los espines están polarizados a lo largo del eje Z, se da
cuenta de que puede medirlos sin alterarlos en lo más mínimo. Así, Alicia y Beatriz jamás
sabrán que están siendo espiadas.
Pero supongamos que Alicia y Beatriz sospechan que sus comunicaciones están siendo
interceptadas. Para confirmarlo, Alicia y Beatriz acuerdan enviarse unos cuantos qubits
polarizados en la dirección X+ . Si Eva está midiendo la componente Z de todos los qubits
que pasan, lo que llegará a Beatriz es una mezcla de estados |X+ i y |X− i con probabilidades
1/2. Medir la componente X de todos ellos les informará de la presencia de la espía. Y así
es como comienza la nueva carrera armamentística entre encriptadores y criptoanalistas, y
esta vez la batalla se da empleando la MQ.
C Estos apuntes son demasiado breves para introducir los conceptos básicos de teoría del
cifrado, pero hemos de entender que la transmisión cuántica sólo se debe emplear para
mensajes muy cortos, que a su vez sirven como clave para encriptar otros mensajes.
Por lo general, asumimos que existe un canal clásico entre Alicia y Beatriz, que puede
ser interceptado sin que les preocupe mucho.
1
En inglés suelen llamarse Alice y Bob las personas que intercambian información, y la espía suele
llamarse Eve por eavesdropping, que significa escuchar a escondidas.

3.2 Comunicación clásica y cuántica 87
3.2.2 Protocolo BB84

Un procedimiento algo más sofisticado es el llamado BB84, propuesto por Bennett y
Brassard en 1984 [10]. Alicia y Beatriz acuerdan que los estados |X+ i y |Z+ i señalan el
bit 0, y que |X− i y |Z− i denotan al bit 1. Ahora, Alicia va transmitiendo un mensaje
enviando al azar estados en eje X o en el eje Z. Beatriz, a su vez, mide la componente
X o Z de los qubits que le llegan, al azar. Uno podría pensar que a partir de ese caos es
imposible recuperar el mensaje original, pero comprobaremos que sí es posible hacerlo, si
procedemos con cuidado.
Una vez transmitido todo el mensaje, Beatriz y Alicia intercambian a través de un
canal abierto las elecciones de eje que hicieron en cada qubit, es decir, dos cadenas del tipo
XZZXZXX · · · . A partir de ahí pueden ver las coincidencias: cada vez que la emisión
fue en X y la recepción también tuvo lugar en X, han conseguido transmitir un bit de
información. Y lo mismo, claro está, cuando hayan coincidido en el eje Z.
Veamos un ejemplo en la siguiente tabla, en la que Alicia trata de enviar a Beatriz el
mensaje 0010001110.
No. de bit 1 2 3 4 5 6 7 8 9 10
Mensaje 0 0 1 0 0 0 1 1 1 0
Eje Alicia X Z X X Z X Z Z X Z
Estado enviado |X+ i |Z+ i |X− i |X+ i |Z+ i |X+ i |Z− i |Z− i |X− i |Z+ i
Eje Beatriz X X Z X Z Z X Z X X
Estado recibido |X+ i |X− i |Z− i |X+ i |Z+ i |Z+ i |X− i |Z− i |X− i |X+ i
¿Válido? Sí No No Sí Sí No No Sí Sí No
Cuando Alicia y Beatriz intercambian la lista de ejes se dan cuenta de que han coinci-
dido en los bits números 1, 4, 5, 8 y 9. El resto se han transmitido al azar y no nos sirven.
Tendremos que realizar una nueva transmisión de éstos, así que el procedimiento no es muy
rápido. Pero no es rapidez lo que busca el BB84, sino seguridad.
Hablando de seguridad, ¿podemos saber si el mensaje fue atacado, de cualquier forma?
En efecto, podemos reservar unos pocos bits del mensaje como control. Esos bits serán
contrastados públicamente entre Alicia y Beatriz, enviándose el resultado a través de un
canal abierto. Si no coinciden, de seguro ha habido un ataque.
3.2.3 Codificación densa

En los protocolos anteriores el emisor (Alicia) enviaba una partícula al receptor (Bea-
triz) y con ello le transmitía un bit de información. Hay, sin embargo, un procedimiento
por el que Alicia podría comunicar dos bits de información enviando un solo qubit. Esto
se denomina codificación densa. Para ello precisaremos que Alicia y Beatriz compartan
pares de qubits entrelazados. Por supuesto, si ellas están a una gran distancia los qubits
han debido ser entrelazados en un momento anterior y después transportados. En general,
diremos que el entrelazamiento es un recurso.
Consideremos la siguiente base del espacio de dos qubits, es decir, los siguientes cuatro
estados distinguibles:
Ψ = √1 (|00i ± |11i) , Φ = √1 (|01i ± |10i) ,

± ±
(3.8)
2 2
y supongamos que Alicia y Beatriz comparten el estado |Φ+ i, es decir, cada una tiene uno
de los qubits en su posesión. Alicia desea transmitir a Beatriz dos qubits de información, es
decir, un número del 1 al 4. En función del valor que quiera transmitir aplicará a su qubit
una de entre cuatro transformaciones unitarias posibles: I, σx , σy y σz . Como es natural,

Alicia no puede actuar sobre el qubit de Beatriz, así que el operador real con el que actúa
sobre el estado debe ser I ⊗ I, σx ⊗ I, σy ⊗ I o σz ⊗ I. El resultado es el siguiente:
1 1
√ (|01i + |10i) = Φ+ ,

(I ⊗ I) √ (|01i + |10i) =
2 2
1 1
√ (|11i + |00i) = Ψ+ ,

(σx ⊗ I) √ (|01i + |10i) =
2 2
1 i
√ (|11i − |00i) = −i Ψ− ,

(σy ⊗ I) √ (|01i + |10i) =
2 2
1 1
√ (|01i − |10i) = Φ− . (3.9)

(σz ⊗ I) √ (|01i + |10i) =
2 2
Ahora, Alicia envía su qubit mediante un canal cuántico a Beatriz. Nótese que el estado de
este qubit, al ser la mitad de un par entrelazado, está en un estado mezcla del que (por sí
solo) es totalmente imposible extraer información. Eva no tiene nada que hacer si captura
este qubit.
Sin embargo, cuando el qubit llega a manos de Beatriz, ella tiene ya los dos miembros
del par, así que sólo tiene que realizar una medida apropiada para averiguar en cuál de los
cuatro estados distinguibles está. De esta manera habrá obtenido dos bits de información a
través del intercambio de un solo qubit seguro. ¿Cómo se construye el observable a medir?
Sabemos que un observable se caracteriza por sus autoestados y sus autovalores asociados.
No tenemos más que asignar un autovalor diferente a cada uno de ellos, es decir:
Ω = a1 Φ+ Φ+ + a2 Ψ+ Ψ+ + a3 Ψ− Ψ− + a4 Φ− Φ− , (3.10)

donde a1 , a2 , a3 y a4 son diferentes dos a dos. Una medida de Ω sobre el par que ha
recibido Beatriz le dará cuál es el estado enviado, y por tanto cuáles son los dos bits que
le transmite Alicia. Esta operación suele denominarse una medida de Bell.
3.2.4 Teleportación cuántica

Como sabemos, los estados cuánticos no pueden ser clonados. Sin embargo, pueden ser
transmitidos a largas distancias a través de un proceso denominado teleportación cuán-
tica pero el estado inicial será destruido en el proceso. El proceso que vamos a describir
se realiza de manera rutinaria en el laboratorio [10], y ha llegado a tener lugar a lo largo
de más de 100 km, entre La Palma y Tenerife [21].
Alicia y Beatriz comparten dos qubits entrelazados, A y B, digamos en el estado |Ψ− i.
Además, Alicia tiene un qubit Q en un estado |ψi que desconoce, pero que desea transmitir
a Beatriz. Muy resumidamente, Alicia realiza una medida de Bell sobre los qubits A y Q,
obteniendo un resultado que enviará a Beatriz a través de un canal clásico. Dependiendo
del valor que reciba, Beatriz realizará una operación sobre el qubit B y éste quedará en el
estado |ψi que tenía el qubit Q inicialmente.
Digamos que |ψi = a |0i + b |1i. Entonces el estado completo de los tres qubits puede
ser escrito como
1
|Θi = |ψi ⊗ Ψ− = (a |0i + b |1i) ⊗ √ (|01i − |10i)

2
a a b b
= √ |001i − √ |010i + √ |101i − √ |110i , (3.11)
2 2 2 2

donde los tres qubits deben leerse en el orden Q-A-B. Ahora realizamos una medida de
Bell, es decir, una medida del observable (3.10), sobre los qubits Q y A. El cálculo es más
sencillo si descomponemos cada estado |00i, |01i, etc. en la base de autoestados de Ω, es
decir, |Ψ± i y |Φ± i. El cambio de base se realiza a través de la matriz
    + 
|00i 1 1 0 0 |Ψ i
|11i 1 1 −1 0 0  |Ψ− i
|01i = √2 0 0 1 1  |Φ+ i ,
     (3.12)
|10i 0 0 1 −1 |Φ− i
llegando a
1 + 1 1 1
|Θi = Ψ ⊗ |v1 i + Ψ− ⊗ |v2 i + Φ+ ⊗ |v3 i + Φ− ⊗ |v4 i , (3.13)
2 2 2 2
donde
|v1 i = b |0i−a |1i , |v2 i = −b |0i−a |1i , |v3 i = a |0i−b |1i , |v4 i = a |0i+b |1i .
(3.14)
Ahora supongamos que la medida de Bell nos informa de que el estado de los qubits QA
es |Ψ+ i. Entonces sabemos inmediatamente que el qubit B está en el estado |v1 i, que no es
exactamente el estado deseado, pero se le parece mucho. De hecho, una operación unitaria
sencilla nos lleva a él: |ψi = iσy |v1 i. De la misma manera, si el resultado de la medida de
Bell es |Ψ− i, entonces el estado del qubit B es |v2 i, y tenemos que |ψi = −σx |v2 i. Si la
medida nos hubiera dado |Φ+ i entonces tendríamos que el estado de B es |v3 i y haríamos
|φi = σz |v3 i. Y si el estado medido es |Φ− i no tenemos que hacer nada, porque |φi = |v4 i
directamente.
Nótese en ningún momento Alicia ha enviado ningún qubit a Beatriz. Sólo compartían
una pareja entrelazada, y una serie de medidas inteligentes ha transportado el estado del
qubit objetivo de las manos de Alicia a las de Beatriz.
Resumen 3.2. La transmisión segura de bits de información entre una fuente (Alicia)
y un receptor (Beatriz), ante la presencia de una posible espía (Eva) tiene soluciones
cuánticas, como el protocolo BB84. Si Alicia y Beatriz comparten pares entrelazados
pueden transmitir una cantidad superior de información mediante el proceso de codifi-
cación densa. Aunque un estado cuántico no puede ser copiado manteniendo el original
(teorema de no-clonación) sí que puede ser transmitido mediante el proceso de telepor-
tación cuántica.
3.3 Computación clásica y cuántica

Una de las mayores promesas tecnológicas en la actualidad la constituye la compu-
tación cuántica, es decir, la idea de que operando con qubits podamos resolver problemas
computacionales de una manera netamente más eficiente de la que podríamos hacerlo con
un ordenador clásico.

3.3.1 Teoría clásica de la computación

Si vamos a comparar la capacidad de cálculo de un sistema cuántico con la de un sistema
clásico, debemos saber antes qué es un sistema de cálculo clásico y cómo funciona. En 1936,
Alan Turing describió el computador clásico universal, es decir: aceptamos que todo lo que
puede hacer un computador clásico lo puede hacer también la máquina de Turing. Su
funcionamiento es el siguiente. Tenemos una cinta infinita dividida en celdas. Cada celda
puede estar en blanco, tener un 1 o un 0 marcados, y se pueden borrar. Además, tenemos
un cabezal que puede moverse sobre la cinta. Este cabezal tiene un estado interno, de entre
una serie de estados posibles, y una serie de instrucciones que le dictan qué hacer en cada
momento, en función del bit que lee de la cinta y de su estado interno. Las acciones a su
alcance son siempre del mismo tipo: cambiar el bit sobre la celda en la que está, cambiar
su estado interno y moverse a la izquierda o a la derecha.
Dado un computador, o cualquier sistema físico que sea capaz de realizar tareas de
cálculo, diremos que es Turing-completo si puede imitar a una máquina de Turing. Como
es lógico, siempre hay un aspecto en el que no podrá hacerlo: la cinta nunca puede ser
infinita. Pero prescinderemos de esa limitación en la práctica.
C Los/as estudiantes de esta asignatura estáis acostumbrados/as a programar en len-

guajes de alto nivel (C, Fortran, Python), y quizá algunos/as lo hayáis hecho en
ensamblador. Pero hay un nivel de detalle más allá: programar una máquina de Tu-
ring para realizar una tarea sencilla, tal como determinar si el número de 1’s en la
cinta es par o impar, nos da la sensación de estar programando al nivel más bajo po-
sible. Es una experiencia muy interesante para un/a físico/a, aunque un poco alejada
de la física.
• • •
Pasemos a discutir los aspectos más esenciales de la teoría de la computabilidad y de

la complejidad computacional desde el punto de vista clásico. Aunque queda fuera de
nuestro alcance una discusión mínimamente completa de estos temas, es imprescindible
una base sólida de teoría clásica de la computación antes de abordar las sutilezas asociadas
al mundo cuántico.
Para mayor concreción consideraremos por el momento sólo problemas de optimización.
Veamos primero algunos ejemplos y después daremos una definición formal.
Problema del viajante de comercio (TSP, traveling salesman problem): nos dicen las
distancias por carretera entre una serie de pares de ciudades, y nos piden la ruta más
corta que las visita a todas.
Problema de la mochila: nos dan una serie de objetos junto con su valor y su peso,
y se nos pide que elijamos un conjunto de ellos, con peso total por debajo de una
cierta cota, y con valor máximo.
Factorización: se nos da un entero compuesto y se nos pide encontrar uno de sus
factores.
Satisfactibilidad (SAT): dada una expresión booleana de n variables, encontrar si
existe una valoración global que la haga cierta. Por ejemplo, f (x1 , x2 , x3 ) = x1 ∧ x2 ∨
(x3 ∧ x1 ) se satisface si x1 = 0, x2 = 0 y x3 = 1.
Todos ellos tienen la siguiente estructura en común. En todos hay un espacio de con-
figuraciones Ω y una función de valoración f : Ω 7→ R que nos devuelve un valor real a
partir de cada elemento. En el TSP, el espacio de configuraciones es el conjunto de or-
denaciones de las ciudades, y la función de valoración nos da la distancia de cada una.
En SAT, el espacio de configuraciones es el conjunto de valoraciones de las variables, y la

función de valoración es la que nos devuelve 0 cuando la función booleana es false o 1 si

es verdadera. Deseamos destacar que los espacios de configuración siempre están descritos
por un número de items, N (ciudades, elementos, variables booleanas) y su tamaño crece
exponencialmente con N . Eso hace inviable el enfoque por fuerza bruta y hace necesaria
la búsqueda de algoritmos más inteligentes.
• • •
Para cada uno de esos problemas existe, al menos, un algoritmo que los resuelve. Todos
esos algoritmos pueden formularse sobre una máquina de Turing, y eso es lo que consdira-
remos en lo sucesivo.
Diremos que un problema está en la clase P cuando existe un algoritmo (clásico, claro
está) que puede resolverlo en un tiempo que escala polinómicamente con el tamaño de la
entrada (medida en número de bits). Así, por ejemplo, si nos dan una serie N de enteros y
nos piden encontrar el mayor, el espacio de configuraciones está formado por los números
del 1 al N , y el tiempo de cálculo es proporcional a N , así que está en la clase P. Otros
problemas relevantes en la clase P son la ordenación de una serie de números, la primalidad
o la diagonalización de una matriz.
Por otro lado, un problema está en la clase NP cuando cada configuración puede
comprobarse en tiempo polinómico. Así, todos los problemas en la lista anterior están la
clase NP. Por ejemplo, si nos dan un orden posible para las ciudades, calcular el tiempo
de viaje es rápido. Si nos dan los valores de las variables booleanas en SAT, calcular si la
función total es cierta o falsa se puede hacer en tiempo polinómico. En general, asumimos
que tiempo polinómico significa rápido y todo lo que crezca más rápidamente (por ejemplo,
exponencial) significa lento. Por supuesto, no es lo mismo un algoritmo cuyo tiempo de
cálculo es O(N 2 ) que O(N 10 ), pero podemos aceptar esta barrera como esencial. Notemos
que no importa cuál sea el tiempo que tardamos en los tamaños bajos: sólo nos importa el
comportamiento asintótico. Para valores suficientemente grandes de N , exp(N ) es mucho
mayor que N 10 , aunque eso no ocurre para valores bajos.
El problema abierto más importante de la teoría de la computación es determinar si P
es igual a NP. La intuición y la experiencia de décadas nos dicen que no, pero no existe una
demostración formal. En 1971, Cook probó que ciertos problemas NP tienen una propiedad
especial: si uno de ellos puede resolverse en tiempo polinómico, todos los problemas NP
pueden resolverse en tiempo polinómico. Se llaman problemas NP-completos, y la razón
de que estos problemas sean especiales es que pueden imitar a cualquier otro, de tal manera
que un algoritmo que pueda resolver uno de ellos puede adaptarse para resolver cualquier
otro problema de la clase. El problema NP-completo original es SAT, que es el paradigma
esencial de esta clase.
A día de hoy, creemos que P6=NP, aunque no tengamos una prueba. Si lo contrario
fuera cierto, es decir, si existieran algoritmos polinómicos para resolver problemas NP-
completos, la revolución tecnológica sería formidable. Para empezar, nuestras técnicas
criptográficas actuales dejarían de ser seguras. Centenares de procesos industriales podrían
optimizarse de manera sencilla.
C Hay muchas otras familias de problemas interesantes en la teoría de la complejidad

computacional. Así, por ejemplo, la clase PSPACE contiene a todos los problemas
que pueden ser resueltos por un algoritmo que utiliza una cantidad de espacio (me-
moria) que crece polinómicamente con el tamaño de la entrada. Incluyen la mayoría
de los juegos, tales como el ajedrez. Recordemos que el problema asociado a un juego
es siempre el mismo: dada una configuración del tablero, ¿existe una ruta segura para
ganar?

C En teoría de la computación se suele dar una importancia esencial a los problemas

de decisión, que se responden con sí o no. Los problemas de optimización son una
clase especial de ellos, y al mismo tiempo, todo problema de optimización se puede
descomponer en una serie de problemas de decisión. Imaginemos que estamos tratan-
do de minimizar el tiempo de viaje del TSP. Un problema de decisión sería: ¿puedo
hacer el viaje en menos de 10 horas? ¿De 5 horas? ¿De 2 horas? En la práctica, los
problemas de decisión y de optimización son de dificultad similar.
• • •
La naturaleza calcula de continuo. Si somos inteligentes, quizá podamos emplear sus

capacidades de cálculo en nuestro beneficio. Por ejemplo, hay muchos procesos en nuestro
entorno que minimizan la energía de un cierto sistema físico. Una canica que desliza sobre
una superficie curva buscará un mínimo local. Una película de jabón sostenida entre unos
alambres buscará la forma de energía mínima.
Consideremos el problema de los agregados atómicos: ¿cuál es la configuración de mí-
nima energía de N átomos que interactúan mediante un potencial V (r) dado, que tiene
un único mínimo? El problema es NP-completo, y de alto interés tecnológico. Podemos
tratar de operar simulando la acción de la naturaleza: consideramos N átomos (simulados)
en un medio viscoso, de manera que las fuerzas se conviertan en velocidades en lugar de
aceleraciones. Lo dejamos evolucionar y observamos la configuración resultante. Parece un
algoritmo inteligente, pero por desgracia no funciona bien. La razón es que la función de
valoración sobre el espacio de configuraciones posee un paisaje (landscape) complejo, con
miles de mínimos locales, separados por barreras de potencial. Es enormemente fácil en-
contrar así un estado metaestable o mínimo local, que no sea realmente la configuración
global de mínima energía.
¿Qué lección sacamos de aquí? Que la naturaleza computa, sí, pero si nos restringimos
a la física clásica nada nos hace pensar que su capacidad de cálculo sea superior a la de
una máquina de Turing. ¿Quizá pueda ir más allá la MQ?
3.3.2 Computación cuántica adiabática

¿Cómo puede ayudarnos un computador cuántico en esta tarea? En esta sección des-
cribiremos uno de los dos enfoques a la computación cuántica, la llamada computación
cuántica adiabática (AQC, adiabatic quantum computation), también conocida como an-
nealing cuántico. La lógica es la siguiente: construyamos un sistema cuántico cuyo estado
fundamental nos proporcione la solución al problema planteado. Una vez hecho esto, en
principio debería bastar con enfriar el sistema para encontrar la solución a nuestro pro-
blema. Pero, por desgracia, eso no es una opción realista. La razón es que los problemas
interesantes suelen tener un paisaje complejo, lleno de mínimos locales, que en este caso
se traducen en una cantidad enorme de autoestados de la energía con autovalores muy
similares al estado fundamental. Meramente enfriar es equivalente al algoritmo descrito en
la sección anterior para los agregados atómicos.
La AQC considera otra opción [22]. Sea H0 el Hamiltoniano cuyo estado fundamental
deseamos obtener, y sea H1 otro Hamiltoniano mucho más sencillo, con un estado fun-
damental conocido. Supongamos que hemos obtenido dicho estado fundamental. Ahora
sólo tenemos que ir adaptando el Hamiltoniano de manera suave, desde H0 hasta H1 . El
teorema adiabático nos garantiza que, si el gap energético ∆E no es cero en ningún mo-
mento del sistema, una evolución suficientemente lenta arrastrará el estado desde el estado
fundamental de H0 hasta el de H1 , que es la solución a nuestro problema.

• • •
Veamos un ejemplo práctico. El problema del vidrio de espín es uno de los paradig-
mas de problema NP-completo. Consideremos N espines 1/2, enlazados mediante cables
en forma de red compleja. Los cables, en ocasiones, los fuerzan a mantenerse paralelos,
mientras que en otras ocasiones los fuerzan a ser anti-paralelos. El Hamiltoniano H0 puede
escribirse como
X
H0 = Jij σzi σzj . (3.15)
i,j
El estado fundamental de este Hamiltoniano se obtiene de forma meramente clásica, ya

que es diagonal en la base de autoestados de σzi . Sin embargo, sabemos que es muy difícil
de obtener en la práctica. Así que ideamos otro Hamiltoniano,
X
H1 = −Γ σxi , (3.16)
i
cuyo estado fundamental tiene todos los espines apuntando en el eje X+ , P

es decir, |Ψ1 i =
⊗N
|X+ i . Nótese que el estado |Ψ1 i también puede escribirse como 2 −n/2
x |xi, es decir:
en la base de σz todas las componentes contribuyen por igual. Ahora creamos la familia
de Hamiltonianos siguiente:
H(s) = sH0 + (1 − s)H1 , (3.17)
de forma que H(s = 0) = H1 y H(s = 1) = H0 . Si hacemos t = sT , donde T es el tiempo

total del proceso, y éste toma un valor suficientemente alto, la evolución llevada a cabo por
H(t) nos debería arrastrar el estado fundamental desde el de H1 hasta el de H0 , usando

t t
H(t) = H0 + 1 − H1 . (3.18)
T T
Inicialmente, tenemos un estado cuántico en el que todas las configuraciones están presentes
con la misma probabilidad, y al final sólo habrá sobrevivido la que corresponde a la solución
del problema, con las probabilidades de todas las demás yendo a cero.
• • •
Por supuesto, no puede ser tan fácil. En la práctica, la AQC se enfrenta a un problema
grave. Si el gap energético se hace cero en algún punto, el teorema adiabático deja de ser
cierto. En los casos reales el gap nunca es exactamente cero, pero sí que puede ser muy
bajo. En ese caso, la probabilidad de saltar a un estado excitado, estropeando así el proceso
de cálculo (equivalente a encontrar un mero mínimo local) depende de la velocidad a la
que avancemos. En la práctica, el tiempo necesario para un cálculo AQC debe escalar con
T ∼ ∆E −2 para tener certeza de haber resuelto el problema.
El otro problema técnico es: ¿cómo construimos el Hamiltoniano H0 que nos ayude en
un problema concreto? Se ha desarrollado toda una tecnología para crear los circuitos que
implementen un Hamiltoniano general, que se pueden seguir en la literatura [23].

|0i H x x H
Uf
|0i X H y y ⊕ f (x)
Figura 3.3: Circuito cuántico asociado al algoritmo de Deutsch-Josza para una función
booleana de un solo bit. Partimos, como siempre, de los dos qubits en |0i. Aplicamos una
puerta X o NOT al segundo qubit, y aplicamos una puerta de Hadamard a cada uno de
ellos. Después aplicamos el oráculo. Una puerta de Hadamard más sobre el primer qubit,
y procedemos a medirlo.
Es interesante destacar que, pese a la sencillez del algoritmo, la AQC es universal en

el siguiente sentido. Todo problema resoluble en tiempo polinómico y con error acotado
mediante un ordenador cuántico de cualquier tipo puede resolverse de la misma forma
mediante una AQC. La clase de complejidad computacional asociada se denomina BQP,
bounded-error quantum polynomial-time.
En la actualidad los circuitos cuánticos se han desarrollado de manera superior a la
AQC, y también constituyen una máquina cuántica universal. Además, existen plataformas
de acceso libre, tal como la IBM Quantum Experience que permiten correr programas
cuánticos reales sobre un número pequeño de qubits.
3.3.3 Algoritmo de Deutsch-Josza

En esta sección describiremos el algoritmo de Deutsch-Josza. Su objetivo es algo
artificial. Nos prometen que una determinada función booleana f de n bits es constante o
equilibrada, y nos piden determinar cuál de las dos opciones es la verdadera. En el primer
caso, f toma el mismo valor para todas las entradas, y en el segundo caso f toma el valor
0 en la mitad de las entradas y el valor 1 en la otra mitad. Es decir, si n = 1, la función
f es equilibrada si f (0) 6= f (1) y es constante si f (0) = f (1). Clásicamente, deberíamos
hacer 2n−1 + 1 llamadas a f para saber con certeza si la función es constante o equilibrada,
aunque ese es sólo en el peor caso.
Por sencilez comenzaremos los cálculos con n = 1, pero al terminar mostraremos el
desarrollo para n genérico. Supongamos que en nuestro circuito cuántico disponemos de
un operador unitario Uf que llamaremos oráculo,
Uf |x, yi = |x, y ⊕ f (x)i , (3.19)
y nos preguntaremos cuántas veces debemos aplicar Uf a lo largo del proceso, valor que
se llama complejidad de llamada (query complexity). Clásicamente, deberíamos hacer dos
llamadas. Cuánticamente, como veremos, nos bastará con una. El circuito cuántico asociado
al algoritmo de Deutsch está representado en la figura 3.3
Partimos del estado inicial usual, |00i. Comenzamos aplicando una puerta X o NOT
al segundo qubit, de manera que el estado será |01i. Ahora aplicamos sendas puertas de
Hadamard, H, a ambos qubits, obteniendo como resultado
1
|Ψi = (|0i + |1i) (|0i − |1i) . (3.20)
2

A continuación aplicamos el oráculo, Uf . Notemos que si x ∈ {0, 1},
Uf |xi ⊗ (|0i − |1i) = |xi ⊗ (|0 ⊕ f (x)i − |1 ⊕ f (x)i) . (3.21)

Atención, que aquí viene la magia. Si f (x) = 0, 0 ⊕ f (x) = 0 y 1 ⊕ f (x) = 1, así que el
estado resultante es |xi (|0i − |1i), mientras que si f (x) = 1, 0 ⊕ f (x) = 1 y 1 ⊕ f (x) = 0 y
el estado resultante es |xi (|1i − |0i), de manera que podemos escribir el estado en forma
compacta como
Uf |xi ⊗ (|0i − |1i) = (−1)f (x) |xi (|0i − |1i) . (3.22)

De esta manera, el estado tras el oráculo puede escribirse como
1
1X
|Ψi = (−1)f (x) |xi (|0i − |1i) . (3.23)
2
x=0
Desde este momento prescindiremos del segundo qubit, ya que es el primero, x, el que
contiene la información relevante, y además ambos están factorizados. Si f es constante,
entonces el signo (−1)f (x) es global e irrelevante, así que tenemos (salvo fase global)
1
|Ψi = (|0i + |1i) (|0i − |1i) , si f es constante, salvo fase, (3.24)
2
mientras que si la función es equilibrada, entonces (−1)f tomará un signo diferente en |0i
y |1i y, salvo fase global,
1
|Ψi = (|0i − |1i) (|0i − |1i) , si f es equilibrada, salvo fase. (3.25)
2
De esta manera, una última puerta de Hadamard actuando sobre el primer qubit nos
llevará ese qubit al |0i cuando f sea constante, y al |1i cuando f sea equilibrada. Una
única medida de σz sobre este qubit nos dará la respuesta.
• • •
Reducir el número de llamadas de 2 a 1 no es una ventaja enorme. Cuando hacemos

el salto a n qubits, tenemos una buena noticia y una mala. La buena es que el número
de llamadas al oráculo que precisamos hacer para determinar si la función es constante
o equilibrada sigue siendo una, aunque para realizar la comprobación debemos realizar la
medida de los n qubits. La mala noticia es que el problema no es tan difícil de resolver
clásicamente como parece. Es cierto que, en el peor escenario posible, deberemos realizar
2n−1 + 1 llamadas a la función, así que parece que la mejora es exponencial. Pero en la
práctica, si elegimos los ensayos al azar, la probabilidad de que la función sea equilibrada
cuando hemos hecho m pruebas y siempre nos ha dado un valor constante cae exponencial-
mente con m. Si definimos bien el problema en términos probabilísticos, nos damos cuenta
de que nunca fue un problema realmente difícil.
El caso de n qubits, de todas formas, es muy relevante, y aparece como uno de los
problemas al final de la sección.
Para demostrar la supremacía cuántica, es decir, que los computadores cuánticos po-
drán realizar tareas de manera netamente más eficiente que los computadores clásicos,
necesitamos otro ejemplo. El primer caso que impresiona de verdad es el siguiente.

3.3.4 El algoritmo de búsqueda de Grover

Sabemos que es fácil encontrar el teléfono de alguien mirando la guía telefónica que
está ordenada por orden alfabético. Una búsqueda en una lista ordenada se puede hacer
en dlog2 N e pasos. Pero ¿qué sucede si lo que queremos saber, mirando la guía, es a quién
pertenece un número de teléfono dado? En términos más generales, ¿cuántos números ten-
dríamos que comprobar para encontrar un ítem dado en una base de datos desordenada?
Unas veces encontraríamos el item a la primera o al cabo de unos pocos intentos. Otras
veces lo encontraríamos después de haber examinado casi toda la base. En promedio ne-
cesitaremos N/2 intentos si la base contiene N items, y en el peor caso N , y no importa
si comenzamos desde el principio o realizamos la búsqueda de manera aleatoria. No hay
atajos. Clásicos, claro.
Veamos cómo un algoritmo cuántico puede acelerar la solución. Consideremos un con-
junto de N = 2n estados |xi descritos mediante cadenas de n qubits. Uno de estos estados,
|ωi es el que deseamos, y para reconocerlo tenemos una función booleana tal que f (ω) = 1
mientras que f (x) = 0 para todo ω 6= x. Podemos construir un oráculo del mismo tipo que
en el caso anterior,
Uω |xyi = |xi ⊗ |y ⊕ f (x)i . (3.26)
El mismo truco que usamos en el caso del algoritmo de Deutsch-Josza nos lleva a escribir
Uω |xi ⊗ (|0i − |1i) = (−1)f (x) |xi ⊗ (|0i − |1i) , (3.27)
y es fácil darse cuenta de que no importa que x esté formado por un bit o por muchos.
Olvidando por el momento el segundo qubit, vemos que la acción del oráculo sobre el
primero se resume en
(
− |xi si x = ω,
Uω |xi = (3.28)
+ |xi en caso contrario.
y, por lo tanto, podemos escribir la acción de Uω sobre el primer qubit como Uω = I −

2 |ωi hω|, que representa una reflexión en el hiperplano perpendicular a |ωi. Definamos
también un estado
n −1
2X
⊗n 1
|si = H n
|0 i = |xi , (3.29)
2n/2 x=0
y definamos un operador unitario similar al anterior reflejando en torno a este estado:
Us = 2 |si hs| − I, (3.30)
es decir: cambia el signo a todas las componentes ortogonales a |si, pero deja la componente
a lo largo de |si tranquila. Ahora definimos la transformación de Grover como RG = Us Uω ,
es decir, llamamos al oráculo y seguidamente llamamos a Us . Procedemos a caracterizar
cómo funciona el operador RG , ayudándonos de la figura 3.4. Notemos, ante todo, que
si partimos de un estado en el plano expandido por |si y |ωi, la acción de RG nunca

Figura 3.4: Ilustración de la aplicación de la transformación de Grover.
abandonará dicho plano. Definamos asimismo el estado |s0 i como la proyección de |si
sobre el subespacio ortogonal a |ωi, es decir, |s0 i es ortogonal a |ωi.
Llamemos φ al ángulo que forman los estados |ωi y |si. Es fácil comprobar que cos φ =
|hω|si| = √1N . Ahora definimos θ/2 como el ángulo formado entre |si y |s0 i. Tenemos
√
que θ/2 √ = π/2 − φ, así que sin(θ/2) = 1/ N . Asumiendo que N es realmente grande,
θ ≈ 2/ N .
Partiendo del estado |si y ayudándonos con la figura 3.4 podemos ver que el efecto de
la reflexión en torno a |s0 i seguido de la reflexión en torno a |si es una rotación neta de
θ en la dirección de |ωi. Es decir, RG |si está más cerca de |ωi de lo que estábamos al
principio. Para llegar a |ωi deberemos dar m pasos tal que mθ ≈ π/2, es decir
√
π N
m≈ . (3.31)
4
√
Eso implica que realizando O( N ) rotaciones RG llevamos |si a |ωi con una gran proba-
bilidad. Si N ≈ 106 (n = 20), en lugar de un millón de operaciones bastarían en torno a
1000. Esto sí que resulta una mejora sustancial.
3.3.5 Otros desarrollos

A nivel informativo nos gustaría describir levemente el panorama de la computación
cuántica en el momento de escribir estas notas. Recordemos que el santo grial de la compu-
tación cuántica aún no se ha obtenido: el desarrollo de un algoritmo cuántico para resolver
un problema NP-completo en un tiempo polinómico. Eso implicaría que la clase BQP
contiene a la clase NP, y sería un resultado revolucionario, sobre el que aún cabe dudar.
En 1998 Peter Shor desarrolló el algoritmo cuántico que lleva su nombre para la factori-
zación de un número en tiempo polinómico. El resultado es muy llamativo, ya que no existe
ningún algoritmo clásico hasta el momento capaz de hacerlo, y pone en jaque muchos de
los algoritmos critpográficos clásicos existentes, tales como el algoritmo de clave pública.
Sin embargo, no se ha demostrado que el problema de factorización sea NP-completo, y
probablemente no lo sea. El algoritmo de Shor se basa en el algoritmo de la transformada
de Fourier cuántica, que tiene muchos usos adicionales.
Hemos dejado de lado un aspecto muy importante, que es el sistema de corrección de
errores cuántico. La dificultad más relevante en la producción de computadores cuánticos

es la pérdida de coherencia entre los qubits. En el caso clásico, siempre es posible copiar
la información en varios lugares, para preservarla. Desafortunadamente, el teorema de no
clonación nos impide realizar esto con los qubits, pero aún así es posible diseñar algoritmos
que empleen más de un qubit físico para implementar cada qubit lógico, disminuyendo así
la probabilidad de errores.
El resultado más reciente es la declaración por parte de un equipo de Google en no-

viembre de 2019 de haber conseguido alcanzar la supremacía cuántica, en base de nuevo
a un problema algo artificial: la predicción del comportamiento de un circuito cuántico
aleatorio. Consideremos un circuito de n qubits (en el ejemplo, n = 53) sobre el que actúa
una serie aleatoria de puertas (de entre un conjunto seleccionado) entre pares de qubits
elegidos al azar. Dado que la función de onda tiene 2n componentes, no es sencillo ni si-
quiera almacenar toda la función de onda en un solo ordenador, y mucho menos predecir
el resultado de una medida al final del proceso. El equipo de Google, dirigido por John
Martinis, lo logró. Pero aún así, la competencia en IBM ha manifestado sus dudas sobre
la relevancia de la hazaña [24, 25].
Parece que la computación cuántica es capaz de resolver eficientemente problemas,

siempre que estos hayan sido planteados por la propia mecánica cuántica. En efecto, exis-
ten computadores cuánticos enormemente eficientes en activo, que son los simuladores
cuánticos. Consideremos un sistema cuántico complejo, como una molécula, un agregado
atómico o un sólido. O también sistemas sobre los que es imposible medir, tales como un
átomo en la vecindad de un agujero negro. En todos estos casos conocemos el Hamilto-
niano, y por tanto las ecuaciones de la MQ, pero es difícil tener la capacidad de cálculo
suficiente como para realizar las predicciones que deseamos. Un simulador cuántico es un
sistema sintético, desarrollado en laboratorio, que simula el Hamiltoniano en cuestión con
unos elementos más controlables, cuya interacción puede ser ajustada: átomos fríos, iones
atrapados, qubits superconductores. Describiremos brevemente esos elementos en nuestra
última sección.
Resumen 3.3. Un problema pertenece a la clase de complejidad computacional P

cuando existe un algoritmo que lo resuelve con certeza en tiempo polinómico, y a la
clase NP cuando existe un algoritmo que puede verificar una solución propuesta en
tiempo polinómico. Es un problema abierto determinar si P=NP. Un problema es NP-
completo cuando su pertenencia a P implicaría que P=NP. La existencia de problemas
NP-completos es no trivial, y se sigue del teorema de Cook. Ejemplos de problemas
NP-completos son el problema de la satisfactibilidad o el problema general del vidrio
de espín.
Llamamos supremacía cuántica a la posibilidad de que un algoritmo cuántico supere
exponencialmente al mejor algoritmo clásico. Hemos descrito dos algoritmos cuánticos.
El algoritmo de Deutsch-Josza nos permite determinar si una función booleana es equi-
librada o constante en una sola medida. El algoritmo de Grover nos permite encontrar
un elemento en una lista desordenada en orden N 1/2 pasos, en lugar del N esperado.
Sea H0 un Hamiltoniano cuyo estado fundamental nos proporciona la solución a un
problema, y H1 un Hamiltoniano sencillo. Una computación cuántica adiabática, o
annealing cuántico, consiste en obtener el GS de H1 y arrastrarlo lentamente con el
Hamiltoniano no autónomo H(t) = (t/T )H0 + (1 − t/T )H1 a lo largo de un tiempo T .
La probabilidad en cada momento de pérdida de adiabaticidad escala con (∆E)−2 .

3.4 Implementaciones físicas 99
3.4 Implementaciones físicas

¿Pueden llevarse estos algoritmos a la práctica? ¿Cómo se pueden construir puertas
lógicas cuánticas que actúen de la manera deseada? En la actualidad se utilizan varios
tipos de dispositivos físicos con este fin.
Qubits superconductores. Posiblemente la tecnología más empleada en la actua-
lidad. Una unión de Josephson son dos materiales superconductores separados por una
barrera aislante. Si formamos un circuito cerrado con una unión de Josephson se creará
una super-corriente permanente. Si, además, se introduce una fuerza electromotriz constan-
te, la súper-corriente se volverá oscilatoria. Estos pequeños circuitos de Josephson pueden
almacenar un qubit de varias formas, como por ejemplo en el sentido de la súper-corriente
(qubits de fase, en sentido horario sería |0i y antihorario |1i) o en la presencia de una carga
eléctrica extra (qubits de carga, sin carga |0i y con ella |1i). Asimismo es fácil hacerlos
interactuar entre sí mediante elementos electrónicos, pudiéndose generar puertas lógicas
cuánticas con facilidad.
• • •
Iones atrapados. Los estados |0i y |1i de un qubit simple son meramente el estado
fundamental, f , y un estado excitado metaestable (de larga vida), e, de un ión. La cons-
trucción de la puerta NOT es sencilla: un pulso adecuado de un láser con la frecuencia de
resonancia de la transición f → e permite pasar de |0i a |1i y viceversa. La medida del
qubit puede hacerse mediante un segundo láser sintonizado a la frecuencia de resonancia
entre f y un segundo estado excitado inestable e0 (de corta vida): si el ión se encuentra
en el estado e, este láser no producirá ningún salto de f a e0 , y por lo tanto, tampoco se
detectará una desexcitación e0 → f . Más difícil es la construcción de una puerta de dos
qubits. Ello se consigue colocando varios iones en una trampa de Paul lineal, que alinea
varios iones a lo largo de un eje mediante una combinación de campos eléctricos oscilantes.
Esta cadena de iones con fuerzas eléctricas repulsivas tiene modos normales de vibración
a lo largo del eje. En conjunto, los pulsos láser que actúan sobre los iones excitan también
los modos normales del movimiento oscilatorio, y esto determina, a su vez, la respuesta de
los iones a sucesivos pulsos láser. Cirac y Zoller mostraron en 1995 que se puede construir
una puerta CNOT con tan sólo 5 pulsos láser [26].
• • •
Cavidades QED. Los estados |0i y |1i de un qubit simple son ahora estados electró-
nicos de átomos neutros. La construcción de una puerta NOT es similar a la de los iones
atrapados. La construcción de puertas de dos qubits se consigue atrapando los átomos en
cavidades ópticas perfectamente ajustadas para contener los fotones que resultan de una
transición entre niveles electrónicos. De este modo, unos átomos pueden interaccionar con
otros a través de su acoplamiento con el estado electromagnético en la cavidad.
• • •
Resonancia magnética nuclear (RMN). En este caso los estados |0i y |1i de un
qubit simple son los estados propios del espín de un núcleo atómico. Se puede pasar de uno
a otro aplicando un cambio magnético pulsante. Para la construcción de puertas de dos
qubits se aprovechan las interacciones dipolo-dipolo entre núcleos diferentes. Este sistema
permite tiempos de coherencia especialmente largos, pero tiene el problema de que no puede
utilizarse a muy bajas temperaturas y es difícil conseguir de entrada una fuerte población
de estados |0i.

Resumen 3.4. Existen diversas tecnologías para la realización de sistemas cuánticos

sintéticos sobre los que tenemos un grado enorme de control, como los átomos ultra-
fríos en redes ópticas, los iones atrapados, los qubits superconductores. Además de las
antedichas, están:
La simulación cuántica, en la que un sistema cuántico sintético está descrito por
un Hamiltoniano que imita al de un sistema real de interés, permitiéndonos hacer simu-
laciones de experimentos caros o directamente imposibles.
La metrología cuántica hace referencia a la posibilidad de estimación de parámetros
(p.ej. tiempo, temperatura, entropía) con mayor precisión de la esperada clásicamente.
La termodinámica cuántica nos muestra las limitaciones para extraer trabajo de
sistemas descritos por la MQ.
3.A Problemas
3.1. Un quantum walk se define en analogía con un random walk, a través de una partícula
y una moneda cuántica, que es un qubit adicional. La partícula puede estar en una serie
de estados, |ii, con i ∈ {−n, · · · , n}, y el espacio de Hilbert es el producto tensorial del
asociado a la partícula y el asociado a la moneda. El estado comienza en |Ψi = |0iP ⊗
|0iM , donde el subíndice P se refiere a la partícula y el subíndice M a la moneda. Ahora
procedemos a actuar de la siguiente forma:
(a) Lanzamos la moneda, aplicándole una puerta de Hadamard.
(b) Movemos la partícula, según la siguiente regla: si el estado de la moneda es |0iM , se
mueve un paso a la izquierda, y si el estado de la moneda es |1iM , entonces se mueve un
paso a la derecha.
Se pide encontrar el estado exacto del sistema tras tres lanzamientos de la moneda.
3.2. Diseñe un circuito cuántico que produzca un estado de 4 qubits en el que el primero
esté máximamente entrelazado con el cuarto y el segundo con el tercero. Ese estado suele
denominarse un estado arcoiris o rainbow.
3.3. Consideremos dos parejas de qubits en estados de Bell, es decir, uno de los estados de
la ecuación (3.8). Demostrar que una medida de Bell, realizada en base al operador (3.10)
sobre un qubit de cada par nos cruzará los pares entrelazados.
3.4. Se define la complejidad de un estado cuántico como el número de puertas lógicas

mínimas que necesitamos para generarlo partiendo del estado |0n i. Por supuesto, esta defi-
nición depende del conjunto de puertas que permitamos. Usando las puertas que consideréis
oportuno, estimar la complejidad de los siguientes estados: (a) |X+ i⊗n , (b) estado rainbow,
definido en el problema 3.2., (c) el estado GHZ, definido como 2−1/2 (|0n i + |1n i).
3.5. Determinar el circuito cuántico que implementa el algoritmo de Deutsch-Josza con n

qubits.

II
Sistemas continuos
4 Mecánica cuántica en sistemas continuos . . 103

4.1 Sistemas continuos
4.2 Traslación y Momento
4.3 Simetrías en Mecánica Cuántica
4.4 Rotaciones y Momento Angular
4.5 Ecuación de Schrödinger
4.A Problemas
5 Algunos sistemas cuánticos continuos . . . . . . 133

5.1 Repaso de los sistemas cuánticos básicos
5.2 Partícula en campo electromagnético
5.3 Teoría de colisiones
5.A Problemas
6 El límite clásico . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153

6.1 La Acción Clásica y Cuántica
6.2 Aproximación semiclásica o WKB
6.3 Integración sobre Caminos
6.A Problemas
7 Mecánica cuántica relativista . . . . . . . . . . . . . . 165

7.1 Ecuación de Klein-Gordon
7.2 Ecuación de Dirac
7.3 Hacia la teoría cuántica de campos
7.A Problemas
4. Mecánica cuántica en sistemas continuos
4.1 Sistemas continuos

Consideremos una partícula cuántica moviéndose en una dimensión, en una recta in-
finita. En principio, existe una cantidad infinita de estados distinguibles, uno por cada
posición posible: x ∈ R. De hecho, se trata de un infinito no numerable, pues corresponde a
los números reales1 . Por lo tanto, nuestro espacio de Hilbert parece requerir una dimensión
infinita no numerable, lo cual parece anunciar grandes complejidades matemáticas. A lo
largo de estas páginas veremos que la dimensión efectiva del espacio de Hilbert necesario
es infinita numerable. No parece una ganancia enorme, pero será suficiente para que el
trabajo cotidiano en MQ de sistemas continuos sea factible.
En esta primera sección seguiremos un enfoque constructivo de la MQ en espacios
continuos, en la que iremos introduciendo elementos más sofisticados que los empleados en
Física Cuántica I y II, tales como el operador traslación y la noción de generador de una
transformación, que serán clave para el análisis de las simetrías en MQ.
El continuo es un concepto matemático más complejo de lo que uno puede pensar a
primera vista, y cuando se emplea en física sin suficiente delicadeza puede dar lugar a
paradojas aparentes. Por ejemplo, la energía contenida en el campo eléctrico que rodea
a una carga puntual es infinita2 . La mejor receta para evitarlas es comenzar el trabajo
imaginando que el espacio subyacente es, realmente, discreto, compuesto por N celdas, y
después tomar con cuidado el límite cuando N → ∞.
4.1.1 Del discreto al continuo

Partamos entonces de una partícula cuántica restringida a moverse en el intervalo [0, L],
pero que sólo puede ubicarse en una serie de celdas de anchura ∆x, que etiquetaremos con
valores desde x1 hasta xN , en base a la coordenada de su centro. La longitud total de
nuestro sistema debe ser, por tanto, L = N ∆x. Esta situación es similar a la encontrada
en los ejemplos 1.7 y 1.16, donde se discutía el movimiento de un electrón en una red
atómica. Tenemos entonces N estados distinguibles, es decir, ortogonales entre sí, y que
constituyen una base del espacio de Hilbert asociado H, que termina por ser isomorfo a
CN . Llamaremos |x̃i i a esos estados de posición, que nos permiten escribir cualquier vector
1
Recordamos a los lectores que Q es un conjunto numerable, puesto que es posible asignar un número
natural a todos los racionales en orden, sin saltarse ninguno. Sin embargo, el argumento diagonal de Cantor
nos muestra que no existe ninguna forma de asignar un natural a cada real.
2
Una de las paradojas más llamativas es el teorema de Banach-Tarski, que afirma que una pelota maciza
de radio R puede ser troceada y reconstruida como dos pelotas de radio R. El resultado es matemáticamente
riguroso, si se hace uso del axioma de elección de Zermelo. Sin embargo, carece de sentido físico.

104 Capítulo 4. Mecánica cuántica en sistemas continuos
de este espacio, |Ψi ∈ H, como
N
X
|Ψi = Ψi |x̃i i , (4.1)
i=1
que llamaremos representación de posiciones del estado, donde las amplitudes de probabi-
lidad de encontrar la partícula en cada celda vienen dadas por
Ψi = hx̃i |Ψi, (4.2)
y los valores {Ψi } constituyen la función de ondas (en representación de posiciones). En

el límite en el que N → ∞, los valores {xi } van rellenando toda la línea, hasta llegar al
continuo. De aquí obtenemos la primera pista de que no es preciso considerar un infinito no
numerable. Si {xi } forman un conjunto completo de posiciones se debe cumplir la relación
de cierre,
N
X
|x̃i ihx̃i | = I, (4.3)
i=1
que nos dice que la suma de los proyectores sobre todas las posiciones debe ser la identidad.
Combinando una base ortonormal y un conjunto de valores reales obtenemos un observable,
de forma que podemos definir el operador posición, X,
N
X
X |x̃i i = xi |x̃i i , X= xi |x̃i ihx̃i |, (4.4)
i=1
que nos permite medir la posición de la partícula con una precisión limitada únicamente
por el valor de ∆x = L/N . Así, tenemos que el valor esperado de la posición en un estado
|Ψi vendrá dado por
N
! N

N
!
X X X
hΨ|X|Ψi = Ψ∗i hx̃i |  xj |x̃j ihx̃j | Ψk |x̃k i
i=1 j=1 k=1
N
X N
X
= xj Ψ∗i Ψk hx̃i |x̃j ihx̃j |x̃k i = xi |Ψi |2 . (4.5)
i,j,k=1 i=1
Ahora vamos a permitirnos tomar el límite cuando N → ∞ de la expresión (4.5),
N N L
|Ψi |2
X X Z
hΨ|X|Ψi = lı́m 2
xi |Ψi | = lı́m ∆x xi = dx x |ψ(x)|2 . (4.6)
N →∞ N →∞ ∆x 0
i=1 i=1
donde en el último paso hemos definido
|Ψi |2
≡ |ψ(x)|2 , → ψ(x) = Ψi dx−1/2 , (4.7)
∆x

y después hemos reconocido que el límite de la suma corresponde a la suma de Riemann,

es decir, a la integral del lado derecho. La ecuación (4.7) define la función de ondas en
el continuo, ψ(x), y nos informa de que tiene unidades de [L]−1/2 , es decir, inverso de la
raíz cuadrada de una longitud. Ya hemos destacado en varias ocasiones que las unidades
son clave en el trabajo en física. Para comenzar, si una ecuación es dimensionalmente
inconsistente, sabemos con certeza que estamos haciendo algo mal.
4.1.2 Representación de posiciones

Veamos cómo tomar el límite al continuo de algunas de las expresiones que hemos
empleado anteriormente. Para empezar, el producto escalar,
N
X Z L
hΨ|Φi = Ψ∗i Φi → dx ψ ∗ (x)φ(x), (4.8)
i=1 0
y la condición de normalización se convierte en
N
X Z L
1 = hΨ|Ψi = |Ψi |2 → dx |ψ(x)|2 . (4.9)
i=1 0
Vemos que la combinación |ψ(x)|2 dx es adimensional precisamente porque ψ(x) tiene

unidades de [L]−1/2 , y tiene como significado físico la probabilidad de encontrar la partícula
en el intervalo [x, x + dx]. Es decir, |ψ(x)|2 es una densidad de probabilidad, y nos
permite calcular la probabilidad de que nuestra partícula esté presente en el intervalo
[x0 , x1 ],
Z x1
P ([x0 , x1 ]) = dx |ψ(x)|2 . (4.10)
x0
Consideremos el equivalente en el continuo de la ecuación (4.1), |Ψi = N i=1 Ψi |x̃i i, ha-

P
ciendo Ψi → ψ(x) dx1/2 y |x̃i i → |xi i dx1/2 , mostrando así que |xi debe tener unidades de
[L]−1/2 para que la ecuación final sea dimensionalmente consistente. Así llegamos a
N
X N
X Z L
|Ψi = Ψi |x̃i i = ∆x ψ(xi ) |xi i → dx ψ(x) |xi , (4.11)
i=1 i=1 0
que es, de hecho, la representación de posiciones del estado |Ψi en el continuo. De la misma
manera podemos considerar la ecuación (4.2) que definía las componentes, Ψi = hx̃i |Ψi, y
postular que
ψ(x) = hx|Ψi, (4.12)
que es, de hecho, correcta. En efecto, el lado izquierdo tiene unidades de [L]−1/2 y el lado
derecho también, debido a que hx| tiene las mismas unidades que |xi. De la misma forma,
la relación de cierre (4.3) se convierte en
Z L
dx |xihx| = I, (4.13)
0

que es dimensionalmente correcta porque ambos lados son adimensionales. De la misma

forma, el operador posición se convierte en
N
X Z L
X= xi |x̃i i hx̃i | , → X= dx x |xihx|. (4.14)
i=1 0
C El estado |xi tiene unidades de [L]−1/2 , y sólo se convierte en un vector adimensional

cuando se multiplica por una longitud elevada a 1/2, por ejemplo dx1/2 . Ésa es la
causa de muchas confusiones: hx|xi no es un número puro, sino que tiene unidades
de [L]−1 , y por eso decimos que los vectores |xi de la representación de posiciones
no son normalizables.
¿Podemos calcular la función de ondas de los estados de posición |xi? Sí, pero resulta
conveniente comenzar con los estados |x̃i i del espacio discreto, con ∆x = L/N . En ese
caso, al ser todas las posiciones distinguibles tenemos que
N
X
|x̃i i = δij |x̃j i , (4.15)
j=1
es decir, la función de ondas del estado |x̃i i viene dada por {δij }Nj=1 . El estado en el
continuo |xi i, correspondiente a la misma posición que el |x̃i i, se puede escribir como
|xi i = |x̃i i ∆x−1/2 , y así llegamos a
N N N
X X X δij
|xi i = ∆x1/2 δij |xj i ∆x−1/2 = δij |xj i = ∆x |xj i , (4.16)
∆x
j=1 j=1 j=1
y si definimos la delta de Dirac, δ(xj − xi ), como el límite cuando ∆x → 0 de δij /∆x,

obtenemos
Z L
|xi i = dx δ(x − xi ) |xi . (4.17)
0
Nótese que δ(x−xi ) no es una función continua. Ingenuamente, toma el valor cero si x 6= xi
y un valor ∆x−1 cuando x = xi , así que se va a infinito en el límite al continuo. Además,
tiene unidades de [L]−1 . De esta forma vemos que
δij = hx̃i |x̃j i = ∆xhxi |xj i, (4.18)
de manera que, en el límite en el que ∆x → 0,
hx|yi = δ(x − y), (4.19)
que vuelve a tener unidades de [L]−1 .
Es importante hacer un breve inciso para hablar de la delta de Dirac. En rigor, no

es una función, sino una distribución, es decir, sólo tiene sentido cuando aparece como

integrando: R dx δ(x − a) f (x) = f (a). Sin embargo, la delta de Dirac es el límite de

R
familias de funciones bien comportadas, continuas y derivables. Por ejemplo, en sentido de

distribuciones,
(x − a)2

1
lı́m √ exp − = δ(x − a). (4.20)
σ→0 2πσ σ2
El espacio de Hilbert que estamos describiendo se conoce como L2 ([0, L]), es decir: el
conjunto de funciones de cuadrado integrable en el intervalo [0, L], con el producto escalar
descrito en la ecuación (4.8). Por supuesto, desde aquí es posible construir el espacio de
Hilbert asociado a las funciones de cuadrado integrable sobre la recta real al completo,
L2 (R) o sobre el espacio, L2 (R3 ).
Ejemplo 4.1 Mostrar que la varianza en la posición de una partícula cuántica se calcula
a través de la expresión,
Z L Z L 2
2
σX = hX 2 i − hXi2 = dx x2 |ψ(x)|2 − dx x |ψ(x)|2 . (4.21)
0 0
2 = h(X − hXi)2 i, y expandir dicho

Basta con recordar que la definición de varianza σX
cuadrado con cuidado,
Z L Z L Z L
2 2 2 2 2
σX = dx (x − hXi) |ψ(x)| = dx x |ψ(x)| − 2hXi dx x |ψ(x)|2 + hXi2 ,
0 0 0
(4.22)
donde la última integral es uno por normalización. Desde esta expresión es inmediato llegar
a la que nos piden.
4.1.3 Operadores y Núcleos

En mecánica cuántica discreta podemos definir un operador lineal mediante su expre-
sión en una base {|uk i},
X
A= Aij |ui ihuj |. (4.23)
i,j
donde Aij = hui |A|uj i son los elementos de matriz de A en la base considerada. Si esta
base está formada por estados de posición discretos, |x̃i i, la formulación es idéntica. Pero
si tratamos con estados posición continuos precisamos hacer adaptaciones significativas,
X X Aij Z
A= Aij |xi ihxj |∆x = |xi ihxj |∆x → 2
A= dx dy A(x, y)|xihy|, (4.24)
∆x R2
i,j i,j
donde hemos definido A(x, y) como el límite al continuo de Aij /∆x, y recibe el nombre de
núcleo integral del operador 3 . Las dos variables de A(x, y) son una versión continua
3
No confundir con el núcleo, Ker(A), que es la solución de la ecuación A |ψi = 0. El núcleo integral de
un operador tiene forma de función de dos variables, pero en general es un objeto de tipo diferente, una
distribución.

de los índices de una matriz, jugando x el papel de salida (fila) e y el de entrada (columna),
y pueden ser evaluadas de manera similar,
A(x, y) = hx|A|yi. (4.25)
Veamos cómo actúa el operador A sobre un estado cualquiera, |Ψi =

R
R dz ψ(z) |zi,
Z Z
A |Ψi = dx dy A(x, y)|xihy| dz ψ(z) |zi
2
ZR R
= dx dy dz A(x, y)hy|ziψ(z)|xi
3
ZR
= dx dy dz A(x, y)δ(z − y)ψ(z)|xi
3
ZR Z
= dx dy A(x, y)ψ(y) |xi. (4.26)
R R
donde reconocemos que las componentes del estado A |Ψi en representación de posiciones
vienen dadas por
Z
hx|A|Ψi = dy A(x, y)ψ(y). (4.27)
R
El operador identidad es fácil de expresar en esta notación,
Z Z
I= dx |xihx| = dx dy δ(x − y) |xihy|, (4.28)
R R2
donde la segunda integración parece innecesaria, pero nos permite definir el núcleo integral
del operador: I(x, y) = δ(x−y). La función delta de Dirac es el equivalente continuo a tener
sólo unos en la diagonal: δij → δ(x − y). Veamos cómo representar el operador posición,
X,
Z Z
X= dx x |xihx| = dx dy x δ(x − y) |xihy|, (4.29)
R R2
usando el mismo truco vemos que X(x, y) = x δ(x − y).

Ejemplo 4.2 Considerar el operador A dado por el núcleo integral A(x, y) = θ(x − y),
donde θ(x) es la función de Heaviside, es decir, θ(x) = 1 si x > 0 y cero en caso contrario.
Encontrar A |Ψi donde |Ψi = dx ψ(x) |xi.
R
Tenemos que hx|A|Ψi = dy A(x, y) ψ(y), así que

R
Z ∞ Z x
hx|A|Ψi = dy θ(x − y) ψ(y) = dy ψ(y), (4.30)
−∞ −∞
así que el operador A obtiene una primitiva de la función de onda considerada.

4.1.4 Dimensiones superiores

En la sección 2.3 discutimos la construcción del espacio de Hilbert asociado a un sistema
cuántico cuyos estados distinguibles forman un producto cartesiano. En efecto, si el espacio
de configuración tiene la forma Ω = Ω1 ×Ω2 el espacio de Hilbert será de la forma H = H1 ⊗
H2 . Si la partícula se mueve en dos dimensiones podemos etiquetar los estados distinguibles
con los valores de sus coordenadas x e y, es decir, Ω = R×R y H = L2 (R)⊗L2 (R) = L2 (R2 ).
En este caso, los estados de posición serán |xi ⊗ |yi = |x, yi = |xi. Nótese que estos estados
tiene dimensiones de [L]−1/2 [L]−1/2 = [L]−1 , haciendo que los cálculos sean coherentes
porque la función de ondas ψ(x, y) = ψ(x) tendrá unidades de [L]−1 también, y así
Z Z
|Ψi = dx dy ψ(x, y) |x, yi = d2 x ψ(x) |xi , (4.31)
R2 R2
se convierte en un objeto adimensional, compensando el [L]2 del diferencial d2 x con el [L]−1

de ψ(x) y el [L]−1 de |xi. En el caso de tres dimensiones, la función de ondas continua
tiene dimensiones [L]−3/2 , por el mismo motivo.
En el caso de que la partícula esté dotada de algún grado de libertad interno, tal como el
espín, polarización, isospín, etc. podemos describir el espacio de Hilbert como un producto
tensorial de los grados de libertad espaciales y los asociados, es decir: H = L2 (R3 ) ⊗ Cd ,
donde d es la dimensión del grado de libertad adicional.
Consideremos, por ejemplo, una partícula en una dimensión con espín 1/2. El espacio
de Hilbert asociado será H = L2 (R) ⊗ C2 . Es decir, la base estará formada a partir de los
estados combinados de posición y espín, |xi ⊗ |+i y |xi ⊗ |−i, que podemos abreviar como
|x, ±i. Podemos tener una imagen mental si imaginamos que la partícula puede situarse
en cualquier punto de un espacio formado por dos líneas paralelas, una correspondiendo a
cada valor de Sz . Si la partícula tiene espín 1, serán tres líneas paralelas, etc. Cualquier
suma sobre la base completa debe recorrer todos los estados, tanto en x como en s ∈ {±}.
Así, por ejemplo, la relación de cierre será
XZ
dx |x, si hx, s| = I. (4.32)
s
A todos los efectos podemos operar con este sistema como un producto tensorial. Así,
por ejemplo, los operadores de espín deben escribirse como Sz = I ⊗ ~2 σz . Y, por supuesto,
podemos definir operadores que combinen grados de libertad espaciales y de espín, como
la helicidad, que se define como λ ≡ S · up , donde up ≡ P/|P| es el vector unitario que
apunta en la dirección del momento. Es decir, la helicidad es la componente del espín a lo
largo de la dirección del momento.
Recordemos también que cuando un espacio de Hilbert se puede expresar como un
producto tensorial, H = H1 ⊗ H2 , entonces todo operador que actúe sólo sobre uno de
las partes conmuta con cualquier otro operador que actúe sobre la otra, es decir, A ⊗ I
conmuta con I ⊗ B aunque A y B no conmuten.
Ejemplo 4.3 Consideremos una partícula con espín 1/2 que se mueve a lo largo del eje
X, con función de ondas dada por
1
|Ψi = √ (|φ1 i ⊗ |Z+ i + |φ2 i ⊗ |Z− i) , (4.33)
2

donde |φi i = R dx φi (x) |xi son estados normalizados de L2 (R). Se pide obtener la entropía
R
de entrelazamiento entre el grado de libertad espacial y el de espín cuando (a) |hφ1 |φ2 i| = 1
y cuando (b) hφ1 |φ2 i = 0.
La expresión (4.33) no es necesariamente una descomposición de Schmidt (ver ecuación
(2.75)), porque los estados |φi i no tienen por qué ser ortogonales. De hecho, si los estados
son coincidentes, |hφ1 |φ2 i| = 1 entonces podemos factorizar y tenemos
1
|Ψi = |φ1 i ⊗ √ (|Z+ i + |Z− i) , (4.34)
2
que es factorizable. Sin embargo, si hφ1 |φ2 i = 0 la expresión (4.33) ya es una descomposición
de Schmidt, desde la que es fácil probar que la matriz densidad reducida para el espín es
ρ = I/2, que nos da una entropía S = log 2. El caso general queda como ejercicio.
Resumen 4.1. Cuando el número de estados distinguibles es infinito el espacio de

Hilbert debe tener dimensión infinita. Para una partícula en una dimensión, H = L2 (R)
puede ser expandido en una base de estados de posiciones no normalizables,R {|xi}, que
cumplen hx|x0 i = δ(x − x0 ), donde el operador posición viene dado por X = dx |xihx|.
Las amplitudes de cualquier estado se convierten en una función de onda, ψ(x) = hx|ψi,
de cuadrado integrable, |ψi = dx ψ(x) |xi.
R
Los operadores yaR no pueden ser representados por matrices, sino por núcleos inte-
grales, (Aφ)(x) = dxA(x, y)φ(y), donde A(x, y) = hx|A|yi. El núcleo del operador
posición es X(x, y) = xδ(x − y).
Si la partícula habita un espacio de dimensión superior o si dispone de grados de
libertad internos sólo debemos tomar los productos tensoriales apropiados entre los
espacios de Hilbert correspondientes.
4.2 Traslación y Momento

4.2.1 Operador Traslación
Consideremos un ket |Ψi ∈ L2 (R), con función de ondas hx|Ψi = ψ(x). Ahora definamos
T (a) como el operador lineal sobre el espacio de Hilbert que traslada el estado a unidades de
longitud a la derecha. Es decir, el operador traslación T (a) |xi = |x + ai. La función de
ondas correspondiente a cualquier estado sufre la transformación asociada. Si ψ(x) = hx|Ψi,
entonces
(T (a)ψ)(x) ≡ hx|T (a)|Ψi = ψ(x − a). (4.35)
Es fácil convencerse de que la transformación T (a) debe ser unitaria. En efecto, el producto
escalar de dos estados trasladados debe ser igual que cuando los dos estados están sin
trasladar:

hΦ|T (a)† T (a)|Ψi = hΦ|Ψi, (4.36)
para cualquier pareja de estados |Φi y |Ψi, implicando que T (a)† T (a) = I. Es decir,
T (a)† = T (a)−1 .

Pero lo interesante comienza cuando nos damos cuenta de que T (a) debe variar suave-
mente con a, así que nos está permitido emplear un desarrollo de Taylor,
dψ(x) a2 d2 ψ(x)
hx|T (a)|Ψi = ψ(x − a) ≈ ψ(x) − a + − ··· , (4.37)
dx 2 dx2
y al tomar a muy pequeño, δa → 0, quedarnos sólo con el primer orden,
d
hx|T (δa)|Ψi = ψ(x) − δa ψ(x) + O(δa2 ), (4.38)
dx
que nos lleva a deducir que
d
T (δa) = I − δa + O(δa2 ). (4.39)
dx
De la misma forma, nos damos cuenta de que la composición de dos traslaciones da
lugar a una traslación cuyo parámetro corresponde a la suma de los dos, es decir,
T (a + b) = T (a)T (b) = T (b)T (a), (4.40)
lo que, si añadimos que T (0) = I y que T (a)T (−a) = I, nos muestra que las traslaciones
forman un grupo. Por lo tanto, siempre es posible descomponer una traslación de paráme-
tro a como el producto de dos traslaciones de parámetro a/2, es decir, T (a) = (T (a/2))2 ,
o en el producto de tres traslaciones de parámetro a/3, T (a) = (T (a/3))3 . Generalizando,
hagamos a = M δa, con δa → 0 y M → ∞. Así, tenemos
a d M
d

T (a) = lı́m T (a/M ) M
= lı́m I − = exp −a , (4.41)
M →∞ M →∞ M dx dx
ya que este último límite se corresponde con la definición de la función exponencial,
exp(x) = lı́mM →∞ (1 + xM −1 )M . Nótese que el desarrollo en serie de la expresión (4.41)
no es más que el desarrollo de Taylor del operador traslación, ecuación (4.37).
C Como iremos viendo a lo largo del capítulo, la estructura precedente se aplica de

manera muy general a las transformaciones continuas, tanto en MQ como en física
clásica. Tenemos un grupo continuo, (como las traslaciones) que se obtiene a partir
de la aplicación repetida de unos generadores (como la derivada), que constituyen un
álgebra. Los elementos del grupo siempre se pueden escribir como una exponencial
de los elementos del álgebra.
4.2.2 Operador Momento

Todo operador unitario U se puede escribir como la exponencial compleja de un ope-
rador hermítico, U = exp(−iA), donde A = A† . En efecto, todo operador hermítico puede
escribirse como A = k ak |ak ihak |, con {|akP
i} una base ortonormal y ak ∈ R, y todo
P
operador unitario puede escribirse como U = k uk |ak ihak |, donde uk = exp(−iak ) es una
fase. En efecto, la ecuación (4.41) nos muestra que

ia
T (a) ≡ exp − Px , (4.42)
~

donde Px es un operador que va a resultar muy relevante el resto de este curso, el operador
momento, que en representación de posiciones se escribe como
d
Px ≡ −i~ . (4.43)
dx
Comprobemos que el operador Px es hermítico, analizando cómo actúa en un producto
escalar. En efecto, para que lo sea debe cumplirse que
hΨ|Px |Φi = hΦ|Px |Ψi∗ , (4.44)

y esta expresión puede ser comprobada

d ∞ d ∗
Z Z
∗ ∗
hΨ| Px |Φi = −i~ dx ψ (x) φ(x) = −i~ ψ (x)φ(x) − dx φ(x) ψ (x) .

R dx −∞ R dx
(4.45)
haciendo una integración por partes, y dado que las funciones deben ser de cuadrado
integrable, podemos asumir que el primer término se anula.
Los operadores traslación y momento pueden expresarse también a través de un núcleo

integral, como en la ecuación (4.24). Sabiendo que T (a) |xi = |x + ai podemos determinar
que
Z
T (a) = dx dy δ(x − y − a) |xihy|, (4.46)
R2
Si tomamos a = δa → 0, tenemos
Z
T (δa) = dx dy δ(x − y − δa) |xihy|, (4.47)
R2
y ahora hagamos uso de matemáticas algo perversas. Sabemos que δ(x − y − δa) no es una
función derivable, pero también sabemos que se puede obtener como el límite de funciones
derivables, como en la ecuación (4.20). De esta manera podemos hacer un desarrollo de
Taylor de primer orden,
Z Z
0
dx dy δ 0 (x−y)|xihy|, (4.48)

T (δa) ≈ dx dy δ(x − y) − δaδ (x − y) |xihy| = I −δa
R2 R2
donde δ 0 (x − y) se define en sentido de distribuciones,
Z
dx δ 0 (x − y) f (x) = −f 0 (y). (4.49)
R
¿Cómo entender esta expresión? Mediante una integración por partes,
Z Z
0
dx δ (x − y) f (x) = − dx δ(x − y) f 0 (x) = −f 0 (y). (4.50)
R R
y de ahí deducimos que el núcleo integral del operador momento es
Px (x, y) = −i~δ 0 (x − y). (4.51)

4.2.3 Estados de Momento

¿Cuáles son los autovalores y autoestados del operador momento? Para determinarlos
tenemos que resolver la ecuación
Px |θp i = p|θp i, (4.52)
que en componentes θp (x) = hx|θp i se corresponde con
d
−i~ θp (x) = p θp (x). (4.53)
dx
Si olvidamos de momento las condiciones de contorno, esa ecuación tiene solución para
todo p ∈ R, y es

ipx
θp (x) = A exp , (4.54)
~
que llamaremos la onda plana de momento p, con A una constante. Por supuesto, la
función de ondas no está normalizada, pero es fácil ver que la norma diverge. Vuelve a
ser importante regularizar, es decir, considerar que nuestro sistema está contenido en un
tamaño finito, [−L, L], y luego haremos tender L → ∞,
Z L
hθp |θp i = |A|2
dx eipx/~ e−ipx/~ = 2|A|2 L, (4.55)
−L
así que la única manera de normalizar sería hacer |A| = (2L)−1/2 , impidiéndonos tomar
el límite L → ∞. Pero debemos retomar la cuestión de las condiciones de contorno. Por
simplicidad, consideraremos que el sistema es periódico, es decir, θp (−L) = θp (L). En ese
caso, tendremos que AeipL/~ = Ae−ipL/~ o, equivalentemente,
~πm
ei2pL/~ = 1, → 2pL/~ = 2πm, m ∈ Z, → p= , m ∈ Z. (4.56)
L
Observamos así que la regularización en posiciones y en momentos no es idéntica. En
posiciones nos vemos obligados a definir un ∆x finito, es decir, hemos realizado un corte
ultravioleta (UV), mientras que en momentos debemos introducir un L finito, es decir,
un corte infrarrojo (IR). Si tenemos tanto ∆x como L finito, podemos definir estados de
posición y de momento normalizables. En caso contrario, esto no es posible.
C Las condiciones de contorno periódicas que hemos impuesto pueden resultar poco
naturales en una primera lectura. En efecto, ¿cómo podemos imponer que la función
de onda tome el mismo valor en L y en −L, estando tan alejadas? Una manera posible
es que, en realidad, nuestra línea forme un anillo, es decir, que estemos considerando
L2 (S 1 ) en lugar de L2 ([−L, L]). Sin embargo, la razón última por la que lo hacemos
es por simplicidad matemática. En muchos casos, las condiciones de contorno no
importan mucho si el sistema es muy grande. Pero debemos advertir de que esto no
es siempre cierto: existen sistemas físicos en los que la naturaleza de la condición
de contorno es relevante, no importa cuán grande sea el sistema. Son los llamados
sistemas topológicos.

4.2.4 Representación de Momentos

Recordemos que la transformada de Fourier de una función f : R 7→ C se define como
1
Z
f˜(k) = (Ff )(k) = √ dx e−ikx f (x), (4.57)
2π R
donde k es el número de onda, mientras que la transformada inversa se obtiene mediante
1
Z
f (x) = (F −1 f˜)(x) = √ dk eikx f˜(k). (4.58)
2π R
Recomendamos repasar las propiedades básicas de la transformada de Fourier, aunque

de momento basta recordar que se trata de un operador lineal actuando sobre el espacio
de Hilbert de las funciones de cuadrado integrable, F ∈ L(L2 (R)), y que se trata de un
operador unitario, es decir: preserva la norma de cualquier estado, tal como expresa la
identidad de Plancherel,
Z Z
dx |f (x)| = 2
dk |f˜(k)|2 . (4.59)
R R
Teniendo en mente que k = p/~ es el número de ondas, vemos que la normalización

que nos resulta interesante para los estados de momento es A = (2π~)−1/2 , es decir,
1
θp (x) = hx|θp i = √ eipx/~ . (4.60)
2π~
Y así escribimos
1
Z
|θp i = √ dx eipx/~ |xi . (4.61)
2π~ R
Hagamos un análisis dimensional. El estado |xi tiene dimensiones de [L]−1/2 , y ~ tiene

unidades de momento × longitud, que podemos escribir como [P L], quedando |θp i con
unidades de [P ]−1/2 , preservando cierta simetría entre posiciones y momentos4 .
Con esta normalización se puede demostrar la relación de cierre,
Z
I= dp |θp i hθp | . (4.62)
R
Apliquémosla sobre un estado arbitrario, |Ψi = ψ(x) |xi, y tenemos

R
R dx

1
Z Z Z Z
−ipx/~
|Ψi = dp |θp i hθp | dx ψ(x) |xi = dp |θp i √ dx e ψ(x) , (4.63)
R R R 2π~ R
4
En rigor, [P ] no es una unidad fundamental, así que deberíamos decir que ~ tiene unidades de [M L2 /T ],
y |θp i con unidades de [T /M L]1/2 .

donde reconocemos el paréntesis como la transformada de Fourier de ψ(x), ψ̃(p). Es decir,

Z
|Ψi = dp ψ̃(p) |θp i , (4.64)
R
y para comprobar que el estado es realmente el deseado, procedamos a extraer sus compo-
nentes en representación de posiciones,
1
Z Z
hx|Ψi = dp ψ(p)hx|θp i = √ dp ψ(p)eipx/~ , (4.65)
R 2π~ R
es decir, realizamos la transformada inversa de Fourier, que nos devuelve el valor ψ(x)
deseado. De esta forma aseguramos toda una serie de relaciones equivalentes que llamamos
representación de momentos de un estado:
Z
|Ψi = dp ψ̃(p) |θp i , → ψ̃(p) = hθp |Ψi, (4.66)
R
y el operador momento en esta representación resulta ser especialmente sencillo:
Z
Px = dp p |θp ihθp |, (4.67)
R
Los estados de momento y los de posición pueden transformarse mutuamente,
1
Z Z
|θp i = dx |xi hx|θp i = √ dx eipx/~ |xi , (4.68)
R 2π~ R
y aplicando la relación de cierre en momentos,
1
Z Z
|xi = dp |θp ihθp |xi = √ dp e−ipx/~ |θp i , (4.69)
R 2π~ R
que expresan los dos cambios de base asociados, de representación de posiciones a momentos
y viceversa.
• • •
En el caso de un sistema cuántico en dos o tres dimensiones, basta con trabajar sobre
el producto tensorial de espacios de una dimensión. Así, escribiremos
Z
|Ψi = d3 p ψ̃(p) |pi , (4.70)
R3
donde |pi = |px , py , pz i = |px i ⊗ |py i ⊗ |pz i, tiene dimensiones de [P ]−3/2 , al igual que
ψ̃(p) = ψ̃(px , py , pz ), para así compensar el d3 p y obtener un estado cuántico final adimen-
sional. De la misma forma
1
Z
ψ̃(p) = d3 x ψ(x) eip·x/~ . (4.71)
(2π~)3/2 R3
Podemos construir los operadores momento en cada uno de los tres ejes como Px = P ⊗I⊗I,
Py = I ⊗ P ⊗ I, etc. Nótese que todo operador referido al eje X conmuta con cualquier
otro operador referido al eje Y : [X, Y ] = [Px , Py ] = 0.

Ejemplo 4.4 Considerar el estado cuántico definido mediante su representación de posi-

ciones,
1
Z
|Ψi = dx √ exp(−(x − x0 )2 /σ 2 ) |xi . (4.72)
R 2πσ
y encontrar su forma en representación de momentos. Usar el resultado para obtener las
desviaciones σX y σPx .
Resumen 4.2. El operador traslación T (a) = exp(−iaPx /~) es un operador unitario

que actúa sobre los estados de posición como T (a) |xi = |x + ai y sobre las funciones de
onda como hx|T (a)|Ψi = ψ(x−a) si hx|Ψi = ψ(x). El operador momento es el generador
de las traslacines, P = −i~∂x . Su espectro es también todo R, Ry sus autoestados son
las ondas planas, que escribiremos como |θp (x)i = (2π~)−1/2 dx exp(−ipx/~) |xi,
normalizados de igual manera que en posiciones, hθp |θp0 i = δ(p − p0 ).
La representación de momentos de un R estado no es más
R que la expresión en coor-
denadas enR la base de {|θp i}, |Ψi = dx ψ(x) |xi = dp ψ̃(p) |θp i, donde ψ(p) =
(2π~)−1/2 dx eipx/~ ψ(x), es decir, transformada de Fourier de la función de onda en
representación de posiciones.
4.3 Simetrías en Mecánica Cuántica

4.3.1 Noción de Grupo de Lie
Cuando discutimos la evolución temporal en MQ en la sección 1.4 encontramos con
una estructura muy similar a la que muestra la ecuación (4.42). Allí teníamos un operador
evolución que dependía de un parámetro continuo, que es el tiempo, U (t), y lo escribíamos
como la exponencial compleja de un operador hermítico, el Hamiltoniano, es decir, U (t) =
exp(−itH/~). Vamos a generalizar esta estructura, a través de la noción de flujo generado
por un grupo de Lie.
Recordemos que un grupo G es un conjunto dotado de una operación interna, G×G 7→ G
que denotaremos como un producto, con las siguientes propiedades: (a) existe un elemento
identidad, I ∈ G, que al multiplicarlo por cualquier elemento a ∈ G lo deja igual, aI =
Ia = a; (b) Todo a ∈ G tiene un elemento inverso, a−1 ∈ G tal que aa−1 = a−1 a = I. Un
grupo de Lie es un grupo en el que a cada elemento se le asocia un punto de una variedad
diferenciable, es decir, de un espacio que es localmente isomorfo al espacio euclídeo.
En este capítulo trataremos con el grupo de Lie más sencillo posible, el uniparamétrico
G = (R, +), es decir, el grupo de los reales bajo la operación de adición 5 . Tanto las
traslaciones espaciales como la evolución temporal poseen la misma estructura algebraica:
T (a)T (b) = T (a + b) y U (t)U (t0 ) = U (t + t0 ). Ambos grupos son evidentemente abelianos
o conmutativos, T (a)T (b) = T (b)T (a).
4.3.2 Traslaciones espaciales y temporales

Hagamos más explícita la analogía entre la evolución temporal y la traslación espacial.
En ambos casos tenemos un operador unitario que implementa una operación natural
sobre los estados: el operador evolución U (t) y el operador traslación T (a). En ambos
casos, este operador unitario se puede escribir como la exponencial compleja de un cierto
5
Existe otro grupo de Lie uniparamétrico diferente, acotado, S 1 , que corresponde a los ángulos de una
rotación en el plano. La diferencia es que el espacio en este segundo caso está acotado.

operador hermítico, U (t) = exp(−itH/~), T (a) = exp(−iaPx /~). En ambos casos podemos
encontrar una ecuación diferencial que nos muestra el flujo de un estado bajo la acción del
grupo. En el caso de la evolución temporal es la ecuación de Schrödinger (1.100)
d i
|Ψi = − H |Ψi , (4.73)
dt ~
mientras que en el caso de las traslaciones es equivalente:
d i
|Ψi = − Px |Ψi , (4.74)
da ~
que justifica la aseveración de que el operador momento Px es el generador de las tras-
laciones, al inducir un flujo entre los estados del espacio de Hilbert. Asimismo podemos
considerar el efecto de este flujo sobre los operadores en imagen de Heisenberg. Es decir,
podemos preguntarnos cómo fluyen los operadores ante la acción del grupo de manera
que los valores esperados sean siempre los mismos pese a que los estados no cambien. El
resultado lo podemos comprobar en la ecuación (1.118),
dA i
= [H, A], (4.75)
dt ~
que en el caso del flujo a causa de las traslaciones se convertiría meramente en
dA i
= [Px , A]. (4.76)
da ~
Y lo podemos demostrar de manera genérica a través de este razonamiento. El operador
trasladado vendrá dado por la siguiente expresión,
A0 = T −1 (a)AT (a), (4.77)
ya que la acción del operador trasladado sobre cualquier estado se obtiene realizando la
traslación sobre el estado, actuando con el operador y trasladando de vuelta el resultado.
Operando de manera infinitesimal tenemos

iδa iδa iδa
A0 = I+ Px A I − Px ≈ A + (Px A − APx ), (4.78)
~ ~ ~
de donde deducimos que
dA A0 − A i
= lı́m = [Px , A], (4.79)
da δa→0 δa ~
que nos da una nueva perspectiva del concepto de conmutador. Todo operador hermítico
Q nos sirve para definir un grupo uniparamétrico a través de la familia de operadores
unitarios V (p) = exp(−ipQ). El conmutador i[Q, A] nos proporciona el ritmo de cambio
del operador A bajo el flujo generado por Q. Por supuesto, esta afirmación siempre puede
invertirse, y tenemos que i[A, Q] = −i[Q, A] será el ritmo de cambio del operador Q bajo
el flujo generado por el operador A.

C Existe una estructura similar en mecánica clásica, y es la dada por el corchete

de Poisson. Consideremos dos funciones del espacio de fases, es decir, de q y p
(coordenada generalizada y su momento conjugado). Entonces, la evolución tem-
poral vendrá dada por las ecuaciones de Hamilton, q̇ = ∂p H y ṗ = −∂q H. La
evolución de cualquier otra función del espacio de fases, A(q, p) vendrá dada por
Ȧ = (∂q A)q̇ + (∂p A)ṗ = (∂q A)(∂p H) − (∂p A)(∂q H) ≡ {A, H}. El corchete de Poisson
clásico se corresponde con el conmutador cuántico.
4.3.3 Teorema de Noether

Una simetría de un sistema cuántico es una operación unitaria6 , U , que deja invariante
la dinámica. Esto se puede formular de distintas formas, pero la más sencilla es afirmar
que si |Ψi es un autoestado del Hamiltoniano con autovalor E, entonces U |Ψi también
es autoestado del Hamiltoniano, con el mismo autovalor. Una simetría es continua cuan-
do existe una familia de operadores unitarios U (a) = exp(iaQ), que conforman un grupo
de Lie, cuya acción sobre el Hamiltoniano sea trivial, es decir, [Q, H] = 0. En ese caso,
la acción del Hamiltoniano sobre el generador de dichas transformaciones Q también es
necesariamente trivial, [H, Q] = 0, y concluimos que Q constituye una cantidad conser-
vada a lo largo del movimiento. Y así llegamos a uno de los grandes teoremas de la física,
enunciado por Emmy Noether en 19157 .
Teorema de Noether: Si un operador genera un flujo que deja invariante el Hamil-

toniano, el valor esperado de dicho operador será una constante del movimiento. Dicho de
otra forma: a cada simetría continua le corresponde una cantidad conservada.
Consideremos un sistema cuántico continuo 1D invariante bajo traslaciones. Es decir,

[Px , H] = 0. En ese caso, también tenemos que [H, Px ] = 0, y por lo tanto tenemos que el
momento lineal es una cantidad conservada. A lo largo de la evolución temporal no sólo
se conserva el valor esperado del momento, sino que se preservará toda la distribución de
probabilidad para el resultado de una medida de Px realizada sobre el sistema.
Más aún, el hecho de que Px y H conmuten implica que es posible elegir una base de
autoestados comunes a ambos observables. Dado que los autoestados de Px son conocidos,
Px |θp i = p |θp i, eso implica que en este caso disponemos de la base de autoestados del
Hamiltoniano. La presencia de una cantidad conservada nos facilita la diagonalización del
Hamiltoniano.
4.3.4 Relaciones de Conmutación Canónicas

Consideremos los siguientes lemas8 , que nos serán útiles con frecuencia.
Lema 1: [A, BC] = B[A, C] + [A, B]C.
La demostración consiste en una mera expansión de los dos lados de la identidad. Así, el
lado izquierdo es ABC − BCA, y el lado derecho es B(AC − CA) + (AB − BA)C, que se
simplifica dando lugar al lado izquierdo.
6
También puede ser antiunitaria, es decir, U c |ψi = c∗ U |ψi.
7
Amalie Emmy Noether es una de las figuras más relevantes y menos conocida de la física y las mate-
máticas del siglo XX. En 1919 presentó su candidatura como Privatdozent en la Universidad de Gotinga,
originando un acalorado debate debido a su sexo, que David Hilbert selló con su famosa frase, Señores,
esto es una universidad, no una casa de baños.
8
Es decir, un resultado en sí mismo poco importante, pero crucial para demostrar algo de relevancia
mayor.

Lema 2: Sean A y B dos operadores lineales de un espacio de Hilbert, y sea C = [A, B]

tal que [B, C] = 0. Entonces, para una función analítica arbitraria g(z) tenemos que
[A, g(B)] = Cg 0 (B), donde g 0 (z) denota la función derivada.
La demostración consta de dos partes. Primero, demostramos que es cierto para g(z) = z n .
Para ello, procedamos por inducción. Si n = 1 el lema se reduce a [A, B] = C, que es
cierto. Ahora, suponiendo que el lema es cierto para g(z) = z n probemos que es cierto
para g(z) = z n+1 . Como [A, BC] = B[A, C] + [A, B]C podemos mostrar que [A, B n+1 ] =
[A, B n ]B + B n [A, B] = CnB n−1 B + B n C = nB n C, con lo que hemos probado el lema
para g(z) = z n conP n un natural arbitrario. Ahora sólo nos resta desarrollar g(z) en serie
de Taylor, g(z) = ∞ n=0 gn z , e igualar orden a orden. Como cada término se deriva, la
n
serie resultante corresponde a la serie de la derivada.
• • •
Es evidente que no es lo mismo trasladar un estado y después medir la posición que

medir su posición primero y después trasladarlo. Es decir, el operador traslación y el
operador posición no pueden conmutar. Es fácil determinar cuál es el conmutador de ambos,
Z Z
XT (a) |Ψi = X dx ψ(x) |x + ai = dx (x + a)ψ(x) |x + ai (4.80)
R Z R Z Z
T (a)X |Ψi = T (a)X dx ψ(x) |xi = T (a) dx x ψ(x) |xi = dx x ψ(x) |x + ai .
R R R
La diferencia vendrá dada por
[X, T (a)] = aT (a). (4.81)
De aquí vamos a deducir la relación de conmutación entre el operador posición y el operador

momento, aplicando el lema 2 al caso en el que A = X y B = T (a). Como T (a) =
exp(−iaPx /~), tenemos que Px = (i~/a) log(T (a)), así que definimos g(z) = (i~/a) log(z),
que es analítica, y su derivada es (i~/a)z −1 . De esta forma tenemos que
[X, Px ] = [X, T (a)](i~/a)T (a)−1 = aT (a)(i~/a)T (a)−1 = i~ I, (4.82)
que se conoce con el nombre de relación de conmutación canónica. En términos intuiti-

vos nos informa de que la evolución de X bajo el flujo generado por Px , que es la traslación,
es meramente un arrastre continuo: dX/da = −I. Pero, de la misma forma, podemos de-
ducir que la evolución de Px debido al flujo generado por el operador posición, X, es un
arrastre positivo. Si β es el parámetro de dicha transformación, V (β) = exp(−iβX/~),
entonces dPx /dβ = +I. Es decir: deducimos que el flujo generado por el operador posición
corresponde a los boost, o transformaciones de Galilei de la velocidad, v → v + v0 . Vemos
que la similaridad entre posiciones y momentos es, por lo tanto, completa: Px genera las
traslaciones en la posición y X genera las traslaciones en el momento.
• • •
Aunque el cálculo precedente parezca intrincado el resultado es de una enorme generali-

dad: el conmutador entre un operador tipo-posición y el generador de los movimientos aso-

ciados a él siempre será i~I. Haciendo uso de la relación de incertidumbre de Schrödinger-

Robinson, ecuación (1.88) llegamos así a la más conocida relación de incertidumbre de
Heisenberg,
σX σPx ≥ ~. (4.83)
Nótese que, por ser distintos subsistemas de un espacio de Hilbert que es un producto
tensorial, [X, Py ] = 0, y lo mismo aplica a cualquier otro par de componentes diferentes.
Hay una paradoja aparente que no deseamos dejar pasar. En un espacio de Hilbert
de dimensión finita, la traza de un conmutador debe ser siempre cero. La demostración
es secilla, ya que en dimensión finita es inmediato ver que Tr(AB) = Tr(BA). ¿Cómo
compatibilizar eso con la relación (4.82)? Evidentemente, porque sólo puede tener lugar
en espacios de Hilbert de dimensión infinita. Aún así, es un ejercicio muy interesante
considerar qué sucede en un caso discreto, que dejamos como ejercicio.
4.3.5 Simetrías discretas

Definimos una simetría continua como aquella en la que toda operación tiene una raíz
cuadrada que también es una simetría. En otras palabras, si U es el operador unitario que
implementa una transformación de simetría, entonces existe un operador U 1/2 que también
deja el sistema invariante. Las rotaciones y traslaciones son operaciones continuas, pero
no siempre el sistema es invariante bajo el grupo completo, y a veces sólo lo es bajo un
subgrupo. Así, por ejemplo, el grupo de simetrías de una molécula con forma de triángulo
equilátero consiste en las rotaciones de de ±120º en torno al su eje, pero no de 60º ni de
ningún otro ángulo.
Consideremos, por ejemplo, un sistema cuántico unidimensional con un potencial es-
pacialmente periódico con periodo a0 , es decir, tal que V (x) = V (x + a0 ). En tal caso,
T (a0 ) es una simetría del sistema, pero T (a0 /2), que sería su raíz cuadrada dado que
T (a0 /2)2 = T (a0 ), no lo es. Por lo tanto, el momento lineal no conmuta con el Hamilto-
niano y no es una constante del movimiento.
No obstante, si T (a0 ) es una simetría del sistema, también lo será T (na0 ) = T (a0 )n
con n ∈ Z, pues si un sistema es periódico con periodo a0 , también lo es con periodo na0 .
Por lo tanto, tenemos un grupo con una cantidad infinita de transformaciones discretas:
correspondiente grupo de operadores es T (na0 ) = exp(−ina0 P/~) y se debe cumplir que
[H, T (na0 )] = 0.
Por lo que hemos visto, si |Ψi es un estado propio del hamiltoniano y U es una simetría,
entonces U |ψi también es un estado propio de H con el mismo valor propio. En nuestro
caso, esto quiere decir que si |Ψi es un estado estacionario de un potencial periódico de
periodo a0 , también T (a0 )n |Ψi (para cualquier n entero) será estado estacionario con el
mismo valor propio. A menos que el valor propio fuera infinitamente degenerado, todos los
T (na0 ) |Ψi deben representar el mismo estado cuántico. Es decir, sólo pueden diferir en
una fase, y esto debe ser cierto para cualquier n entero
T (na0 ) |Ψi = T (a0 )n |Ψi = einφ |Ψi , (4.84)
Pero, por otro lado, T (na0 ) actúa sobre la función de ondas desplazándola. Si ψ(x) = hx|Ψi,
(T (na0 )ψ) (x) = ψ(x − na0 ) = einφ ψ(x), (4.85)

y eso se satisface cuando ψ(x) = u(x)eikx , donde u(x) es una función de periodo a0 , y
k ∈ R. Es decir, los autoestados de un potencial periódico en 1D son siempre una onda
plana, eikx , modulada por una función de periodo a0 , y este resultado se conoce como
teorema de Bloch, que es central en física de la materia condensada.
Aparte de este ejemplo sencillo, las simetrías discretas más importantes son la simetría
bajo inversión espacial o paridad (cambio de x por −x), la simetría bajo inversión
temporal (cambio de t por −t), de la que debemos destacar que no es unitaria, sino
antiunitaria, y la simetría bajo conjugación de carga (cambio de q por −q). Se suelen
abreviar como simetrías P, T y C.
C Durante mucho tiempo se pensó que P, C y T eran simetrías imprescindibles de

toda interacción fundamental. Sin embargo, se han ido observando procesos que vul-
neran cada una de ellas, sobre todo en las interacciones nucleares débiles. Aún así,
la combinación de las tres forma una simetría ineluduble de todas las interacciones
fundamentales conocidas, tal como se puede demostrar haciendo uso del formalismo
de la teoría cuántica de campos que introducimos al final de estos apuntes. Se trata
del teorema CPT.
Resumen 4.3. En analogía con la evolución temporal, definimos el flujo asociado a todo
operador hermítico A como la evolución bajo la ecuación diferencial i~∂a |Ψi = A |Ψi,
que se puede implementar mediante el operador unitario U (a) = exp(−iaA/~). La
evolución de cualquier operador B bajo el flujo de A vendrá dada por −i~∂a B = [A, B].
Por lo tanto, si [A, B] = 0, B será invariante bajo el flujo de A y A será invariante bajo
el flujo de B. Cuando A es el Hamiltoniano obtenemos la identidad entre simetrías y
cantidades conservadas que afirma el teorema de Noether.
El operador posición y el operador momento cumplen la relación de conmutación
canónica, [X, Px ] = i~I, que conduce a σX σPx ≥ ~. Al mismo tiempo, X evoluciona
como ∂a X = −I bajo el flujo generado por Px , que es la traslación, y Px evoluciona
como ∂a Px = I bajo el flujo generado por X, que son las transformaciones de Galilei.
4.4 Rotaciones y Momento Angular

El tema del momento angular es central en MQ, y ha sido estudiado en detalle en las
asignaturas de Física Cuántica I y II (momento angular orbital y espín). No repetiremos el
desarrollo realizado en esos cursos, sino que daremos una perspectiva diferente, mostrando
el momento angular como el generador del grupo de las rotaciones, y sus relaciones de
conmutación como una consecuencia ineludible de la estructura geométrica subyacente.
4.4.1 El Grupo de las Rotaciones

Consideremos ahora un sistema cuántico en tres dimensiones, expresado en represen-
tación de posiciones,
Z
|Ψi = d3 x ψ(x) |xi , (4.86)
donde x = (x, y, z). Consideremos el grupo de Lie formado por las rotaciones en torno a
cualquier eje, de cualquier ángulo. Este grupo se denomina O(3), debido a que las trans-
formaciones son ortogonales de dimensión 3. Para ser más precisos, comencemos con la

transformación Rz (θ) que realiza una rotación de ángulo θ en torno al eje Z. 9 Tenemos la
ecuación
x0 = cos(θ) x − sin(θ) y,
y 0 = sin(θ) x + cos(θ) y,
z 0 = z, (4.87)
que cuando dθ es pequeño se convierte en
x0 = x − dθ y,
y 0 = y + dθ x,
z 0 = z, (4.88)
Es decir, x0 = x + dθ Gz x, donde
 
0 −1 0
Gz =  1 0 0  . (4.89)
0 0 0
es el generador de las rotaciones en torno al eje Z en R3 . De la misma manera podemos

operar con las rotaciones en torno a los ejes X e Y , llegando a
   
0 0 0 0 0 1
Gx = 0 0 −1 , Gy =  0 0 0 , (4.90)
0 1 0 −1 0 0
y el generador en torno a un eje arbitrario se obtiene como
Gn = n x Gx + n y G y + n z Gz . (4.91)
y comprobamos que G2 = G2x + G2y + G2z = −2I. 10
Deseamos destacar un hecho geométrico crucial: dos rotaciones tridimensionales en

torno a ejes diferentes no conmutan, en general. Tomemos un objeto cualquiera, que tenga
tres ejes bien definidos, como por ejemplo un libro, y realicemos un ejercicio que requiere
una visión espacial muy desarrollada. Rotemos el libro 90º en torno al eje Z, y después
90º en torno al eje X. Tomemos nota de su posición. Ahora realicemos ambas rotaciones
al revés. Concluiremos que la posición final no es la misma. Este hecho geométrico se
traslada a una propiedad algebraica de los generadores del grupo de las rotaciones, Gi , con
i ∈ {x, y, z}, a saber,
X
[Gi , Gj ] = εijk Gk ,
k
[Gi , G2 ] = 0, (4.92)
9
En rigor, las rotaciones siempre tienen lugar en un plano. La descripción en base a un eje es una
licencia poética que podemos permitirnos únicamente en 3D.
10
Puede parecer extraño que la suma de unos operadores al cuadrado den como resultado un operador
definido negativo, pero ahí está la magia del álgebra lineal.

donde εijk es el llamado símbolo de Levi-Civita11 , definido como
+1 si ijk es una permutación par de 123.



εijk = −1 si ijk es una permutación impar de 123. (4.93)
si ijk repite algún valor.

0

El ejemplo más sencillo sería [Gx , Gy ] = Gz . En términos geométricos esto significa que
una rotación infinitesimal en Y seguida de otra rotación infinitesimal en X difieren de las
rotaciones realizadas en sentido inverso en una rotación realizada en Z.
¿Cómo podemos entender estas relaciones de conmutación? Tomemos un operador vec-
torial cualquiera, (Ax , Ay , Az ), y consideremos cómo se transforma bajo la acción de una
rotación en torno al eje Z. Como es lógico, la componente Az no debe variar, es decir,
dAz /dθ = 0, así que [Gz , Az ] = 0. Por otro lado, la componente Ax irá transformándose
poco a poco en la componente Ay , así que dAx /dθ = Ay , y tenemos que [Gz , Ax ] = Ay ,
y la componente Ay se irá transformando en −Ax , así que [Gz , Ay ] = −Ax . Pues bien,
el propio momento angular es un vector, así que sus relaciones de conmutación consigo
mismo deben ser del mismo tipo, y llegamos a la ecuación anterior.
4.4.2 Operador Momento Angular

Apliquemos la transformación Rn (θ) sobre un estado de posición, obteniendo
Rn (θ) |xi = |Rn (θ)xi , (4.94)

donde por un abuso de rotación estamos usando el mismo símbolo para el operador sobre
el espacio de Hilbert y el operador actuando sobre puntos de R3 . Observamos que Rn (θ)
es, necesariamente, un operador unitario. Veamos qué sucede cuando tenemos un estado
cuántico completo,
Z Z Z
Rn (θ) |Ψi = d3 x ψ(x) Rn (θ) |xi = d3 x ψ(x) |Rn (θ)xi = d3 x ψ(Rn (−θ)x) |xi ,
(4.95)
haciendo un cambio de variable de jacobiano unidad, y dándonos cuenta de nuevo que la
transformación de la función de ondas es opuesta a la transformación de los puntos del
espacio. Ahora consideremos que el ángulo de rotación es dθ → 0 y desarrollemos la función
de ondas en serie de Taylor para obtener el generador,
Z Z
Rn (dθ) |Ψi = 3
d x ψ (x − dθ Gn x) |xi = d3 x [ψ(x) − dθ (Gn x) · ∇ψ(x)] |xi , (4.96)
es decir,
(Rn (dθ)ψ) (x) ≈ ψ(x) − dθ (Gn x) · ∇ψ(x), (4.97)

de donde deducimos que el generador de las rotaciones a lo largo del eje n es
Ln = i~ (Gn x) · ∇, (4.98)
11
Pronunciado “Levi-Chivita”.

que es lo que llamaremos la componente del momento angular a lo largo del eje n. En
el caso más sencillo, Lz , obtenemos
Lz = −i~ (y∂x − x∂y ) , (4.99)

es decir, Lz = Px Y − Py X, que es un operador autoadjunto como podemos comprobar
fácilmente,
L†z = (Px Y )† − (Py X)† = Y † Px† − X † Py† = Y Px − XPy = Px Y − Py X, (4.100)

donde hemos hecho uso del hecho de que tanto X como P son autoadjuntos, además del
hecho de que X y Py conmutan necesariamente, porque actúan sobre subsistemas distintos
del espacio producto tensorial. De manera idéntica definimos
Lx = Py Z − Pz Y,
Ly = Pz X − Px Z,
Lz = Px Y − Py X,
L2 = L2x + L2y + L2z . (4.101)
El conmutador entre dos componentes cualesquiera es tedioso de calcular, pero directo.
Haciendo uso del convenio de suma,
[Li , Lj ] = i~ εijk Lk ,
[Li , L2 ] = 0, (4.102)
Es decir, las componentes del momento angular y su módulo cumplen las mismas rela-
ciones de conmutación que los generadores de O(3), dadas en (4.92), salvo una constante
multiplicativa irrelevante. Recordemos la idea clave de la sección anterior: el conmutador
[A, B] nos informa del ritmo de cambio de B cuando sigue el flujo generado por A. Por
lo tanto, la relación de conmutación (4.102) nos indica que Ly se va convirtiendo en Lz a
medida que rotamos en torno al eje X.
4.4.3 Álgebras de Lie

Regresemos a la teoría sobre grupos de Lie. Dado que los elementos del grupo tienen
una estructura de variedad diferenciable, siempre es posible tomar límites en torno al punto
que señala la identidad, y definir así los elementos del álgebra de Lie, que es el espacio
vectorial formado por los generadores del grupo. En términos de geometría diferencial es
el espacio tangente a la variedad en torno al origen. Si U (a) son los elementos del grupo de
Lie, con a ∈ Rd tal que U (0) es la identidad, el álgebra es el espacio vectorial expandido
por los siguientes vectores,

∂U (a)
Gi = . (4.103)
∂ai a=0
es decir, un elemento del álgebra es cualquier combinación lineal de los Gi . Pero la estruc-
tura profunda del álgebra, y la del propio grupo de Lie, vienen dadas por las relaciones de
conmutación. En general, escribimos
[Gi , Gj ] = fijk Gk , (4.104)

donde fijk se denominan constantes de estructura. Para el grupo O(3) las constantes de
estructura vienen dadas por fijk = εijk .
Se llama un invariante de Casimir a un operador que conmuta con todos los elemen-
tos del álgebra, sin ser la identidad. En el caso de O(3), L2 es un invariante de Casimir.
Físicamente, es razonable que así sea, puesto que el módulo del momento angular no varía
cuando realizamos una rotación.
Como L2 conmuta con todas las componentes de Li , siempre es posible encontrar una
base de autoestados comunes a ambos operadores. Evidentemente, es imposible encontrar
una base de autoestados simultáneos de Lx y Ly , pero sí de L2 y Lz (por ejemplo), que
son los que suelen emplearse.
Todo grupo de Lie admite representaciones en forma de grupos de matrices, es decir,

asociamos a cada elemento del grupo una matriz, de manera que se respeten las relaciones
de grupo. Ya hemos visto cómo las matrices de rotación en R3 forman una representación
natural del grupo O(3), de dimensión 3, pero no es la única. Por supuesto, siempre existe
una representación trivial, en la que cada elemento del grupo mapea al número 1, pero se
dice que esta representación no es fiel, porque no lleva elementos diferentes del grupo a
matrices diferentes. Es sorprendente notar que existe una representación del álgebra con
dimensión 2, formada por las matrices de Pauli,
[σi , σj ] = 2i εijk σk , (4.105)
donde volvemos a recalcar que una constante multiplicativa es irrelevante.
C ¿Cómo puede ser que representemos de manera fiel la acción del grupo de rotaciones
en tres dimensiones sobre vectores de 2 componentes? Para empezar, porque se trata
de vectores complejos. Pero la razón fundamental es que el grupo O(3) comparte
álgebra de Lie con el grupo SU(2), que es el grupo de las matrices unitarias sobre
C2 de determinante unidad. En efecto, SU(2) y O(3) son localmente equivalentes,
pero no globalmente. Aunque no lo demostraremos aquí con detalle, en SU(2) una
rotación de 2π en torno a cualquier eje no es equivalente a la identidad, sino a un
cambio de fase de −1. Sólo una rotación de 4π es equivalente a la identidad. Se dice
que SU(2) es un recubridor universal de O(3).
El álgebra de Lie asociada a SU(2) tiene una representación para cada dimensión en-
tera, es decir, podemos encontrar matrices de dimensión D arbitraria que cumplen las
relaciones (4.102). En efecto, para espín s tenemos matrices de dimensión 2s + 1, y dado
que el espín puede tomar cualquier valor entero o semientero, sus matrices nos sirven como
representación de SU(2).
Resumen 4.4. Un grupo de Lie es un grupo en el que los elementos conforman una
variedad diferenciable. Un álgebra de Lie es su espacio vectorial tangente en torno al
origen, y su estructura está inscrita en sus relaciones de conmutación. El grupo de
rotaciones O(3) tiene tres generadores que no conmutan, [Gi , Gj ] = iεijk Gk . En MQ,
el generador de las rotaciones es el momento angular, Li = εijk (Xj Pk − Xk Pj ), que
cumple que [Li , Lj ] = i~εijk Lk . El álgebra de Lie de O(3), equivalente al de SU(2),
tiene representaciones de todas las dimensiones enteras.

4.5 Ecuación de Schrödinger

La evolución de un estado cuántico siempre está determinada por la acción del operador
Hamiltoniano, en la forma
∂
i~ |ψ(t)i = H(t) |ψ(t)i , (4.106)
∂t
donde hemos incluido la posibilidad de que el operador Hamiltoniano dependa explícita-
mente del tiempo, H(t), es decir, que el sistema no sea autónomo. El Hamiltoniano más
simple que podemos considerar en términos físicos será el correspondiente a una partícula
no relativista que se mueve en el espacio sujeta a una fuerza conservativa que procede de
un potencial F(x) = −∇V (x),
P2
H= + V (X), (4.107)
2m
donde P 2 = Px2 + Py2 + Pz2 y V (X) es una función de los operadores posición, X, Y y Z.
Así, tenemos
P2

∂
i~ |ψ(t)i = + V (X) |ψ(t)i , (4.108)
∂t 2m
Ahora definamos las componentes del ket |ψ(t)i en representación de posiciones, ψ(x, t) =
hx|ψ(t)i. De esta manera obtenemos
~2 ∇2

∂
i~ ψ(x, t) = − + V (x) ψ(x, t), (4.109)
∂t 2m
que es la forma más conocida de la ecuación de Schrödinger. Notemos que los autoestados
comunes de los operadores Pi son la ondas planas, ψ(x, t) = exp(p · x/~), mientras que los
autoestados del operador V (X) son de la forma ψ(x, t) = δ(x − x0 ). Por supuesto, ambos
conjuntos de autoestados son no normalizables, como discutimos en la primera sección de
este capítulo. No es posible elegir una base de autoestados comunes a la energía cinética y a
la energía potencial, porque ambos operadores no conmutan. De hecho, podemos aprender
mucho a partir del conmutador entre ellos.
4.5.1 Relaciones de Ehrenfest

Consideremos la ecuación de Ehrenfest (1.113), discutida en el primer tema. Para todo
observable A,
dhAi i
= h[A, H]i. (4.110)
dt ~
Recordemos cómo interpretar esta ecuación: el conmutador de un observable A con B nos
da la ratio de cambio del operador A a lo largo del flujo generado por B. Por supuesto,
el flujo generado por H es, meramente, la evolución temporal. Ahora, apliquémosla al
operador posición X y al operador momento P,
dhXi i dhPi i
= h[X, H]i, = h[P, H]i, (4.111)
dt ~ dt ~

y calculemos los conmutadores pedidos. Hagamos uso del lema que probamos anteriormen-
te, que dictaba que si [A, B] = C y [B, C] = 0, entonces [A, g(B)] = Cg 0 (B), para cualquier
función analítica g(z). Este lema nos permite calcular cualquier conmutador entre X y una
función de P (o viceversa) porque el conmutador entre ambos [X, P ] = i~ es proporcional a
la identidad y, por lo tanto, conmuta con todos los operadores. Por supuesto, [X, V (X)] = 0
y [Px , P 2 /2m] = 0, es decir: la evolución de X viene dada por el término cinético y la de
Px por el término potencial. En efecto,
P2

1 Px Px
[X, H] = X, + V (X) = [X, Px2 ] = [X, Px ] = i~ . (4.112)
2m 2m m m
Es decir: la evolución del operador X bajo el flujo hamiltoniano es meramente avanzar en
la dirección de la velocidad. Bueno, tiene lógica. Veamos qué ocurre con el momento,
P2

[Px , H] = Px , + V (X) = [Px , V (X)] = [Px , X] ∇V (X) = −i~ ∇V (X), (4.113)
2m
Y de nuevo el resultado es fácil de comprender: la evolución del operador Px bajo el
flujo hamiltoniano consiste en avanzar en la dirección de la fuerza. Esto nos lleva a las
ecuaciones de Ehrenfest para una partícula cuántica,
hPi
hẊi = , hṖi = h−∇V (X)i. (4.114)
m
Estas ecuaciones son engañosamente simples. En efecto, se podría pensar que consisten
meramente en añadir unos valores esperados a las ecuaciones de Hamilton,
p
ẋ = , ṗ = −∇V (x). (4.115)
m
¿Podemos afirmar entonces que los valores esperados de X y de P siguen las ecuaciones
clásicas del movimiento? No. El problema está en la segunda ecuación, porque en general
−h∇V (X)i =
6 −∇V (hXi), (4.116)
es decir: el valor esperado de la fuerza no tiene por qué coincidir con la fuerza en el valor
esperado de la posición. En general, el valor esperado de una función de una variable
aleatoria no coincide con la función evaluada en el valor esperado de la variable aleatoria.
Si así fuera, las variables aleatorias no tendrían varianza, porque σX
2 = hX 2 i − hXi2 sería
siempre cero. En general, si una función es cóncava (desde arriba) tenemos siempre que
hf (X)i ≥ f (hXi), lo cual se conoce como desigualdad de Jensen, que se demuestra en
teoría (clásica) de probabilidades y se extiende al mundo cuántico. Si la función es convexa,
la desigualdad cambia de signo.
C Una manera intuitiva de verlo es imaginar la variable aleatoria como una nube de
puntos simétrica alrededor de su centro, que es su valor esperado. Ahora evaluamos
una función en todos los puntos de la nube, y calculamos su valor esperado. Si
la función es lineal (p.ej. creciente) los valores a la derecha darán un exceso, los
valores a la izquierda un defecto, y ambos se compensarán, dando al final como valor
esperado el valor de la función en el centro. Si la función es curva (p.ej. estamos en un

mínimo) los valores de la función evaluada en los puntos a la izquierda y a la derecha

serán superiores al valor evaluado en el centro. Ése es el origen de la desigualdad de
Jensen, y de casi todos los fenómenos interesantes asociados a fluctuaciones clásicas
o cuánticas.
Pero hay un caso en el que f (hXi) = hf (X)i: cuando la función no es cóncava ni

convexa, es decir, cuando es lineal. Es decir: para un potencial armónico: si V (X) es una
función cuadrática, entonces los valores esperados de X y P siguen exactamente la ecuación
de movimiento clásica. Pase lo que pase.
¿Y qué sucede cuando el potencial no es cuadrático? En ese caso, la ecuación de mo-
vimiento de los valores esperados recibe una corrección que podemos estimar haciendo
un desarrollo de Taylor de la fuerza en torno al valor esperado de la posición. Definiendo
Fc = F(hXi), es decir, la fuerza clásica,
1
Fi (X) ≈ Fic + (∂j Fic )(Xj − hXj i) + (∂jk Fic )(Xj − hXj i)(Xk − hXk i), (4.117)
2
donde hemos usado el convenio de índices repetidos. Ahora podemos tomar promedios, y
sabiendo que hXj − hXj ii = 0 tenemos
1
hFi (X)i ≈ Fic + (∂jk Fic ) (hXj Xk i − hXj ihXk i) , (4.118)
2
es decir: la fuerza recibe una contribución extra que podemos estimar en algunos casos. En
una dimensión tendríamos,
1
hF i ≈ F c + (∂x2 F c ) σX
2
. (4.119)
2
es decir, la corrección cuántica de la fuerza crece con la varianza de la posición, y depende
de la segunda derivada de la fuerza, que es siempre cero en el caso de un oscilador armónico.
Ejemplo 4.5 Calcular la corrección cuántica a la fuerza radial que siente un electrón
en la vecindad de un núcleo de carga Ze, suponiendo que la distancia esté sometida a
fluctuaciones cuánticas de magnitud σR . ¿La fuerza resultante será mayor o menor que la
fuerza clásica?
La componente radial de la fuerza de Coulomb será F = −Ze2 /r2 , de manera que ∂r2 F =
−6Ze2 r−4 , de forma que la corrección cuántica a la fuerza será, aproximadamente, ∆F ≈
−3Ze2 r−4 σR2 . Es decir, será levemente más atractiva. La razón es que la partícula, al estar
deslocalizada en un rango de radios σR , explora con la misma probabilidad regiones algo

más lejanas y algo más cercanas al núcleo. Pero la corrección en las zonas algo más cercanas
es superior a la corrección en las zonas algo más lejanas, así que la resultante es netamente
atractiva. Es el mismo mecanismo que provoca las fuerzas de marea.
4.5.2 Ecuación de continuidad

La regla de Born dicta que debemos interpretar el valor |ψ(x, t)|2 ≡ ρ(x, t) como una
densidad de probabilidad de encontrar la partícula en un entorno del punto x a tiem-
po t. Eso nos sugiere la posibilidad de dar una interpretación hidrodinámica de ρ(x, t),
estableciendo una ecuación de continuidad del tipo
∂t ρ(x, t) + ∇ · j(x, t) = 0, (4.120)

para alguna corriente j(x, t) que deberíamos encontrar. Sea i~∂t ψ = Hψ la ecuación de
Schrödinger. Tomando complejos conjugados a ambos lados llegamos a −i~∂t ψ ∗ = Hψ ∗ , y
el operador H no cambia ya que H = H † es autoadjunto. De esta manera podemos evaluar
la evolución de ρ = ψ ∗ ψ,
i
∂t ρ = (∂t ψ ∗ )ψ + ψ ∗ (∂t ψ) = ((Hψ ∗ )ψ − ψ ∗ (Hψ)) . (4.121)
~
Y en el caso de que el Hamiltoniano sea H = −(~2 ∇2 /2m) + V podemos comprobar que
nos queda
i~
ψ ∗ (∇2 ψ) − (∇2 ψ ∗ )ψ , (4.122)

∂t ρ =
2m
es decir, existe una corriente que cumple la ecuación (4.120),
i~ 1
j(x, t) = − (ψ ∗ (x, t)(∇ψ(x, t)) − (∇ψ ∗ (x, t))ψ(x, t)) = (ψ ∗ Pψ − ψPψ ∗ ) . (4.123)
2m 2m
C ¿Qué interpretación física podemos dar a esta densidad ρ(x, t) y a esta corriente
j(x, t)? En rigor no podemos hablar de una densidad de materia o de carga, ni de
una corriente de materia o de carga, porque sólo son densidades y corrientes de pro-
babilidad. Sin embargo, la experiencia muestra que podemos hacer una descripción
física semiclásica correcta de una partícula con carga q asumiendo que qρ(x, t) funcio-
na como una densidad de carga y qj(x, t) como una corriente eléctrica. Pero debemos
recordar que el estudio riguroso de la interacción entre dos cargas eléctricas asociadas
a partículas cuánticas debe realizarse en el marco de la electrodinámica cuántica.
Ejemplo 4.6 Consideremos una partícula cuántica de masa m que puede moverse li-
bremente en una circunferencia, S1 , que parametrizaremos como [0, 1) con condiciones

de contorno periódicas. Consideremos el estado definido en la base de posiciones por
hx|ψλ i = A(λ) exp(−iλx), donde A(λ) es una constante de normalización. Se pide: (a)
establecer los valores de λ y las constantes A(λ) para las que los estados están bien defini-
dos; (b) Encontrar la densidad y la corriente de probabilidad.
(a) Sabemos que ψλ (x) = hx|λi = A(λ) exp(−iλx) con ψλ (0) = ψλ (1), asíR que λ = 2πn.
1
La condición de normalización se obtiene haciendo 1 = hψλ |ψλ i = |A(λ)|2 0 dx, de forma
que A(λ) = 1 para todo λ nos sirve como constante de normalización.
(b) La densidad de probabilidad es sencilla, ρ(x) = |ψλ (x)|2 = 1. La corriente es ligeramente
más complicada. En nuestro caso, el operador momento P = −i~∂x , así que
i~ i~ λ~
j(x) = − (ψ ∗ (x)∂x ψλ (x) − ψλ (x)∂x ψλ∗ (x)) = − (iλ + iλ) = . (4.124)
2m λ 2m m
que es fácilmente interpretable si nos damos cuenta de que el estado |ψλ i es autoestado
del operador P con autovalor λ~. La corriente corresponde a la velocidad de la partícula.
La ecuación (4.120) se cumple de manera trivial.
Ejemplo 4.7 Demostrar que la corriente de probabilidad para una partícula de masa m
en un estado gaussiano,
1
ψ(x) = exp(−(x/2σ)2 ), (4.125)
(2πσ)1/4

es nula. ¿Cómo podríamos modificar el estado para que tuviera una corriente no nula?
El estado propuesto es real, ψ ∗ (x) = ψ(x). La expresión (4.123) es trivialmente nula en
este caso. Para que no lo sea deberíamos añadir un término complejo, por ejemplo
1
ψ(x) = exp(−(x/2σ)2 + ikx), (4.126)
(2πσ)1/4
y en ese caso comprobamos que la corriente es meramente j(x) = m ρ(x).
~k

C ¿Y si la partícula tiene masa m = 0? En mecánica no relativista, las partículas de

masa cero son enormemente anómalas. Por ejemplo, no pueden tener energía cinética.
En mecánica relativista, en cambio, no tienen ningún problema en existir, pero se
mueven siempre con la velocidad de la luz. Consideramos este problema en el último
capítulo el curso.
4.5.3 Propagadores
¿Podemos escribir el operador evolución asociado a una partícula que se mueve en el
continuo? Sí, pero de nuevo debemos hacerlo con cuidado. Sea la evolución dada por
H(t2 − t1 )

|ψ(t2 )i = exp −i |ψ(t1 )i , (4.127)
~
y definamos el propagador o función de Green como
H(t2 − t1 )

G(x2 , t2 ; x1 , t1 ) = hx2 | exp −i |x1 i, (4.128)
~
es decir, es la amplitud de probabilidad de encontrar en x2 para tiempo t2 a una partícula
que estaba localizada en x1 para tiempo t1 . El propagador funciona como un kernel, es
decir,
Z
ψ(x2 , t2 ) = dx1 G(x2 , t2 ; x2 , t1 ) ψ(x1 , t1 ), (4.129)
que nos proporciona una imagen de la propagación tipo principio de Huygens: cada punto de
la función de ondas original emite una onda secundaria, que viaja a través del propagador,
y para obtener la función de onda evolucionada meramente debemos sumar todas.
Supongamos que el espectro del Hamiltoniano sea discreto, es decir, autovalores {Ek } y
autoestados |Ek i. Entonces podemos introducir la descomposición espectral de la identidad,
k |Ek ihEk | y tenemos
P
X X
G(x2 , t2 ; x1 , t1 ) = hx2 |Ek ihEk |e−iH(t2 −t1 )/~ |El ihEl |x1 i = hx2 |Ek ieiEk (t2 −t1 )/~ hEk |x1 i,
k,l k
(4.130)
y si las funciones de onda correspondientes son hx|Ek i = φk (x), entonces
X
G(x2 , t2 ; x1 , t1 ) = φ∗k (x1 )φk (x2 )eiEk (t2 −t1 )/~ . (4.131)
k

Es común definir el propagador retardado como aquél que sólo permite que t2 ≥ t1 ,
G+ (x2 , t2 ; x1 , t1 ) ≡ θ(t2 − t1 )G(x2 , t2 ; x1 , t1 ). (4.132)

El propagador retardado cumple una ecuación diferencial sencilla. En efecto,

∂ X
i~ − H2 G+ (x2 , t2 ; x1 , t1 ) = i~δ(t2 −t1 ) φ∗k (x1 )φk (x2 ) = i~δ(t2 −t1 )δ(x2 −x1 ).
∂t2
k
(4.133)
donde H2 es el Hamiltoniano aplicado meramente sobre x2 . Notamos, de paso, que el
propagador normal daría simplemente cero.
¿Por qué podría interesarnos calcular el propagador de un cierto Hamiltoniano? Por la

misma razón por la que nos puede interesar calcular el operador evolución en un sistema
discreto: porque a partir de ese momento calcular la evolución de cualquier estado es un
problema más sencillo. En lugar de resolver una ecuación diferencial, no tenemos más que
calcular una integral.
(0)
Calculemos, por ejemplo, el propagador retardado de la evolución libre, G+ en 1D.
Generalizando la ecuación (4.131) al caso continuo tenemos
1
Z
(0) 2 (t −t )/2m~
G+ (x2 , t2 ; x1 , t1 ) = θ(t2 − t1 ) dp eip(x2 −x1 )/~ e−ip 2 1
. (4.134)
(2π~)
La integración se puede realizar de manera exacta, al ser de forma gaussiana. Nos interesa
sólo el resultado final, que es
1/2
m(x2 − x1 )2

(0) m
G+ (x2 , t2 ; x1 , t1 ) = θ(t2 − t1 ) exp i . (4.135)
2πi~(t2 − t1 ) 2~(t2 − t1 )
Notamos de inmediato que presenta una similaridad enorme con la solución de la ecuación
del calor, pero con tiempo imaginario. En efecto, la ecuación de Schrödinger que estudiamos
se puede considerar como una rotación de Wick de la ecuación del calor, en la que hacemos
el cambio t → it. Esta rotación, por supuesto, debe hacerse siempre con mucha precaución.
Ejemplo 4.8 Supongamos una partícula en 1D, inicialmente localizada en el punto x1 = 0.
¿Cuál es la probabilidad de encontrarla en otro punto x, tras un tiempo ∆t muy pequeño?

De la ecuación (4.135) deducimos que la probabilidad de encontrar a la partícula en cual-
quier otro punto del espacio es la misma, y escala con (∆t)−1/2 . La razón es que la partícula
localizada en el espacio de posiciones está perfectamente deslocalizada en espacio de mo-
mentos, así que sale a todas las velocidades posibles. Este resultado muestra que la ecuación
de Schrödinger no relativista no es causal, y exige que diseñemos una mecánica cuántica
relativista.
Resumen 4.5. El Hamiltoniano para una partícula cuántica no relativista y sin espín
~2
viene dada por H = − 2m ∇2 + V (x), donde V (x) es la energía potencial en cada punto.
Los valores esperados de posición y momento cumplen las ecuaciones de Ehrenfest,
hẊi = hP i/m, hṖ i = −h∂x V i, que no coincide con −∂x V (hXi) salvo en el caso de
que el potencial sea cuadrático. En caso contrario hay un exceso de fuerza cuántico que

podemos estimar como (−1/2)(∂x2 V )σX

2 .
La evolución cuántica da lugar a una ecuación de continuidad, ∂t ρ + ∇j = 0, donde

1
j = 2m (ψ ∗ P ψ − ψP ψ ∗ ).
Se define el propagador Rcomo el kernel del operador evolución, de tal manera que
se cumple que ψ(x, t) = dx0 G(x, t; x0 , t0 )ψ(x0 , t0 ). Se suele imponer la condición de
que el propagador sea cero para t < t0 , es decir, definimos el propagador retardado
G+ (x, t; x0 , t0 ) = θ(t − t0 )G(x, t; x0 , t0 ), que cumple una ecuación diferencial sencilla,
(i~∂t − Hx )G+ (x, t; x0 , t0 ) = i~δ(x − x0 )δ(t − t0 ).
4.A Problemas
4.1.- Si un operador A sobre L2 (R) tiene núcleo integral A(x, y), probar que el núcleo
integral de A2 es A2 (x, y) = dz A(x, z)A(z, y).
R
4.2.- Encontrar el producto del operador A sobre L2 (R) cuyo núcleo es A(x, y) =
θ(x − y) y el operador B, cuyo núcleo es B(x, y) = −δ 0 (x − y).
4.3.- Dada una función de onda sobre L2 (R)⊗C2 de tipo |Ψi = 2−1/2 (|φ1 , +i + |φ2 , −i),
encontrar el entrelazamiento entre el grado de libertad espacial y el espinorial, sabiendo
que hφ1 |φ2 i = δ.
4.4.- Conociendo el espectro de Px , obtener el espectro y los autoestados del opera-

dor derivada, D = ∂x , como operador de L2 (R). Usarlo para obtener la descomposición
espectral del operador D y del operador traslación, definido como T (a) = exp(−aD).
4.5.- Bases mutuamente no-sesgadas (mutually unbiased bases, MUB). Las bases de
posición y de momentos cumplen una propiedad interesante: dado un elemento de una de
ellas, es igualmente fácil confundirlo con cualquier elemento de la otra. Es decir, |ai i y |bi i
forman una pareja de MUB si hai |bj i = δ, independiente de i y de j. Encontrar una pareja
de MUB en dimensión 2 y, si es posible, en dimensión 3.
4.6.- Recordemos que la relación de conmutación [X, P ] = i~ es imposible en un espacio

de dimensión discreta, y veamos cuál será su análogo. Considerar una red discreta con N
sitios, que forman un anillo equiespaciado. (a) Definir el operador posición y el operador
traslación en dicho sistema. (b) Calcular la relación de conmutación entre ellos. (c) Definir el
operador momento tomando el logaritmo del operador traslación. (d) Encontrar la relación
de conmutación entre posición y momento en este sistema.
4.7.- La representación adjunta. Toda álgebra de Lie con constantes de estructura

fijk tiene una representación matricial privilegiada, llamada representación adjunta, cuya
dimensión coincide con el número de generadores, y el generador i-ésimo viene dado por
la matriz (Ai )jk = fijk . Encontrar la representación adjunta del grupo O(3), sabiendo que
sus constantes de estructura son fijk = εijk .
4.8.- Considerar una partícula libre sin espín en una dimensión. Obtener la ley de
evolución de la varianza de su posición, σX
2 . Para ello, obtener la evolución de hX 2 i y de
hXi a partir de la ecuación de Ehrenfest. Demostrar que, bajo condiciones muy generales,
la varianza siempre crece linealmente.

5. Algunos sistemas cuánticos continuos
5.1 Repaso de los sistemas cuánticos básicos

En las asignaturas de Física Cuántica I y II se han considerado una serie de sistemas
cuánticos en detalle: pozos de potencial, barreras de potencial, osciladores armónicos, el
átomo de hidrógeno, átomos multielectrónicos y moléculas. En esta sección visitamos de
nuevo algunos de dichos sistemas, en un grado de profundidad mayor. Dejamos de lado los
relativos a física atómica y molecular, porque requieren de unos conceptos más especiali-
zados.
5.1.1 Pozos de potencial

La ecuación de autovalores del Hamiltoniano para una partícula que se mueve en un
espacio continuo toma la forma de una ecuación diferencial, ya sea ordinaria o en derivadas
parciales. Para el Hamiltoniano (4.109) en 1D tenemos que
~2 00
− ψ (x) + V (x)ψ(x) = Eψ(x), (5.1)
2m
que es especialmente manejable en el caso de que V (x) sea constante por tramos. En ese
caso, en cada tramo en el que V (x) = V0 tendremos que
2m
ψ 00 (x) = (V0 − E)ψ(x), (5.2)
~2
cuya solución local es fácil de obtener,
p
2m(E − V0 )
ψ(x) = A exp(ikx) + B exp(−ikx), donde k = , (5.3)
~
es decir, si E > V0 las soluciones son oscilatorias, pero si E < V0 entonces las soluciones
serán una combinación de exponenciales reales, una creciente y otra decreciente. Por su-
puesto, no hemos determinado los valores de A y B, porque deben ser encontrados mediante
requisitos globales: a partir de las condiciones en los bordes de la región.
Nótese que, por tratarse de una ecuación de segundo orden, un salto finito en el poten-
cial se manifiesta en un salto finito en la segunda derivada de la función de ondas. Por lo
tanto, podemos imponer una condición de continuidad tanto en el valor de la función de
ondas como en su primera derivada.
En términos intuitivos, sabemos que el n-ésimo estado excitado será una función con n
nodos. La razón física es que la energía cinética crece con la variación (segunda derivada)

134 Capítulo 5. Algunos sistemas cuánticos continuos
de la función de ondas. También es importante emplear los argumentos de paridad. Si un

potencial es par, V (x) = V (−x), entonces se puede demostrar (ver los ejercicios propuestos)
que las funciones de onda son, alternadamente, pares e impares.
Ejemplo 5.1 Sea una partícula de masa m que se encuentra en el primer estado excitado
(n = 2) de un pozo cuadrado finito unidimensional de anchura a y profundidad V0 < 0.
La energía de dicho estado medida desde el fondo del pozo es E2 = V0 /2. Calcule la
probabilidad de encontrar a la partícula dentro del pozo.
Definamos el sistema de referencia de manera que el potencial esté centrado en torno al

origen,
(
0 si |x| < a/2,
V (x) = (5.4)
V0 en caso contario.
la función de onda del segundo estado estacionario debe ser impar, necesariamente tendrá
la forma
si x ≤ −a/2,

−β exp(qx)

φ(x) = C sin(kx) si x ∈ [−a/2, +a/2] , (5.5)
+β exp(−qx) si x ≥ a/2.


con q = 2m(V0 − E)/~2 = mV0 /~2 , k = 2mE2 /~2 = mV0 /~2 . Así obtenemos que
p p p p
β = sin(ka/2) exp(qa/2) garantiza la continuidad de la función de onda junto con k = q.

Resta sólo imponer continuidad en la primera derivada en x = ±a/2,
q cos(qa/2) = −βq exp(−qa/2), (5.6)
y sustituyendo el valor de β nos queda
qa 3π 3π
cos(qa/2) = − sin(qa/2) → = → q= , (5.7)
2 4 2a
donde hemos tomado la primera solución de la ecuación trigonométrica ya que estamos en
el primer nivel con función de onda impar. Por tanto, la función de onda queda
 √ 3π/4
−a

2e 3πx
− exp + si x ≤ ,


2 2a 2




−a +a

 3πx
φ(x) = C × sin si x ∈ , , (5.8)

 √ 2a 2 2
2e3π/4

3πx +a


+ exp − si x ≥ ,


2 2a 2
La probabilidad pedida vendrá dada por
R +a/2 2 R a/2
a −a/2 |φ(x)| dx |φ(x)|2 dx I1

P |x| < = R +∞ = R a/2 0
R∞ ≡ , (5.9)
2 2
|φ(x)| dx 2
|φ(x)| dx + 2
|φ(x)| dx I1 + I2
−∞ 0 a/2

y sólo resta evaluar las integrales pedidas,
a/2 a/2
3πx 3π + 2
Z Z
I1 = 2
|φ(x)| dx = |C| 2
sin 2
dx = a|C|2 , (5.10)
0 0 2a 12π
Z ∞
e3π/2 |C|2 ∞

3πx 2
Z
I2 = 2
|φ(x)| dx = exp − dx = a|C|2 , (5.11)
a/2 2 a/2 a 12π
por lo que
a I1 3π + 2 3π + 2
P |x| < = = = ≈ 0.851. (5.12)
2 I1 + I2 3π + 2 + 2 3π + 4

5.1.2 Potenciales delta

Un caso particular interesante es aquél en el que V (x) = Kδ(x−a). En realidad, ningún
potencial puede estar infinitamente localizado en un punto, pero la aproximación resulta
relevante en la práctica, en casos en el que tenemos una barrera de potencial muy alta y
muy estrecha. En este caso, el valor infinito del potencial en x = a nos muestra que la
segunda derivada de la función de ondas toma un valor infinito, y por lo tanto la primera
derivada tendrá un salto finito. Pero podemos hacer algo más: podemos evaluar el salto en
la derivada de la función de ondas, integrando formalmente la ecuación de Schrödinger en
torno al valor singular, obtenemos
a+η
−~2
Z
lı́m ψ 0 (a + η) − ψ 0 (a − η) = lı́m (5.13)

ψ(x)V (x)dx = Kψ(a).
2m η→0+ η→0+ a−η
así que en nuestro caso tendremos que el salto en la primera derivada será ∆ψ 0 (a) =
−(2mK/~2 )ψ(a).
Ejemplo 5.2 Una partícula de masa m en una dimensión está sometida al potencial
atractivo tipo delta V (x) = −γδ(x), con γ > 0. Halle las autoenergías y las autofunciones
de los estados ligados.
Sea E < 0 la energía de un estado estacionario ligado (si E > 0 el autoestado será no
ligados). Puesto que el potencial es nulo si x 6= 0, la función de onda del estado estacionario
la podemos escribir como
con k = (5.14)
p
φ(x) = C exp(−k|x|), −2mE/~,
donde la constante de normalización C se obtiene a partir de
∞ ∞
C2
Z Z
1=C 2
exp(−2k|x|)dx = 2C 2
exp(−2kx)dx = . (5.15)
−∞ 0 k
Por tanto,
√
φ(x) = k exp(−k|x|). (5.16)

Para calcular los valores permitidos de k (y, por ende, de la energía E) tenemos que ir a
la propia ecuación de Schrödinger. Derivando φ(x) una primera vez,
φ0 (x) = sign(x)k 3/2 exp(−k|x|), (5.17)

y volviendo a derivar
φ00 (x) = k 5/2 exp(−k|x|) − 2k 3/2 δ(x). (5.18)

La ecuación de Schrödinger del sistema es entonces
~2 00
− φ (x) + V (x)φ(x) = Eφ(x),
2m
~2 5/2 −k|x| ~2 3/2
− k e + k δ(x) − γδ(x)k 1/2 e−k|x| = Ek 1/2 e−k|x| ,
2m m
~2 k 2 ~2 k

−k|x|
E+ e − − γ δ(x) = 0. (5.19)
2m m
Ambos
p paréntesis deben anularse. La anulación del primero implica la relación ya conocida
k = −2mE/~2 ; la del segundo proporciona la relación que estamos buscando,
~2 k
− γ = 0. (5.20)
m
Por tanto llegamos a que existe un único estado ligado, con energía
γ2m
E=− . (5.21)
2~2

5.1.3 Barreras de potencial

Consideremos ahora el caso en el que E > V (x) para todo x. Clásicamente, la partícula
no está restringida a moverse en una región finita, y por lo tanto los estados asociados no
serán normalizables. Por lo tanto, es usual plantear el problema en términos de un haz
de partículas que se envía desde la izquierda y que puede ser reflejado o transmitido por
el potencial. Asumamos que existe una región extremo-izquierda en la que V (x) = VL ,
en la que escribiremos la función de onda como la combinación de una onda incidente
y una onda reflejada, ψL = Ai exp(ikL x) + Ar exp(−ikL x). En la región del extremo-
derecho también asumiremos que V (x) = VR , y sólo consideraremos una onda transmitida
ψR = At exp(ikR x). Por supuesto, kI no tiene por qué coincidir con kR si VL 6= VR . Los
coeficientes de reflexión y de transmisión se definen rigurosamente a través de la corriente
de probabilidad,
jR · (−n) jR · n
R= , T = , (5.22)
jI · n jI · n
donde jI , jR y jT son las corrientes de probabilidad asociadas a cada una de las tres ondas,
que nos dan
|AR |2 |AT |2 kT
R= , T = . (5.23)
|AI |2 |AI |2 kI

5.1.4 El oscilador armónico

Un caso especial que requiere un tratamiento diferente es el del oscilador armónico. En
ese caso la ecuación diferencial es
~2 00 k
− ψ (x) + x2 ψ(x) = Eψ(x), (5.24)
2m 2
que puede resolverse por métodos analíticos. Sin embargo, es mucho más interesante realizar
un enfoque algebraico inventado por Paul Dirac. En efecto, el Hamiltoniano se puede
escribir como
1 2 k 2
H= P + X , (5.25)
2m 2
y sólo necesitamos saber que [X, P ] = i~. Definimos unos operadores escalera (en breve se
comprenderá el origen del nombre),
r
mω i
a= X+ P ,
2~ mω
r
† mω i
a = X− P . (5.26)
2~ mω
y procedemos a calcular su conmutador,

mω i i i
[a, a† ] = X+ P, X − P = ([X, −P ] + [P, X]) = 1. (5.27)
2~ mω mω 2~
Ahora definimos el operador número N = a† a, y determinamos su relación con el Ha-

miltoniano del sistema. En efecto, se puede comprobar que H = ~ω(N + 1/2). Por lo
tanto, si obtenemos el espectro de N podremos obtener el de H. Para ello, calculamos su
conmutador con a y con a† ,
[N, a] = [a† a, a] = a† [a, a] + [a† , a]a = −a,

[N, a† ] = [a† a, a† ] = a† [a, a† ] + [a† , a† ]a = a† . (5.28)
Asumamos que N |ni = n |ni, para algún n ∈ R. Ahora consideremos el estado a |ni y
comprobemos que también es autoestado de N :
N a |ni = (N a−aN +aN ) |ni = [N, a] |ni+aN |ni = −a |ni+na |ni = (n−1)a |ni , (5.29)
y así probamos que a |ni es también autoestado de N , con autovalor (n − 1). De la misma
manera podemos probar que a† |ni es autoestado de N , con autovalor (n+1). Por eso se les
llama operadores escalera. Más aún: el operador a se conoce como el aniquilador, también
llamado operador destrucción, y a† se conoce como el creador, también conocido como
operador creación.

Pero aún no sabemos qué valores de n son autovalores válidos del operador N . En
términos físicos es razonable pensar que exista una cota inferior, debido a su relación con
el Hamiltoniano. En efecto,
n = hn|N |ni = hn|a† a|ni = |a|ni|2 ≥ 0, (5.30)
y así probamos que el espectro de N no puede tomar valores negativos. Más aún, si n es
autovalor entonces también lo es n−1, así que la única manera de no entrar en contradicción
es aceptar que n ∈ N. De esta manera tendremos que al aplicar el aniquilador sobre el |0i
no obtenemos otro autovector diferente, simplemente obtenemos 0.
Regresando a nuestro Hamitoniano, H = ~ω(N + 1/2), de manera que deducimos que
el espectro de H está formado por valores equiespaciados una distancia ~ω, comenzando
por ~ω/2, que se conoce como energía del punto cero.
C Nótese que hemos deducido todo el espectro del Hamiltoniano usando meramente las
relaciones de conmutación de los operadores creación, aniquilación y número. Estos
mismos operadores aparecerán de nuevo cuando consideremos las teorías cuánticas
de campos, y allí |ni será un estado en el que hay n partículas (fotones, electrones,
o lo que consideremos), tal que a |ni es el estado con una partícula menos y a† |ni el
estado con una más.
La obtención de los autoestados del Hamiltoniano del oscilador armónico es una tarea
complicada, pero es importante conocer cómo obtener el estado fundamental, |0i, que puede
obtenerse imponiendo la ecuación a |0i = 0, que se convierte en

i ~
0= X+ P φ0 (x) = x − ∂x φ0 (x), (5.31)
mω mω
que tiene la forma xφ0 (x) = (~/(mω))φ00 (x). Al ser una ecuación de primer orden puede
resolverse de manera cerrada,
φ00 (x)

φ(x)
Z Z
~x ~x
dx = dx, → log = . (5.32)
φ0 (x) mω φ(0) 2mω
y de ahí llegamos a la forma gaussiana,
mω 1/4 mω
φ0 (x) = exp − x2 . (5.33)
π~ 2~
Los estados subsiguientes pueden obtenerse, en orden, aplicando a† repetidas veces, tenien-
do en cuenta que a† |ni = (n + 1) |n + 1i.
Ejemplo 5.3 Hallar las funciones propias y valores propios de la energía para un oscilador
armónico truncado cuyo potencial es
(
1
2k x
2 if x > 0,
V (x) = (5.34)
∞ if x < 0.
Calcule la incertidumbre de la posición y el momento para el estado fundamental.

La función de onda en la región x < 0 es idénticamente nula. Por otro lado, en la región x >
0 la función de onda de energía E ha de verificar la ecuación de Schrödinger independiente
del tiempo de un oscilador armónico de frecuencia ω. Por continuidad en x = 0 sólo son
admisibles las soluciones con n impar. En definitiva, los niveles de energía son

1 3
En = 2n + 1 + ~ω = 2n + ~ω, con n ∈ N, (5.35)
2 2
(esto es, los niveles energéticos impares del oscilador armónico completo) y las autofuncio-
nes correspondientes
(
0 x<0
φn (x) = q
2 con n = 0, 1, 2, . . . (5.36)
α ψ2n+1 (x/α) x > 0,
√
donde ψn (x) es la n-ésima función del oscilador armónico, α2 = ~/(mω), y el prefactor 2
se incluye a efectos de normalización. Por tanto, la función de onda normalizada del estado
fundamental será
s
x2

4 x
φ0 (x) = √ exp − 2 , (5.37)
πα α 2α
y los valores esperados de x y x2 serán
∞ Z ∞
4 x 2 −x2 /α2 2
Z
2
hxi = x|φ0 (x)| dx = √ x e dx = √ α,
πα 0 α π
Z0 ∞ Z ∞
4 x 2 2 2 3
hx2 i = x2 |φ0 (x)|2 dx = √ x2 e−x /α dx = α2 , (5.38)
0 πα 0 α 2
por lo que
r r r
3 4 3π − 8 ~
(5.39)
p
∆x = hx2 i − hxi2 = α − = .
2 π 2π mω
Por otro lado, como el estado es estacionario y ligado, hpx i = 0. Entonces:
s
p p 3~ω 1
∆px = hp2x i = 2m (E0 − hV (x)i) = 2m − mω 2 hx2 i
2 2
s
3√
r
3 3
= 2~ωm − = ~mω. (5.40)
2 4 2
Obsérvese que
r r
3π − 8 3
∆x∆px = ~ ' 0.583~, (5.41)
2π 2
por lo que no llega a saturarse la desigualdad de Heisbenberg.

Resumen 5.1. La función de onda debe anularse en los puntos en los que la barrera
de potencial es infinita. Si la barrera es finita, la función de onda debe ser continua y
derivable. Si es una función delta, sólo debe ser continua.
Oscilador armónico, partícula sin espín de masa m y potencial V (x) = kx2 /2, de
frecuencia natural ω = k/m. Los autoestados |ni tienen energía En = (n + 1/2)~ω.
p
El Hamiltoniano se resuelve
p expresándolo en términos de los p operadores creación, ani-
quilación y número, a = mω/(2~)(X + iP/(mω), a† = mω/(2~)(X − iP/(mω) y
N = a† a, ya que H = hω(n + 1/2). Nótese que [a, a† ] = 1, [N, a] = −a y [N, a† ] = a† .
5.2 Partícula en campo electromagnético

5.2.1 Partícula clásica en un campo electromagnético
Recordemos que una partícula de carga q y masa m, no relativista y sin espín, en el
seno de un campo electrico E y magnético B, está sometida a la fuerza de Lorentz,
mẍ = q (E + v × B) . (5.42)
Esta ecuación del movimiento se puede obtener a partir del siguiente lagrangiano
1
L(x, v, t) = m|v|2 + qv · A(x, t) − qV, (5.43)
2
si V y A(x, t) son, respectivamente, un potencial escalar y un potencial vector válidos, es
decir, que cumplan que
E = −∇V − ∂t A, B = ∇ × A. (5.44)
Estas ecuaciones no definen un único potencial escalar y vector, pero cualquier pareja V y
A que satisfagan las ecuaciones (5.44) serán apropiadas para nuestro fin. Para comprobarlo,
obtengamos las ecuaciones de Euler-Lagrange para cada una de las componentes de x =
(x1 , x2 , x3 ),
d ∂L ∂L
= . (5.45)
dt ∂ ẋi ∂xi
En nuestro caso, las ecuaciones de Euler-Lagrange conllevan alguna sutileza, así que las
desarrollaremos en detalle. La derivada con respecto a ẋi del lagrangiano es,
∂L
= mẋi + qAi , (5.46)
∂ ẋi
y procedemos a calcular su derivada total con respecto al tiempo para completar el lado
izquierdo de las ecuaciones de Euler-Lagrange. Pero esta derivada total debe hacerse a
través de la regla de la cadena,
d ∂ X ∂
= + ẋj , (5.47)
dt ∂t ∂xj
j

y el motivo físico es que es la derivada respecto al tiempo de un observador que sigue a la

partícula, y que lleva una cierta velocidad. Por lo tanto, pasándonos a la notación compacta
en la que las derivadas parciales se representan con símbolos tras la coma, las ecuaciones
de Euler-Lagrange nos quedan
X X
mẍi + q Ȧi + q ẋj Ai,j − q ẋj Aj,i + qV,i , (5.48)
j j
donde reconocemos el campo eléctrico, Ei = Ȧi −V,i y el campo magnético aparece a través
de la fuerza de Lorentz,
 
X
mẍi = q Ei − ẋj (Ai,j − Aj,i ) , (5.49)
j
y comprobamos que j ẋj (Ai,j − Aj,i ) es la i-ésima componente de v × B. Esta última

P
expresión es fácil de comprobar en componentes, pero animamos a los lectores/as a intentar
un enfoque más general, empleando el símbolo de Levi-Civita.
C Hay muchas elecciones diferentes posibles para A, pero todas son físicamente equi-
valentes, constituyendo la llamada invariancia gauge. La invariancia gauge va mucho
más allá de lo que se explica en este curso. En términos muy breves, partamos del
hecho de que todas las funciones de onda son invariantes bajo un cambio de fase glo-
bal, es decir: poseen una simetría U(1) global. Imaginemos que deseáramos imponer
que esa simetría sea local, es decir: que fuera posible multiplicar la función de ondas
por una fase diferente en cada punto. Sería posible si introdujéramos unos campos
compensadores, que se corresponden con el campo electromagnético.
C Las ecuaciones del electromagnetismo deberían expresarse siempre en notación mani-

fiestamente covariante, es decir: en el régimen relativista. Las ecuaciones son mucho
más elegantes, y no es una mera cuestión estética, sino que su elegancia muestra
la estructura profunda que poseen. En este capítulo trabajamos en notación no-
relativista porque nuestra MQ no es aún capaz de incluir la invariancia Lorentz, que
será discutida en el último tema.
Una vez que tenemos el lagrangiano para la partícula en un campo electromagnético,

nos preguntamos cuál es el momento conjugado a la posición. La respuesta es
∂L
pi ≡ = mẋi + qAi , (5.50)
∂ ẋi
y esta ecuación define el llamado acoplo mínimo. Resulta inicialmente sorprendente que
el momento no sea meramente mẋ. Este valor seguirá siendo importante, y lo llamaremos
momento cinético, mẋ = p − qA. Podemos escribir el Hamiltoniano del sistema, mediante
X 1
H= pi xi − L = (p − qA)2 + qV, (5.51)
2m
i
que nos muestra que la energía se compone de dos términos: la energía cinética, correspon-
diente al cuadrado del momento cinético, y la energía potencial.

C ¿Por qué no escribimos el Hamiltoniano como mv 2 /2 + qV ? Ciertamente, ése es

su valor. Sin embargo, lo canónico es escribir el Hamiltoniano como función de las
variables conjugadas, x y p. Ahora veremos por qué.
5.2.2 Niveles de Landau

El salto del sistema clásico al cuántico se realiza transformando la posición y el mo-
mento canónico (no el cinético) en variables conjugadas, es decir, asignamos el observable
Xi a la posición como hacemos usualmente, y Pi a pi = mẋ + qA. En rigor, el campo
electromagnético también debería ser cuantizado, pero en esta sección asumiremos que el
campo electromagnético es clásico y viene dado de forma exterior, es decir, no depende de
la posición de nuestras partículas.
C ¿Por qué el momento de una partícula cargada en un campo electromagnético no

coincide con su momento cinético? Haremos la discusión en términos cuánticos, pero
en realidad la razón se puede traducir exactamente en mecánica clásica. El momento
debe ser, esencialmente, el generador de las traslaciones. Pero, en presencia de A, las
traslaciones deben compensar el efecto del potencial vector. Lo entenderemos mejor
a medida que el capítulo avanza.
C Una anotación más: la definición del momento, p = mẋ + qA no es invariante gau-

ge, es decir: cambiará cuando cambiemos de elección de gauge. Eso no es ningún
problema, sólo implica que, sorprendentemente, el momento de una partícula elec-
tromagnética cargada no es un observable físico. Toda medida debe ser invariante
gauge, así que las observaciones del momento quedan descartadas. Eso no significa
que no sea un observable útil, en términos matemáticos.
El Hamiltoniano cuántico de una partícula cargada en un campo electromagnético

clásico es, por tanto,
1
H= (P − qA(X, t))2 + qV (X). (5.52)
2m
Resulta muy ilustrativo calcular el conmutador entre dos componentes diferentes de la
velocidad, [Vi , Vj ]. Como sabemos, [Pi , Pj ] = 0, y en ausencia de campo magnético esa
misma relación se aplica a las velocidades. Pero ya no será el caso, y es muy interesante
entender por qué.
1
[Vi , Vj ] = [Pi − qAi (X), Pj − qAj (X)]
m2
q
= 2 ([Pi , Aj (X)] − [Pj , Ai (X)])
m
i~q i~q
= 2 (Ai,j − Aj,i ) = 2 εijk Bk , (5.53)
m m
donde usamos el convenio de índices repetidos. En resumen: la evolución de Vi bajo el
flujo generado por Vj es proporcional al campo magnético. Este hecho será suficiente para
establecer el comportamiento de una partícula en el seno de un campo magnético.
También podemos calcular el conmutador entre posiciones y momento cinético, y com-
probaremos que responden al resultado canónico, [Xi , mVi ] = i~δij . El motivo es que Xi
conmuta con toda función de la posición, en concreto con Ai (X).

Consideremos ahora el caso particular de un campo magnético constante y homogéneo,

que apunta en la dirección del eje Z, es decir, B = Bez . Prescindamos de la necesidad
de elegir un gauge, es decir, una representación para A. Sabemos que el Hamiltoniano se
puede escribir como
m
Vx2 + Vy2 + Vz2 . (5.54)

H=
2
y además sabemos que [Vx , Vz ] = [Vy , Vz ] = 0, aunque [Vx , Vy ] = qB/m2 . Por lo tan-
to, el Hamiltoniano se puede descomponer en la suma de dos términos que conmutan,
H⊥ = (m/2)(Vx2 + Vy2 ) y Hk = (m/2)Vz2 , según sean perpendiculares o paralelos al campo
magnético. Podemos diagonalizarlos independientemente.
Como [Z, Vz ] = i~, sabemos que el espectro de ambos operadores debe ser todo R. Por
lo tanto, el espectro de Vz2 debe ser [0, ∞). Es fácilmente interpretable: la energía cinética
de una partícula en un campo magnético uniforme se puede descomponer en dos términos:
el término paralelo al campo magnético y el término perpendicular. El primer término es
necesariamente constante, y además no está restringido. El segundo será lo que estudiemos
a continuación.
Volvamos a considerar el operador H⊥ = (m/2)(Vx2 + Vy2 ), pero olvidemos por un mo-
mento el significado físico de Vx y Vy , y razonar que se trata meramente de dos operadores
cuyo conmutador es proporcional a la identidad, como X y P . La idea genial de Lev Da-
vidovich Landau fue reconocer que H⊥ es matemáticamente equivalente al de un oscilador
armónico, donde Vx y Vy juegan el papel de posición y momento, aunque en realidad su
significado físico sea muy diferente.
En términos generales, inventemos dos operadores, Q y S, tales que [Q, S] = iλ/2. En
ese caso, el espectro del operador H = Q2 + S 2 será En = λ(n + 1/2). Se sugiere comprobar
que este resultado nos proporciona exactamentep el espectro del oscilador armónico. En
nuestro caso, definimos Q = m/2Vx y S = m/2Vy , de manera que su conmutador
p
será [Q, S] = (m/2)[Vx , Vy ] = (~qB/2m), así que habríamos llegado al resultado de que el
espectro de H⊥ es discreto,
~qB
En = (n + 1/2), con n ∈ N, (5.55)
m
son los llamados niveles de Landau. Nótese que qB/m = ωc es la frecuencia de ciclotrón,
es decir, la correspondiente a las órbitas circulares clásicas.
C La trayectoria clásica del oscilador armónico estándar es una elipse en el espacio

XP , o una circunferencia cuando se escalan apropiadamente los ejes. En el caso de
los niveles de Landau, la partícula dibuja una circunferencia... en el espacio real. En
rigor, lo que estamos trazando es la trayectoria en el plano Vx Vy , que también es
circular, lógicamente.
Pero aún no hemos determinado las autofunciones de la energía. Para ello debemos
elegir un gauge. El llamado gauge de Landau corresponde a tomar Ax = Az = 0, Ay = Bx,
y nos resulta conveniente porque [Py , H⊥ ] = 0, de manera que el autovalor de Py , que
llamaremos py , sirve para etiquetar los autoestados de H⊥ , mostrando que los niveles de
Landau están infinitamente degenerados, porque en cada uno de ellos hay que acomodar
los infinitos autovalores de Py como estados diferentes. En este caso podemos escribir el

Hamiltoniano H⊥ como
Px2 Py 2

1
H⊥ = 2
+ mωc X − , (5.56)
2m 2 qB
es decir, es un oscilador armónico con una posición central x0 = py /(qB) que depende del
valor de py . Esto resulta muy chocante hasta que nos damos cuenta de que es el fruto de
haber elegido un gauge particular.
La degeneración infinita, en cambio, no depende del gauge escogido. ¿Es realmente

observable? Sí, pero debemos tener precaución. Si tenemos un sistema finito, de tamaño
Lx ×Ly (el eje Z no importa por ahora), entonces los valores de py deben estar discretizados:
py = 2π~n/Ly , para algún n ∈ Z. Pero, además, sabemos que x0 = py /(mωc ), y ese valor
debe estar físicamente en [0, Lx ], así que tenemos que py = 2π~n/Ly < qBLx , de forma
que n < qBLx Ly /(2π~). Esta estimación resulta muy buena en la práctica: en un sistema
físico de área A = Lx Ly la degeneración de cada nivel de Landau es
qBA
N= , (5.57)
2π~
que suele expresarse diciendo que el número de estados por unidad de área es qB/(2π~).
Si q = e, la carga de un electrón, entonces definimos Φ0 = h/e como el flujo magnético
elemental. Entonces, podemos escribir
Φ
N= , (5.58)
Φ0
es decir: la degeneración de cada nivel de Landau corresponde al cociente entre el flujo
magnético total entre el flujo elemental.
C El resultado anterior es sorprendentemente fructífero. En términos experimentales, se

ha observado que muchas propiedades de muchos materiales conductores presentan
una oscilación cuando se muestran en términos del campo magnético externo. El
fenómeno se conoce como efecto De Haas-Van Alphen. La razón física detrás del
mismo es que a medida que aumenta el campo magnético cambiamos la degeneración
de cada nivel de Landau, pero no el número de electrones totales en la muestra. De
esta manera, el estado pasa periódicamente de tener sus niveles de Landau completos
a tenerlos a llenado parcial, y muchas propiedades físicas responden a dicha fracción
de llenado.
5.2.3 Ecuación de Pauli

Consideremos ahora una partícula con espín 1/2 en un campo electromagnético. En ese
caso, el Hamiltoniano tomará la forma
1 h i
H= (P − qA)2 − q~σ · B + qV, (5.59)
2m
que puede reescribirse de una manera más compacta que a veces resulta útil,
1
H= (σ · (P − qA))2 + qV. (5.60)
2m

Para demostrar la equivalencia entre estas dos ecuaciones es preciso emplear una identidad
muy útil sobre las matrices de Pauli,
(σ · a)(σ · b) = a · b + iσ · (a × b). (5.61)
Resumen 5.2. Una partícula en un campo electromagnético descrito por un potencial

vector, A(x), cambia la definición de su momento lineal, p = mv + qA, relación que se
conoce como acoplo mínimo. En un campo magnético constante B a lo largo del eje Z, el
Hamiltoniano efectivo en el plano XY se convierte en (m/2)(Vx2 +Vy2 ), pero las relaciones
de conmutación entre las velocidades se vuelven no triviales, [Vx , Vz ] = i(~qB/m2 ),
de manera que el sistema es un oscilador armónico disfrazado, cuyos estados están
equiespaciados, En = (~qB/m)(n + 1/2), pero con degeneración qBA/(2π~), donde A
es el área de la muestra.
5.3 Teoría de colisiones

La MQ trabaja con objetos microscópicos, que son difíciles de manipular. Debido a ello,
una fracción importante de los experimentos con sistemas cuánticos han sido de colisión (o
scattering): un haz de partículas incide contra un blanco (o target), tras lo cual una serie de
detectores analizan las partículas que emergen. El scattering es la base de los experimentos
históricos en física nuclear, desde que Ernest Rutherford mostró la existencia del núcleo
al hacer incidir partículas α contra una lámina delgada de oro y en física de partículas
elementales, pero también es una herramienta esencial en óptica y física del estado sólido1 .
En esta sección consideraremos el problema de colisión en su versión más sencilla, que
es la interacción de un haz colimado2 de partículas con un potencial V (x) que tiene alcance
limitado, es decir, se espera que lı́mr→∞ V (ru) = 0, donde u es cualquier dirección3 . El
target, por lo tanto, permanecerá estático durante todo el proceso, lo cual implica que debe
tratarse de un objeto de una gran masa (comparativamente hablando). Por otra parte,
nuestro haz incidente estará compuesto por partículas con momento bien definido, lo cual
implica que su posición estará deslocalizada4 . Más aún, haremos la aproximación de que
las partículas del haz no interactúan entre ellas, es decir: que lanzar N partículas nos
da el mismo resultado que lanzar una partícula N veces. En experimentos reales esto no
siempre es cierto, y las partículas pueden tender a un comportamiento de salida coherente
(o correlacionado). Asimismo asumiremos que no se producen colisiones múltiples, ya sea
de varias partículas incidentes contra un target, o de una partícula incidente con varias
partículas del target.
En los problemas de colisión consideraremos sólo dos tiempos: t0 → −∞ y t1 → +∞.
Es decir, consideraremos que los tiempos de observación en el laboratorio son enormemente
grandes en comparación con los tiempos característicos de la dinámica, de modo que sólo
nos interesa la situación en el pasado remoto y cómo evoluciona hasta el futuro remoto.
1
La traducción del término scattering es complicada. Los términos dispersión o difusión tienen connota-
ciones diferentes: dispersión es la separación de las distintas frecuencias de una onda en un medio material,
y difusión es también la expansión aleatoria de una nube de partículas en un medio material.
2
Es decir, de partículas que se mueven todas en la misma dirección.
3
Más aún, se espera que el potencial caiga a cero de manera suficientemente rápida. Idealmente,
V (Ru) ∼ exp(−R/ξ), y entonces decimos que el rango del potencial es ξ.
4
Naturalmente, lo correcto es suponer que se trata de un paquete de ondas de anchura finita, pero no
entraremos en esas sutilezas.

Figura 5.1: Ilustración esquemática de la cinemática de un proceso de colisión. La partícula

tiene inicialmente un momento p0 , y la línea recta que resulta de prolongar su trayectoria
inicial pasa a una distancia mínima b del target.
Llamaremos matriz S al operador evolución que nos lleva de −∞ a +∞, y es el objeto

matemático clave de la teoría de colisiones. En el caso más sencillo, en el que no se crean
ni se destruyen partículas, la matriz S debe especificar la amplitud de probabilidad de que
una partícula de momento p0 en t → −∞ se convierta en una partícula de momento p1
para t → +∞, es decir,
S(p0 , p1 ) = lı́m lı́m hp1 | U (t0 , t1 ) | p0 i. (5.62)

t1 →+∞ t0 →−∞
5.3.1 Cinemática de colisiones

Antes de discutir los aspectos cuánticos de la colisión conviene repasar cuestiones de
índole geométrica y de mecánica clásica. Trabajando en el sistema de referencia del labo-
ratorio, cada partícula incidente lleva un momento p0 y se desplaza inicialmente a lo largo
de una línea recta, cuya prolongación pasa a una distancia mínima b del target, tal como se
ve en la figura 5.1. Esta longitud b se llama parámetro de impacto. En un experimento
real, en el que lanzamos un haz de partículas contra un target también formado por muchas
partículas, desconocemos el valor real del parámetro de impacto de cada colisión. Por lo
tanto, razonaremos de manera estadística.
Sea F el flujo de partículas incidente, es decir, el número de partículas incidentes que
atraviesa la unidad de área en la unidad de tiempo. Detrás del target pondremos detectores
en distintas posiciones, para detectar las partículas que han sido deflectadas en cada ángulo
posible. Así, definimos n(θ, φ)dΩ como el número de partículas por unidad de tiempo que
salen en la dirección dada por los ángulos θ y φ, medidos usando el eje de entrada como
el eje Z (por tanto, el valor θ = 0 corresponde a las partículas que no se deflectan, y
θ = π a las que rebotan y vuelven por donde llegaron). Por lo tanto, dΩ = sin θ dθdφ es el
elemento de ángulo sólido. Asi, dividiendo esa magnitud entre el flujo incidente tendremos
la sección eficaz diferencial,
n(θ, φ)
σ(θ, φ) = dΩ, (5.63)
F

y si integramos a todos los ángulos, obtenemos la sección eficaz,
n(θ, φ)
Z Z
σ= dΩ σ(θ, φ) = dΩ , (5.64)
F
Nótese que las unidades de n(θ, φ) son de [T −1 ] y las de F son [L−2 T −1 ], de manera que
la sección eficaz tiene unidades de área. Intuitivamente, podemos imaginar σ como el área
de la sombra que presenta el target al flujo de partículas. En el caso de que la interacción
entre la partícula incidente y el target es central, es decir, sólo depende de la distancia
entre ellos, la sección eficaz diferencial sólo dependerá de θ.
Diremos que la colisión es elástica si se conserva la energía y si no se crean ni se

destruyen partículas en el proceso. En ese caso, el módulo del momento de la partícula
incidente se debe conservar. Es decir, el momento transferido ∆p = p1 − p0 cumplirá que

θ
∆p = |∆p| = 2p sin , (5.65)
2
donde θ es el ángulo de deflexión de la partícula. Estas variables serán cruciales para nuestro
análisis.
5.3.2 Colisiones cuánticas y aproximación de Born

Consideremos un haz colimado de partículas de masa m y energía E, que inciden a
lo largo del eje Z sobre una región del espacio en la que existe un potencial V (x), que
supondremos de corto alcance5 . Las partículas incidentes, lejos de la zona dispersiva, serán
modelizadas mediante ondas planas
con k = (5.66)
p
ψ0 (x) = eikz , 2mE/~2 .
El potencial distorsiona la onda plana, que debe cumplir la ecuación de Schrödinger,
(∇2 + k 2 )ψ(x) = U (x)ψ(x), (5.67)
donde hemos definido U (x) ≡ (2m/~2 )V (x). Escribiremos la solución de (5.67) como una
combinación de la onda incidente y una onda dispersada hacia fuera desde del target,
eikr
ψ(x) = eikz + f (θ, φ) , (5.68)
r
y nuestro objetivo será encontrar f (θ, φ) para que la ecuación (5.67) sea válida. Pero
antes de eso, encontremos el significado físico de f (θ, φ). Intuitivamente, es la amplitud de
probabilidad de que la partícula incidente pase a viajar en la dirección (θ, φ). En efecto,
podemos calcular la corriente de probabilidad, ecuación (4.123), y comprobaremos que la
componente a lo largo de un radio en la dirección (θ, φ) es, meramente,
~k
jr = |f (θ, φ)|2 . (5.69)
mr2
5
Debe cumplir que lı́mr→∞ rV (ru) = 0 para todo vector unitario u.

de manera que el flujo de partículas que sale en la dirección (θ, φ) es, en efecto, n(θ, φ) dΩ =
(~k/m)|f (θ, φ)|2 dΩ. El flujo de partículas incidentes, por su parte, será F = p/m = ~k/m,
así que tenemos
σ(θ, φ) = |f (θ, φ)|2 , (5.70)
y deseamos hacer notar que este resultado es exacto.
Para resolver la ecuación (5.67), consideraremos primero una ecuación similar, más
sencilla,
(∇2 + k 2 )ψ(x) = F (x), (5.71)
que podemos resolver usando el método de la función de Green, similar al empleado para
calcular el campo eléctrico de una fuente extensa en electromagnetismo clásico. Resolvemos
el caso particular en el que F (x) = δ(x),
(∇2 + k 2 )ψ(x) = δ(x), (5.72)
que tiene por solución
eikr
ψ(x) = − , (5.73)
4πr
como se puede comprobar por sustitución directa, si recordamos la expresión del laplaciano
en coordenadas esféricas,
∂2

1 ∂ 2 ∂ 1 ∂ ∂ 1
2
∇ = 2 r + 2 sin θ + 2 2 , (5.74)
r ∂r ∂r r sin θ ∂θ ∂θ r sin θ ∂φ2
Ahora procedemos integrando la solución anterior para obtener una solución de la ecua-
ción (5.71)
1 eik|x−a|
Z
ψ(x) = − d3 r F (a). (5.75)
4π |x − a|
Volviendo a la ecuación (5.67), podemos aplicar la expresión anterior fomalmente, usan-
do como lado derecho U (x)ψ(x), y añadiendo la onda incidente obtendremos
m eik|x−a|
Z
ψ(x) = eikz − d3 a V (a)ψ(a), (5.76)
2π~2 |x − a|
que es una ecuación integral para ψ(x), que no es fácil de resolver explícitamente. Pero
podemos dar una solución aproximada. Primero, consideremos el factor exp(ik|x−a|)/|x−
a|, que podemos suponer que varía poco de un a a otro, debido a que la función de onda
es observada en un punto x que está muy alejado del target. Podemos aproximar
1
|x − a| = (r2 + a2 − 2x · a)1/2 ≈ r − x · a, (5.77)
r

y nos queda
exp(ik|x − a|) eikr

≈ exp(−iq · a), (5.78)
|x − a| r
donde q = kur = k(x/r), es decir, es el vector de módulo k en la dirección de x. Haciendo

esta aproximación llegamos a
m
Z
f (θ, φ) = − d3 a exp(−iq · a) V (a) ψ(a), (5.79)
2π~2
y damos paso a la última aproximación, que es sustituir ψ(a) por la onda incidente, llegando
a
m
Z
f (θ, φ) = − d3 a exp(−ik · a) V (a), (5.80)
2π~2
donde k = kur − kuz es el momento transferido. Esta expresión se conoce como aproxi-
mación de Born para la amplitud de probabilidad de colisión, que es proporcional a la
transformada de Fourier del potencial evaluada en el vector k apropiado.
¿Cuándo es válida la aproximación de Born? La condición más importante es que la

función de onda ψ(x) difiera poco de la onda plana incidente, puede reescribirse de la
siguiente manera

m Z eik|x−a|
d3
a V (a) ψ(a) 1. (5.81)

2π~
2 |x − a|
Nos fijamos en el punto x = 0, en cuyos alrededores cabe esperar que la distorsión tome
los valores mayores. Supongamos, por simplificar, que el potencial tiene simetría esférica.
En esas circunstancias,
m ∞ 2ika
Z
(5.82)

2
e − 1 V (a) da 1.
~ k 0

Para dar una estimación sencilla, usemos un potencial cuadrado (con V (r) = V0 si r < r0
y con V (r) = 0 si r > r0 ) y partículas incidentes con una energía suficientemente alta (esto
es, que kr0 1). Entonces, la condición (5.81) nos dice que la validez de la aproximación
de Born viene dada por la condición
~2
|V0 | ~v o, equivalentemente, que |V0 | k. (5.83)
m
Esto significa que la aproximación de Born tendrá mayor validez cuanto mayores sean las
energías de las partículas incidentes, y eso es intuitivamente fácil de comprender: cuanto
menos tiempo pase la partícula cerca del target, menos la afectará.

Ejemplo 5.4 Determinar la sección eficaz para la colisión con el potencial repulsivo defi-
nido como V (r) = V0 para r < a; V (r) = 0 para r > a.
Usando la aproximación de Born,
m
Z
f (θ, φ) = − d3 xe−iq·x V (x), (5.84)
2π~2
donde q es el momento transferido, que podemos pasar a coordenadas esféricas e integrar
cuando el potencial es central, como en nuestro caso,
m
Z
f (θ, φ) = − r2 dr sin θdθ dφ e−iqr cos θ V (r)
2π~2
m ∞
Z Z π
=− 2 2
dr r V (r) dθ sin θe−iqr cos θ
~ 0 0
Z ∞
m
= 2 dr rV (r) sin(qr). (5.85)
~ q 0
Y deseamos hacer notar que esta ecuación es válida en aproximación de Born para cualquier
potencial central. En el caso que nos ocupa, la integral se extiende sólo hasta r = a, siendo
constante en su interior, así que
a
mV0 mV0
Z
f (θ, φ) = dr r sin(kr) = (sin(aq) − ak cos(aq)) . (5.86)
~2 q 0 ~2 q 3
En el límite de bajas energías, aq 1, podemos desarrollar en serie el seno y el coseno,
quedándonos con el segundo orden nos da
mV0
f (θ, φ) ≈ , (5.87)
2~2 q
pero debemos recordar que k es el momento transferido, es decir q = 2k sin(θ/2), llegando
a la sección eficaz diferencial,
mV0
σ(θ, φ) ≈ 2
. (5.88)
4~ k sin(θ/2)

Resumen 5.3. Consideramos un haz de partículas en el espacio que inciden sobre un

blanco fijo dado por un potencial V (x). La función de onda saliente se puede escribir
como ψ(x) = f (θ, φ)eikr /r, donde σ(θ, φ) = |f (θ, φ)|2 Res la sección eficaz diferencial
de colisión. En aproximación de Born, f (θ, φ) = − 2π~
m
2 d3 xe−iq·x V (x), donde q es el
momento transferido.
5.A Problemas
1.- Demostrar que si V (x) = V (−x), los autoestados de la ecuación de Schrödinger
son alternativamente pares e impares. Extra: demostrar que cada nivel excitado agrega un
nodo a la función de ondas.

5.A Problemas 151
2.- Consideremos un pozo de potencial V (x) = −γδ(x) con γ > 0. ¿Cómo afecta a los
niveles del pozo la presencia de una pared infinita colocada en x = −a? ¿Para qué valores
de a habrá un estado estacionario ligado?
3.- Potencial de Kronig-Penney. Consideremos una partícula en un potencial periódico

de tipo almena, es decir, V (x) = 0 en los intervalos de tipo [na, (n + 1/2)a) y V (x) = V0 en
los de tipo [(n + 1/2)a, (n + 1)a). Encontrar la matriz de transferencia, es decir, la matriz
2 × 2 que, cuando actúa sobre el vector (ψ(x), ψ 0 (x)) nos da el vector (ψ(x + a), ψ 0 (x + a)).
Usar dicha matriz para encontrar las energías permitidas, y demostrar que forman una
banda, es decir un continuo en espacio de momentos.
4.- Considérese un oscilador armónico bidimensional cuyo Hamiltoniano es
1 1
Px2 + Py2 + mω 2 X 2 + Y 2 . (5.89)

H=
2m 2
y se nos pide considerar el operador que implementa las rotaciones en torno al eje Z, U (θ) =
exp(−iθLz /~), con Lz = XPy −Y Px . Se pide: (a) Demostrar que el Hamiltoniano conmuta
con el operador de rotación. (b) Demostrar que el estado fundamental del Hamiltoniano
tiene simetría circular, es decir, U (θ) |ψ0 i = |ψ0 i. (c) Los dos primeros estados excitados
están degenerados en energía. Demostrar que una rotación de ángulo θ = π/2 puede
convertir uno en el otro.
5.- Demostrar el teorema del virial. Para un estado estacionario de un Hamiltoniano de

la forma H = P 2 /2m + V (X), en cualquier dimensión, hP 2 /mi = hX · ∇V i. Pista: calcular
la evolución temporal (d/dt)(hX · P i) mediante las ecuaciones de Ehrenfest.
6.- Aplicar el teorema del virial, demostrado en el ejercicio anterior, para mostrar que
en una dimensión, si el potencial es V (x) = V0 xk , entonces hP 2 /mi = khV i. Aplicarlo al
caso del oscilador armónico.
7.- Encontrar en aproximación de Born la sección eficaz diferencial para un haz de par-
tículas que incide sobre un potecial de Yukawa, de la forma V (r) = Ae−r/r0 /r. Encontrar
el límite en el que r0 → ∞ e interpretar físicamente, comparando con la sección eficaz de
Rutherford para un potencial coulombiano.
8.- Encontrar la sección eficaz diferencial en aproximación de Born para un haz de

partículas que incide sobre un potencial de la forma V (x) = V0 exp(−r2 /a2 ).

6. El límite clásico
Si la MQ es la verdadera mecánica del universo, ¿cómo es posible que la Humanidad

no se diera cuenta hasta hace poco más de un siglo? La respuesta es, al tiempo, sencilla
y compleja. Por un lado, es cierto que la mecánica clásica (MC) describe con una enorme
precisión los objetos a la escala humana. Pero cuando observamos las enormes diferencias
conceptuales entre la MC y la MQ no podemos por menos que preguntarnos ¿cómo surge
la mecánica clásica desde la cuántica, cuando los objetos son grandes? La pregunta es
enormemente no trivial, y dedicaremos este capítulo a responderla, reconociendo que aún
quedan preguntas abiertas en esta línea.
Pero antes de comenzar a responder en positivo, veamos un par de caminos inapropia-

dos. Por ejemplo, no es correcto decir, meramente, que tomamos el límite ~ → 0. Primero,
porque ~ es una constante de la naturaleza y no existe ninguna máquina que permita ha-
cerla variar. Para asegurarnos de que hacemos física y no (mala) metafísica, es conveniente
discutir siempre en términos operacionales. Más aún: si elegimos un sistema de unidades
natural, podemos hacer que ~, la velocidad de la luz c, la constante de la gravitación GN y
la constante de Boltzmann kB tomen todas el valor uno. Si estamos en lo cierto, el sistema
de unidades naturales, o sistema de Planck, es el más fundamental para el estudio de la
física. Eso implica que los valores que podemos tomar para ~ son cero (MC) o uno (MQ),
y no tiene sentido variar entre ellos.
También podríamos pensar que la MQ se acerca a la MC para números cuánticos

grandes. Por poner un ejemplo, si tomamos el átomo de hidrógeno y consideramos valores
muy altos del número cuántico principal n, nos iremos aproximando a la MC. Esto no es
cierto. El orbital ` = 0 para cualquier valor de n posee simetría esférica, y no se parece
en nada a las órbitas keplerianas que predice la MC. Para ello necesitamos combinar una
gran cantidad de funciones de onda, es decir, una gran cantidad de valores de n, ` y
m. Recordemos que los autoestados de la energía, sea cual sea el valor de sus números
cuánticos, son estados estacionarios, es decir, su evolución es trivial, dada meramente por
una fase exp(−iEt/~). La obtención de las leyes de Kepler a partir de la expresión de los
orbitales del átomo de hidrógeno es un problema altamente complejo. Las trayectorias de
la MC están escondidas en el seno de los orbitales de la MQ, pero no es sencillo extraerlas
de allí.
Entonces, ¿el caso es desesperado? No. Necesitamos el enfoque adecuado, que es recor-
dar el concepto de acción en MC.

154 Capítulo 6. El límite clásico
6.1 La Acción Clásica y Cuántica

6.1.1 Ecuación de Hamilton-Jacobi
Esta primera sección será un repaso de la mecánica lagrangiana y hamiltoniana nece-
sarias. Recordemos que una partícula con coordenadas generalizadas q (pueden ser una o
muchas), viene descrita por una lagrangiana L(q, q̇, t), tal que, cuando elegimos la trayec-
toria física real q(t) que comienza en q0 para t0 , la acción, definida por
Z t
S(q, q0 , t) = dt L(q, q̇, t), (6.1)
t0
toma un valor estacionario, es decir, δS = 0. Cuando la expresamos de esta manera, como

función de las coordenadas iniciales y finales, la acción suele denominarse también función
principal de Hamilton1 . Las ecuaciones del movimiento vienen dadas por la ecuación de
Euler-Lagrange,
d ∂L ∂L
− = 0. (6.2)
dt ∂ q̇ ∂q
∂ q̇ , y a partir de ahí podemos expresar

Es importante definir el momento conjugado, p = ∂L
la función hamiltoniana, H = pq̇ − L. Las ecuaciones del movimiento pueden expresarse
también a través de la ecuaciones de Hamilton,
∂H ∂H
ṗ = − , q̇ = . (6.3)
∂q ∂p
Notemos que la derivada total de la función principal de Hamilton con respecto al tiempo
debe ser la lagrangiana, es decir,
dS ∂S ∂S
= + q̇ = L, (6.4)
dt ∂t ∂q
de donde se puede deducir que ∂S/∂q = p y ∂S/∂t = −H. Es decir, la siguiente ecuación
para la función S es formalmente válida,

∂S ∂S
+ H q, , t = 0, (6.5)
∂t ∂q
que conocemos como ecuación de Hamilton-Jacobi (HJ). Por ejemplo, para la partícula
en un potencial, H = p2 /2m + V (q), tenemos
2
∂S 1 ∂S
+ + V (q) = 0, (6.6)
∂t 2m ∂q
que es una ecuación en derivadas parciales (EDP) de primer orden para la función principal
de Hamilton (es decir, la acción). En caso de que el sistema sea autónomo (i.e. sin depen-
dencia explícita en el tiempo), la energía se conserva, así que ∂S/∂t es una constante, que
1
En rigor, la acción es un funcional del camino, y la función principal de Hamilton es una función
ordinaria de las coordenadas iniciales y finales.

6.1 La Acción Clásica y Cuántica 155
llamaremos −E. Así, podemos escribir que S(q, q0 , t) = W (q, q0 ) − Et, donde W cumple
que2
2
1 ∂W
+ V (q) = E. (6.7)
2m ∂q
C Encontrar la función principal de Hamilton es muy difícil, pero a cambio nos resuelve
completamente el problema dinámico, porque induce una transformación canónica
a unas nuevas coordenadas generalizadas llamadas de acción-ángulo en las que la
dinámica es trivial. Todo esto fue material de Mecánica Teórica, de tercer curso.
C Es interesante observar que, dado que p = ∇S, las trayectorias físicas son ortogo-
nales a las curvas S(q, t) =constante. Eso recuerda al principio de Huygens para la
propagación de ondas. En efecto, el frente para un determinado tiempo t estará dado
por la superficie (o curva) S(q, q0 , t) = C, y podemos propagarlo hasta un tiempo
t + δt haciendo que de cada punto q salga una trayectoria real, y reuniendo todos los
puntos que constituyen la nueva superficie.
6.1.2 Ecuaciones de Madelung

Volvamos a la MQ, y consideremos una función de ondas escrita en la forma
ψ(x, t) = A0 exp(i Φ(x, t)/~), (6.8)
donde A0 es una constante de normalización, y Φ(x, t) es una función compleja. Ahora

introducimos esta expresión en la ecuación de Schrödinger (4.109), obteniendo
∂Φ 1 i~ 2
− = (∇Φ)2 − ∇ Φ + V (r), (6.9)
∂t 2m 2m
que es sorprendentemente similar a la ecuación de Hamilton-Jacobi (6.6). Más aún, si
hacemos ~ = 0, la ecuación es exactamente igual a la de HJ, salvo por el hecho de que
la función Φ es compleja. Eso podemos resolverlo descomponiendo la función en su parte
real e imaginaria, Φ(x, t) = S(x, t) + i~B(x, t). Nótese que el módulo de la función de
ondas vendrá dado por |ψ(x, t)|2 = ρ(x, t) = |A0 |2 exp(−2B(x, t)), mientras que S(x, t) se
corresponde con la fase. Entonces, la ecuación (6.9) se convierte en
∂S 1 ~2
(∇S)2 + V (r) − |∇B|2 − ∇2 B , (6.10)

− =
∂t 2m 2m
∂B 1 1 2
− = ∇S · ∇B − ∇ S, (6.11)
∂t m 2m
que se conocen como ecuaciones de Madelung. Como vemos, la ecuación para la fase, S(x, t),
toma exactamente la forma de la ecuación de HJ cuando ~ = 0. Es decir, parece interesante
interpretar la fase de la función de ondas como la acción del sistema físico. La analogía
2
En la literatura, W suele llamarse función característica de Hamilton, pero consideramos que ya son
demasiados los nombres.

llega aún más lejos. Si la energía se conserva, entonces tenemos S(x, t) = W (x) − Et, y la
función de ondas nos queda,
ψ(x, t) = A0 ρ(x, t) exp(−iW (x)/~) exp(−iEt/~), (6.12)
que es exactamente la forma temporal de la función de ondas. La MQ y la MC no están

tan lejos, pero hay que saber dónde mirar para encontrar el parecido de familia.
En efecto, de estas ecuaciones podemos llegar a uno de los enfoques más prometedores
para explicar el origen de la MC desde la MQ. Cuando escribimos la ecuación para la
evolución de la fase en MQ nos damos cuenta de que, si los cambios esperados en la acción
son muy grandes en comparación con el cuanto de acción, que es ~, es posible obtener S
resolviendo el problema clásico equivalente, es decir, S se corresponde meramente con la
acción clásica.
Ejemplo 6.1 Consideremos un sistema discreto, en un espacio de Hilbert complejo de
dimensión N , sometido a la acción de un Hamiltoniano dado Ppor los elementos de matriz
Hij en la base estándar, y con una función de ondas |Ψi = i Ψi |ii. Descomponer Ψi en
módulo y fase, y encontrar la ecuación de evolución de cada una de ellas.
1/2
Hagamos Ψi = ρi exp(iSi /~), donde ρi y Si son reales. Asimismo, hagamos Hij =
hij exp(iαij ), con hij y αij reales. Introducimos estas expresiones en la ecuación de Schrö-
dinger,
X
i~Ψ̇i = Hij Ψj , (6.13)
j
y encontramos el equivalente discreto de las ecuaciones de Madelung, que son
X 2hij
ρ̇i = (ρi ρj )1/2 sin βij ,
~
j
1/2
X ρj
Ṡi = − hij cos βij , (6.14)
ρi
j
donde ~βij ≡ αij + Sj − Si , con βii = 0.
Resumen 6.1. Descomponiendo la función de onda en forma polar (módulo y fase),

comprobamos que la ecuación de Schrödinger se convierte en una ecuación de continui-
dad para el módulo y una ecuación similar a la ecuación de Hamilton-Jacobi para la
fase, que toma el papel de la acción. Se conocen como ecuaciones de Madelung.
6.2 Aproximación semiclásica o WKB

Antes de profundizar en el límite clásico, consideremos la vertiente práctica de los
cálculos que hemos realizado. La ecuaciones de Madelung, (6.10) y (6.11) pueden ser el
primer paso para desarrollar una técnica de cálculo aproximada para las soluciones de
la ecuación de Schrödinger estacionaria en 1D. En efecto, en 1926, Wentzel, Kramers y
Brillouin (WKB) decidieron considerar la posibilidad de construir las funciones de onda a
partir de

6.2 Aproximación semiclásica o WKB 157
1 2
S 0 (x) + V (x) = E,
m
S 00 (x)
S 0 (x)B 0 (x) = − . (6.15)
2
La segunda ecuación, que nos ayuda a determinar el módulo de la función de ondas,
|ψ(x)| ≡ A(x) = exp(−B(x)), se puede transformar en
B 0 (x) 1 S 00 (x)
A0 (x) = − = , (6.16)
A(x) A(x) 2S 0 (x)
cuya solución es A(x) ∝ (S 0 (x))−1/2 , como se puede comprobar por sustitución directa. La
primera ecuación, en cambio, se resuelve mediante
Z x
S(x) = du p(u), (6.17)
x0
donde p(u) ≡ 2m(E − V (u)), es decir, el momento local que debería tener la partícula
p
en la posición u, y el límite inferior de la integral, x0 , debe determinarse con precaución.

De esta manera es posible escribir la solución básica WKB,
i x

A0
Z
ψ(x) = p exp ± du p(u) . (6.18)
p(x) ~ x0
La física de la aproximación WKB termina aquí, pero ahora dan comienzo plas sutile-
zas técnicas, que son muy importantes. La primera está en el denominador p(x), que
notamos que diverge cuando x se acerca a un punto de retroceso, es decir, un punto x∗ en
el que V (x∗ ) = E. Lejos de esos puntos, la solución tiene perfecto sentido, pero debemos
ser cuidadosos al considerar la región del espacio en la que estamos. En efecto, en la re-
gión permitida, tenemos que E > V (x), p(x) es real y la solución toma la forma de una
fase modulada. En general, la solución WKB será la combinación lineal de las dos ondas
posibles,
Z x
i x

A0 i
Z
ψ(x) = p A exp du p(u) + B exp − du p(u) . (6.19)
p(x) ~ x0 ~ x0
en cambio, en la región prohibida, cuando E < V (x), p(x) se vuelve imaginario, haciendo
que las exponenciales se vuelvan reales. Eso corresponde a nuestra intuición: en una región
prohibida la función de onda debe decaer exponencialmente.
Ahora bien, estas soluciones sólo serán de interés si somos capaces de conectar las
soluciones oscilatorias con las exponenciales a través de un punto de retroceso. Para ello es
preciso resolver analíticamente la ecuación de Schrödinger en torno al punto de retroceso, e
identificar términos, y para realizarlo aproximamos el potencial por una recta. Ese análisis
es costoso, y consideramos que no aporta mucho al curso. Sólo daremos la solución en
el caso más sencillo, que es cuando el potencial V (x) crece sin límite para x → ±∞, de

manera que siempre tendremos un punto de retroceso izquierdo, x = a y un punto derecho,

x = b. La regla de empalme en cualquiera de los dos será
1 x
Z x
C C 1 π
Z
p exp − du p(u)) → p cos du p(u) − , (6.20)
2 p(x) ~ a p(x) ~ a 4
donde debemos recordar que cambiar el orden de los límites de integración cambia el signo
de la integral. De esta manera, podemos definir dos regiones prohibidas, que llamaremos I
y III, en las que la función de onda es
1 x

C
Z
ψI (x) = p exp − du p(u) ,
2 p(x) ~ a
1 x

C
Z
ψIII (x) = p exp − du p(u) (6.21)
2 p(x) ~ b
y una región permitida, la II, que podemos escribir de dos formas diferentes, según venga-
mos de I o de III,
1 x 1 b

C π C π
Z Z
ψII (x) = p cos − du p(u) − = p cos − du p(u) − . (6.22)
p(x) ~ a 4 p(x) ~ x 4
Ambas expresiones para la función de onda en II deben coincidir, y para ello debemos tener
que las fases en ambas difieran en un múltiplo de π. Como cos(−x) = cos(x) cambiamos
el signo a la fase del primer coseno para que empalme bien,
x b
1 π 1 π
Z Z
du p(u) + = − du p(u) − + mπ, con m ∈ N, (6.23)
~ a 4 ~ x 4
y tenemos
b b
1
Z Z
(6.24)
p
du p(u) = dx 2m(E − V (x)) = m+ π~,
a a 2
que es la condición de cuantización WKB que nos permite obtener las energías permitidas
en el sistema.
Ejemplo 6.2 Veamos el ejemplo que siempre sale bien, el oscilador armónico,
p V (x) =
kx2 /2. Si la energía es E, los puntos de retroceso vendrán dados por x∗ = ± 2E/k, y
tendremos
Z √2E/k s
k 2 1
√ dx 2m E − x = m + π~. (6.25)
− 2E/k 2 2
Para hacer la integral, primero adimensionalizamos en la medida de lo posible,
√ Z √2E/k
k 2 √
r r
1
r
2E m
Z p
2mE √ dx 1− x = 2mE 2
du 1 − u = E π, (6.26)
− 2E/k 2E k −1 k

donde hemos hecho el cambio u = x k/2E, y de donde deducimos que las energías
p
permitidas serán

1
E = ~ω m + , (6.27)
2
que sorprendentemente da el resultado exacto.
Resumen 6.2. Cuando la acción involucrada en un problema es grande comparada con

~ es lícito realizar una aproximación semiclásica. La función de ondas
pse puede aproximar
entonces por ψ(x) = p(x)−1/2 exp(±i p(u)du/~), donde p(x) = 2m(E − V (x)), en
R
el caso de un potencial V (x) con una energía E. Si los puntos de retroceso clásicos
son y x2 , entonces la aproximación WKB a las energías permitidas vendrá dada por
R x2 x 1 p
x1 dx 2m(E − V (x)) = (m + 1/2)π~, con m ∈ N.
6.3 Integración sobre Caminos

Existe una formulación alternativa de la MQ, totalmente equivalente a ella, que se
conoce como formulación de suma o integral sobre caminos. Fue descubierta por Dirac y
por Feynman, y tiene un enorme encanto intuitivo, especialmente en relación con el límite
clásico, que pasaremos a discutir primero intuitivamente, y después de manera formal.
Recordemos el famoso experimento de la doble rendija. Un haz de partículas incide sobre
una pared dotada de una doble rendija, tras la cual hay una pantalla que nos permite
detectar la partículas. Si las partículas son clásicas, pero llegan a la pared con cierta
incertidumbre en la posición, veremos cómo algunas pasan por la rendija izquierda y otras
por la derecha, formando dos máximos sobre la pantalla. Si las partículas son cuánticas
(e.g. fotones), entonces el comportamiento puede hacerse más rico.
Supongamos que, una vez que las partículas han llegado a la pantalla, no hay manera
de determinar por qué rendija pasaron. Las partículas no dejan ninguna traza que permita
reconstruir su camino. En ese caso, observaremos un patrón de interferencia, dado que las
partículas pasan por ambas rendijas a la vez. Pero ese patrón de interferencia será destruido
en el momento en el que instalemos un detector que nos pueda informar sobre la rendija
que usó cada partícula, aunque jamás observemos dicha información.
El postulado de la integral de camino es el siguiente: para calcular la amplitud de
probabilidad de que la partícula realice un cierto viaje de un punto x1 a un punto x2
en un tiempo t debemos considerar todos los caminos que haya podido seguir y que sean
compatibles con la información a nuestro alcance. Para cada camino γ calculamos la acción
clásica, S(γ), y le asociamos una fase exp(iS(γ)/~). Después sumamos todas esas fases,
X
exp(iS(γ)/~), (6.28)
γ
y el resultado será la amplitud de probabilidad deseada. En el caso de fotones incidiendo

sobre una doble rendija, la suma se restringe a dos caminos, la acción es meramente S(γ) =
p`γ , donde `γ es la longitud del camino y p es el momento del fotón, así que la amplitud
de probabilidad final nos da cuenta del fenómeno de interferencia.
Antes de entrar en el formalismo matemático, discutamos un par de ejemplos más,

de manera intuitiva. Siguiendo con la óptica, podemos discutir el caso de la propagación

a través del vacío. Como hemos dicho, la acción asociada a cada camino es, meramente,
S(γ) = p`γ , y el momento p es una constante. Habrá un camino de acción mínima, que es
la línea recta, y una infinidad de caminos de longitudes mayores. Pero al sumar las fases
asociadas a cada camino encontraremos un efecto interesante. El camino mínimo, `0 , tiene
muchísimos caminos de longitud cercana, que contribuyen una acción parecida a la que
contribuye él. Sin embargo, si tomamos un camino aleatorio, habrá caminos vecinos con
longitud mayor y con longitud menor, de manera que será fácil que su fase se cancele con la
de otro camino. Los caminos cercanos al mínimo interfieren constructivamente, sumando
sus fases y creando una amplitud de probabilidad alta. Por ello decimos que el camino de
longitud mínima y sus vecinos son los que más contribuyen a la integral de caminos.
Ésa es la conexión que proporciona la integración de caminos entre la MC y la MQ: si la
acción es grandes en comparación con ~, sólo importan los caminos cercanos al camino de
acción mínima (o, más bien, acción estacionaria), porque son los que interfieren construc-
tivamente, y recuperamos la noción de trayectoria bien definida. A medida que la acción
se hace más pequeña, más y más caminos contribuyen significativamente a la integral de
caminos, la partícula deja de comportarse de manera clásica.
Ejemplo 6.3 Consideremos un haz de fotones que incide desde el aire en un medio con
un índice de refracción mayor, n > 1. La energía del fotón es la misma, pero su momento
p = vE debe disminuir proporcionalmente a la disminución de la velocidad de la luz. De
esta manera, tenemos que la acción puede escribirse como S(γ) = p`1 (γ) + (p/n)`2 (γ),
donde p1 es el momento inicial, y p/n es el momento en el interior del medio, `1 y `2
son las longitudes recorridas en ambos medios. Así, vemos que la acción es proporcional
al tiempo total de viaje del fotón. De ahí proviene el principio de Fermat, o principio del
tiempo mínimo.
6.3.1 Del propagador a la integral de camino

Recordemos la noción de propagador, descrito en la sección 4.5.3, como el elemento
de matriz del operador evolución entre dos estados de posición. De hecho, la propiedad
de grupo de los operadores evolución, U (tf , t0 ) = U (tf , t1 )U (t1 , t0 ) se puede escribir en
términos del propagador como
Z
G(xf , tf ; x0 , t0 ) = dx1 G(xf , tf ; x1 , t1 ) G(x1 , t1 ; x0 , t0 ), (6.29)
si t1 ∈ [t0 , tf ]. Esta ecuación se puede entender también de la siguiente manera: para

calcular la amplitud de probabilidad de viajar entre x0 en t0 y xf en tf , debes sumar sobre
todas los caminos de la forma x0 → x1 → xf . Por supuesto, podemos introducir tantos
puntos intermedios como queramos, y tomar una partición de tiempos, ti = t0 + i∆t, con
∆t = (tf − t0 )/(N + 1), de modo que tN +1 = tf ,
Z
G(xf , tf ; x0 , t0 ) = dx1 dx2 · · · dxN G(xf , tf ; xN , tN ) · · · G(x1 , t1 ; x0 , t0 ), (6.30)
y básicamente, eso es una integral de camino, si consideramos el límite N → ∞, que

escribiremos como
Z N
Y
G(xf , tf ; x0 , t0 ) = lı́m dx1 · · · dxN G(xj+1 , tj+1 ; xj , tj ), (6.31)
N →∞
j=0

como ∆t es pequeño, y asumiendo que H = P 2 /2m+V (X), podemos escribir exp(−iH∆t/~) ≈

exp(−iV (X)∆t/~) exp(−iP 2 ∆t/(2m~)), llegando a
G(xj+1 , tj+1 ; xj , tj ) = hxj+1 |e−i∆tH/~ |xj i

i i 2
≈ exp − V (xj )∆t hxj+1 | exp − P ∆t |xj i
~ 2m~
i p2

i 1 i
Z
= exp − V (xj )∆t dp exp − ∆t − p(xj+1 − xj )
~ 2π~ ~ 2m ~
1/2 " 2 !#
−im m xj+1 − xj

i
= exp ∆t − V (xj ) , (6.32)
2π∆t~ ~ 2 ∆t
donde esta última integral es idéntica a la realizada para obtener (4.135). En la exponencial
reconocemos la energía cinética menos la potencial, es decir, la lagrangiana. Ahora podemos
regresar a la expresión completa y, meramente, leer el resultado deseado,
N/2 !
−im

iX
Z
G(xf , tf ; x0 , t0 ) = lı́m dx1 · · · dxN exp − ∆t L({xi })
2π∆t~ N →∞ ~
i

i
Z
= Dx exp S[x(t)] . (6.33)
~
donde hemos obtenido la acción como el límite de la suma de Riemann de los valores de
la lagrangiana, y hemos definido una medida en el espacio de caminos, Dx, que incluya el
prefactor anterior. Nótese que este prefactor era no trivial, mostrando que la medida sobre
el espacio de caminos es un objeto matemáticamente complejo.
6.3.2 Efecto Aharonov-Bohm

Consideremos una versión del experimento de la doble rendija, en la que las partículas
pueden viajar entre el punto A y el punto B siguiendo dos caminos idénticos contenidos
en el plano XY .HPero añadamos un elemento más: un solenoide atravesado por un flujo
magnético Φ = B · dS, situado de manera vertical de tal manera que uno de los dos
caminos pasa a su izquierda y el otro a su derecha, sin que ninguno de los dos lo toque.
Por lo tanto, el campo magnético a lo largo de cada camino es nulo en todo momento.
¿Podría el flujo magnético a través del solenoide tener algún efecto sobre el experimento?
Sorprendentemente, la respuesta es sí.
Como hemos comentado en la sección 5.2, la acción correspondiente al campo magnético
se obtiene desde el potencial vector, A(x),
Z Z
S(γ) = q A · v dt = q A · d`, (6.34)
γ γ
es decir, depende del camino seguido, pero no de la velocidad a la que se recorra. La

diferencia entre la acción de un camino y del otro vendrá dada por
Z Z I
∆S = S(γ1 ) − S(γ2 ) = − qA · d` = qA · d`. (6.35)
γ1 γ2 γ

es decir, es la integral del potencial vector A a lo largo del circuito cerrado γ = γ1 + γ2 (el
segundo recorrido en sentido inverso). Usando el teorema de Stokes, esa integral es igual a
la integral de superficie del rotacional de A, que es ∇ × A = B,
Z
∆S = q B · dS = qΦ, (6.36)
S
de modo que la diferencia entre la acción a lo largo de los dos caminos coincide con el
flujo magnético que atraviesa multiplicada por la carga. Pero sabemos que, en base a la
interpretación de la integral de caminos, la diferencia de fases entre los dos caminos será
exp(i∆S/~) = exp(iqΦ/~). (6.37)
Es decir: a medida que aumentemos la intensidad de la corriente en el solenoide, veremos

cómo el patrón de interferencia entre ambos caminos se desplaza, siendo constructivo para
Φ = 0 o para Φ = 2nπ(~/q), con n ∈ Z, y destructivo para Φ = (2n + 1)(~/q).
C El efecto Aharonov-Bohm puede obervarse en las propiedades de transporte electróni-

co en materiales con impurezas magnéticas. Consideremos un electrón moviéndose en
un plano que tropieza con una impureza, presentando una cierta probabilidad de re-
botar y volver hacia atrás, fenómeno que llamamos backpropagation. Hay dos caminos
idénticos que contribuyen a la backpropagation, que consisten en rodear la impureza
completamente en sentido horario o antihorario, y después viajar en sentido opuesto
al original. Si el flujo magnético es cero, ambos caminos interfieren constructivamen-
te, pues dan lugar exactamente a la misma acción. Sin embargo, encendiendo un
campo magnético transverso al plano podemos observar cómo la conductividad cre-
ce, porque ahora ambos caminos pasan a interferir destructivamente, incrementando
la probabilidad de que el electrón siga su camino.
C ¿Cómo puede un campo magnético restringido al interior del solenoide afectar el

movimiento de partículas que no tocan el solenoide? Hay dos maneras complementa-
rias de entenderlo. Por un lado, no es realmente cierto que sólo los campos importen
y que los potenciales sean meros artefactos matemáticos. El efecto Aharonov-Bohm
muestra que los potenciales importan, pero al no ser invariantes gauge, extraer sus
implicaciones físicas es complicado. La otra forma de explicarlo es topológica: cuando
consideramos dos caminos para una partícula cuántica, toda la región entre ambos
es relevante.
C En 1931, Dirac calculó cuál sería el potencial vector al que daría origen un monopolo
magnético de intensidad g. Después calculó el cambio en la fase de una partícula
cargada que diera una vuelta en torno a él, y mostró que debía cumplir la relación
gq = 2πn~, mostrando así que la existencia de un único monopolo en el universo
forzaría la cuantización de la carga eléctrica. A día de hoy no existe ningún otro ar-
gumento físico que fuerce dicha cuantización, pero tampoco se ha encontrado ningún
monopolo magnético, si excluimos el monopolo de San Valentín, descubierto el 14
de febrero de 1981 por el dispositivo ideado por Blas Cabrera (junior), y que jamás
ha vuelto a repetirse, dejando la sensación de falso positivo. Si existiera un monopo-
lo magnético, deberíamos imaginarlo como un imán usual, de dos polos, uno de los
cuales se ha alejado hasta el infinito, desapareciendo de nuestro alcance.

6.A Problemas 163
Resumen 6.3. El propagador se puede calcular como una suma sobre todos los caminos
posibles γ de un factor exp(iSγ /~), donde Sγ es la acción clásica asociada a cada camino.
6.A Problemas
1.- Determinar el sistema de unidades de Planck, o sistema natural de unidades, en el
que el valor numérico de ~, c (la velocidad de la luz), GN (la constante de la gravitación)
y kB (la constante de Boltzmann) toman todas el valor uno.
2.- Encontrar las energías permitidas en aproximación WKB para un potencial de la

forma V (x) = |x|α .
3.- (Difícil) Dado un conjunto de energías {En }, se pide encontrar V (x) tal que el
Hamiltoniano H = P 2 /2m + V (X) lo tenga como espectro, en aproximación WKB.
4.- En el texto se ha demostrado que la mecánica cuántica tradicional deriva en la

formulación de la integral de camino. Se pide realizar el tránsito inverso, es decir, mostrar
que la formulación de la integral de camino da lugar a una ecuación de tipo Schrödinger.

7. Mecánica cuántica relativista
Las primeras décadas del siglo XX fueron testigos del desarrollo de dos grandes marcos
teóricos en Física: la teoría de la relatividad especial (TRE) y la MQ. Decimos marcos
teóricos y no teorías porque su generalidad es mayor. Una teoría es un conjunto de
reglas que explican una serie de fenómenos, a ser posible de manera predictiva. Un marco
teórico, por el contrario, nos dice cuáles son los principios válidos para construir teorías.
Así, por ejemplo, la gravitación newtoniana es una teoría (de enorme éxito) construida en
el marco teórico de la mecánica clásica. Las teorías dictan leyes, que aplican al fenómeno
que estamos estudiando. Los marcos teóricos dictan principios, que tienen un rango de
aplicabilidad universal. Sin embargo, los marcos teóricos de la TRE y la MQ parecían
incompatibles. No era posible formular teorías consistentes que respetaran los principios
de ambas, y pronto se comprendió por qué: la MQ proporciona las herramientas para
estudiar el comportamiento de una o muchas partículas, pero suponiendo siempre que su
número se conserva. En cambio, la TRE exige tener en cuenta la posibilidad de creación y
aniquilación de partículas. Ambos marcos se fundieron en un marco superior que contiene
a ambos: la teoría cuántica de campos.
En este capítulo, con el que terminamos el curso de MQ, discutiremos el intento de
fusionar ambos marcos originalmente en una MQ relativista, y los problemas a los que da
lugar, para concluir con una introducción al formalismo de la segunda cuantización, que
constituye el núcleo conceptual de la teoría cuántica de campos.
¿Y la teoría de la relatividad general? Pues, por desgracia, no disponemos de un marco
teórico que sintetice los requerimientos de ambos marcos, lo que constituye uno de los retos
más relevantes de la física teórica actual. Pero esas cuestiones deben ser reservadas para
estudio futuro, para el cual se encontrará una guía en la sección ¿Y ahora qué?
7.0.1 Recordatorio de Teoría de la Relatividad Especial
Necesitamos recordar unos pocos conceptos de la teoría de la relatividad especial

(TRE). Cada evento viene caracterizado por un 4-vector, X = (ct, x1 , x2 , x3 ), es decir,
X 0 = ct, X i = xi . El intervalo del 4-vector X se define como c2 t2 −x21 −x22 −x23 = ηµν X µ X ν ,
donde hacemos uso del convenio de índices repetidos, y es invariante bajo cambios de sis-
tema de referencia inerciales. El tensor ηµν se conoce como tensor métrico de Minkowski, y
viene dado por η = diag(+, −, −, −). El 4-momento está definido como p = (E/c, p1 , p2 , p3 ),
y su intervalo asociado es E 2 /c2 − p21 − p22 − p23 = m2 c4 . Las derivadas parciales también
deben adaptarse a la notación relativista. Así, ∂0 es la derivada con respecto a x0 = ct, así
que ∂0 = c−1 ∂t .

166 Capítulo 7. Mecánica cuántica relativista
7.1 Ecuación de Klein-Gordon

Recordemos cómo llegó Erwin Schrödinger a la ecuación que lleva su nombre. Partió
de la relación entre energía y momento para una partícula libre, E = p2 /2m, e hizo uso de
la regla de sustitución E → i~∂t , p → −i~∇, llegando a
~2 2
i~∂t ψ(x, t) = − ∇ ψ(x, t). (7.1)
2m
Schrödinger vio inmediatamente que esta ecuación no parecía ser invariante Lorentz, ya
que no trata espacio y tiempo de manera similar. En efecto, no le costó convencerse de que
la ecuación era invariante bajo transformaciones de Galilei. ¿Cómo obtener una ecuación
similar, pero que respete el principio de la relatividad de Einstein? Partamos de la norma
del cuadrivector momento,
E2
− p2 = m2 c2 , (7.2)
c2
y realicemos la misma sustitución, llegando a
1 2 2
− ~ ∂t ψ(x, t) + ~2 ∇2 ψ(x, t) = m2 c2 ψ(x, t), (7.3)
c2
que se conoce como ecuación de Klein-Gordon (KG). Es común escribirla en términos

del operador D’Alembertiano, que es el equivalente 4-dimensional del laplaciano,
1 2
≡ ∂ − ∇2 = ∂µ ∂ µ , (7.4)
c2 t
donde hemos introducido el 4-vector (∂0 , ∂1 , ∂2 , ∂3 ), con ∂0 = c−1 ∂t , y subimos los índices
con la métrica de Minkowski, ∂ µ = η µν ∂ν . Por supuesto, hacemos uso del convenio de
índices repetidos. De esta manera la ecuación de Klein-Gordon queda mucho más elegante,
m2 c2

+ 2 ψ(x, t) = 0. (7.5)
~
C Siempre es posible simplificar artificialmente una ecuación para que parezca elegan-
te. Por ejemplo, Feynman solía decir que todas las ecuaciones de la física podrían
resumirse en U = 0, donde U se expresa como una suma de términos correspon-
dientes a cada ley conocida de la física, cada uno de ellos elevado al cuadrado pa-
ra que Pla anulación de U implicara la anulación de todos ellos. Así, por ejemplo,
ma = iF i y ∇ · E = ρ/ε0 , que son ecuaciones bien conocidas, pasarían como
U = (ma − i Fi )2 + (∇ · E − ρ/ε0 )2 + · · · , y podríamos ir añadiendo nuevas leyes a
P
medida que las fuéramos describiendo. ¿Es, realmente, U = 0 una ecuación elegante?
En lo más mínimo, ya que meramente esconde la complejidad bajo la alfombra. Una
ecuación es elegante cuando su simplicidad aparente es reflejo de la simplicidad real
que suponemos del universo. Por ejemplo, en la ecuación de Klein-Gordon, en el que
simplicidad de la ecuación refleja la invariancia Lorentz subyacente.

7.1 Ecuación de Klein-Gordon 167
Ejemplo 7.1 Encontremos soluciones de la ecuación de Klein-Gordon. Para ello, impo-

nemos un Ansatz con forma de ondas planas, ψ(x, t) = exp(i(kx ± ωt)), y llegamos a la
2
condición ωc2 − k 2 = m2 c2 , que es una relación de dispersión, es decir, una ecuación que
vincula ω con k, que no hace más que reflejar la ecuación (7.2) cuando sustiuimos E = ~ω
y p = ~k.
La ecuación (7.5) es manifiestamente covariante, es decir, su mera forma muestra que

cumple con el principio de la relatividad especial. Sin embargo, a Schrödinger no le resultó
satisfactoria. La razón es que, al ser de segundo orden en el tiempo, requiere el conocimiento
de la función de ondas y de su derivada temporal en el instante inicial. Por lo tanto,
es conceptualmente diferente de su análoga no relativista, ya que cambiar el orden de
una ecuación diferencial cambia el conjunto de datos iniciales que requiere. Podríamos
plantearnos escribir una ecuaciónp equivalente que fuera de primer orden en el tiempo,
basada en la ecuación E = ±c p2 + m2 c2 , pero eso da lugar a una ecuación en derivadas
parciales de difícil interpretación,
p
i~∂t ψ(x, t) = ±c −~2 ∇2 + m2 c2 ψ(x, t). (7.6)
Por supuesto, sabemos extraer la raíz cuadrada de un operador, pero nos resulta extraño
tener que realizar un proceso tan complejo, además del hecho de que la ecuación (7.6)
vuelve a no ser ser manifiestamente covariante, ya que trata la derivada espacial de una
manera muy diferente de la temporal. Nótese, además, que existe una ambigüedad en
cuanto al signo del lado derecho.
C Por simplicidad, es frecuente emplear unidades naturales, es decir, elegir las unidades
de espacio, tiempo, momento y energía de manera que c = 1 y ~ = 1. De esa manera,
la ecuación de Klein-Gordon es, meramente, ( + m2 )ψ = 0.
Para poder interpretar físicamente (7.5) dentro del formalismo de la MQ necesitamos

obtener una densidad de probabilidad, ρ(x, t), de encontrar la partícula cuántica en el punto
x a tiempo t. En la MQ no relativista tenemos que ρ(x, t) = |ψ(x, t)|2 , y tenemos la certeza
de que la interpretación probabilista es coherente debido a que cumple una ecuación de
continuidad, ∂t ρ + ∇ · j = 0. ¿Podemos encontrar una ecuación de continuidad asociada a
la ecuación de Klein-Gordon?
Es fácil convencerse de que si ψ cumple la ecuación de KG, también ψ ∗ la cumple. De
esta manera, tenemos que
m2 c2 m2 c2

ψ∗ + 2 ψ−ψ + 2 ψ ∗ = ψ ∗ ψ − ψψ ∗ = 0. (7.7)
~ ~
Ahora definamos
i~ i~ ↔
jµ ≡ (ψ ∗ ∂ µ ψ − ψ∂ µ ψ ∗ ) ≡ ψ ∂ ψ∗, (7.8)
2mc 2mc
donde el prefactor se ha elegido por conveniencia posterior y hemos definido implícitamente
↔
el operador ∂ . De esta manera concluimos que la ecuación (7.7) puede escribirse como
∂µ j µ = 0, (7.9)

que podemos comprobar que tiene la forma de una ecuación de continuidad apropiada,
1 0
∂t j (x, t) + ∇ · j(x, t) = 0, (7.10)
c
y nos permite definir una cierta densidad ρ(x, t) = j 0 (x, t) asociada a la función de ondas
ψ(x, t), que se conserva, es decir, que cumple que
Z
d3 x ρ(x, t) = 1, (7.11)
si normalizamos inicialmente las funciones de onda de esa forma.

Podemos calcular la corriente de alguna solución de la ecuación de Klein-Gordon, para
obtener algo de intuición. Partiendo de una onda plana relativista dada por ψ(x, t) =
exp(ipx/~), donde usamos que px = Et − p · x, es fácil mostrar que j µ = pµ /(mc). Las
componentes espaciales de la corriente están asociadas al momento, así que la componente
temporal debe estarlo a la energía.
Sigamos investigando esta densidad, que viene dada por
i~
ρ(x, t) = (ψ ∗ ∂t ψ − ψ∂t ψ ∗ ) ≡ ρ(x, t). (7.12)
2mc2
Notamos que las derivadas temporales hacen que la expresión sea muy diferente de la no-
relativista, que es meramente |ψ(x, t)|2 . En efecto, supongamos que ψ(x, t) = φ(x) exp(−iωt),
con ω > 0. En ese caso, podemos comprobar que la densidad ρ = (E/mc2 )|φ(x)|2 , sabien-
do que E = ~ω. En el límite no-relativista, E ≈ mc2 , de tal manera que parece que
obtenemos el mismo resultado. Sin embargo, algo llama nuestra atención: ¿qué ocurre si
ω < 0? Esas soluciones también están permitidas por la ecuación de Klein-Gordon. Enton-
ces, ρ(x, t) < 0, y nos resulta imposible interpretar ρ como una densidad de probabilidad.
Como vemos, la ecuación de Klein-Gordon no puede interpretarse apropiadamente en el
marco de la MQ que conocemos, ya que la aplicación directa de la regla de Born nos da lugar
a probabilidades negativas. En los problemas veremos algún ejemplo aún más notable, como
la conocida paradoja de Klein, que muestra cómo un haz incidente de partículas que incide
sobre una barrera de potencial puede dar origen a más partículas de las que llegaron. ¿Cómo
es eso posible? Como hemos mencionado antes, porque la combinación de los principios
de la MQ con los principios de la TRE nos fuerzan a considerar la posibilidad de que las
partículas sean creadas y destruidas. ¿Quiere eso decir que la ecuación de Klein-Gordon
no es útil? Ni en lo más mínimo, de hecho es la ecuación de ondas apropiada para una
partícula sin espín. Tan sólo quiere decir que no hemos sabido interpretarla correctamente,
como veremos en la sección 7.3.
Resumen 7.1. La manera más sencilla de combinar la MQ con la invariancia Lorentz

consiste en convertir E 2 /c2 = p2 + m2 c4 en una relación entre operadores, llegando a
la ecuación de Klein-Gordon, ( + m2 c2 /~2 )ψ = 0, donde = ∂µ ∂ µ es el operador
D’Alambertiano. Su interpretación es complicada, porque es una ecuación de segundo
orden en el tiempo, tiene soluciones de energía negativa y su densidad asociada puede
tomar valores negativos, impidiendo interpretarla como una probabilidad. Sin embargo,
es la ecuación de ondas apropiada para una partícula cuántica de espín cero.

7.2 Ecuación de Dirac

La ecuación de Klein-Gordon presenta una diferencia importante con respecto a la
ecuación de Schrödinger: necesita la especificación de dos funciones en todo el espacio para
un tiempo dado si deseamos obtener la evolución temporal, que corresponden a ψ(x, t) y
∂t ψ(x, t) = ψ̇(x, t). Podríamos imaginarlas como las dos componentes de un objeto de varias
componentes, Ψ = (ψ, ψ̇)T , similar en cierto modo a las componentes del espín. Podríamos
entonces encontrar una ecuación de Schrödinger del tipo i~∂t Ψ = HΨ. En efecto, tal
planteamiento se conoce como representación de Feshbach-Villars de la ecuación de Klein-
Gordon, que se discute en los problemas. Sin embargo, no existe ninguna interpretación
física sencilla de las dos componentes de Ψ.
Esta idea condujo a P.A.M. Dirac a proponer una ecuación MQ relativista de primer
orden tanto en espacio como en tiempo, para que sea manifiestamente covariante, pero
aceptando la posibilidad de que la función de onda ψ sea un objeto con varias componentes,
cuya naturaleza se determinará a posteriori.
C Las ecuaciones de primer orden con varias componentes son una buena manera de
camuflar una ecuación de segundo orden, como sabemos. Si tenemos ∂t ψ1 = ψ2 y
∂t ψ2 = −ψ1 , ambas ecuaciones pueden ser combinadas obteniendo ∂t2 ψ1 = −ψ1 y
∂t2 ψ2 = −ψ2 . Este truco es enormemente útil en física teórica.
Dirac deseaba una ecuación del tipo
i~∂t Ψ = HΨ, (7.13)
donde Ψ será un objeto con un índice interno, aunque su dimensión no nos es conocida.
Más explícitamente,
 
X
i~∂t Ψ = −i~c αj ∂j + mc2 β  Ψ, (7.14)
j
donde {αi } y β son matrices desconocidas que actúan sobre los índices internos, y los
factores constantes han sido elegidos por conveniencia posterior. Ahora que tenemos una
ecuación de primer orden, buscaremos cuáles deben ser {αi } y β para que cada componente
de Ψ cumpla la ecuación de Klein-Gordon, que es manifiestamente covariante. Para ello
aplicamos sobre el lado
P izquierdo2 de (7.14) el operador i~∂t y sobre el lado derecho el
operador H = −i~c j αj ∂j + mc β, obteniendo
 
~2 c2 X X
−~2 ∂t2 Ψ = − (αi αj + αj αi )∂i ∂j − i~c3 (αi β + βαi ) + m2 c4 β 2  Ψ, (7.15)
2
i,j i
de donde leemos las condiciones deseadas,
αi αj + αj αi = δij ,
αi β + βαi = 0,
β 2 = 1. (7.16)

Notemos que las relaciones se expresan fácilmente en términos del anticonmutador,
{A, B} = AB + BA, (7.17)
quedando la primera meramente como {αi , αj } = δij . En efecto, existen conjuntos de

matrices que cumplen estas ecuaciones, pero antes de describirlos notemos que podemos
escribir la ecuación (7.14) de una manera más covariante, multiplicando toda la ecuación
por β y sustituyendo c−1 ∂t por ∂0 ,
X
i~β∂0 Ψ = −i~ βαi ∂i Ψ + mcΨ, (7.18)
i
y a continuación introduciendo unas nuevas matrices, que formarán la expresión definitiva,

γ 0 ≡ β, γ i ≡ βαi , de modo que la ecuación queda como
(i~γ µ ∂µ − mc) Ψ = 0, (7.19)
que es la forma canónica de la ecuación de Dirac, a veces también escrita como
(7.20)

i~∂/ − mc Ψ = 0,
donde definimos el slash, la diagonal sobre la derivada parcial, como ∂/ ≡ γ µ ∂µ . Las condi-
ciones anteriores pueden imponerse sobre las matrices γ µ , de manera mucho más elegante,
{γ µ , γ ν } = 2η µν , (7.21)
donde η µν es la métrica de Minkowski, que tomamos como diag(+, −, −, −). Estas rela-
ciones de anticonmutación se conocen como álgebra de Clifford. ¿Existen, realmente,
matrices que respondan a dicho álgebra? La respuesta es que sí, hay infinitas elecciones
posibles de los γ µ , y la dimensión más pequeña en la que las encontramos es D = 4. Así,
por ejemplo,

I1 0 0 σx 0 σy 0 σz
γ =0
, γ = 1
, 2
γ = , 3
γ = , (7.22)
0 I2 −σx 0 −σy 0 −σz 0
donde σi es la i-ésima matriz de Pauli. Por lo tanto, la función de ondas de Dirac, Ψ,

tendrá, como mínimo, 4 componentes. ¿Cómo podemos obtener su significado físico?
Para comprender el significado físico de las componentes de la función de ondas de Dirac
es conveniente acoplarla a un campo electromagnético, con 4-potencial vector Aµ (x). El
acoplo mínimo, consistente en sustituir el momento p por p − qA(x), se convierte en este
caso en la sustitución de −i~∂µ por −i~∂µ − qAµ , de modo que la ecuación de Dirac queda
como
(γ µ (i~∂µ − qAµ ) + mc) Ψ = 0. (7.23)

A partir de la expresión de la matrices γ µ es fácil darse cuenta de que las cuatro compo-
nentes están agrupadas en dos superiores y dos inferiores. Hagamos uso de dicha descom-
posición y escribamos nuestra función de onda como

−iEt/~ uA (x)
ψ(x, t) = e , (7.24)
uB (x)
donde uA (x) y uB (x) son objetos de dos componentes. Aplicando la ecuación (7.23) llega-
mos a
(E − qV )uA − cσ · (p − qA)uB = mc2 uA ,

−(E − qV )uB + cσ · (p − qA)uA = mc2 uB , (7.25)
que podemos convertir en una sola ecuación,
c2
(σ · (p − qA))2 uA = (E − mc2 )uA , (7.26)
E + mc2
que es muy parecida a la ecuación de Pauli para una partícula con espín 1/2 en un campo
electromagnético, dada en (5.60). Basta con considerar que el factor c2 /(E+mc2 ) ≈ 1/(2m)
en el límite no relativista, y que E −mc2 es una aproximación a la energía no relativista. Un
argumento similar nos muestra que las dos componentes inferiores son aproximadamente
cero en este caso. Vemos así que la ecuación de Dirac, en el límite no relativista, corresponde
con una partícula de espín 1/2. Por ello, nos permitiremos usar la terminología de espinores
de Dirac para referirnos a ellos. Pero aún queda un misterio importante: ¿qué sucede con
las dos componentes inferiores?
7.2.1 Corriente de probabilidad

Definamos un espinor adjunto, Ψ̄ = Ψ† γ0 , donde Ψ† es el transpuesto conjugado de Ψ.
Entonces, haciendo uso del hecho de que (γ µ )† γ 0 = γ 0 γ µ , encontramos una ecuación de
Dirac análoga para el espinor adjunto,
Ψ̄ (i~γ µ ∂µ + mc) = 0, (7.27)
donde entendemos que la derivada, en este caso, actúa sobre su izquierda. Podemos mul-
tiplicar esta ecuación a la derecha por Ψ, y la ecuación de Dirac original por la izquierda
por Ψ̄. Cuando las sumamos, nos queda
∂µ Ψ̄γ µ Ψ = 0, (7.28)

que es la ecuación de conservación de la corriente de la ecuación de Dirac, con jµ = Ψ̄γ µ Ψ.

¿Qué sucede en este caso con la componente cero? Es fácil de obtener,
ρ = j0 = Ψ̄γ 0 Ψ = Ψ† Ψ, (7.29)
que tiene la misma forma y la misma interpretación que en el caso de la ecuación de

Schrödinger. Realmente, hemos avanzado desde la ecuación de Klein-Gordon.

7.2.2 Mar de Dirac

Sin embargo, la ecuación de Dirac tal como la hemos presentado también tiene proble-
mas. Para empezar, las partículas libres pueden tener una energía E tanto positiva como
negativa. Si el momento es cero, tenemos que la ecuación es i~∂t Ψ = mc2 βΨ, con

I 0
β= , (7.30)
0 −I
de forma que tendremos cuatro soluciones independientes,
ψ{1,2} = exp(−imc2 t/~)e{1,2} , ψ{3,4} = exp(+imc2 t/~)e{3,4} . (7.31)

donde ei es el i-ésimo vector de la base canónica en el espacio interno (espacio de espín). Si
tenemos estados de energía tanto positiva como negativa, ¿por qué los estados de energía
positiva no decaen en estados de energía negativa, emitiendo radiación en el proceso?
Recordemos que la motivación inicial que dio lugar a la MQ fue la estabilidad de la materia:
la razón por la que los electrones que orbitan a los núcleos atómicos no radían energía y
caen es porque no tienen dónde caer, ya que los estados de energía están cuantizados y no
existen estados de energía menor a la que tenemos.
Dirac dio una interpretación que sabemos que es falsa, pero aún así es interesante
desde el punto de vista histórico y como paso hacia la interpretación correcta dada por
la teoría cuántica de campos. Dirac postuló que los estados de energía negativa están
todos ocupados, formando lo que se dio en llamar el mar de Dirac. Por eso los electrones
que tienen energías positivas no decaen: no porque no tengan estados a los que decaer,
sino porque dichos estados están todos ocupados. Más aún. La teoría del mar de Dirac
explicaba el origen de las antipartículas como agujeros en este mar, de manera similar al
comportamiento de los huecos electrónicos en un sólido.
C Además de los problemas antedichos, hay que destacar que también la ecuación de
Dirac sufre de la paradoja de Klein, es decir: un haz de partículas que colisiona
contra una barrera de potencial con una energía mayor que mc2 puede dar lugar a
una probabilidad de encontrar las partículas resultantes mayor que uno. La razón
física, claro está, es que la ecuación de Dirac desea representar una situación en la
que las partículas pueden crearse y destruirse, pero el formalismo de la MQ no lo
permite.
C Paul Dirac dijo de sí mismo que había tenido la suerte de “haber vivido en una época
en la que un físico de segunda podía hacer física de primera”. Es posible achacarle un
exceso de humildad. Todos somos conscientes de que en los momentos revolucionarios
cualquier físico puede hacer un gran descubrimiento, pero quizá no todos sean capaces
de interpretarlo debidamente y darle la importancia que merece. Se cuenta que un
colega se jactaba ante Lev Landau de haber descubierto la ecuación de Schrödinger
antes que el mismo Schrödinger, pero que no le dio importancia. Landau le recomendó
que no se jactara de tal hecho, y que más bien debería avergonzarse de él.
Resumen 7.2. Es posible escribir una ecuación de evolución de primer orden para una
partícula cuántica relativista, siempre que a cambio consideremos funciones de onda con
varias componentes. La ecuación de Dirac, que se puede expresar como i~∂/ − mc Ψ =
0, donde ∂/ = γ µ ∂µ y {γ µ , γ ν } = 2η µν , se formula con cuatro componentes, de las cuales

dos corresponden a estados de energía negativa y dos a los de positiva. Dentro de cada
pareja pueden distinguirse dos estados de espín diferente, mostrando que la ecuación
describe una partícula de espín 1/2 y su antipartícula. La ecuación de Dirac está dotada
de una ecuación de continuidad para la 4-corriente j µ = Ψ̄γ µ Ψ, donde Ψ̄ = Ψ† γ 0 .
7.3 Hacia la teoría cuántica de campos

Como hemos visto, la fusión de los marcos teóricos de la MQ y la TRE es complicada.
Richard Feynman dio una explicación intuitiva de los problemas de dicho ajuste en base a
su teoría de la integración sobre caminos. Consideremos una de las historias realizada por
nuestra partícula, según una curva x(t). En principio, la velocidad en cada punto debe ser
siempre menor que c, para que la trayectoria sea realizable clásicamente. Feynman mostró
que las trayectorias en las que la velocidad superaba c en intervalos de tiempo pequeños
también contribuían a la probabilidad total, aunque exponencialmente poco. Pero, claro,
un cambio de sistema de referencia puede hacer que estas trayectorias parezcan viajar hacia
atrás en el tiempo, dado que esos tramos clásicamente prohibidos vulneran el principio de
causalidad.
Reflexionemos un poco más sobre estas trayectorias, improbables, pero no imposibles.
Una partícula (sin espín) con carga +q en la que cambiamos t por −t se comporta como si
fuera una partícula con carga −q que viaja de manera normal, hacia delante en el tiempo.
Es decir, una antipartícula. Por lo tanto, un observador vería a su partícula avanzar en
el tiempo hasta que aparece un par partícula-antipartícula de la nada, y la antipartícula
se dirige contra la partícula original hasta aniquilarse con ella, quedando la otra partícula
viajando por sí sola.
Por lo tanto, lo que necesitamos es un marco teórico en el que podamos hablar de
partículas que se crean y se destruyen. Eso es la teoría cuántica de campos.
7.3.1 Segunda cuantización: bosones

Consideremos un espacio de Hilbert ampliado, en el que coexisten estados con diferentes
números de partículas. Este espacio suele llamarse espacio de Fock. El estado primitivo,
con cero partículas, es el vacío de Fock, y se escribirá como |0i. Ahora, por simplicidad,
consideremos un espacio discretizado, como en la sección 4.1.1, con una serie de sitios i ∈
{1, · · · , L}. Obtenemos una base de estados distinguibles (es decir, ortogonales), definida
en términos de ocupaciones,
|n1 , n2 , · · · , nL i , (7.32)
es un estado que contiene ni partículas en el sitio i. Nótese que las partículas no tienen
identidad propia, sólo importa la cantidad de ellas que hay en cada sitio. Por supuesto,
esos sitios pueden constituir una red en cualquier dimensión, o pueden combinar grados de
libertad espaciales e internos (p.ej. espín, o polarización).
Los operadores básicos sobre este espacio son los de creación y aniquilación, muy simi-
lares a los empleados para describir el oscilador armónico. Sea a†i el operador que crea una
partícula en el sitio i, y sea ai el operador que la aniquila, definidos por
√
a†i |n1 , · · · , ni , · · · i = ni + 1 |n1 , · · · , ni + 1, · · · i ,
√
ai |n1 , · · · , ni , · · · i = ni |n1 , · · · , ni − 1, · · · i , (7.33)

y de manera similar definimos el operador número, ni = a†i ai . En el caso de que las

partículas sean bosones, diremos que los operadores que actúan sobre sitios diferentes
conmutan. De hecho, estos operadores creación y aniquilación cumplen unas relaciones
de conmutación canónicas que son las que definen su actuación,
[ai , a†j ] = δij . (7.34)
Supongamos que los sitios considerados están en una cadena unidimensional. Entonces
es posible escribir un Hamiltoniano apropiado para este sistema de la manera siguiente,
L−1
X
H = −t0 a†i ai+1 + a†i+1 ai . (7.35)
i=1
En términos intuitivos, a†i ai+1 actúa destruyendo una partícula en i + 1 y creándola a

continuación en i. Es decir: mueve una partícula desde el sitio i + 1 hasta el i. Y el segundo
término actúa de la manera opuesta. De tal manera que deducimos que este Hamiltoniano
permite que una partícula se desplace a lo largo de la red.
Veamos cómo diagonalizar este Hamiltoniano. Primero, lo escribimos de manera algo
más general, en términos de una matriz de hopping,
tij a†i aj ,
X
H= (7.36)
i,j
y ahora diagonalizamos la matriz T = {tij }, U † T U = D, con U una matriz unitaria y

ε = diag(εk ) es una matriz diagonal. Ahora introducimos una transformación canónica de
los operadores creación y aniquilación, definida por unos nuevos operadores b†k y bk ,
a†i = ∗ †
X X
ai = Uik bk , Uik bk , (7.37)
k k
y reescribimos el Hamiltoniano original en términos de estos operadores,
! !
tij a†i aj ∗ †
εk b†k bk ,
X X X X X
H= = tij Uik bk Ujk0 bk0 = (7.38)
ij ij k k0 k
donde εk son los autovalores de la matriz T . La nueva forma no parece muy diferente de
la anterior, pero es mucho más sencilla. El nuevo Hamiltoniano es una suma de términos
que conmutan entre sí, todos ellos operadores número. Supongamos que nos dicen que el
sistema contiene NP partículas. Entonces, el estado fundamental consistirá en ocupar NP
veces el estado k de autovalor más bajo, es decir:
NP
b†1
|Ψi = |NP , 0, 0, · · · ib = √ |0i . (7.39)
NP !
y podemos escribirlo en la forma original con sólo realizar el cambio, b†1 = i Ui1
P ∗ †
ai . La
energía de este estado no es más que el valor esperado del operador número en el primer
estado-b multiplicado por ε1 , es decir, E = NP ε1 .
¿Y es posible diagonalizar la matriz T en situaciones prácticas? Sí, ya vimos cómo
hacerlo en el ejemplo 1.16.

7.3.2 Segunda cuantización: fermiones

Consideremos ahora el caso en el que las partículas sean fermiónicas y, por lo tanto,
cumplan el principio de exclusión de Pauli. De este modo, diremos que es imposible crear
más de una partícula en el mismo sitio. O, de otro modo, (a† )2 = 0. ¿Existen operadores
que cumplan esta condición? Sí, y lo vemos ya en dimension dos. Sean, por ejemplo,

0 1 0 0 0 0
a† = , a= , n = a† a = , (7.40)
0 0 1 0 0 1
pero en este caso las relaciones de conmutación no son las correctas. El truco consiste en
cambiar los conmutadores por anticonmutadores, y definir {a, a† } = 1. Cuando tenemos
una serie de L sitios, diremos que {ai , a†j } = δij , así que los operadores en distintos sitios
anticonmutan. Eso significa que
a†1 a†2 |0i = −a†2 a†1 |0i , (7.41)
o, lo que es lo mismo, importa el orden en el que creemos las partículas, pero sólo a nivel de
una fase global. Las partículas siguen sin tener identidad, son igualmente indistinguibles.
Pero una rotación de π en torno al centro del segmento que las une (intercambiándolas así)
da lugar a un cambio de fase de (−1) en la función de onda global. Eso implica que una
rotación de 2π de cada una de las partículas en torno a ese mismo punto también debe
llevar un cambio de fase de (−1). Eso es sólo posible cuando las partículas tienen espín
semientero, dando lugar a la explicación intuitiva de lo que se conoce como teorema espín-
estadística, que afirma que en 3D las partículas con espín semientero deben comportarse
como fermiones, mientras que las partículas con espín entero deben comportarse como
bosones.
Nótese que el espacio de Fock de para partículas fermiónicas en L sitios tiene dimensión
2 . El motivo es que cada uno de los sitios puede estar únicamente ocupado o vacío. Si el
L
número de partículas está fijado a M ≤ L, entonces la dimensión del subespacio de Fock

correspondiente vendrá dado por un número combinatorio, CL . Nótese que M CL = 2L .
M M
P
7.3.3 La teoría cuántica de campos

Esta sección va más allá del contenido del curso, y meramente daremos unas pinceladas
de la utilidad que tiene la segunda cuantización para unificar los marcos de la MQ y la
TRE. La ecuación de Klein-Gordon y la ecuación de Dirac son, respectivamente, teorías
apropiadas para partículas de espín 0 y espín 1/2, respectivamente, siempre que se inter-
preten en segunda cuantización. Es decir, dividimos el espacio en una red, con un espaciado
∆x, y asociamos a cada punto del espacio un operador creación y un operador aniquilación
apropiado. Después escribimos el Hamiltoniano de Klein-Gordon o el de Dirac en función
de dichos operadores, quedando una forma similar al Hamiltoniano (7.35). Introducimos
una transformación canónica a unos nuevos operadores b†k y bk , que no es más que una
transformada de Fourier de los operadores originales, quedando así el Hamiltoniano diago-
nal. De la misma manera es posible introducir el campo electromagnético, como un campo
sin masa de espín 1. No es fácil tratar campos de espines superiores, pero tampoco es real-
mente importante, porque apenas aparecen en la práctica, con una excepción: el campo de
espín 2 que sería necesario para describir la gravitación desde un punto de vista cuántico.
¿Qué sucede con los estados de energía negativa? En la ecuación de Dirac son inevita-
bles, pero la distinción pasa meramente por distinguir entre el vacío de Fock y el vacío

físico. El vacío de Fock es el estado sin partículas. El vacío físico, también llamado vacío
de Dirac, es el estado fundamental del Hamiltoniano que describe el campo, y es un estado
que puede contener un número enorme de partículas, y una complejidad enorme. De hecho,
la energía real del vacío es infinita (si llevamos a cero el corte ultravioleta, ∆x → 0), pero
ese infinito no nos preocupa especialmente, porque no es una cantidad medible. En cambio,
sí son medibles las diferencias de energía del vacío cuando situamos unas placas en él, que
restringen las fluctuaciones en su vecindad. De esa manera se puede medir la fuerza de
Casimir, como la derivada de la energía del vacío con respecto a la distancia entre las
placas, y es un efecto realmente observable.
Los campos que hemos descrito hasta el momento son campos libres, en los que las
partículas meramente se propagan. El mayor interés proviene de los campos en interacción.
Aplicando el proceso de segunda cuantización sobre el Hamiltoniano dado en la ecuación
(7.23) tanto sobre el campo de Dirac como sobre el campo electromagnético da lugar a la
electrodinámica cuántica (quantum electrodynamics, QED), en la que los electrones y
positrones (partículas y antipartículas) interactúan con los fotones. Pero eso es otra historia
que será contada en otro lugar.
Resumen 7.3. Una teoría cuántica relativista consistente debe considerar la posibilidad
de crear o destruir partículas, de manera que el marco teórico preciso para contenerla
debe realizarse en el formalismo de la segunda cuantización, ampliando el espacio de
Hilbert para que pueda contener estados con diferentes números de partículas, llamán-
dose entonces un espacio de Fock. El espacio se contruye a partir del vacío de Fock, |0i,
que contiene cero partículas, actuando con operadores de creación o aniquilación, a†k o
ak , que crean o destruyen una partícula en el estado k. Cuando las partículas son bosó-
nicas tenemos [a†k , ak0 ] = δk,k0 , mientras que si son fermiónicas {a†k , ak0 } = δk,k0 , donde
{a, b} = ab+ba es el anticonmutador de dos operadores. El vacío físico se obtiene como
el estado fundamental de un determinado Hamiltoniano, y no tiene por qué coincidir
con el vacío de Fock.
7.A Problemas
1.- Representación de Feshbach-Villars de la ecuación de Klein-Gordon. Asociemos a
cada solución de la ecuación de KG, ψ, un objeto de dos componentes, Ψ = (φ, χ), con
φ = (1/2)(ψ + (i/m)ψ̇), χ = (1/2)(ψ − (i/m)ψ̇. Se pide demostrar que Ψ cumple una
ecuación de tipo Schrödinger, i∂t Ψ = HΨ con H = mσz − (1/2m)∇2 (σz + iσy ). Nota:
trabajaremos en unidades naturales.
2.- EnR la representación de Feshbach-Villars del problema anterior, demostrar que

hΨ|Ψ0 i = d3 x Ψ† σz Ψ0 es un buen producto escalar entre soluciones de la ecuación de
KG.
3.- Escribir la ecuación de Dirac en (2+1)D. Esta ecuación tiene una especial relevancia
porque sirve para describir la propagación de electrones a través de ciertos materiales, como
el grafeno.
4.- (a) ¿Pueden existir representaciones de orden impar del álgebra de Clifford? Pista:
tomar determinantes en la ecuación definitoria del álgebra. (b) Encontrar, desde la relación
del álgebra, cuánto debe ser la traza de las matrices γ µ .

7.A Problemas 177
5.- Demostrar que no existen matrices que cumplan el álgebra de Clifford en dimensión
2 o 3.
6.- Mostrar que si γ µ satisfacen el álgebra de Clifford, Sγ µ S −1 también lo hará, para

cualquier matriz S invertible.
7.- Escribir la ecuación de autovalores para una partícula de Klein-Gordon en un po-

tencial eléctrico.
8.- Paradoja de Klein. Estudiar el impacto de un haz de partículas que cumplen la

ecuación de Klein-Gordon sobre una barrera de potencial V . Comprobar cómo cuando
V > E pero V < E + mc2 no existe onda transmitida en la región prohibida clásicamente.
Sin embargo, cuando V > E + mc2 , vuelve a existir onda transmitida viajera.
9.- Bosones duros. Considerar un sistema formado por partículas bosónicas que saltan
entre tres sitios que forman un anillo, con amplitudes de salto iguales entre cada par de
sitios. Restringir el problema al caso en el que las ocupaciones de cada sitio no puedan
exceder de uno (bosones duros). Encontrar el estado fundamental del Hamiltoniano, que
correspondería con el vacío físico.

¿Y ahora qué?
Después de un duro trabajo, al fin hemos completado el cuatrimestre de MQ de cuarto

curso. ¿Qué puedo hacer ahora con los conocimientos adquiridos? Se abren muchas puertas
para seguir avanzando en el conocimiento de la física.
Para empezar, tras completar este curso estamos capacitados para el estudio de la
teoría de la información cuántica, con todas sus posibles aplicaciones: computación
cuántica, simuladores cuánticos, metrología cuántica, termodinámica cuántica, etc. Asi-
mismo, el interés en los fundamentos de la MQ ha aumentado en los años recientes,
con una gran cantidad de trabajos sobre decoherencia, sistemas cuánticos abiertos o sobre
aproximaciones alternativas a la MQ, tal como la MQ de Bohm o la de Nelson.
Asimismo, otra ruta en la que avanzar es la de los sistemas de muchos cuerpos
cuánticos (quantum many-body physics). En su vertiente fundamental se parte del forma-
lismo de la segunda cuantización, pudiendo aplicarse a la física del estado sólido, la química
cuántica, el magnetismo cuántico, propiedades electrónicas, de transporte o estructurales.
De especial interés son los llamados fenómenos colectivos cuánticos, que incluyen el láser,
la superconductividad o superfluidez. Un área con interés en sí misma está constituida
por los métodos numéricos para tales sistemas, que incluyen la teoría del funcional de la
densidad, la diagonalización exacta, los métodos de Lanczos o el grupo de renormalización
de la matriz densidad o las redes tensoriales.
La teoría cuántica de campos que hemos entrevisto sirve para analizar tales fe-
nómenos, especialmente cuando trabajamos a escalas muy superiores a la microscópica,
pero también se aplica al estudio de la física de altas energías, es decir, física nuclear y de
partículas elementales, desde la electrodinámica cuántica, la teoría electrodébil que unifica
las fuerzas electromagnética y nuclear débil, o la cromodinámica cuántica, que describe
la fuerza nuclear fuerte. Todas estas teorías responden a simetrías de tipo gauge, cuya
cuantización presenta retos particulares. Y muchas de estas simetrías están espontánea-
mente rotas, ruptura que tiene especial relación con la naturaleza del bosón de Higgs y
el mecanismo de generación de masa. Entre todas ellas constituyen el modelo estándar.
Sin embargo, la gravitación no ha sido cuantizada aún. Las teorías más prometedoras que
aspiran a ello incluyen la teoría de cuerdas, la gravedad de bucles o, recientemente, marcos
teóricos que son agnósticos respecto al mecanismo real, pero basan sus predicciones en
técnicas holográficas, en las que se plantea una dualidad entre una teoría gravitatoria en
un espacio con una teoría no gravitatoria en la frontera del mismo.

Bibliografía
Libros
[1] A. D. Aczel, Entrelazamiento, Ed. Crítica (2004). Un libro ameno que introduce muchos
conceptos modernos con perspectiva histórica.
[2] L. Susskind, A. Friedman, Quantum Mechanics, the theoretical minimum, Basic Books
(2014). Parte del conocido “mínimo teórico” de Leonard Susskind, una gran introducción
a los conceptos básicos de la mecánica cuántica.
[3] J. S. Bell, Speakable and unspeakable in quantum mechanics, Cambridge Univ. Press
(2004). Colección de artículos clave en la creación de la moderna visión de la mecánica
cuántica, especialmente en lo relativo a la parte más formal del temario. Hay traducción
española, J. S. Bell, Lo decible y lo indecible en mecánica cuántica (Alianza Editorial,
colección Alianza Universidad).
[4] A. Cassinello, J.L. Sánchez Gómez, La realidad cuántica, Crítica (2013).
• Libros de texto adicionales sobre mecánica cuántica con un nivel similar al de este
curso:
[5] P. García González, J. E. Alvarellos, J. J García Sanz, Introducción al formalismo de

la mecánica cuántica, Cuadernos de la UNED (2007). Proporciona un valioso refuerzo
del marco matemático de la mecánica cuántica.
[6] T. Banks, Quantum mechanics: an introduction, CRC Press (2019). Un enfoque mo-
derno, muy completo y próximo a la investigación contemporánea.
[7] C. Cohen-Tannoudji, B. Liu, F. Laloë, Quantum mechanics, Wiley interscience (1977).

Un libro especialmente didáctico, con muchos ejemplos resueltos.
[8] L. de la Peña, Introducción a la mecánica cuántica, Fondo de Cultura Económica (2006).

Quizá el libro más completo de mecánica cuántica en castellano. Algo heterodoxo en
temas de interpretación. Contiene gran cantidad de problemas resueltos.
[9] L. E. Ballentine, Quantum mechanics: a modern development, World Scientific (1998).

Un libro didáctico que pone un especial énfasis en los problemas de interpretación.
[10] M. A. Nielsen, I. L. Chuang, Quantum information and quantum computation, Cam-

bridge Univ. Press (2000). Aunque centrado en información y computación cuántica,
ofrece una exposición muy interesante de la matriz densidad y el entrelazamiento, con
muchos ejemplos resueltos.

182 BIBLIOGRAFÍA
[11] M. Le Bellac, A short introduction to quantum information and quantum computation,

Cambridge Univ. Press (2006). Una exposición sencilla de los temas de información y
computación cuántica.
[12] D. Lay, Álgebra Lineal y sus aplicaciones, Tercera edición, Pearson (2007).
[13] El código de BLAS y LAPACK junto con la documentación pueden encontrarse en

http://netlib.org.
[14] Se puede programar en C/C++ fácilmente usando las librerías apropiadas, como por
ejemplo HVB, creada en la UNED, http://github.com/jvrlag/hvb.
[15] GNU-Octave es un programa de cálculo numérico de uso libre basado

en MATLAB. Se puede encontrar un tutorial en la web de la UNED,
http://mononoke.fisfun.uned.es/octave.
Artículos
[16] S. Bugajski, Nonlinear quantum mechanics is a classical theory, Int. J. Theor. Phys.
30, 961 (1991).
[17] C.E. Shannon, A mathematical theory of communication, Bell System Tech. J. 27, 379
(1948).
[18] R.P. Feynman, Lectures on computation, CRC Press (1996).
[19] Wikipedia, entrada Quantum Logic Gate, recuperada el 1 de julio de 2021.
[20] N. Smart, Cryptography made easy, Springer (2016).
[21] T. Herbst, T. Scheidl, M. Fink, J. Handsteiner, B. Wittmann, R. Ursin, A. Zeilinger,

Teleportation of entanglement over 143 km, PNAS 112, 14202 (2015).
[22] J. Rodríguez-Laguna, S.N. Santalla, Building an adiabatic quantum computer in the

classroom, Am. J. Phys. 86, 360 (2018).
[23] T. Albash, D.A. Lidar, Rev. Mod. Phys. 90, 015002 (2018).
[24] F. Arute et al., Nature 574, 505 (2019).
[25] Respuesta al artículo [24] en la web de IBM, en

https://www.ibm.com/blogs/research/2019/10/on-quantum-supremacy.
[26] J.I. Cirac, P. Zoller, Quantum computations with cold trapped ions, Phys. Rev. Lett.
74, 4091 (1995).

Índice alfabético
A E
Acoplo mínimo . . . . . . . . . . . . . . . . . . . . . . . 142 Ecuación

Álgebra de Lie . . . . . . . . . . . . . . . . . . . . . . . . 121 de Dirac . . . . . . . . . . . . . . . . . . . . . . . . . . 171
Algoritmo de Ehrenfest . . . . . . . . . . . . . . . . . . . . . . 126
de Deustsch-Josza . . . . . . . . . . . . . . . . . 89 de Hamilton-Jacobi . . . . . . . . . . . . . . . 156
de Grover. . . . . . . . . . . . . . . . . . . . . . . . . .89 de Klein-Gordon . . . . . . . . . . . . . . . . . . 168
de Shor . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 de Madelung . . . . . . . . . . . . . . . . . . . . . 156
Antipartículas . . . . . . . . . . . . . . . . . . . . . . . . 171 de Schrödinger . . . . . . . . . . . . . . . . 37, 126
Aproximación Entropía . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
WKB. . . . . . . . . . . . . . . . . . . . . . . . . . . . .158 de entrelazamiento . . . . . . . . . . . . . . . . . 59
Átomos ultrafríos . . . . . . . . . . . . . . . . . . . . . . 99 de von Neumann. . . . . . . . . . . . . . . . . . .52
Esfera de Bloch . . . . . . . . . . . . . . . . . . . . . . . . 11
B Espacio de Hilbert . . . . . . . . . . . . . . . . . . . . . 11
Espín . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
Barrera de potencial . . . . . . . . . . . . . . . . . . 135 Estado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
BLAS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .45 GHZ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
Bra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 mezcla . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
Experimento de Stern-Gerlach . . . . . . . . . 11
C
F
Cambio de base . . . . . . . . . . . . . . . . . . . . . . . . 11
Clase de complejidad Factor de Boltzmann. . . . . . . . . . . . . . . . . . .52
#P . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 Fidelidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
BPP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 Fuerza de Lorentz . . . . . . . . . . . . . . . . . . . . 142
BQP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 Función de un operador . . . . . . . . . . . . . . . . 21
NP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
NP-completa . . . . . . . . . . . . . . . . . . . . . . 89 G
P . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
PSPACE . . . . . . . . . . . . . . . . . . . . . . . . . . 89 GNU-Octave . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
Codificación densa . . . . . . . . . . . . . . . . . . . . . 86 Grupo
Corriente de probabilidad . . . . . . . . . . . . . 126 de rotaciones . . . . . . . . . . . . . . . . . . . . . 121
O(3). . . . . . . . . . . . . . . . . . . . . . . . . . . . . .121
D SU(2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
Decoherencia . . . . . . . . . . . . . . . . . . . . . . . . . . 75 I
Descomposición de Schmidt . . . . . . . . . . . . 59
Desfasajes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147 Imagen
Desigualdades de Bell . . . . . . . . . . . . . . . . . . 75 de Heisenberg. . . . . . . . . . . . . . . . . . . . . .37

184 ÍNDICE ALFABÉTICO
de Schrödinger . . . . . . . . . . . . . . . . . . . . . 37 retardado . . . . . . . . . . . . . . . . . . . . . . . . . 130

Integral de camino . . . . . . . . . . . . . . . . . . . . 161 Proyector . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
Invariancia gauge . . . . . . . . . . . . . . . . . . . . . 142 Puerta
Iones atrapados . . . . . . . . . . . . . . . . . . . . . . . . 99 CNOT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
Isospín . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 de Hadamard . . . . . . . . . . . . . . . . . . . . . . 81
de Toffoli . . . . . . . . . . . . . . . . . . . . . . . . . . 81
K
Q
Ket . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
Qubit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
L Qubits superconductores . . . . . . . . . . . . . . . 99
LAPACK . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 R
M Redes ópticas . . . . . . . . . . . . . . . . . . . . . . . . . . 99
Relación de incertidumbre . . . . . . . . . . . . . 33
Matrices de Pauli . . . . . . . . . . . . . . . . . . . . . . 21
Representación
Matriz
de posiciones . . . . . . . . . . . . . . . . . . . . . 103
densidad . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
S . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
S
Medición. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .33
Momento angular . . . . . . . . . . . . . . . . . . . . . 121 Sección eficaz . . . . . . . . . . . . . . . . . . . . . . . . . 147
Segunda cuantización . . . . . . . . . . . . . . . . . 175
N
Niveles de Landau . . . . . . . . . . . . . . . . . . . . 142 T
Teleportación cuántica . . . . . . . . . . . . . . . . . 86
O
Teorema
Observable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 de Bloch. . . . . . . . . . . . . . . . . . . . . . . . . .120
Observables compatibles . . . . . . . . . . . . . . . 33 de imposibilidad de clonación . . . . . . 55
Operador de Noether . . . . . . . . . . . . . . . . . . . . . . . 116
creación . . . . . . . . . . . . . . . . . . . . . . . . . . 175 Teoría de representaciones . . . . . . . . . . . . 121
destrucción . . . . . . . . . . . . . . . . . . . . . . . 175
evolución . . . . . . . . . . . . . . . . . . . . . . . . . . 37 V
Hamiltoniano . . . . . . . . . . . . . . . . . . . . . . 21
Valor esperado . . . . . . . . . . . . . . . . . . . . . . . . . 33
hermítico . . . . . . . . . . . . . . . . . . . . . . . . . . 21
momento . . . . . . . . . . . . . . . . . . . . . . . . . 110
posición . . . . . . . . . . . . . . . . . . . . . . . . . . 103
traslación . . . . . . . . . . . . . . . . . . . . . . . . . 110
unitario. . . . . . . . . . . . . . . . . . . . . . . . . . . .37
Oscilador armónico . . . . . . . . . . . . . . . . . . . 135
Polarización . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
Potencial vector . . . . . . . . . . . . . . . . . . . . . . 142
Pozo de potencial . . . . . . . . . . . . . . . . . . . . . 135
Preparación . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
Producto tensorial . . . . . . . . . . . . . . . . . . . . . 55
Propagador . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
libre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130

Mecanica Cuantica UNED 2022 PDF

Cargado por

Copyright:

Formatos disponibles

Mecanica Cuantica UNED 2022 PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Mecanica Cuantica UNED 2022 PDF

Cargado por

Copyright:

Formatos disponibles

Mecánica Cuántica

Departamento de Física Fundamental

Distribuido bajo licencia Creative Commons Attribution-NonCommercial 3.0. Este docu-

Primera edición, Septiembre de 2021.

1 Mecánica cuántica en sistemas discretos . . . . . . . . . . . . . . . . . . . . . 11

2 Matriz densidad y entrelazamiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

3 Tecnologías cuánticas de la información . . . . . . . . . . . . . . . . . . . . . . 81

Apuntes Mecánica Cuántica UNED 2022

5 Algunos sistemas cuánticos continuos . . . . . . . . . . . . . . . . . . . . . . . . 133

6 El límite clásico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153

7 Mecánica cuántica relativista . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165

¿Y ahora qué? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179

Índice alfabético . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183

Este documento contiene el material básico de la asignatura Mecánica Cuántica, opta-

Al tratarse de un tercer cuatrimestre de Mecánica Cuántica, nuestro enfoque será más

Apuntes Mecánica Cuántica UNED 2022

resolución de ecuaciones diferenciales ordinarias y con los fundamentos de la teoría de

Madrid, 23 de junio de 2021.

Apuntes Mecánica Cuántica UNED 2022

También podemos recomendar estos libros a nivel divulgativo o histórico:

Apuntes Mecánica Cuántica UNED 2022

1 Mecánica cuántica en sistemas discretos . . . 11

2 Matriz densidad y entrelazamiento . . . . . . . . . . 47

3 Tecnologías cuánticas de la información . . . . 81

1.1 Qué es un estado

1.1.1 Estados distinguibles

C La elección del espacio de estados siempre implica un cierto grado de aproximación.

Apuntes Mecánica Cuántica UNED 2022

C En física es siempre conveniente dar definiciones operacionales de los términos, es

Llamaremos espacio de configuraciones de un sistema, Ω, a cualquier conjunto ma-

Apuntes Mecánica Cuántica UNED 2022

distinguir repitiendo el experimento muchas veces. Es cierto: si realizamos 100 ex-

Dada una dirección de propagación, la polarización de un fotón sólo puede estar en

1.1.2 Principio de superposición

Apuntes Mecánica Cuántica UNED 2022

1.1.3 Fidelidad y detectores

ui vj δij = i ui vi . De aquí llegamos a definir la norma de cada vector, k~uk2 = ~u · ~u =

La desigualdad de Cauchy-Schwarz, |~u · ~v | ≤ k~ukk~v k nos permite definir el coseno del

Pero falta un aspecto importante: en MQ necesitamos un espacio de Hilbert complejo,

Apuntes Mecánica Cuántica UNED 2022

C En matemáticas se clasifican los espacios en función de las estructuras que impone-

Volvamos a la MQ y a nuestra notación de Dirac. El producto escalar entre dos estados

y su módulo al cuadrado |hu|vi|2 se corresponde con el coseno al cuadrado del ángulo

Apuntes Mecánica Cuántica UNED 2022

1.1.4 Ejemplos de sistemas cuánticos discretos

dirección del eje Z. El espacio de configuraciones es Ω = {X, Y }, es decir, polarización hori-

|Ψi = α |Xi + β |Y i , (1.6)

con α, β ∈ C y |α|2 + |β 2 | = 1. Si α y β son reales, entonces estamos denotando un vector

|Ψi = α |Z+ i + β |Z− i = α |+i + β |−i = α |↑i + β |↓i . (1.8)

|hX+ |Z+ i|2 = 1/2. (1.9)

Apuntes Mecánica Cuántica UNED 2022

|Ψi = α |0i + β |1i . (1.13)

Apuntes Mecánica Cuántica UNED 2022

Ejemplo 1.7 Consideremos una cadena de n átomos fijados en posiciones equiespaciadas,

1.1.5 Cambios de base

Las componentes de ambas, {αi } y {βj } se denominan amplitudes de probabilidad debido

Apuntes Mecánica Cuántica UNED 2022

|a1 i = U11 |b1 i + U21 |b2 i + · · · + Un1 |bn i

hb1 |a1 i = U11 , (1.19)