Science">
Capitulo 1 Relatividad Miguel Alcubierre
Capitulo 1 Relatividad Miguel Alcubierre
Capitulo 1 Relatividad Miguel Alcubierre
Relatividad especial y el
espacio–tiempo de Minkowski
1.1. Introducción
La relatividad especial fue desarrollada por Einstein en 1905 [35, 36] como una manera
de reconciliar la electrodinámica de Maxwell con el principio de relatividad de Galileo,
que dice que las leyes de la fı́sica deben ser las mismas en todo sistema inercial. Esta teorı́a
está basada en dos postulados: el primero es precisamente el principio de relatividad, y el
segundo es la invariancia de la velocidad de la luz.
Aún cuando fue Einstein quién desarrolló la relatividad especial en su forma final,
desde fines del siglo XIX varios otros investigadores estaban ya tras su pista, aunque aún
sin tener una imagen completa. Entre ellos podemos mencionar desde luego a Hendrik
Lorentz y Henri Poincaré, además de algunos quizá menos recordados hoy en dı́a como
Woldemar Voigt y Joseph Larmor.
En la década de los 1860’s James Clerk Maxwell desarrolló la forma final de la teorı́a
electromagnética. Dicha teorı́a predecı́a nuevos fenómenos tales como la existencia de las
ondas electromagnéticas, pero parecı́a estar en conflicto con el principio de relatividad.
En particular, el hecho de que la fuerza debida a un campo magnético B ~ actuando sobre
una partı́cula con carga q estuviera dada en términos de la velocidad de la partı́cula ~v por
~ llevaba inmediatamente a preguntarse en que sistema de referencia
la expresión q(~v ⇥ B)
deberı́a medirse dicha velocidad. De manera similar, era claro que una carga en reposo
solo tenı́a campo eléctrico y no magnético, mientras que una carga en movimiento (una
corriente eléctrica) producı́a un campo magnético. Pero, ¿quién decidı́a si la carga estaba
en reposo o en movimiento?
1
2 CAPÍTULO 1. RELATIVIDAD ESPECIAL
Por otro lado, Maxwell habı́a encontrado que la velocidad de las ondas electromagnéti-
cas en el vacı́o c estaba dada en términos de la permitividad eléctrica ✏0 y la permeabilidad
p
magnética µ0 del vacı́o como c = 1/ ✏0 µ0 , que resultaba ser aproximadamente igual al
valor conocido de la velocidad de la luz (lo que lo llevó a concluir que la luz era una
onda electromagnética).1 Sin embargo, dado que de acuerdo a la fı́sica newtoniana esta
p
velocidad tendrı́a que depender del sistema de referencia, el valor de c = 1/ ✏0 µ0 deberı́a
ser válido únicamente en un sistema de referencia especı́fico.2
Los problemas que acabamos de mencionar, junto con la idea mecanicista que se
tenı́a en esa época de que un fenómeno ondulatorio como la luz deberı́a necesariamente
propagarse en un medio material, llevó a postular que los campos electromagnéticos eran
en realidad perturbaciones en un medio que permeaba todo el espacio conocido como el
“éter luminı́fero”.3 La electrodinámica de Maxwell se suponı́a entonces válida solo en el
sistema de referencia en el cual dicho éter se encontraba en reposo, y la velocidad de la luz
deberı́a medirse en ese mismo sistema de referencia. Maxwell mismo trabajó en posibles
modelos mecánicos para el éter, y Lorentz desarrolló toda una teorı́a sobre la dinámica
de las cargas eléctricas conocida como la “teorı́a del electrón”.4
La teorı́a del éter, sin embargo, presentaba una serie de problemas. El éter deberı́a ser
un fluido para poder llenar todo el espacio, incluso el espacio intermolecular en medios
1
Es interesante notar que el valor de la velocidad de la luz se conocı́a ya desde el siglo XVII con
muy buena aproximación. Fue medido por primera vez por el astrónomo danés Ole Roemer en 1676 a
partir de comparar las leyes de Kepler con el movimiento de las lunas galileanas de Júpiter (Io, Europa,
Ganı́medes y Calisto), que aparentemente se atrasaban o adelantaban dependiendo de la posición relativa
entre Júpiter y la Tierra. Roemer razonó que si la luz tenı́a una velocidad de propagación finita, tardarı́a
más en llegar cuando Júpiter estuviera más lejos, y utilizó este hecho para determinar el valor de dicha
velocidad [121, 127]. El valor que obtuvo Roemer era de aproximadamente c = 215, 000 km/s, un 75 % del
valor correcto de c = 299, 792.458 km/s. El error era debido principalmente a dos factores: la distancia de
la Tierra al Sol aún no se conocı́a con mucha precisión, y Roemer calculó que la luz tardaba 22 minutos
en atravesar la órbita terrestre, cuando en realidad tarda unos 16 minutos.
2
Hoy en dı́a el valor de la velocidad de la luz de c = 299, 792.458 km/s es exacto, esto es debido a
que la definición moderna de un metro es precisamente la distancia que recorre la luz en 1/299,792,458
segundos. El segundo, a su vez, se define ya no como una fracción del dı́a terrestre, sino a partir de la
transición entre dos niveles hiper-finos del átomo de Cesio 133.
3
La naturaleza ondulatoria de la luz fue propuesta por Robert Hooke en 1665 y por Christiaan
Huygens en 1678, y fue posteriormente confirmada experimentalmente por Thomas Young en 1803. La
existencia del éter de hecho fue propuesta ya por Huygens desde 1690, y solo muy posteriormente fue
adaptada a la electrodinámica de Maxwell.
4
La teorı́a del electrón de Lorentz, desarrollada a partir de 1892, no se refiere directamente a las
partı́culas elementales que hoy en dı́a conocemos como electrones y que fueron descubiertas por Joseph
John Thomson en 1897. Inicialmente la palabra “electrón” se referı́a más bien a hipotéticos “átomos de
electricidad”, y solo posteriormente fue asociada a la partı́cula descubierta por Thomson (el protón no
fue descubierto sino hasta 1909 por Ernest Rutherford).
1.1. INTRODUCCIÓN 3
como el aire o el vidrio, ya que la luz claramente podı́a propagarse en ellos. Por otro lado,
deberı́a ser un sólido para permitir ondas transversales como lo son las ondas electro-
magnéticas, y deberı́a ser enormemente rı́gido para soportar las altı́simas frecuencias que
podı́an tener dichas ondas. Deberı́a también tener cero viscosidad y masa extremadamente
baja, o de otra forma afectarı́a las órbitas de los planetas de manera visible. Todas estas
propiedades, algunas de ellas incluso contradictorias, hacı́an del éter algo casi imposible
de entender.
Pero el problema más grande vino con los experimentos de Albert Michelson y Edward
Morley. Como hemos mencionado, la velocidad de la luz deberı́a tener el valor c solo
en el sistema de referencia del éter en reposo, pero la Tierra se mueve alrededor del
Sol con una velocidad de unos 30 km/s, por lo que es claro que su velocidad relativa
respecto al éter deberı́a cambiar durante una órbita. Esto implica que la velocidad de
la luz medida en el laboratorio deberı́a variar a lo largo de un año. En 1881, Michelson
diseño un interferómetro para medir el cambio en la velocidad de la Tierra respecto al
éter. El experimento dio resultados negativos, pero el aparato aún no era muy preciso.
En 1887, Michelson y Morley repitieron el experimento con una versión mejorada del
interferómetro, obteniendo de nuevo resultados negativos: la velocidad de la luz era la
misma a lo largo del año, y cualquier variación que pudiera existir era mucho menor a
la predicha por la teorı́a del éter. El experimento de Michelson y Morley es, sin duda, el
experimento “fallido” más famoso de la historia.
Los resultados de Michelson y Morley pusieron a trabajar a los fı́sicos teóricos en
diversas posibles explicaciones. La mejor explicación antes de Einstein fue la debida a
George Fitzgerald y Hendrik Lorentz, quienes de manera independiente propusieron que
al moverse a travésp del éter los objetos se contraen en la dirección de movimiento por
un factor igual a 1 v 2 /c2 , con v la velocidad de movimiento respecto al éter y c la
velocidad de la luz. Dicha contracción de Lorentz–Fitzgerald explicaba perfectamente el
resultado negativo del experimento de Michelson y Morley. Lorentz argumentaba que esa
contracción era debida a un efecto del éter en las fuerzas intermoleculares, pero un me-
canismo dinámico que explicara porqué todos los objetos sufrirı́an exactamente la misma
contracción resultaba difı́cil de encontrar.
En 1905 Einstein dio el golpe final a la teorı́a del éter con la relatividad especial
(aunque algunos investigadores, incluyendo a Lorentz y Poincaré, siguieron hablando del
éter por varios años más). En esta nueva teorı́a la velocidad de la luz es la misma en todo
sistema inercial por construcción, y el concepto del éter se vuelve superfluo.5 El precio a
5
No es claro si Einstein sabı́a del experimento de Michelson y Morley en 1905. Lo que sı́ es claro es que
no los menciona en sus artı́culos originales. Al parecer en ese momento Einstein estaba más inspirado por
la elegancia del principio de relatividad y la teorı́a electromagnética de Maxwell que por los resultados
experimentales.
4 CAPÍTULO 1. RELATIVIDAD ESPECIAL
pagar es introducir una nueva cinemática distinta a la de Newton, donde los conceptos de
espacio y de tiempo dejan de ser absolutos.
1. El principio de relatividad, según el cuál las leyes de la fı́sica son las mismas en todo
sistema inercial. Este principio tiene su origen en las observaciones de Galileo sobre
la imposibilidad de determinar el movimiento de un observador de manera absoluta,
y es completamente compatible con la mecánica newtoniana. Einstein, sin embargo,
lo eleva a un postulado acerca de todas las leyes de la fı́sica (en particular la óptica
y la electrodinámica), y no solo las leyes de la mecánica.6
A primera vista podrı́a parecer que los dos postulados anteriores son contradictorios.
El primero parece indicar que no existen las velocidades absolutas, mientras que el se-
gundo nos dice que sı́ hay una: la velocidad de la luz. En su artı́culo original, Einstein
mismo hace mención de esta aparente contradicción. Pero notemos que en realidad el pri-
mer postulado no menciona en ningún momento velocidades (relativas o absolutas), sino
solamente la invariancia de las leyes de la fı́sica en los sistemas inerciales. Crucialmente, el
primer postulado escrito de esta forma resulta ser compatible con la existencia de una sola
velocidad absoluta, que de acuerdo al segundo postulado tomaremos como la velocidad
de la luz.
¿Por qué la velocidad de la luz es especial? Por dos motivos, uno empı́rico y otro
teórico: 1) el experimento de Michelson y Morley habı́a mostrado empı́ricamente que
esta velocidad era siempre la misma, sin importar el estado de movimiento de la Tierra,
y 2) las ecuaciones de Maxwell permitı́an derivar la velocidad de la luz sin hacer mención de
ningún sistema de referencia especı́fico (el éter se introducı́a a posteriori). Lo importante
6
Cabe mencionar que el primero que usó le nombre “principio de relatividad” fue de hecho Henri
Poincaré. En 1904 lo enuncia ya de una forma casi idéntica a la de Einstein [106]. La diferencia más
importante es que Poincaré y Lorentz veı́an a este principio como algo que tenı́a que demostrarse a partir
de la electrodinámica, mientras que Einstein lo toma como un postulado. De hecho, en 1909 Lorentz llega
a decir que “Einstein simplemente postula lo que nosotros hemos deducido, con cierta dificultad y no de
manera totalmente satisfactoria, a partir de las ecuaciones fundamentales del campo electromagnético”.
1.2. LOS POSTULADOS DE EINSTEIN 5
aquı́ es que existe una velocidad absoluta, que como veremos más adelante es la que
define las relaciones de causalidad en nuestro Universo. Otras interacciones, tales como
la gravedad o la interacción nuclear fuerte, también se propagan a esta misma velocidad,
ası́ que bien podrı́amos haberla llamado la “velocidad de la gravedad” o “la velocidad de los
gluones” (los portadores de la fuerza nuclear fuerte) de haber entendido estas interacciones
antes que la electromagnética. Es más, si el dı́a de mañana se descubre que existe una
partı́cula que se mueve ligeramente más rápido que la luz esto no destruirı́a a la teorı́a de
la relatividad, sino que nos llevarı́a a concluir que la velocidad absoluta no coincide con
la de la luz, y por lo tanto los fotones probablemente tendrı́an una pequeñı́sima masa.7
La relatividad especial hace énfasis en algo que quizá podrı́amos bautizar como el
“postulado cero”, y eso es precisamente el suponer que los sistemas de referencia inerciales
existen. De hecho, se mencionan en los dos postulados de Einstein. Pero, ¿qué es un sistema
inercial? En términos simples un sistema inercial se puede definir como aquel en el que se
cumple la primera ley de Newton: objetos libres de fuerzas externas se mantienen en un
estado de movimiento rectilı́neo uniforme. Aunque la definición anterior parece simple,
en realidad esconde ya una serie de complejidades. Para empezar, debemos poder definir
qué es una lı́nea recta, y que significa movimiento uniforme. La definición de un sistema
inercial entonces debe incluir alguna noción sobre las propiedades geométricas del espacio,
ası́ como una noción del tiempo. Vamos entonces a enunciar algunas de las propiedades
básicas que debe tener un sistema inercial:8
2. Las distancias entre dos puntos del espacio son independientes del tiempo. Alterna-
tivamente, podemos decir que dados dos objetos en reposo uno respecto al otro, y
libres de fuerzas externas, la distancia entre ellos se mantiene siempre igual.
3. El tiempo fluye al mismo ritmo en todos los puntos del espacio. Operativamente,
podemos situar una serie de relojes sincronizados en reposo unos respecto a otros
en distintos puntos del espacio, y estos permanecerán sincronizados para siempre.
7
Esto estuvo a punto de ocurrir cuando el experimento de neutrinos OPERA en la mina Gran Sasso
(en Italia) anunció en 2012 que habı́a medido una velocidad para los neutrinos provenientes del CERN (en
Suiza) mayor a la de la luz en una parte en 105 . El resultado finalmente resultó ser un error de medición.
8
Para una discusión muy detallada sobre los conceptos de espacio y tiempo en la teorı́a de Newton
ası́ como en la relatividad puede verse el libro de Tim Maudlin [80].
6 CAPÍTULO 1. RELATIVIDAD ESPECIAL
¿Existen los sistemas inerciales en la naturaleza? La intuición nos dice que sı́, o que
por lo menos son una excelente aproximación a las propiedades del espacio y del tiempo a
las que estamos acostumbrados. De hecho, toda la fı́sica de Newton asume su existencia.
La relatividad especial también los toma como su punto de partida.
Aquı́ vale la pena preguntarse qué es lo que hace “especial” a la relatividad especial.
Es frecuente oı́r decir, incluso entre algunos fı́sicos, que la relatividad especial es especial
debido a que no puede describir objetos acelerados u observadores acelerados. Esto no
podrı́a estar más equivocado. La relatividad especial es en esencia una nueva cinemática,
y dentro de ella por supuesto que se puede hacer dinámica, es decir estudiar el efecto
de las fuerzas sobre los objetos fı́sicos, por lo que las aceleraciones aparecen todo el
tiempo. Observadores acelerados, o más correctamente sistemas de referencia acelerados,
también pueden incluirse (de hecho los estudiaremos en capı́tulos posteriores), aunque las
matemáticas se vuelven bastante más complejas. Lo que hace “especial” a la relatividad
especial es precisamente el hecho de que asume la existencia de los sistemas inerciales.
Como ya hemos mencionado, en esto la relatividad especial no difiere de la mecánica
newtoniana. Veremos más adelante que en la relatividad general los sistemas inerciales
1.3. UNIDADES GEOMÉTRICAS 7
globales ya no existen.
Un último comentario, ¿por qué se llama “teorı́a de la relatividad”? Este nombre
es quizá desafortunado, y se debe a que restaura la compatibilidad entre la teorı́a elec-
tromagnética de Maxwell y el principio de relatividad de Galileo, que aparentemente se
encontraban en conflicto, sin la necesidad de postular un sistema de referencia privilegiado
(el del éter). El nombre de hecho no se debe a Einstein, quién inicialmente la llamaba
“teorı́a invariante” (Invariantentheorie en alemán), haciendo énfasis en las cantidades que
permanecen iguales en todo sistema de referencia inercial. Fue Alfred Bucherer quién la
llamó teorı́a de la relatividad por primera vez en 1906, y este nombre se popularizó rápi-
damente (Lorentz se habı́a referido a ella antes como “teorı́a relativa”).9 Por desgracia, el
nombre se presta a que la gente diga con frecuencia que “Einstein demostró que todo es re-
lativo”, lo cuál por supuesto es absurdo. Si revisamos los postulados de Einstein, podemos
ver que ambos se refieren a cosas absolutas: las leyes de la fı́sica son absolutas (las mismas
en todo sistema inercial), y la velocidad de la luz es absoluta. De hecho, en la relatividad
siempre se hace énfasis en aquellas cantidades fı́sicas que resultan ser absolutas, es decir
aquellas que son iguales en todo sistema de referencia. La teorı́a quizá deberı́a haberse lla-
mado “teorı́a de la velocidad de la luz absoluta”, lo que desde luego es un nombre mucho
menos elegante y llamativo. Aunque en realidad, como veremos más adelante, la manera
más correcta de referirse a esta teorı́a es simplemente decir que estamos trabajando en el
espacio–tiempo de Minkowski.
t v<1
Haz de luz (v = 1)
Evento
v>1
45o
x
Figura 1.1: Diagrama espacio–tiempo. Un punto en el diagrama se denomina un evento. Lı́neas
rectas corresponden a la lı́nea universo de objetos que se mueven a velocidad constante. La luz
(fotones) se mueve en lı́neas rectas a 45 .
11
De aquı́ en adelante usaremos la palabra “fotón” simplemente para referirnos a un haz de luz.
La naturaleza cuántica de la luz no es algo que nos preocupe tanto como las trayectorias de la luz en
el espacio–tiempo, aunque sı́ tendremos algo que decir más adelante sobre algunas propiedades de los
fotones.
10 CAPÍTULO 1. RELATIVIDAD ESPECIAL
t
Cono de luz
Evento (t,x,y,z)
x
Línea universo
Figura 1.2: Lı́nea universo de un objeto que se mueve con velocidad variable siempre menor que
la de la luz, y cono de luz asociado al evento (t, x, y, z). Nótese que el cono de luz se asocia a un
evento especı́fico, y no a toda la lı́nea universo.
que llegan desde el pasado hasta ese evento (ver Figura 1.2). Dado que el espacio en el
que vivimos tiene tres dimensiones, en realidad de trata de un hiper–cono en un espacio–
tiempo de cuatro dimensiones, pero eso no se puede representar de manera gráfica.
Antes de concluir esta sección vamos a introducir algo de notación. Las coordenadas
de un evento en el espacio–tiempo de cuatro dimensiones se denotarán por (t, x, y, z),
o de manera enteramente equivalente usando superı́ndices como (x0 , x1 , x2 , x3 ). Enfati-
zamos que se trata de superı́ndices y no de potencias, y por convención tomaremos el
ı́ndice 0 como el correspondiente a la coordenada temporal (la razón por la que usamos
superı́ndices y no subı́ndices quedará clara más adelante). Cuando queramos referirnos
a una coordenada arbitraria utilizaremos ı́ndices griegos x↵ , donde ↵ puede tomar cual-
quiera de los cuatro valores (0, 1, 2, 3). En algunas ocasiones necesitaremos referirnos solo
a las coordenadas espaciales, en cuyo caso utilizaremos ı́ndices latinos xi , donde ahora i
solo puede tomar los valores (1, 2, 3).12
12
Esta convención es muy común hoy en dı́a, pero de ninguna manera es universal. Por ejemplo,
algunos autores toman la coordenada temporal como t = x4 , por lo que las coordenadas de un evento
son (x1 , x2 , x3 , x4 ). Otros pueden utilizar ı́ndices latinos mayúsculos para las coordenadas en el espacio–
tiempo, y minúsculos para las coordenadas espaciales. Siempre es importante revisar las convenciones
que se utilizan en las distintas referencias.
1.5. LAS TRANSFORMACIONES DE LORENTZ 11
t̄ = ax + bt , (1.5.6)
x̄ = bx + at . (1.5.7)
Ahora, dado que por construcción el sistema Ō se mueve respecto a O con velocidad
v, esto implica que la posición del origen x̄ = 0 debe corresponder a la lı́nea x = vt. A
partir de esta observación encontramos que a = bv, y la transformación toma la forma:
t̄ = b (t vx) , (1.5.8)
x̄ = b (x vt) . (1.5.9)
Nótese que ahora tenemos solo una última constante por determinar. Por otro lado, es ya
claro que estas transformaciones no se reducen a las de Galileo para ningún valor de b.
Para encontrar el valor de la constante b invertimos la transformación. Un poco de
álgebra nos lleva a:
1
t= (t̄ + vx̄) , (1.5.10)
b(1 v2)
1
x= (x̄ + v t̄) . (1.5.11)
b(1 v2)
Pero dado que ambos sistemas de referencia son igualmente válidos, las transformaciones
de uno a otro deben tener la misma forma salvo por el signo de la velocidad v. Esto
implica entonces que:
1 1
b= 2
=) b2 = , (1.5.12)
b(1 v ) 1 v2
y finalmente:
1
b= p ⌘ , (1.5.13)
1 v2
p
donde hemos definido el llamado factor de Lorentz como := 1/ 1 v 2 . La transforma-
ción final de coordenadas toma la forma final:
t̄ = (t vx) , (1.5.14)
x̄ = (x vt) , (1.5.15)
ȳ = y , (1.5.16)
z̄ = z , (1.5.17)
14 CAPÍTULO 1. RELATIVIDAD ESPECIAL
x̄ = (x vt) , (1.5.18)
t̄ = t vx/c2 , (1.5.19)
p
con = 1/ 1 v 2 /c2 . Si asumimos ahora que la velocidad v es muy baja comparada con
la velocidad de la luz |v| ⌧ c, o equivalentemente si tomamos el lı́mite cuando la velocidad
de la luz c se hace infinita, encontramos que = 1, y las transformaciones anteriores se
reducen a las de Galileo.15
t = vx . (1.6.2)
Esta es de nuevo la ecuación de una lı́nea recta que pasa por el origen, pero ahora con
pendiente v, y claramente no coincide con el eje x para v 6= 0. Es decir, todos aquellos
eventos que ocurren a un mismo tiempo t̄ = 0 y por lo tanto son simultáneos en el
sistema Ō, ocurren a distintos tiempos t y por lo tanto no son simultáneos en el sistema
O. Concluimos entonces que la simultaneidad no es absoluta, y su definición depende del
sistema de referencia en que estemos trabajando. Galileo y Newton no habrı́an estado de
acuerdo con esto, pero nos obligan las transformaciones de Lorentz.
La Figura 1.3 muestra en el panel izquierdo la posición de los ejes x̄ y t̄ vistos en
el sistema de referencia O (asumiendo v > 0), ası́ como las lı́neas con x̄ y t̄ constantes.
1.6. SIMULTANEIDAD Y CAUSALIDAD 17
- -
t t t t
q q
-
x
q -
x x
q
x
Figura 1.3: Ante una transformación de Lorentz los ejes coordenados rotan un ángulo
✓ = arctan(v) en direcciones opuestas. Panel izquierdo: sistema Ō visto desde O (asumiendo
v > 0). Panel derecho: sistema O visto desde Ō.
-
t=0
A B t=0
-
t=0
Figura 1.4: Eventos A y B vistos desde tres sistemas de referencia inerciales. En el sistema
¯ tenemos
O tenemos tA = tB , en el sistema Ō tenemos t̄A > t̄B , y finalmente en el sistema Ō
¯ ¯
t̄A < t̄B .
D difiere a lo más en un tiempo t = D/c. Para el caso de la Tierra, por ejemplo, ese
tiempo resulta ser de solo 4 centésimas de segundo de un extremo al otro del planeta.
Incluso en el caso de la distancia a la Luna, la diferencia es de apenas poco más de un
segundo, por lo que no hay gran ambigüedad en el concepto de simultaneidad en el sistema
Tierra–Luna.
Cuando hablamos de distancias astronómicas, sin embargo, la ambigüedad en definir
la simultaneidad puede ser desde unos años para las estrellas cercanas, hasta muchos
millones de años cuando consideramos otras galaxias. Vemos ası́ que en realidad no tiene
ningún sentido preguntarse algo como: ¿qué estará pasando en la galaxia de Andrómeda en
este momento? Andrómeda está a dos millones de años luz de nosotros. A esa distancia
incluso alguien moviéndose en un avión a 1000 km/hora no estarı́a de acuerdo con la
definición de simultaneidad de una persona en reposo en el suelo por varios años.
Lo que realmente nos interesa no es si dos eventos ocurren “a un mismo tiempo”,
sino si puede existir o no una relación causal entre ellos. Y aquı́ aparentemente tenemos
un problema. Consideremos de momento tres sistemas de referencia inerciales: el sistema
del laboratorio O, un sistema Ō que se mueve respecto a O con velocidad v > 0, y un
tercer sistema Ō¯ que se mueve respecto a O con velocidad v. Y supongamos ahora que
tenemos dos eventos A y B que ocurren a un mismo tiempo t = 0 en el sistema O, como
se muestra en la Figura 1.4. De la Figura vemos claramente que en el sistema O se cumple
tA = tB = 0, por lo que ambos eventos son simultáneos. Por otro lado, para el sistema Ō
tenemos t̄A > 0 y t̄B < 0, por lo que en este sistema los eventos no son simultáneos, y B
¯ tenemos t̄¯ < 0 y t̄¯ > 0, por lo que en
ocurrió antes que A. Finalmente, en el sistema Ō A B
este sistema los eventos tampoco son simultáneos, pero ahora A ocurrió antes que B.
1.7. INVARIANCIA DEL INTERVALO 19
¿Quién tiene la razón? ¿Cuál evento ocurrió primero? La respuesta es que todos tie-
nen razón, y el orden temporal de los eventos A y B no esta bien definido, es cuestión de
convención. Pero, si el orden temporal de dos eventos no está bien definido, ¿no tenemos
ahora un problema potencial con la causalidad? La respuesta es que no, siempre y cuando
podamos garantizar que los eventos A y B no tienen relación causal. ¿Y cómo lo garanti-
zamos? Es aquı́ donde entra el cono de luz. Si dos eventos están dentro de sus respectivos
conos de luz (o sobre las fronteras de dichos conos), entonces todos los sistemas inerciales
estarán de acuerdo en el orden temporal de ambos eventos, por lo que en principio puede
existir una relación causal entre ellos (ver Ejercicio 1.3). Si, por el contrario, los eventos
están fuera de sus conos de luz, el orden temporal no está definido y dependerá del siste-
ma de referencia, por lo que no puede haber una relación causal entre ellos. Esta relación
siempre es recı́proca: si el evento A está dentro del cono de luz futuro (pasado) de B,
entonces B estará dentro del cono de luz pasado (futuro) de A.
Recordemos que el cono de luz es absoluto debido a que la velocidad de la luz es
absoluta. Todos los sistemas inerciales están de acuerdo en cuál es el cono de luz de
un evento dado. El cono de luz es la única estructura absoluta que podemos usar para
definir la causalidad. La conclusión es entonces la siguiente: si queremos tener relaciones
de causalidad bien definidas, donde las causas siempre ocurran antes que los efectos en
todo sistema de referencia, entonces debemos restringir todas las interacciones fı́sicas al
cono de luz. Dicho de otra forma, para rescatar la causalidad es necesario exigir que
ningún tipo de interacción fı́sica se propague más rápido que la luz. En particular ningún
objeto puede viajar más rápido que la luz, porque de hacerlo habrı́a sistemas de referencia
perfectamente válidos donde dicho objeto llegarı́a a su destino antes de haber salido. Esta
es la razón principal por la que, de acuerdo a la relatividad, nada puede viajar más rápido
que la luz: destruirı́a las relaciones de causalidad. La Figura 1.5 muestra las posibles
relaciones causales entre distintos eventos.
A
C
Figura 1.5: Posibles relaciones causales entre eventos. El evento A y el evento B pueden tener
una relación causal pues están dentro de sus respectivos conos de luz. Lo mismo el evento B y
el evento C. Pero el evento A y el evento C no pueden tener relación casual al estar fuera de sus
conos de luz.
“distancia” invariante [83].16 Inicialmente Einstein vio este nuevo desarrollo como algo
abstracto e innecesario, pero poco a poco se convenció de que en realidad esta nueva
visión era fundamental, y resultó crucial para el posterior desarrollo de la relatividad
general.17
Para entender el resultado de Minkowski partimos de la siguiente definición: dados dos
eventos A y B con coordenadas (tA , xA , yA , zA ) y (tB , xB , yB , zB ), definimos el intervalo
de Minkowski como:
s2AB := t 2 + x2 + y 2 + z 2 , (1.7.1)
donde tomamos t = tA tB , y lo mismo para las otras coordenadas. Nótese que esta
definición es muy similar a la distancia euclidiana en 4 dimensiones (esencialmente el
teorema de Pitágoras), salvo por el signo del término t2 . Definido ası́, el intervalo entre
dos eventos distintos puede ser positivo, negativo, o incluso cero, por lo que s2 no es
16
Minkowski mostró sus resultados originalmente en una conferencia durante la reunión anual de
“Filósofos Naturales” (Naturforscher) en la ciudad de Colonia, Alemania, en septiembre de 1908. Su frase
inicial en dicha conferencia se ha vuelto famosa: “La noción de espacio y tiempo que deseo presentarles
proviene del campo de la fı́sica experimental. Es de ahı́ de donde obtiene su fortaleza. Su tendencia es
radical. Desde ahora, el espacio en sı́ mismo, y el tiempo en sı́ mismo, están destinados a convertirse en
meras sombras, y solo una especie de unión entre ellos mantendrá una realidad independiente”.
17
Einstein declaró que “desde que los matemáticos invadieron la teorı́a de la relatividad, ya ni yo
mismo la entiendo”.
1.7. INVARIANCIA DEL INTERVALO 21
necesariamente el cuadrado de un número real y se debe entender más bien como una
forma cuadrática (cuando necesitemos sacar la raı́z tomaremos el valor absoluto).
Si calculamos ahora el valor del intervalo en el sistema Ō, y usamos las transformaciones
de Lorentz, obtenemos:
B C
D
A
Figura 1.6: Tres tipos de intervalos. El intervalo entre los eventos A y B es temporaloide, entre
A y C es nulo, y entre A y D es espacialoide.
La Figura 1.6 muestra ejemplos de los tres tipos de intervalos. La clasificación de los
intervalos está ı́ntimamente relacionada con los conos de luz. Si dos eventos están dentro
de sus conos de luz su separación es temporaloide, su están fuera de sus conos de luz su
separación es espacialoide, y si están sobre la frontera de sus conos de luz su separación
es nula. De nuestra discusión sobre la causalidad vemos entonces que dos eventos solo
pueden tener una relación causal si su separación es temporaloide o nula.
Como veremos más adelante, en la relatividad ni las distancias espaciales, ni los inter-
valos de tiempo, son invariantes ante transformaciones de Lorentz. Aún más, el hecho de
que la simultaneidad no sea absoluta implica que ni siquiera podemos definir el “espacio
tridimensional” a un tiempo constante de manera absoluta: cada sistema de referencia
tiene su propia definición de qué es el “espacio”. Ante una transformación de Lorentz el
espacio y el tiempo se mezclan. Pero el intervalo de Minkowski permanece invariante. Es
precisamente por esto que hablamos del espacio–tiempo de cuatro dimensiones como un
concepto unificado, y ya no de espacio y tiempo por separado.
Dado que el intervalo de Minkowski nos permite medir distancias en el espacio–tiempo,
decimos que el espacio–tiempo de la relatividad es un espacio métrico. Es importante re-
cordar que en la fı́sica newtoniana no tenemos una medida de distancia en cuatro dimen-
siones, tenemos intervalos de tiempo (absolutos) por un lado, y distancias tridimensionales
(relativas) por otro.19 La existencia de una distancia (o pseudo–distancia) absoluta en el
19
La distancia tridimensional entre dos eventos no es absoluta en la fı́sica newtoniana. Por ejemplo,
si consideramos dos eventos que ocurren en el mismo lugar, pero a distintos tiempos, en un sistema de
1.7. INVARIANCIA DEL INTERVALO 23
Antes de terminar esta sección vamos a introducir un poco más de notación. Primero,
definimos la siguiente matriz 4 ⇥ 4:
0 1
1 0 0 0
B 0 1 0 0 C
⌘ := B
@ 0 0 1 0 A.
C (1.7.4)
0 0 0 1
A esta última expresión se le conoce como el elemento de lı́nea, pues nos permite calcular
distancias infinitesimales e integrarlas para calcular la longitud de una curva arbitraria
(veremos ejemplos de esto más adelante).
La matriz anterior tiene una estructura que recuerda a la de las rotaciones rı́gidas en el
plano. En efecto, si consideramos el plano euclidiano (x, y), una rotación rı́gida por un
ángulo está dada por la matriz:
✓ ◆
cos( ) sin( )
R := . (1.8.4)
sin( ) cos( )
Esta matriz tiene la misma estructura que la transformación de Lorentz, salvo por un
signo, y por el hecho de que en la transformación de Lorentz aparecen funciones trigo-
nométricas hiperbólicas. El signo distinto se debe simplemente a que en el caso de las
transformaciones de Lorentz los ejes t y x rotan en direcciones opuestas. Por otro lado,
el hecho de que aparezcan funciones hiperbólicas nos indica que la rotación es sobre las
hipérbolas dadas por x2 t2 = ±a2 (con a constante), y no sobre los cı́rculos x2 + y 2 = a2
como en el caso del plano euclidiano.
Las hipérbolas x2 t2 = ±a2 se conocen como las hipérbolas invariantes, debido a
que el intervalo invariante entre un evento arbitrario (t, x) y el origen es precisamente
1.9. TIEMPO PROPIO Y DILATACIÓN DEL TIEMPO 25
Las hipérbolas invariantes nos permiten calibrar los ejes coordenados ante una transfor-
mación de Lorentz simplemente arrastrando puntos sobre la hipérbola correspondiente.20
Por ejemplo, ante una transformación de Lorentz inversa ( ! ), el punto (t̄ = 0, x̄ = 1)
que se encuentra a una distancia unitaria espacialoide del origen s̄2 = 1, corresponde al
punto (t = sinh( ), x = cosh( )) sobre la hipérbola unitaria x2 t2 = 1, que también se
encuentra a una distancia unitaria del origen s2 = sinh2 (v) + cosh2 (v) = 1. De la mis-
ma manera, el punto (t̄ = 1, x̄ = 0) que se encuentra a una distancia unitaria temporaloide
del origen s̄2 = 1, corresponde al punto (t = cosh( ), x = sinh( )) sobre la hipérbo-
la unitaria x2 t2 = 1, que también se encuentra a una distancia unitaria del origen
s2 = cosh2 (v) + sinh2 (v) = 1. Estos conceptos están ilustrados en la Figura 1.7.
_
B x
q
Figura 1.7: Hipérbolas invariantes y calibración de los ejes. El evento A tiene coordenadas
(t̄ = 1, x̄ = 0) y (t = cosh( ), x = sinh( )), mientras que el evento B tiene coordenadas
(t̄ = 0, x̄ = 1) y (t = sinh( ), x = cosh( )). Ambos están sobre hipérbolas invariantes unitarias.
espacialoide el reloj tendrı́a que moverse más rápido que la luz para pasar por ambos
eventos. Consideremos ahora un sistema inercial Ō que se mueve con el reloj, de manera
que el reloj está en reposo respecto a ese sistema. Dado que el reloj está en reposo en Ō,
tenemos evidentemente que dx̄i = 0, por lo que el intervalo invariante se reduce a:
de donde encontramos:
1/2
d⌧ 2 = ds2 =) d⌧ = ds2 . (1.9.2)
Es decir, el tiempo propio entre dos eventos con separación temporaloide no es más que
la raı́z cuadrada de (menos) el intervalo de Minkowski. Para separaciones espacialoides
tenemos ds2 > 0, por lo que el tiempo propio no tiene sentido pues resultarı́a ser imagi-
nario. Por otro lado, para separaciones nulas el tiempo propio resulta ser igual a cero, lo
que indica que para la luz el tiempo no transcurre.
Dado que hemos definido el tiempo propio de manera infinitesimal, podemos ahora
imaginarnos un reloj que se mueve de manera que su velocidad no sea constante. Como el
intervalo de Minkowski es la medida de distancia invariante en el espacio–tiempo, vemos
que el tiempo propio total en realidad no es otra cosa que la longitud de arco de la lı́nea
1.9. TIEMPO PROPIO Y DILATACIÓN DEL TIEMPO 27
universo de este reloj. Podemos ahora pensar en esa lı́nea universo como una curva en el
espacio–tiempo parametrizada por un parámetro real , de manera que está descrita de la
forma x↵ ( ). El tiempo propio a lo largo de la curva estará dado entonces por la integral:
Z ✓ ◆ Z " 1/2
# Z 1/2
d⌧ ( ds2 ) dx↵ dx
⌧= d = d = ⌘↵ d . (1.9.3)
d d d d
Pero en el sistema del reloj tenemos dx̄ = 0 y dt = d⌧ (por definición), de manera que:
Esto implica que el tiempo medido en el sistema del laboratorio siempre es mayor al
tiempo medido por el reloj en movimiento. En otras palabras, el reloj en movimiento
se atrasa visto desde el sistema del laboratorio. Esto se conoce como la dilatación del
tiempo.22 De hecho, podemos ir más allá. Como el reloj se mueve respecto al sistema del
laboratorio con velocidad v, tenemos dx = vdt, y sustituyendo en la expresión anterior
encontramos:
1
1 v 2 dt2 = d⌧ 2 =) dt2 = d⌧ 2 , (1.9.6)
(1 v 2 )
y finalmente:
dt = d⌧ , (1.9.7)
p
con = 1/ 1 v 2 el factor de Lorentz. Nótese que el factor de Lorentz es igual a 1 para
v = 0, y crece hasta volverse infinito para v = 1, de manera que para |v| > 0 siempre es
mayor que 1 por lo que dt siempre es mayor (o igual para v = 0) que d⌧ .
Aquı́ es muy importante enfatizar que el efecto de dilatación del tiempo es totalmente
simétrico. Si un reloj en reposo en el sistema Ō se atrasa visto desde el sistema O, un reloj
en reposo en el sistema O también se atrasa (¡no se adelanta!) visto desde el sistema Ō.
¿Cómo puede ser esto? ¿Qué no es contradictorio? La respuesta es que no hay ninguna
22
En su derivación de las transformaciones de coordenadas Lorentz habı́a ya encontrado la transforma-
ción de t y hablaba del “tiempo local”, pero lo entendı́a como un artificio matemático y no consideró la
posibilidad de que fuera el tiempo percibido por un observador en movimiento.
28 CAPÍTULO 1. RELATIVIDAD ESPECIAL
contradicción, y todo tiene que ver con qué es lo que estamos comparando con qué. Cuando
en un sistema de referencia especı́fico O comparamos un reloj en movimiento con relojes
en reposo, lo hacemos usando nuestras propias superficies de simultaneidad. Mientras que
los relojes que se mueven respecto a nosotros hacen las comparaciones usando sus propias
superficies de simultaneidad. Esto es más fácil de entender con un diagrama espacio–
tiempo. La Figura 1.8 muestra la lı́nea universo de dos relojes, uno que se encuentra en
reposo en el sistema O (reloj 1), y otro que se mueve respecto a este a velocidad constante v
(reloj 2). Hemos exagerado los ángulos para hacer más claro el diagrama. Por simplicidad
asumimos que las trayectorias de ambos relojes se cruzan en el origen. Los eventos A (el
origen) y B están sobre la lı́nea universo del reloj 2, mientras que los eventos A, C y D se
encuentran sobre la lı́nea universo del reloj 1. El evento C es simultáneo con B de acuerdo
al sistema de referencia O del reloj 1, mientras que el evento D es simultáneo con B de
acuerdo al sistema de referencia Ō del reloj 2.
En el sistema de referencia O comparamos el tiempo propio del reloj en reposo (reloj
1), con el tiempo propio del reloj en movimiento (reloj 2), utilizando las superficies de
simultaneidad de O, y concluimos que ⌧AC > ⌧AB , por lo que el reloj en movimiento
respecto a O se atrasó. Por otro lado, en el sistema Ō se debe comparar el tiempo propio
del reloj en reposo en ese sistema (reloj 2), con el tiempo propio del reloj que se mueve
respecto a ese sistema (reloj 1), usando las superficies de simultaneidad de Ō, y concluimos
que ⌧AB > ⌧AD , por lo que de nuevo el reloj que se mueve respecto a Ō se atrasó. Es
decir, ambos sistemas ven que el reloj que se mueve respecto a ellos es el que se atrasa,
pero están haciendo comparaciones utilizando superficies de simultaneidad distintas. En
realidad no hay ninguna contradicción, pues lo que hemos encontrado es simplemente
que ⌧AC > ⌧AB > ⌧AD , lo que puede verificarse fácilmente calculando los intervalos
invariantes correspondientes.
Aquı́ hay que tener mucho cuidado. Al hacer diagramas espacio–tiempo y comparar in-
tervalos invariantes es muy importante no dejarse guiar por las distancias euclidianas. Los
eventos (A, B, C) forman un triángulo rectángulo, y en términos de distancias euclidianas
vemos claramente que dAC < dAB (el cateto es más corto que la hipotenusa). Pero en el
espacio–tiempo no debemos usar distancias euclidianas sino el intervalo de Minkowski, y
en términos de ese intervalo invariante encontramos ⌧AC > ⌧AB .
t _
t
Trajectoria del reloj 2
Trajectoria del reloj 1
_
x
C
D B
A
x
Figura 1.8: Lı́nea universo de dos relojes. El reloj 1 está en reposo en el sistema O, mientras que
el reloj 2 está en reposo en el sistema Ō que se mueve respecto a O. Ambos sistemas ven que el
reloj que se mueve respecto a ellos se atrasa, pero las comparaciones se hacen usando distintas
superficies de simultaneidad por lo que no hay contradicción.
Ō el sistema inercial en reposo del reloj 1. En este sistema el reloj 2 siempre está en
movimiento, primero se aleja del reloj 1 y luego se acerca de nuevo (por supuesto hay un
momento intermedio donde el reloj 2 está momentáneamente en reposo respecto al reloj 1,
pero esto ocurre solo en un instante de tiempo). Supongamos que en el primer encuentro
los dos relojes marcan la misma hora. Dado que el reloj 2 siempre se mueve respecto al
reloj 1, visto desde el sistema Ō se atrasa durante todo el trayecto, por lo que cuando se
encuentran por segunda ocasión mide un tiempo menor. Es decir:
Z B Z B
d⌧1 > d⌧2 . (1.9.8)
A A
t
B
Reloj 2
Reloj 1
x
Figura 1.9: Dos relojes siguen trayectorias distintas para llegar del evento A al evento B. El
reloj 1 se mueve a velocidad constante, mientras que el reloj 2 acelera y desacelera. El reloj 2
mide un tiempo menor entre los dos eventos.
t
C
E
B
Gemelo 1 Gemelo 2
D
A
Tierra Sirio x
Figura 1.10: Paradoja de los gemelos. El gemelo 1 se queda en la Tierra y el gemelo 2 hace un
viaje de ida y vuelta a Sirio.
puesta es que el gemelo 2 no estuvo siempre en un mismo sistema inercial, sino en dos
sistemas inerciales distintos, por lo que en cada segmento está utilizando superficies de
simultaneidad diferentes para hacer la comparación.
En la Figura 1.10 hemos marcado una serie de eventos de interés. Sea O el sistema de
referencia inercial del gemelo 1. El evento A es el inicio del viaje, el evento C el final, y
el evento B es cuando el gemelo 2 llega a Sirio y da la vuelta. Pero hay otros dos eventos
de interés. El evento D es simultáneo con el evento B en el sistema inercial Ō del gemelo
2 mientras viaja a Sirio, mientras que el evento E es simultáneo con B en el sistema
¯ del gemelo 2 a su regreso a la Tierra. ¿Qué mide el gemelo 2
de referencia inercial Ō
en sus sistemas inerciales? Al llegar a Sirio, y antes de dar la vuelta, compara su reloj
con un reloj en la Tierra a lo largo de su superficie de simultaneidad y encuentra que
⌧AB > ⌧AD , por lo que concluye que los relojes en la Tierra se atrasan. En el camino
de regreso compara su reloj con el reloj en la Tierra a lo largo de sus nuevas superficies
de simultaneidad y encuentra ⌧BC > ⌧EC , y de nuevo concluye que los relojes en la
Tierra se atrasan. Al final del viaje entonces puede concluir que:
⌧2 ⌘ ⌧AB + ⌧BC > ⌧AD + ⌧EC . (1.10.1)
Pero crucialmente ⌧1 ⌘ ⌧AC 6= ⌧AD + ⌧EC . ¡Falta tomar en cuenta el segmento
⌧DE ! La relación completa entre los distintos segmentos es entonces:
⌧1 ⌘ ⌧AC > ⌧2 ⌘ ⌧AB + ⌧BC > ⌧AD + ⌧EC , (1.10.2)
y aquı́ no hay ninguna contradicción.
1.10. EL ASUNTO DE LOS GEMELOS 33
¿Cómo es posible que el gemelo 2 perdiera de vista todo el segmento ⌧DE ? No es que
lo haya perdido de vista, es más bien que hizo las mediciones en dos sistemas inerciales muy
distintos con sus respectivas definiciones de simultaneidad. Recordemos, la simultaneidad
es una convención.
Una pregunta quizá más interesante serı́a qué ve el gemelo 2, y no qué mide. Medimos
con nuestras reglas rı́gidas y relojes sincronizados en sistemas inerciales, mientras que
vemos con luz que se propaga por el espacio–tiempo. Esta pregunta es más compleja.
Mientras el gemelo 2 se aleja de la Tierra los rayos de luz que emite el gemelo 1 tardan
más y más en alcanzarlo. Para cuando el gemelo 2 llega a Sirio, 5 años después de acuerdo
a su propio reloj y 10 años después en la Tierra, apenas esta recibiendo la señal que el
gemelo 1 envió 2.4 años después de iniciado el viaje (Sirio está a 8.6 años luz). Entonces
claramente “ve” que el gemelo 1 solo ha envejecido 2.4 años. Pero al regresar todo se
invierte, y alcanza cada vez más y más rápido los rayos de luz que vienen desde la Tierra,
de manera que en los 5 años que le toma volver ve a su gemelo envejecer aceleradamente
otros 17.6 años, para un total de 20 años contra los 10 que él ha envejecido. Cuidado, ver
y medir son cosas distintas, ver es un fenómeno óptico, medir es simple cinemática.
Pero en toda esta discusión quizá estamos perdiendo de vista lo más importante.
Al definir un sistema inercial utilizamos relojes sincronizados en todo el espacio para
tener una noción de simultaneidad. Pero está claro que no tenemos relojes sincronizados
moviéndose continuamente al 86 % de la velocidad de la luz de aquı́ a Sirio, y en ambas
direcciones, distribuidos a lo largo de todo el trayecto. Dada esta situación, el hablar de
superficies de simultaneidad para el gemelo 2, aunque perfectamente consistente, resulta
ser algo meramente académico y no particularmente útil. Cuando consideramos distancias
astronómicas la noción de simultaneidad en realidad deja de tener mucha utilidad. Lo
importante es que ambos gemelos partieron de un mismo evento, siguieron trayectorias
distintas en el espacio–tiempo hasta volver a encontrarse, y como consecuencia el tiempo
propio total que experimentaron es distinto.
Aquı́ vale la pena eliminar otra duda que surge con frecuencia. Es común encontrar un
argumento que afirma que la asimetrı́a entre ambos gemelos se debe a que uno se acelera
y el otro no. Esto no es correcto. La aceleración en realidad no interviene en el fenómeno,
salvo en el hecho trivial de que el gemelo 2 cambio de dirección, por lo que evidentemente
se aceleró. Lo crucial, de nuevo, es que siguieron trayectorias distintas. Esto se puede ver
fácilmente si consideramos una pequeña variación en el problema. Asumimos ahora que
el gemelo 1 también se acelera en la misma dirección que el gemelo 2, solo que inicia el
viaje tiempo después, se arrepiente rápidamente, y regresa a la Tierra mucho antes que
su hermano. Las trayectorias de ambos gemelos en el espacio–tiempo se pueden ver en la
Figura 1.11. En esta variación del problema ambos gemelos experimentan exactamente las
34 CAPÍTULO 1. RELATIVIDAD ESPECIAL
Gemelo 2
Gemelo 1
Figura 1.11: Una variación en la trayectoria del gemelo 1. Ahora ambos gemelos experimentan
exactamente las mismas aceleraciones, pero aún ası́ el gemelo 2 experimenta un tiempo propio
mucho menor.
mismas aceleraciones aunque en diferentes momentos. Aún ası́, es fácil convencerse que el
gemelo 2 experimenta un tiempo propio mucho menor que el gemelo 1. De hecho, podemos
hacer que el gemelo 1 se arrepienta tan pronto que su tiempo propio sea prácticamente el
mismo que en la versión original del problema (solo ligeramente menor).25
¿Es la dilatación del tiempo un fenómeno real? Sı́, y ha sido verificado experimental-
mente. Aún cuando no tenemos la tecnologı́a para enviar astronautas a Sirio al 86 % de la
velocidad de la luz, sı́ podemos acelerar partı́culas elementales a velocidades mucho más
cercanas a c. Muchas de estas partı́culas son inestables, y decaen después de un cierto
tiempo. Por ejemplo, un neutrón libre en reposo tiene una vida media de unos 880 se-
gundos (poco menos de 15 minutos), mientras que un muón tiene una vida media de solo
2.2 ⇥ 10 6 segundos.26 Cuando las partı́culas se aceleran a velocidades cercanas a la de la
luz estas vidas medias crecen, sus “relojes internos” se atrasan, de manera completamente
consistente con la predicción de la relatividad. Los muones, por ejemplo, fueron descu-
biertos en 1936 estudiando los rayos cósmicos. Dado que su vida media es muy corta en
realidad no nos llegan del espacio sino que se producen en las colisiones de protones (que
sı́ vienen del espacio) con las moléculas de la atmósfera terrestre, a decenas de kilómetros
25
Este argumento está tomado directamente de Maudlin [80].
26
Un muón es una versión inestable y mucho más masiva del electrón, y decae precisamente en un
electrón, un neutrino y un antineutrino.
1.11. CONTRACCIÓN DE LORENTZ–FITZGERALD 35
de altura. No es difı́cil ver que, incluso si se mueven casi a la velocidad de la luz, les
toma aproximadamente ⇠ 10 4 segundos llegar a la superficie terrestre, unas 50 veces
su vida media. Es decir, no deberı́a llegar ninguno. Pero llegan en grandes cantidades: la
dilatación del tiempo hace que su vida media se alargue.
a) t - b)
t
C
Trayectoria de la barra
L q t
c
- l d
x
L A B D
q
l x
¿Cómo relacionamos L con l? Empezamos por notar que dado que el evento C está so-
bre el eje x̄ por construcción, tenemos t̄C = 0 y x̄C = L. Las transformaciones de Lorentz
(inversas) implican entonces que las coordenadas de C en el sistema O son:
xC = L , tC = vL , (1.11.1)
p
con = 1 v 2 el factor de Lorentz. Por otro lado tenemos l = xB = xD d = L d,
donde usamos el hecho de que xD = xC = L.
Necesitamos ahora encontrar el valor de d. De la figura vemos que los eventos BCD
forman un triángulo rectángulo. Notemos que el ángulo ✓ es el ángulo entre la vertical
y una lı́nea paralela al eje t̄, por lo que debe estar dado por ✓ = arctan(v). Tenemos
entonces:27
d/tC = tan ✓ = v =) d = vtC = v 2 L . (1.11.2)
Encontramos entonces para l:
l= L v2L = L 1 v 2 = L/ 2
, (1.11.3)
y finalmente:
l = L/ . (1.11.4)
27
Una duda común es el por qué podemos utilizar trigonometrı́a estándar si estamos en el espacio–
tiempo de Minkowski. La razón es que para definir el ángulo ✓ no usamos intervalos invariantes, sino
simplemente las coordenadas cartesianas (t, x). En particular, en el cálculo que acabamos de hacer nunca
usamos la longitud de la hipotenusa del triángulo BCD, que podrı́a parecer problemática, sino simple-
mente los catetos cuyas longitudes euclidianas corresponden directamente a las coordenadas x y t.
1.11. CONTRACCIÓN DE LORENTZ–FITZGERALD 37
Dado que para v 6= 0 el factor de Lorentz es tal que > 1, vemos que l es siempre
menor que L, es decir la barra se contrae en la dirección de movimiento.28 Esta es la
famosa contracción de Lorentz–Fitzgerald (aunque por simplicidad de ahora en adelante
la llamaremos simplemente la contracción de Lorentz).
¿Es la contracción de Lorentz un efecto real? Es decir, ¿la barra se contrae, o solo se
“ve” contraı́da? La respuesta es que el efecto es real, la barra sı́ se contrae (ver siguiente
sección). La contracción de Lorentz viene directamente de la relatividad de la simultanei-
dad. En ese sentido es un efecto de proyección, ya que al pasar de un sistema de referencia
a otro rotamos los ejes coordenados y ya no estamos de acuerdo en quién es el “espacio”
sobre el cuál debemos medir la longitud del objeto. Pero no es de ninguna manera una
simple “ilusión óptica”.
De hecho, el efecto óptico es muy distinto, y un objeto que se mueve a velocidades
cercanas a la de la luz no se “ve” contraı́do (aunque sı́ lo está), sino que se ve rotado un
ángulo ' = arcsin(v). Para entender este efecto observemos con cuidado la Figura 1.13.
El panel a) muestra un cubo en reposo rotado un ángulo ' (el observador está abajo),
y el panel b) muestra la imagen que ve el observador, donde hemos coloreado el lado B
para mayor claridad. Si el cubo tiene lado L y el ángulo de rotación es ', la proyección
del lado A que ve el observador tiene una longitud de LA = L cos ', y la proyección del
lado B una longitud de LB = L sin '. Nótesepque en general LA + LB > L, por ejemplo si
tomamos ' = 45 encontramos LA + LB = 2L, lo que no es de extrañar pues estamos
viendo el cubo a lo largo de toda la diagonal.
Por otro lado, los paneles c) y d) muestran la situación para un cubo no rotado que se
mueve hacia la derecha con velocidad v > 0. En el panel c) vemos aquellos rayos de luz
que llegan al observador a un mismo tiempo en el momento en que el cubo está frente a
él. Es claro que todos los rayos de luz del lado A alcanzan al observador simultáneamente.
Ahora, si el cubo estuviera en reposo el observador solo podrı́a ver el lado A y no el lado
B ya que el cubo mismo le estorbarı́a, pero dado que el cubo se está moviendo de hecho
sı́ puede ver el lado B: los rayos que salieron un poco antes desde el lado B lo alcanzan
pues el cubo se movió y ya no estorba. En otras palabras, cuando el cubo está justo frente
a él, el observador sı́ alcanza a ver el lado B gracias a la luz que se emitió antes.
¿Qué tan largo se ve cada lado? La luz que sale del extremo más lejano del lado B
debe recorrer una distancia extra igual a L para llegar al observador, y dado que la luz
28
De nuevo hay que tener cuidado con la intuición euclidiana. Si bien es cierto que si la geometrı́a
fuera euclidiana del diagrama verı́amos inmediatamente que l < L, la razón entre ambas distancias no
serı́a la correcta. Podemos usar trigonometrı́a estándar cuando hablamos de coordenadas, pero no cuando
hablamos de longitudes fı́sicas medidas con reglas (o tiempos medidos con relojes). Para eso debemos
usar el intervalo invariante, o de manera equivalente las transformaciones de Lorentz.
38 CAPÍTULO 1. RELATIVIDAD ESPECIAL
a) b)
L
L
B A
A
j
L sin j L cos j
L sin j L cos j
c) d)
v v
B A
A
d Lv L/g
Figura 1.13: El panel a) muestra un cubo en reposo rotado un ángulo ' con el observador en
la parte de abajo, y el panel b) muestra la imagen que ve dicho observador. Los paneles c) y
d) muestran un cubo que no está rotado pero que se mueve con velocidad v > 0. El panel c)
muestra los rayos de luz que llegan al observador a un mismo tiempo, y el panel d) la imagen que
ve. Debido al movimiento del cubo, el observador sı́ alcanza a ver el lado B, y como resultado
el cubo se ve rotado.
1.12. LA BARRA Y EL GRANERO 39
a) Trayectoria b) Trayectoria
Trayectoria -
t del granero
de la barra t de la barra
Trayectoria
B del granero
A A
B
x x-
Figura 1.14: La barra y el granero versión 1: el granero tiene dos puertas. El panel a) muestra
la situación vista desde el sistema de referencia del granero O, y el panel b) muestra la situación
vista desde el sistema de referencia de la barra Ō.
En la primera versión asumimos que el granero tiene dos puertas, una adelante y una
atrás. Inicialmente la puerta trasera está cerrada y la puerta delantera está abierta, y hay
sensores en cada puerta. El sensor en la puerta delantera está programado para cerrar la
puerta en cuanto la barra la cruce por completo, llamemos a esto el evento A. Por otro
lado, el sensor en la puerta trasera está programado para abrir esa puerta en el instante
en que la barra está a punto de chocar con ella, llamaremos a esto el evento B.
La Figura 1.14 muestra un diagrama espacio–tiempo de esta situación. En el panel a)
de la Figura se muestra lo que ocurre desde el punto de vista del sistema de referencia O
donde el granero está en reposo. En el evento A la puerta delantera se cierra y la barra
está completamente contenida dentro del granero. En el evento B, que ocurre después, la
1.12. LA BARRA Y EL GRANERO 41
puerta trasera se abre y la barra puede continuar su camino. Lo importante aquı́ es que
en este sistema de referencia A ocurre antes que B, es decir tA < tB .
El panel b) muestra la misma situación vista desde el punto de vista del sistema Ō
donde la barra está en reposo. En este sistema la barra es más larga que el granero. El
granero se mueve hacia la izquierda y comienza a tragarse a la barra. Cuando la parte
trasera del granero está a punto de chocar con el extremo de la barra la puerta trasera
se abre (evento B). La barra ahora está ensartada en el granero con ambos extremos
salidos, mientras el granero se sigue moviendo a la izquierda. Después de un tiempo la
parte delantera del granero llega al final de la barra y la puerta se puede cerrar (evento
A). Vemos que en este sistema de referencia B ocurre antes que A, es decir t̄B < t̄A .
En ambos sistemas de referencia los eventos A y B ocurren sin ningún problema: una
puerta se cierra cuando la barra ya entró (A), y la otra se abre cuando está a punto de salir
(B). ¡Pero el orden temporal de los eventos A y B se invierte! ¿Es eso un problema? No
lo es siempre y cuando los eventos A y B no puedan tener una relación causal entre ellos,
es decir siempre y cuando su separación sea de tipo espacialoide. En la Figura hemos
marcado también con lı́neas punteadas el cono de luz del evento B en ambos paneles.
Podemos ver claramente que el evento A está fuera del cono de luz de B, por lo que
en efecto la separación entre ambos eventos es espacialoide, y para eventos separados de
manera espacialoide el orden temporal no está bien definido, es cuestión de convención.
Concluimos entonces que no hay ninguna paradoja.
En la segunda versión del problema complicamos un poco las cosas: pedimos que solo
exista la puerta delantera, y sustituimos la puerta trasera por un muro sólido capaz de
detener la barra. El evento B ahora será el momento en que la barra choca con la parte
trasera del granero. La Figura 1.15 muestra un diagrama espacio–tiempo de esta nueva
situación. El panel a) muestra de nuevo el punto de vista del sistema del granero O. En
este sistema las cosas siguen de manera similar al caso anterior. La barra está contraı́da,
entra en el granero y la puerta se cierra en el evento A. Posteriormente la barra choca
con la parte posterior del granero en el evento B y se detiene.
En el panel b) vemos la situación desde el punto de vista del sistema de la barra Ō.
Ahora el evento B ocurre antes, la barra choca con la parte de atrás del granero cuando
su extremo izquierdo aún sigue fuera del granero. ¿Cómo puede cerrarse la puerta? La
respuesta es que, aún cuando en el evento B la parte derecha de la barra ya chocó con el
muro del granero y entonces comienza a ser empujada hacia la izquierda por el granero,
el extremo izquierdo de la barra sigue en reposo pues aún no le ha llegado ninguna señal
que le diga que el choque ya ocurrió y “debe empezar a moverse”. Recordemos que la
velocidad máxima de cualquier interacción fı́sica es la velocidad de la luz. Una onda de
choque se propaga entonces a través de la barra hacia la izquierda, pero lo hace a lo más a
42 CAPÍTULO 1. RELATIVIDAD ESPECIAL
a) b)
Trayectoria -
t del granero t
C
Trayectoria C
B del granero
A Trayectoria A B Trayectoria
de la barra de la barra
x x-
Figura 1.15: La barra y el granero versión 2: el granero tiene una puerta en la parte delantera
y un muro sólido en la parte trasera. El panel a) muestra la situación vista desde el sistema de
referencia del granero O, y el panel b) muestra la situación vista desde el sistema de referencia
de la barra Ō.
la velocidad de la luz (en la práctica seguramente mucho más lento). En la Figura hemos
marcado un tercer evento C, que corresponde a la intersección entre la lı́nea universo del
extremo izquierdo de la barra, y el cono de luz de B. Este es el primer momento en que
el extremo izquierdo de la barra puede recibir el efecto de la colisión con el granero, y
hasta ese momento continuará sin moverse. Pero ahora es claro que, en ambos sistemas
de referencia C ocurre después que A. Esto implica que la puerta se cierra antes de que
el extremo izquierdo de la barra reciba el efecto del choque. Para cuando esto ocurre la
barra ya está comprimida dentro del granero.
¿Qué ocurre después? Eso ya depende de la dinámica del material de la barra, y no es
de gran interés. La barra y granero, que ahora están en reposo en un mismo sistema de
referencia, podrı́an quizá regresar a su longitud propia después de algún proceso elástico,
o la barra podrı́a romperse si no logra soportar la colisión. Lo importante es que la barra
entra al granero y la puerta se cierra, y de nuevo no hay ninguna paradoja. Notemos que
el hecho de que la barra se comprima después de la colisión no es debido a la contracción
de Lorentz, sino al hecho de que la interacción fı́sica entre sus átomos viaja, a lo más, a
la velocidad de la luz. Es algo similar a lo que ocurre en la fila del cine si la persona de
hasta atrás empuja a quién le queda enfrente. No todos se caen a la vez, se van cayendo
uno después de otro debido a que la interacción entre las personas no es instantánea.
Podemos entonces concluir varias cosas a partir del problema de la barra y el gra-
nero. Primero, vemos de nuevo que la relatividad de la simultaneidad implica que el
orden temporal de eventos separados de manera espacialoide no está bien definido, y esto
no representa ninguna contradicción. Por otro lado, de la segunda versión del problema
1.13. COMPOSICIÓN DE VELOCIDADES 43
concluimos que en la relatividad no existen los objetos infinitamente rı́gidos, pues esto
implicarı́a que la interacción entre sus partes es instantánea. En los ejercicios al final del
capı́tulo veremos ejemplos de situaciones donde un objeto no solo se comprime debido a
este fenómeno, sino que incluso se puede doblar.
y finalmente:
u v
ū = . (1.13.3)
1 uv
Esta es la regla de composición de velocidades en relatividad especial (asumiendo movi-
miento solo en el eje x). Notamos de inmediato que la composición de velocidades ya no
es una simple adición.
Hay dos casos lı́mites de interés que vale la pena mencionar. El primero es el caso
cuando ambas velocidades son pequeñas comparadas con la velocidad de la luz, es decir
|u| ⌧ 1 y |v| ⌧ 1. En ese caso tenemos claramente que |uv| ⌧ 1, y la composición de
velocidades se reduce al caso newtoniano. El otro lı́mite es cuando el objeto que estamos
considerando es un fotón (un haz de luz), en cuyo caso tenemos u = 1. Sustituyendo
44 CAPÍTULO 1. RELATIVIDAD ESPECIAL
en (1.13.3) encontramos:
u v 1 v
ū = = =1. (1.13.4)
1 uv 1 v
Esto no es otra cosa que el segundo postulado de Einstein: la velocidad de la luz es la
misma en todo sistema inercial.
temporaloides, y tipo punto silla para separaciones nulas. Y dadas esas lı́neas rectas po-
demos enunciar la ley de la inercia o primera ley de Newton en un lenguaje puramente
geométrico: partı́culas con masa libres de fuerzas externas siguen lı́neas rectas tempora-
loides (geodésicas) en el espacio tiempo, y partı́culas de masa cero (fotones) siguen lı́neas
rectas nulas en el espacio–tiempo. Ninguna interacción fı́sica puede propagarse a lo largo
de trayectorias espacialoides. Además, postulamos que el intervalo ds2 de Minkowski es
empı́ricamente accesible: para separaciones espacialoidespnos proporciona directamente
las mediciones de longitud (lo que miden las reglas) dl = ds2 , y para separaciones tem-
poraloides nos proporciona
p directamente lo que mide un reloj que se mueve a lo largo de
esa trayectoria d⌧ = 2
ds .
Lo que acabamos de describir es el contenido esencial de la relatividad especial, que
como vemos puede expresarse sin recurrir en ningún momento a un sistema de coorde-
nadas. Por supuesto, dada la estructura geométrica del espacio–tiempo de Minkowski,
podemos definir un sistema de referencia inercial como aquel cuyas lı́neas coordenadas
son lı́neas rectas ortogonales en el espacio–tiempo. Definiremos el concepto de ortogonali-
dad en detalle más adelante. De momento basta con decir que para las lı́neas coordenadas
asociadas al tiempo tomamos simplemente un conjunto lı́neas rectas temporaloides pa-
ralelas entre sı́, mientras que para las lı́neas coordenadas espaciales tomamos un sistema
de coordenadas cartesiano en las superficies de simultaneidad asociadas a las lı́neas de
tiempo (ya hemos visto como podemos establecer esas superficies de simultaneidad sin-
cronizando relojes). En este sentido un sistema de coordenadas inerciales es especial en el
espacio–tiempo de Minkowski exactamente de la misma manera que las coordenadas car-
tesianas son especiales en el espacio euclidiano. Pero al igual que en el espacio euclidiano
podemos decidir trabajar en coordenadas no cartesianas (esféricas, cilı́ndricas, etc.), en el
espacio–tiempo de Minkowski podemos trabajar en coordenadas no inerciales. Como ya
hemos mencionado, las coordenadas son simplemente etiquetas.
El hecho de que tengamos un concepto de paralelismo global y podamos construir un
sistema de coordenadas ortogonales indica que formalmente el espacio–tiempo de Min-
kowski es un espacio plano. Cuando lleguemos a la relatividad general veremos que la
gravedad se asocia a una curvatura del espacio–tiempo, por lo que en presencia de un
campo gravitacional ya no es posible tener un sistema inercial global, aunque la estruc-
tura de Minkowski se mantiene de manera local.
32
Se espera que la relatividad general deje de ser válida en la llamada escala de Planck, donde los
fenómenos cuánticos asociados a la naturaleza del espacio–tiempo ya no puedan ser ignorados. Esta
escala se define a partir de las tres constantes más fundamentales de la naturaleza, la velocidad de la luz
c, la constante p
de la gravitación de Newton G, y la constante de Planck
p ~, y corresponde a distancias del
orden de lP = ~G/c3 ⇠ 10 35 m, y tiempos del orden de tP = ~G/c5 ⇠ 10 43 s.
1.15. EJERCICIOS 47
1.15. Ejercicios
1.1. Unidades geométricas. Conversión de unidades geométricas a unidades del sistema
internacional:
a) El eje t̄ del sistema Ō gira en el sentido de las manecillas del reloj un ángulo
✓ = arctan v.
b) El eje x̄ del sistema Ō gira en el sentido inverso el mismo ángulo. Hint: utilice
un rayo de luz que sale del eje t̄ a un tiempo t̄ = T , se refleja en un punto
sobre el eje x̄, y regresa al eje t̄ a un tiempo t̄ = +T . ¿Cómo se ve esto desde
el sistema del laboratorio?
1.3. Orden temporal de eventos I. Considere dos eventos A y B tales que en el sistema
O el evento A ocurre antes que el evento B. Demuestre explı́citamente que:
1.4. Orden temporal de eventos II. Tres eventos A, B y C ocurren en el orden temporal
ABC vistos en el sistema O. Otro observador Ō ve los eventos en el orden CBA.
¿Es posible que un tercer observador vea los eventos en el orden ACB? Justifique
su respuesta con un diagrama espacio–tiempo.
48 CAPÍTULO 1. RELATIVIDAD ESPECIAL
1.5. Ángulo de emisión. Supongamos que un cohete se mueve en la dirección x con velo-
cidad v respecto a la Tierra, y que emite un haz de luz a un ángulo ✓¯ con respecto
a su dirección de propagación medido en su propio sistema de referencia. Muestre
que el ángulo ✓ del haz de luz con respecto al eje x medido desde la Tierra es tal
que:
v + cos ✓¯
cos ✓ =
1 + v cos ✓¯
1.6. Parámetro de velocidad. Si una partı́cula se mueve con velocidad v definimos el
parámetro de velocidad como: ⌘ arctanh(v).
1.9. Barra inclinada II. Un sistema de referencia Ō se mueve respecto a O con velocidad
v > 0 a lo largo del eje x. Una barra en reposo en el sistema Ō tiene un ángulo ✓¯ en
el plano x̄ ȳ con respecto al eje x̄. ¿Cuál es el ángulo respecto al eje x medido en
el sistema O?
1.15. EJERCICIOS 49
1.10. Barra y agujero. Una barra paralela al eje x de longitud propia igual a 1 m se
mueve en la dirección x con velocidad constante vx en el sistema del laboratorio O.
Al mismo tiempo, una placa delgada paralela al plano xy se mueve en la dirección
z (hacia arriba) con velocidad constante uz , también vista desde el laboratorio. La
placa tiene un agujero circular de 1 m de diámetro centrado en el eje z. Las cosas
se sincronizan de tal manera que el centro de la barra llega al origen x = y = z = 0
al mismo tiempo que la placa alcanza el plano z = 0. Visto desde el laboratorio,
la barra esta contraı́da y cabe en el agujero, de manera que la barra pasa a través
del agujero sin problema y sigue su camino mientras la placa sigue subiendo. Pero
desde el sistema de referencia de la barra Ō, el agujero es el que está contraı́do y la
barra no cabe en él. ¿Qué pasa realmente? Resuelva la aparente paradoja y explique
lo que ocurre visto desde el punto de vista del sistema Ō.
1.11. Barra y granero. Una barra de longitud en reposo l se mueve a una velocidad v
hacia un granero de longitud en reposo L.
1.12. Guerra espacial. Dos cohetes de igual longitud en reposo pasan uno junto al otro
moviéndose en direcciones opuestas a velocidades relativistas. El cohete A tiene un
cañón en la cola y lo dispara contra el cohete B en el instante en que la nariz de
A pasa justo frente a la cola de B. Como desde el punto de vista de A el cohete B
esta contraı́do, A espera fallar el tiro. Pero desde el punto de vista de B, A es quién
esta contraı́do, y B piensa que si A le dispara cuando la punta de A esta frente a
la cola de B el tiro no puede fallar. ¿Que pasa realmente? Indique que es lo que no
queda totalmente claro en el planteamiento del problema. Diga cuales son los dos
planteamientos posibles que son consistentes y que ocurre en cada caso.
a) Muestre que la velocidad del objeto (ux̄ , uȳ , uz̄ ) visto desde Ō está dada por:
ux v uy uz
ux̄ = , uȳ = , uz̄ =
1 ux v (1 ux v) (1 ux v)
(1 v 2 )(u2 1)
ū2 1=
(1 ux v)
c) Finalmente, muestre que si |v| < 1 y |u| < 1 entonces |ū| < 1, y que si |u| = 1
entonces |ū| = 1 para toda v.