Nothing Special   »   [go: up one dir, main page]

Física Del Sólido

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 62

Fı́sica del Estado Sólido

Apuntes de clase 2021 - Gustavo Castellano

Introducción
La “fı́sica de la materia condensada” es un campo que está creciendo notoriamente en la actualidad, y está
dedicada al estudio de propiedades fı́sicas macroscópicas y microscópicas de la materia. Casualmente son esas
propiedades las que motivan el desarrollo de esta área, principalmente en virtud de que todo nuestro entorno
está hecho de “materia condensada”. Por ello ha resultado natural preguntarse por qué brillan los metales y nos
parecen frı́os; o por qué el vidrio es transparente; o por qué el agua es un fluido y se siente húmeda; o por qué
la goma es blanda y elástica.
Además, los numerosos avances en las últimas décadas han demostrado su utilidad al momento de fabricar
nuevos materiales o explotar sus propiedades produciendo cambios relevantes en nuestro mundo cotidiano. Por
ejemplo, la comprensión sobre los sólidos ha permitido invenciones que explotan la tecnologı́a de semiconduc-
tores, los que se trasladan a la industria electrónica, y a su vez a las computadoras, telefonı́a móvil, LEDs,
dispositivos de almacenamiento, láseres, etc.
Finalmente, las preguntas que surgen en este ámbito se encuentran entre las más profundas de la fı́sica.
Muchos de los fenómenos estudiados en Mecánica Cuántica o en Fı́sica Estadı́stica se demuestran a través de
estudios de materia condensada. Si bien varias conclusiones que se extraen en esta rama de la fı́sica pueden
aplicarse a lı́quidos o sistemas plásticos, aunque parezca obvio es importante remarcar que la Fı́sica del Estado
Sólido se restringe a sistemas sólidos, donde han sido desarrolladas las teorı́as para que verdaderamente cierren.

1. Metales: Teorı́a de Drude-Sommerfeld (basado en el texto de Ashcroft)

Entre los sólidos, los metales siempre atrajeron la atención de los cientı́ficos: son excelentes conductores de
calor y electricidad, son dúctiles y maleables, y pueden pulirse hasta lograr un llamativo brillo en su superficie.
Uno de los primeros intentos para describir la fenomenologı́a observada es la teorı́a de Drude (1900) para la
conducción metálica. Tras el descubrimiento del electrón en 1897 por J.J. Thomson, Drude intentó utilizar la
teorı́a cinética de los gases para los electrones en la banda de conducción. Para ello los imaginó como esferas
rı́gidas moviéndose libremente en tramos rectos hasta colisionar con otros electrones o las paredes, invirtiendo
un tiempo despreciable en estos choques. La carga negativa de estos electrones se compensa con la de los núcleos
con Za protones, mucho más masivos, que se consideran fijos en el material. Los Z electrones de valencia de
cada átomo por separado son los que conforman la banda de conducción, permaneciendo ligados a los núcleos
los Za −Z electrones restantes. De este modo, si el material de densidad másica ρ ocupa un volumen V , los N
electrones de conducción se distribuirán en una unidad de volumen según (ejercicio)

N Zρ
n= = 6, 0223×1023 ,
V A
donde A es la masa atómica de estos átomos (masa asociada a un mol), y hemos recordando el significado del
número de Avogadro NA = 6, 0223×1023 (moléculas por mol). A presión y temperatura normales, los valores
tı́picos de n en metales es de unos 1022 electrones por cm3 ; por ejemplo, para el Cs (Za = 55) es de 0, 91×1022
electrones por cm3 , mientras que para Be (Za = 4) es de 24, 7×1022 electrones por cm3 .
El volumen especı́fico por electrón V /N suele asociarse a una esfera de radio rs a través de la relación
 1/3
V 1 4π 3 3
= = r ⇒ rs = .
N n 3 s 4πn

Estas distancias medias caracterı́sticas entre electrones son del orden de 1Å.

1.1. Modelo de Drude


Las hipótesis principales en el modelo de Drude son:
2 1 Metales: Teorı́a de Drude-Sommerfeld

a) Entre colisiones, los electrones realizan un “camino libre” sin interactuar ni con otros electrones ni con
los iones fijos en el material. Esta aproximación de electrones independientes es también conocida como
aproximación de electrones libres.
b) Al igual que en la teorı́a cinética, las colisiones son “instantáneas” y se evidencian en cambios repentinos
de velocidad. Drude las imaginó como eventos de dispersión con los iones fijos del metal, y no como en
un gas ideal donde las partı́culas colisionan entre sı́; si bien esta imagen de sucesivos choques con los
iones del material no es muy atinada, esta suposición debe tomarse como algo cualitativo que refleja algún
mecanismo de dispersión. Pronto veremos además que las interacciones entre electrones son realmente
poco importantes.
c) La probabilidad de colisionar por unidad de tiempo es 1/τ , donde el tiempo de relajación τ representa
el intervalo promedio entre colisiones, y se lo considera independiente tanto de la posición como de la
velocidad de los electrones. Esta hipótesis implica que entre los instantes t y t+ dt la probabilidad de que
ocurra una colisión es dt/τ .
d) Los electrones de conducción se termalizan a través de estas colisiones, de modo que inmediatamente
luego de un evento emergen en dirección aleatoria y con una velocidad determinada únicamente por
la temperatura del sitio donde ocurrió la dispersión (y no con el estado de los electrones antes de la
interacción). Como en el caso de un gas ideal, las zonas más calientes están asociadas a velocidades
(promedio) mayores.

Conductividad eléctrica (corriente continua)

Según la ley de Ohm, la corriente eléctrica I que atraviesa un cable se relaciona con la diferencia de potencial
V aplicada entre sus extremos mediante la resistencia R del cable

V =IR.

Esta resistencia solo depende del material y de sus dimensiones, pero no de I o de V . Para independizarnos de
la forma particular del cable utilizamos la resistividad ρ y la densidad de corriente j (carga por unidades de
área y de tiempo), de manera que cuando se aplica un campo eléctrico E en un material se cumple la relación
E = ρ j . En el caso de corriente I uniforme en un cable de longitud L y área transversal A resulta
I V AR AR
j= y E (= |E|) = = j ⇒ ρ= .
A L L L

Cuando en un metal circulan n electrones por unidad de volumen con velocidad media v, la densidad de
corriente j será paralela a v. En un intervalo diferencial dt , cada electrón avanza una longitud v dt (en la
dirección de v) portando una carga −e, de manera que en ese lapso n (v dt) A electrones atraviesan el área
transversal A generándose una densidad de corriente j = −nev. Conviene recalcar que si bien los electrones
pueden moverse en diferentes direcciones, v representa un promedio; por ejemplo si E = 0 entonces v = 0, lo
cual sólo tiene sentido como valor medio. Cuando E 6= 0, el movimiento de los electrones se opone al campo, ya
que las cargas en movimiento son negativas.
Con un campo E aplicado, si en t = 0 un electrón colisionó por última vez y salió con velocidad vo , en
el instante t tendrá una velocidad vo − (eE/m)t. El aporte de vo al transporte de carga es nulo, puesto que
las direcciones están isotropizadas luego de cada interacción, de modo que en el intervalo τ transcurrido (en
promedio) hasta la siguiente colisión la velocidad media será vm = −(eE/m)τ , con lo cual la densidad de
corriente debida al movimiento de los electrones será j = −nevm , es decir

ne2 τ
j= E,
m
de manera que en términos de la conductividad σ ≡ 1/ρ podemos escribir la ley de Ohm

ne2 τ
j = σE identificando σ= . (1)
m
Como la resistividad ρ puede medirse, esta última relación permite estimar el tiempo de relajación como
τ = m/(ρne2 ). A temperatura ambiente resultan valores τ ∼ 10−15 -10−14 s. Para ver cuán razonables son estos
resultados, conviene evaluar la magnitud asociada al “camino libre medio” (distancia media entre colisiones)
ℓ = vo τ , donde vo es la velocidad media de los electrones. Para ello recuperamos de un gas ideal la relación
mvo2 /2 = (3/2)kB T , donde kB = 1, 38 × 10−16 erg/K es la constante de Boltzmann; entonces, a temperatura
1.1 Modelo de Drude 3

ambiente tenemos valores tı́picos de vo ∼ 107 cm/s, con lo cual ℓ ∼1 Å -10 Å, que resulta similar al radio rs de
las esferas mencionadas más arriba. No obstante, como veremos pronto los valores estimados para vo resultan
demasiado pequeños (1 orden de magnitud), y por lo tanto los τ para bajas temperaturas resultan 10 veces
mayores que a temperatura ambiente, a pesar de que vo deberı́a ser independiente de la temperatura: esto
hace que a bajas temperaturas ℓ ∼ 1000 Å, que representa 1000 veces el espaciamiento tı́pico entre iones, lo que
constituye una evidente falla en el modelo de Drude.
A pesar de los defectos mencionados, ciertas estimaciones realizadas mediante este modelo resultan válidas.
En el caso de una fuerza externa f (t), para el incremento en el impulso p de los electrones puede escribirse
(ejercicio)
 
dt h i
p(t + dt) = 1 − p(t) + f (t) dt + O( dt2 ) ,
τ
de donde (otro ejercicio)
dp p(t)
=− + f (t) .
dt τ
Esta expresión es útil para computar el efecto Hall en un metal al que se aplica un campo magnético externo
B, en cuyo caso la fuerza de Lorentz interviene como fuerza externa aplicada, es decir f = −(e/c) v × B.

Conductividad eléctrica (corriente alterna)

Cuando el campo eléctrico aplicado es alterno, conviene emplear la notación compleja


 
E(t) = Re E(ω) e−iωt .

En este caso podemos utilizar el resultado anterior para escribir

dp p
= − − eE .
dt τ
Como buscamos una solución (estacionaria) de la forma
 
p(t) = Re p(ω) e−iωt ,

la ecuación anterior resulta


p(ω)
−iω p(ω) = − − e E(ω) .
τ
Recordando que j = −nep/m, tendremos también

  nep(ω) (ne2 /m)E(ω)


j(t) = Re j(ω) e−iωt , donde j(ω) = − = ,
m 1/τ − iω

o bien
σo
j(ω) = σ(ω) E(ω) , con σ(ω) = , (2)
1 − iωτ
donde notamos la conductividad para corriente continua como σo = ne2 τ /m. Ası́ hemos obtenido la conduc-
tividad eléctrica σ(ω) para corriente alterna con frecuencia ω. Este resultado tiene aplicaciones respecto de
la propagación de radiación electromagnética en metales, para lo cual conviene recordar que siempre que ten-
gamos un campo eléctrico oscilante tendremos también un campo magnético transversal asociado a esa onda, y
en principio estos campos pueden cambiar con la posición r dentro del metal.
En realidad el término de la fuerza de Lorentz es varios órdenes menor que el correspondiente al campo
eléctrico, por lo que resulta despreciable. En cuanto a las variaciones de E con la posición, conviene notar que
la densidad de corriente en r queda determinada por la última colisión sufrida por el electrón, la cual suele
ubicarse a unos pocos caminos libres medios ℓ de r; en esos casos la ec. (2) es válida para relacionar j(r, ω) con
E(r, ω) en cada r si la longitud de onda λ del campo electromagnético es bastante mayor que ℓ (por ejemplo, la
luz visible, donde λ ≃ 1000 Å). Cuando se cumple entonces la condición λ ≫ ℓ podemos recurrir a las ecuaciones
de Maxwell
1 ∂H 4π 1 ∂E
∇ · E = 01 , ∇ · H = 0 , ∇ × E = − , ∇×H = j+ ,
c ∂t c c ∂t
1 En esta aproximación se asume que la densidad de carga inducida se anula.
4 1 Metales: Teorı́a de Drude-Sommerfeld

y proponer nuevamente soluciones oscilatorias (∝ e−iωt ). Aplicando entonces el rotor a la tercera de estas
ecuaciones  
2 iω iω 4π iω
∇ × (∇ × E) = ∇(∇ · E) − ∇ E = ∇×H = j− E ,
c c c c
de donde  
2 ω2 4πiσ ω2
−∇ E = 2 1+ E= ǫ(ω)E .
c ω c2
Obtenemos entonces la ecuación de ondas habitual, definiendo la constante dieléctrica compleja

4πiσ
ǫ(ω) = 1 + .
ω

Para altas frecuencias, es decir, ωτ ≫ 1, la ec. (2) permite escribir σ(ω) = iσo /(ωτ ) = ine2 /(mω), de manera
que en primera aproximación
ωp2 4πne2
ǫ(ω) = 1 − 2 , con ωp2 = ,
ω m
donde ωp es conocida como frecuencia de plasma. Como ǫ se vuelve real y negativo para ω < ωp , las soluciones
para E decaen exponencialmente y por ende la radiación no se propaga en el metal. En cambio cuando ǫ es
positivo (ω > ωp ), las soluciones son oscilatorias, de manera que la radiación puede propagarse y el metal resulta
transparente. Como habı́amos planteado, todo esto vale siempre que en las proximidades de ω = ωp estemos
en el régimen de altas frecuencias ωτ ≫ 1. Para el caso de metales alcalinos estas hipótesis son válidas, y las
longitudes de onda para las cuales resultan transparentes a la radiación son predichas con bastante éxito.
Una consecuencia importante de estos resultados es que predicen también oscilaciones de carga, ya que j
representa justamente el movimiento colectivo de los electrones del metal. Estas ondas de densidad de carga
también ocurren por encima de la frecuencia ωp ; son conocidas como oscilaciones plasmónicas, o directamente
como plasmones.

Conductividad térmica en un metal

La conductividad térmica κ de un material se define como la constante de proporcionalidad (positiva) entre


la densidad de corriente térmica jq (cantidad de calor por unidad de área y de tiempo) y el gradiente de
temperaturas ∇T en esa posición
jq = −κ ∇T .
El signo − evidencia que el calor fluye en la dirección opuesta a ∇T , y en esta descripción supondremos que
este flujo se debe solo al movimiento de los electrones libres en un metal. Para fijar ideas imaginemos un
caso unidimensional según la coordenada x, es decir ∇T = ı̂ dT / dx. Si notamos con ε(T ) a la energı́a térmica
(promedio) por electrón en una región que se encuentra a temperatura T , podemos explicitar la expresión
anterior teniendo en cuenta que si la última colisión ocurrió en x′ , entonces la energı́a térmica del electrón
emergente será ε[T (x′ )]: en cada coordenada x tendremos electrones provenientes de la derecha con ε[T (x+vτ )]
(habiéndose dispersado por última vez en x+vτ en promedio), y de la izquierda con ε[T (x−vτ )]. Teniendo en
cuenta que T varı́a poco en ℓ = vτ , la componente x para la expresión anterior puede escribirse como (ejercicio)
nvn o
jq = ε[T (x−vτ )] − ε[T (x+vτ )] ,
2
o bien  
dε2 dT
jq = n v τ − .
dT dx

Al pasar a 3D, la derivada con respecto a la coordenada será una derivada parcial, y además los valores
cuadráticos medios de las componentes de v serán equivalentes, es decir hvx2 i = hvy2 i = hvz2 i = v 2 /3, donde v 2 es la
velocidad cuadrática media. Por otro lado, si notamos con cv al calor especı́fico por unidad de volumen, como
n = N/V ,  
dε 1 dE
n = = cv ,
dT V dT
de modo que
1 2 1 2 1
jq = v τ cv (−∇T ) ⇒ κ= v τ cv = ℓ v cv .
3 3 3
1.2 Teorı́a de Sommerfeld 5

Recordando que para corriente continua la ec. (1) permite expresar la conductividad eléctrica como σ = ne2 τ /m,
podemos prescindir del tiempo de relajación realizando el cociente

κ cv mv 2
= .
σ 3 n e2
Aquı́ podemos evocar dos resultados conocidos para un gas ideal, tanto para cv = n 3kB /2 como para mv 2 /2 =
3kB T /2, obteniendo la ley de Wiedemann-Franz
 2
κ 3 kB watt Ω
= = 1, 11×10−8 (constante)
σT 2 e K2

Si bien el valor experimental para este cociente es 2, 22×10−8 watt Ω/ K2 , un error de cálculo en σ llevó a Drude
a obtener una notoria coincidencia con los datos medidos. Ese éxito casual dejaba varias cuestiones en suspenso:
a temperatura ambiente la contribución electrónica a cv es 100 veces menor que la considerada aquı́, y tampoco
es cierto que los electrones del metal se comporten como un gas ideal clásico, lo que hace que v 2 real sea 100
veces mayor que la predicha (¡y se compensan ambos factores 100!).
Vale la pena resaltar que no hemos tenido en cuenta la acumulación de cargas que surge como consecuencia
del desplazamiento de los electrones frente a un gradiente de temperaturas. Este se traduce en la creación de
un campo eléctrico que se opondrá al flujo de partı́culas originado por ∇T , conocido como efecto Seebeck.

1.2. Teorı́a de Sommerfeld


La exagerada contribución de los electrones de conducción al calor especı́fico en un metal (100 veces mayor
que la real) está relacionada con la naturaleza de los electrones como partı́culas de espı́n 1/2: se trata de fermiones
que, a bajas temperaturas, se comportan de manera muy diferente a las partı́culas clásicas. Sommerfeld modificó
en 1928 el modelo de Drude para los electrones de conducción, teniendo en cuenta la distribución de Fermi para
los estados cuánticos de estos electrones, es decir considerando un gas de fermiones libres en una caja de lado
L (V = L3 ). Para este caso las soluciones estacionarias individuales son
 Z 
1 2
ψk (r) = √ eik·r cumplen dr |ψ(r)| = 1 ,
V V

a las que deben imponerse condiciones periódicas respecto de las dimensiones de la caja, es decir, los autovalores
para las energı́as individuales son

~2 k 2 2π
ε(k) = , con k= (nx , ny , nz ) .
2m L
Los valores para la energı́a total del sistema se obtiene sumando las energı́as de todos los electrones (denotadas
con i)
N
X ~2 ki2
E= .
i=1
2m

Distribución de Fermi-Dirac

Al tratarse de fermiones, en el estado fundamental los electrones no pueden ocupar el estado2 de mı́nima
energı́a individual, ya que deben satisfacer el principio de exclusión de Pauli. Entonces se van poblando los
estados con ε creciente, a razón de 2 por cada autoenergı́a individual, ya que poseen dos orientaciones posibles
para su espı́n s = 1/2. De este modo se cubren los autoestados de k hasta cierto valor máximo kF . En el lı́mite
termodinámico los valores de k pueden tomarse como un continuo para estimar el volumen ocupado en el espacio
k por todos estos estados como (4π/3)kF3 ; considerando que en realidad los estados conforman un reticulado
de espaciamiento kα = 2π/L (α = x, y, z), el volumen (en el espacio k) asociado a cada autovalor de k es 8π 3 /V ,
de manera que el número N de estados disponibles para los N = nV electrones en el estado fundamental debe
cumplir
4π 3
kF k3 1/3
2 × 3 3 = F2 V
N = |{z} ⇒ kF = 3π 2 n .
8π 3π
2s+1
V
2 Los estados, si hay degeneración (como en el caso de espı́n 1/2)
6 1 Metales: Teorı́a de Drude-Sommerfeld

Del mismo modo suele definirse el impulso de Fermi a partir de la relación pF = ~kF y también la velocidad
de Fermi vF , que puede expresarse en términos de rs y el radio de Bohr ao = 0, 529 × 10−8 cm
~kF 4, 2 cm
vF = = × 108 .
m rs /ao s
Aquı́ conviene notar que la estimación para una velocidad media puede ser comparable a la velocidad de la luz
(≈ c/100), la que resulta muy diferente de la predicción clásica.
La energı́a de Fermi εF en este caso coincide con la máxima energı́a individual ocupada en el estado funda-
mental, y puede escribirse en términos del volumen especı́fico por electrón v = 1/n o también de ao
 2/3
~2 3π 2 50, 1 eV
εF = = .
2m v (rs /ao )2
Los valores tı́picos de εF varı́an entre 1,5 eV y 15 eV. Asociando esta magnitud a una medida de la excitación
térmica, se define la temperatura de Fermi a través de la relación
58, 2 × 104 K
εF = k B T F ⇒ TF = .
(rs /ao )2

Como los electrones de nuestro “gas” son fermiones, si µ representa el potencial quı́mico y β = 1/(kB T ),
sabemos que la distribución de Fermi-Dirac3
1
fiN =
eβ(εi −µ) +1
representa la probabilidad de que un electrón esté en el estado individual |ii —independientemente de su
estado de espı́n— cuando el sistema de N electrones está en equilibrio termodinámico a temperatura T . Esta
distribución está relacionada con el número total de electrones, pues al sumar las probabilidades sobre todas
las partı́culas que componen nuestro sistema se cumple
N N
X X 2 f (ε)
N= (2s + 1) fiN = . T =0
i=1 i=1
eβ(εi −µ) +1 1

En el lı́mite termodinámico las posibles energı́as in-


dividuales se vuelven continuas, y escribimos esta dis-
tribución como
1
f (ǫ) = β (ǫ−µ) ,
e +1 T >0
que tiene el comportamiento mostrado en la figura.
Aquı́ se pone en evidencia que la correcta definición ε
para la energı́a de Fermi es
0 µ
εF = lı́m µ(T ) .
T →0

1.2.1. Cálculo de propiedades termodinámicas

Nos interesa calcular cantidades como el calor especı́fico (por unidad de volumen)
   
T ∂S ∂u
cv = = ,
V ∂T V,N ∂T v

donde u = U/V es la energı́a interna por unidad de volumen. Entonces es necesario evaluar la energı́a interna
almacenada en el sistema, que al pasar al lı́mite termodinámico se convierte en una integral
2s+1 Z Z
X V z}|{
3
U (= E) = ε(k) −→ 3
× 2 × d k ε(k) f (ε(k)) = V dε g(ε) ε f (ε) ,

k

donde al hacer el cambio de variables ε = ~2 k 2 /(2m) en la última integral introducimos la densidad de estados
m3/2 √
g(ε) = 2ε ,
~3 π 2
3 También puede deducirse fi a partir de la distribución de Maxwell-Boltzmann y el principio de exclusión de Pauli.
1.2 Teorı́a de Sommerfeld 7

la cual representa el número de estados individuales permitidos con energı́as entre ε y ε+ dε. Esta densidad de
estados puede expresarse en términos de la energı́a de Fermi
3n √
g(ε) = 3/2
ε.
2 εF

Entonces podemos reescribir las cantidades termodinámicas de interés como


Z ∞ Z ∞
U
u= = dε g(ε) ε f (ε) , n= dε g(ε) f (ε) .
V 0 0

Definiendo g(ε) = 0 para ε < 0, estas cantidades son entonces de la forma


Z ∞
dε H(ε) f (ε) ,
−∞

que puede aproximarse para bajas temperaturas mediante la expansión de Sommerfeld (como vimos en Termo
2)
Z ∞ Z µ ∞
X d2j−1 H(ε)
dε H(ε) f (ε) = dε H(ε) + (kB T )2j aj ,
−∞ −∞ j=0
dε2j−1 ε=µ

donde Z  

x2n d 1
aj = dx − .
−∞ (2n)! dx ex + 1
Manteniendo los primeros términos no nulos
Z ∞ Z µ  6
π2 7π 4 kB T
dε H(ε) f (ε) = dε H(ε) + (kB T )2 H ′ (µ) + (kB T )4 H ′′′ (µ) + O ,
−∞ −∞ 6 360 µ

de modo que podemos estimar para u y n


Z µ  4
π2 kB T
u= dε ε g(ε) + (kB T )2 [µg ′ (µ) + g(µ)] + O ,
0 6 µ
Z µ  4
π2 kB T
n= dε g(ε) + (kB T )2 g ′ (µ) + O .
0 6 µ

Utilizando la densidad de energı́a resultante para el estado fundamental, uo = (3/5)nkB TF (ejercicio), obtenemos
la aproximación para bajas temperaturas
 4  
π2 kB T ∂u π2 2
u(T ) = uo + (kB T )2 g(εF )+O ⇒ cv = = k T g(εF ) .
6 µ ∂T n 3 B

En nuestro caso de electrones libres, explicitamos la expresión para la densidad de estados y encontramos

π 2 kB T
cv = nkB ,
2 εF
que obviamente difiere del cv predicho para un gas ideal clásico: a temperatura ambiente, esta predicción es
∼100 veces menor que 3nkB /2. Entonces concluimos que en una descripción adecuada, no hay contribución a
cv por parte de los electrones de conducción.
Sommerfeld retomó el modelo de Drude para modificar lo que corresponde a la distribución de Maxwell-
Boltzmann por la de Fermi-Dirac. Como los electrones de un metal tienen un momento del orden de ~kF y
la incertidumbre en esta magnitud debe ser pequeña como para intentar una descripción clásica, teniendo en
cuenta que kF ∼ 1/rs (ejercicio), para la incertidumbre en la posición tendremos para alguna de las coordenadas

~ 1
∆x ∼ ≫ ∼ rs .
∆p kF

Esto significa que es imposible conocer x con mejor error que rs ∼ 1Å en una descripción como la desarrollada.
La estadı́stica de Fermi-Dirac se pondrá en evidencia en aquellas predicciones del modelo de Drude que requieren
8 2 Redes cristalinas

detalle sobre la distribución de velocidades. Por ejemplo, si reescribimos la relación entre el tiempo de relajación
y la resistividad ρ como
 3
m 0, 22 rs
τ= = × 10−14 s
ρ n e2 ρ ao
puede estimarse el camino libre medio según el modelo de Sommerfeld como

(rs /ao )2
ℓ = vF τ = × 92 Å ,
ρ

lo que da resultados bastante diferentes de los predichos por Drude (unas 100 veces mayor). Para la conductividad
térmica κ = (1/3)v 2 τ cv = (1/3)ℓvcv , de manera que para la ley de Wiedemann-Franz resulta
 2
κ π2 kB watt Ω
= = 2, 44 × 10−8 .
σT 3 e K2

Este resultado concuerda bastante con el predicho por Drude, a pesar de las imprecisiones mencionadas para
las estimaciones de cv y la velocidad media de los electrones de conducción.
Vemos que algunas de las predicciones erróneas de Drude son corregidas al considerar la correcta distribución
de energı́as de Fermi-Dirac. No obstante, el modelo de electrones libres en la banda de conducción presenta
falencias, que deben subsanarse considerando adecuadamente la interacción de los electrones con los núcleos del
material.

2. Redes cristalinas (basado en el texto de Ashcroft)

El modelo de electrones libres falla en la predicción de diversos coeficientes de transporte, de calores especı́fi-
cos y de compresibilidades de metales, y presenta ciertas inconsistencias en la explicación de otras propiedades,
tanto de conductores como de aislantes. En realidad los electrones interactúan con los núcleos del sólido, que
generalmente se acomodan en un ordenamiento microscópico regular: resulta entonces un potencial periódico
sobre los electrones (en particular los de conducción), cuyo efecto se traslada a la predicción de las diferentes
propiedades macroscópicas de los materiales.
Algunos minerales evidencian este ordenamiento cristalino mostrando caras que naturalmente son muy
lisas, formando ángulos bien definidos entre ellas. Aunque los metales en general no se encuentran ası́, muchos
de ellos suelen aparecer en la naturaleza mostrando ese ordenamiento microscópico. Si bien esta estructura
cristalina es la manera más sencilla que podemos imaginar para aglutinar átomos, no existe un argumento
definitivo (como un teorema) para explicar este acomodamiento periódico. Hay ejemplos en los que se proponen
energı́as de interacción entre átomos y al plantear la minimización de algún potencial termodinámico se obtiene
un arreglo periódico. También se emplean argumentos de simetrı́a para mostrar que entre las disposiciones
posibles, los átomos se acomodan en posiciones equivalentes, es decir conformando cristales. Muchos elementos
y compuestos solidifican constituyendo estructuras cristalinas (en condiciones que permitan minimizar la energı́a
libre correspondiente), con la única excepción del helio, que permanece lı́quido a 0 K (a 1 atm).
Las estructuras cristalinas estables correspondientes a un determinado material pueden variar con la tem-
peratura y la presión. También puede haber varias configuraciones casi equivalentes, conformando estados
“alotrópicos”. Este es el caso del carbono a temperatura ambiente, que se encuentra como grafito o bien como
diamante, con propiedades termodinámicas bien diferentes. Lo mismo ocurre con el estaño: si se trata de estaño
gris es un semiconductor, mientras que el estaño blanco es metálico. En realidad suele haber un solo estado con
mı́nima energı́a libre, aunque una vez que solidifican el tiempo requerido para transformarse espontáneamente
en la estructura más estable es tan prolongado que directamente se lo descarta.

2.1. Redes de Bravais


En este tipo de redes el entorno de cada punto es igual al de cualquier otro punto. Se define entonces una red
de Bravais como un arreglo periódico en el cual las unidades de un cristal se repiten regularmente de manera
exacta; estas unidades pueden conformarse con un único átomo o con un grupo de átomos.
2.1 Redes de Bravais 9

Una definición equivalente establece que una red de Bravais es el conjunto de todos los puntos con posiciones
dadas por los vectores

R = n1 a1 + n2 a2 + n3 a3 , con {aj } (j = 1, 2, 3) linealmente independientes y {nj } ∈ Z .

Los vectores {aj } se denominan “vectores primitivos”, y decimos que generan o expanden la red de Bravais. La
demostración sobre la equivalencia de ambas definiciones se deja como ejercicio.
La figura ejemplifica una red oblicua en dos di-
mensiones: cualquier punto de la red tiene un entorno R2
c1
equivalente de puntos vecinos, y puede escribirse como
n1 a1+ n2 a2 escogiendo adecuadamente los enteros n1 R1
y n2 . Por ejemplo, R1 = −2a1 +a2 y R2 = a1 +2a2 . a2

El conjunto de vectores primitivos no es único: un a1


ejemplo sencillo se muestra también en la figura, donde c2
c1 y c2 pueden elegirse para expandir la red oblicua.
La elección no es arbitraria, y se deja como ejercicio en-
contrar otras elecciones válidas para los vectores primi-
tivos asociados a esta red. Pronto veremos que algunas
elecciones particulares favorecen el aprovechamiento de a3
simetrı́as en una determinada red cristalina.
La estructura más sencilla en 3 dimensiones es la a2
red cúbica simple como la de la figura (“sc”): cada a1
sitio de red se ubica en los puntos de este retı́culo cúbi-
co. Los vectores primitivos aj pueden escogerse ortogo-
nales entre sı́, de manera que sus magnitudes |aj | coin-
ciden con el espaciamiento a entre los sitios de red. En
este caso el parámetro de red a es el único parámetro
necesario para identificar esta red. De todos modos,
debe tenerse presente que cada sitio de red puede rela-
cionarse con un grupo de átomos, a menudo llamado
motivo. A pesar de su simpleza, el único elemento que
solidifica con esta estructura es el Po; redes compuestas
con esta estructura son las de CsCl, CsBr, CsI, TlCl,
TlBr y TlI.
En el caso de una red plana hexagonal (o un api-
lamiento 3D de ellas), debe tenerse la precaución
de notar que no todos los vértices de los hexágonos
son equivalentes, ya que las orientaciones con respecto a los primeros vecinos va cambiando. Dicho de otro modo,
no todos los vértices conforman una red de Bravais, aunque este arreglo de átomos conforman una red cristalina
con más de un átomo por sitio: se deja como ejercicio descifrar tamaño enigma.
Cuando se estudian las propiedades termodinámi-
cas, los sistemas considerados son muy extensos, por
lo que suele pensarse que las redes cristalinas son in-
finitas y por lo tanto los efectos de superficie son de-
spreciables. No obstante, al trabajar con fragmentos
pequeños de material los análisis deben tener en cuen-
ta de alguna manera el tamaño finito abarcado, siempre
que puedan considerarse como sistemas termodinámi-
cos. En el caso de tamaños nanométricos, que gracias a
los avances tecnológicos pueden manipularse cada vez a2 a1
con mayor facilidad, debe tenerse presente que ninguna
descripción macroscópica puede abarcar sistemas con
un número pequeño de partı́culas, ya que los postula-
dos de la termodinámica no tienen validez. a3
Otro ejemplo interesante es la red cúbica centra-
da en los cuerpos (de los cubos), que puede pensarse de
10 2 Redes cristalinas

dos maneras diferentes: por un lado, como lo indica el nombre, imaginamos una red cúbica simple con un átomo
extra en el centro de cada cubo; análogamente, consideramos dos redes cúbicas simples intercaladas, de manera
que cada átomo de una red ocupa el centro de los cubos de la otra (y viceversa). En esta figura se indica la
elección para los vectores primitivos, tomando respectivamente los versores x̂, ŷ y ẑ paralelos a los a1 , a2 y a3
del esquema anterior para la red cúbica simple de parámetro a
a a a
a1 = (ŷ + ẑ − x̂) , a2 = (x̂ + ẑ − ŷ) , a3 = (x̂ + ŷ − ẑ) .
2 2 2
Pronto veremos que con esta elección se aprovecha de mejor manera la simetrı́a de esta red. Muchos elementos
puros solidifican con esta estructura (Li, Na, K, V, Cr, Fe, Nb, Mo, Rb, Ba, Cs, Tl, Ta, W), con parámetros de
red entre 3 y 6 Å. Es común referirse a ella como “bcc”, por sus siglas en inglés (body-centered cubic).
También es común la estructura de red cúbica centrada en las caras (“fcc”, face-centered cubic), que como
su nombre indica, consiste de una red cúbica simple a la que se agrega un átomo en el centro de cada cara de
los cubos. La elección simétrica de los vectores primitivos es
a a a
a1 = (ŷ + ẑ) , a2 = (x̂ + ẑ) , a3 = (x̂ + ŷ) .
2 2 2
Esta es la estructura en que se encuentran muchos otros materiales puros en su fase sólida, como Ne, Al, Ar,
Ca, Sc, Cu, β-Co, Ni, Kr, Ag, Ir, Ce, La, Pd, Pt, Au, Pb, con parámetros de red también entre 3 y 6 Å.

En una red de Bravais se identifica como número de coordinación al número de primeros vecinos, entendidos
como sitios de red más próximos a otro sitio de red (no necesariamente átomos solos, puede ser un grupo de
átomos definiendo el motivo de la red). En el caso de una red sc, el número de coordinación es 6; para una red
bcc es 8, y para la fcc, 12. Se deja como ejercicio la verificación de cada caso.

2.2. Celda primitiva


Se denomina ası́ al volumen asociado a cada sitio de la red, de modo que al trasladarse hacia todos los
puntos de la red completa todo el espacio, sin superposiciones ni dejando espacios huecos. Este volumen puede
escogerse de numerosas maneras, lo que puede visualizarse fácilmente analizando la red oblicua plana presentada
más arriba: la elección de diferentes celdas primitivas se torna un pasatiempos adictivo.
La celda primitiva contiene 1 solo punto de la red, de modo que si la elegimos permitiendo que sus bordes
compartan sitios con celdas vecinas, debe contarse adecuadamente el número de sitios compartidos (ejercicio:
verificarlo en la red oblicua). Esto significa que si tenemos n sitios por unidad de volumen, y v es el volumen
de la celda primitiva siempre debe cumplirse (como esperamos)
1
nv = 1 ⇐⇒ v= .
n
La celda primitiva puede construirse a partir del conjunto de vectores primitivos elegidos, teniendo presente
que el volumen de esta puede evaluarse como v = |a1 · (a2 × a3 )| (la demostración se deja como ejercicio).
A veces puede resultar conveniente recurrir a celdas unidades que se corresponden con varias celdas primi-
tivas; de este modo completamos el espacio sin superposiciones solo si las trasladamos según un subconjun-
to de vectores de la red de Bravais correspondiente. Estas celdas guardan algo de la simetrı́a de la red, como
sucede con las redes bcc o fcc: podemos describirlas utilizando celdas cúbicas, que en el primer caso contiene
el doble de volumen de una celda primitiva (y 2 puntos por celda), mientras que en el segundo, el cuádru-
ple (y 4 puntos por celda). En general, las caracterı́sticas de una esctructura cristalina se sintetizan a través
de diferentes constantes de la red, como los parámetros
de red (pueden requerirse varios), el número de sitios
por celda (si no es la primitiva), los ángulos que la
definen, etc.
La elección de celda primitiva que respeta al máxi-
mo las simetrı́as de una red es la celda de Wigner-Seitz,
que rodea a cada sitio de red de manera que resul-
ta la región más cercana a ese punto, representativa
de posiciones equivalentes en el espacio. Independien-
temente de los vectores primitivos escogidos, se con-
struye conectando con segmentos los vecinos cercanos
y tomando los planos normales que bisectan esos seg-
mentos, los cuales delimitan la celda de Wigner-Seitz.
2.3 Red recı́proca 11

En 3 dimensiones los gráficos se vuelven más complicados, y conviene recurrir a diferentes libros de texto, o
sitios de internet como physics-in-a-nutshell.com, donde se ilustran varias propiedades para las redes bcc
y fcc.
Con todas estas definiciones, conviene recalcar que la estructura de un cristal se completa especificando qué
contiene cada celda unidad, lo que llamamos “base” o “motivo” de la red. Por ejemplo, para el panal de abejas
presentado anteriormente, develamos el misterio diciendo que se trata de una red oblicua, cuya base o motivo
consiste de dos átomos (ejercicio).
En particular, si la celda unidad escogida no es una celda primitiva, siempre debe especificarse la base de
cada celda. Esto ocurre cuando elegimos celdas cúbicas para referirnos a las redes bcc y fcc: en el primer caso
se trata de una red sc con dos átomos por celda, uno en 0 y otro en (a/2)(x̂+ ŷ + ẑ); en el segundo caso, una
red sc con cuatro átomos en 0, (a/2)(x̂+ ŷ), (a/2)(ŷ+ ẑ) y (a/2)(x̂+ ẑ).
Otra estructura que resaltamos en este contexto es la del diamante, que consiste de dos redes fcc intercaladas,
una desplazada de la otra 1/4 sobre una diagonal del cubo. O equivalentemente, es una red fcc con un motivo
de dos átomos, uno en 0 y otro en (a/4)(x̂ + ŷ + ẑ). No solo el diamante presenta esta estructura cristalina:
también el silicio, el germanio, o la fase α del estaño gris.
En 3 dimensiones, se llama red hexagonal compacta
(o empaquetamiento hexagonal) al apilamiento de re-
des triangulares planas. Estos apilamientos hcp (por
sus siglas en inglés) pueden darse de dos modos: sobre
un conjunto de intersticios de la red A (ejercicio: ver-
ificar que hay dos opciones) se acomoda la red B, y
encima de ella otra red hexagonal que horizontalmente
coincida con la ubicación de la red A, o bien de man-
era que se acomode en los otros intersticios, es decir
desplazada respecto de la A original. Al primer caso
...ABABAB... se alude como empaquetamiento hcp,
mientras que el segundo, ...ABCABCABC... coincide
con la red fcc. Algunas tierras raras (también llama-
dos metales raros) presentan otros empaquetamientos
compactos del tipo ...ABACABACABA... Muchos el-
ementos solidifican en una estructura hcp, como Be,
Mg, Sc, Ti, Zn, Y, Zr, Cd, Ce, Gd, Dy, Hf, Os, Tl, etc.

2.3. Red recı́proca


Dada una red de Bravais caracterizada por los sitios R, si la irradiamos con una onda plana cualquiera eik·r ,
en general esta no tendrá la periodicidad propia de la red, salvo para ciertos valores de k . El conjunto de todos
los vectores de onda K que generan ondas planas con la periodicidad de una dada red de Bravais constituye la
llamada “red recı́proca”.
Los vectores de una red recı́proca quedan definidos justamente como aquellos que satisfacen la condición
eiK·(r+R) = eiK·r ⇔ eiK·R = 1 , (3)
para cualquier R de la red de Bravais estudiada. Toda red directa R tiene asociada una red recı́proca K.
La red recı́proca asociada a una red de Bravais también constituye una red de Bravais. La demostración
queda como ejercicio, y esencialmente consiste en notar que los vectores primitivos {bj } de la red recı́proca
pueden construirse a partir de los vectores primitivos {aj } de la directa mediante las relaciones
a2 × a3 a3 × a1 a1 × a2
b1 = 2π , b2 = 2π , b3 = 2π .
a1 · (a2 × a3 ) a1 · (a2 × a3 ) a1 · (a2 × a3 )
Estos vectores cumplen la relación bi · aj = 2πδij , y como cualquier vector de la red recı́proca pueden expresarse
como K = m1 b1 + m2 b2 + m3 b3 con mi ∈ Z, queda garantizada la condición (3). Las relaciones anteriores
nos permiten también demostrar que si el volumen de la celda primitiva de una red es v, el volumen de la celda
primitiva del espacio recı́proco es (2π)3 /v . El hecho de que la red recı́proca sea una red de Bravais implica que
tiene asociada a su vez una red recı́proca: casualmente, esta coincide con la red directa de la cual partimos (otro
ejercicio).
Es directo demostrar que la recı́proca de una red sc con celda primitiva de lado a es otra red sc de lado
2π/a ; la recı́proca de una red bcc con celda convencional de lado a es una red fcc de lado 4π/a , mientras que
12 2 Redes cristalinas

la recı́proca de una red fcc (siempre con celda convencional de lado a ) es una red bcc de lado 4π/a . Una red
hexagonal simple plana con parámetro a tiene asociada una red recı́proca que también es una red hexagonal
simple (ejercicio).

2.3.1. Primera zona de Brillouin

Se denomina ası́ a la celda de Wigner-Seitz de la red recı́proca. Esto implica que para una red bcc, la
primera zona de Brillouin tiene la estructura de una celda de Wigner-Seitz asociada a una red (recı́proca) fcc;
del mismo modo, la primera zona de Brillouin de una red fcc, es una celda de Wigner-Seitz asociada a una red
recı́proca bcc.
Cada uno de los vectores K de la red recı́proca está asociado a un conjunto de planos cristalinos de la red
directa: se trata de la familia de planos perpendiculares a ese K que contienen un gran número de sitios de
red. Estas familias de planos reemiten la radiación que reciben, dando lugar a patrones de interferencia que
permiten el análisis de estructuras cristalinas mediante la “difracción de rayos x” (DRX). La separación d de
los planos mencionados está asociada con cada vector K mediante la relación |K| = 2π/d. Resulta natural
imaginar que cada conjunto de átomos asociados con los sitios de red abarcados por cada plano contribuyen a la
reemisión de la radiación (con alguna eficiencia para reemitir), y que las longitudes de onda λ correspondientes
a la interferencia constructiva serán los submúltiplos de esa distancia interplanar d = 2π/|K|. De este modo, si
las distancias interatómicas (y por lo tanto las distancias interplanares) son de algunos angstrom, la radiación
capaz de evidenciar esa interferencia debe tener energı́as ~ω = hc/λ ≈ 104 eV, que corresponde al rango de los
rayos x.
En 1913 W.H. y W.L. Bragg (padre e hijo) obser-
varon patrones de difracción en sólidos, que no ocurrı́an
en lı́quidos: para determinadas longitudes de onda y en
direcciones especı́ficas ocurrı́an máximas intensidades θ θ
dispersadas (picos de Bragg). Para explicarlos W.L.
Bragg pensó a estas estructuras cristalinas como una θθ
colección de planos paralelos que dispersan los rayos x:
d sen θ d
a través de cierta reflexión especular en esos conjuntos
de iones se podı́a explicar la interferencia constructiva
que da lugar a esos picos intensos observados.
Para un frente de ondas plano de longitud de on-
da λ, analizando la diferencia de camino óptico entre
los dos rayos señalados en la figura, la condición para interferencia constructiva resulta

2 d sen θ = n λ ,

donde el número natural n se denomina orden de la reflexión. Esta condición es conocida como “ley de Bragg”,
y para realizar un análisis de difracción de rayos x se realiza un barrido angular con un haz monocromático, de
manera que se va cumpliendo la condición anterior para diferentes valores de d asociados con distintas familias
de planos. Vale la pena detenerse en la estructura oblicua de la figura y poner en evidencia algunas familias de
planos diferentes para convencerse de la necesidad del barrido angular mencionado.
La explicación de von Laue para el fenómeno de
difracción considera en cambio a cada ion de la red
(ubicado en un sitio R de la red de Bravais) como k
un centro dispersor de la radiación incidente. Como k
solo se considera dispersión elástica, los vectores k y k′
k′ solo difieren en su dirección, es decir |k| = |k′ | =
2π/λ . Tomando d como el vector que conecta dos cen- θ θ′
tros dispersores, en este caso la diferencia de camino d · k = d cos θ d k′
óptico entre los dos rayos indicados en la figura es
d cos θ+d cos θ′ = d·(k̂−k̂′ ), de manera que la condición d cos θ′ = −d · k′
para interferencia constructiva resulta
d · (k̂ − k̂′ ) = m λ (m ∈ Z) ⇒ d · (k − k′ ) = 2πm .
Al tratarse de una red de Bravais, esto implica que para cualquier vector R de la red debe cumplirse

R · (k − k′ ) = 2πm ⇐⇒ ei(k −k)·R = 1 ∀ R de la red .
2.3 Red recı́proca 13

Como esta restricción coincide con la relación (3), la


condición de Laue entonces es que el vector K = k′ −k
pertenezca a la red recı́proca. Tomando el cuadrado de k θ k′
k′ , y recordando que |k| = |k′ | encontramos la condi-
ción equivalente
1 K
k · K̂ = |K| .
2
Puede verse que, por simetrı́a, en esta construcción el plano que bisecta al vector K se corresponde con
la familia de planos imaginados por Bragg en su explicación (ejercicio). De esta manera queda demostrada la
equivalencia entre las condiciones de Bragg y de von Laue que rigen los análisis por difracción de rayos x.
Para realizar experimentos de DRX se han ideado numerosos montajes de laboratorio. Uno de los métodos
más usados en la actualidad es el de cristal rotante, que utiliza un haz monocromático y realiza un barrido en los
ángulos de incidencia θ variando la orientación de la muestra irradiada (dejando el haz incidente fijo); de este
modo, para cada valor de θ se van encontrando diferentes familias de planos o vectores K de la red recı́proca
que satisfacen las condiciones de interferencia constructiva señaladas más arriba. Otro diseño experimental es el
de Debye-Scherrer, y se aplica a materiales que pueden molerse, conservando su estructura en una muestra en
polvo: de este modo se dispone simultáneamente de todas las orientaciones posibles para la estructura analizada,
lo que equivale a rotar la muestra alrededor de todos los ejes posibles.

Estructuras con una base: factor de estructura. Cuando la celda unidad escogida no coincide con la
celda primitiva, los sitios de red tienen asociados n centros dispersores idénticos ubicados en las posiciones d1 ,
d2 , ..., dn . Entonces las diferentes posiciones imponen diferencias de fases en los haces dispersados, reflejadas en
factores eiK·(dj −dm ) . El factor de estructura geométrica SK permite tener en cuenta estos efectos de interferencia
n
X
SK = eiK·dj .
j=1

Es importante notar que este factor depende del valor de K en cuestión, y que todos los centros son igualmente
eficientes para dispersar la radiación (átomos idénticos). Este factor de estructura no alcanza para predecir los
valores netos de intensidades dispersadas, pero adquiere relevancia en aquellos casos en que se anula, ya que
allı́ la intensidad resultante de cada celda unidad (∝ |SK |2 ) es cero y por lo tanto la interferencia asociada
con la red será completamente destructiva. Un ejemplo de la utilidad de este factor se evidencia cuando para
describir una red bcc (o fcc) se utiliza la red sc con una base de 2 (o 4) átomos, como comentamos más arriba:
en ese caso, hay máximos predichos para la red sc para los cuales SK = 0 (ejercicio), garantizando que esas
interferencias constructivas en la red sc se vuelven completamente destructivas en la bcc (o fcc).

Cristales poliatómicos: factor de forma. En este caso, también utilizamos una celda unidad con una base,
pero los átomos involucrados contribuyen con diferente “eficiencia” para dispersar la radiación. La eficiencia
del j-ésimo átomo fj (K) se denomina factor de forma atómica y entonces el factor de estructura refleja las
diferentes contribuciones de una celda mediante la expresión
n
X
SK = fj (K) eiK·dj .
j=1

Un modelo sencillo asociado con las reflexiones de Bragg considera el factor de forma fj (K) como la transformada
de Fourier de la distribuciones de carga ρj (r) asociada con el j-ésimo ion, es decir
Z
1
fj (K) = − d3 r eiK·r ρj (r) .
e

En todos nuestros análisis a lo largo de este curso, recurriremos a redes ortogonales, como la cúbica que ya
presentamos; la tetragonal, que cuenta con una arista diferente (parámetro de red c adicional); o la ortorrómbica,
cuya celda unidad tiene 3 aristas ortogonales diferentes (y por ende 3 parámetros de red). También comentaremos
sobre los apilamientos compactos (hcp) descriptos anteriormente, aunque está claro que cada vez que contemos
con aristas no ortogonales, debemos agregar como parámetros de red adicionales a los ángulos involucrados para
poder especificar completamente la estructura analizada.
14 3 Electrones en un potencial periódico

Cuasicristales

Se denominan ası́ a formas estructurales bastante ordenadas, aunque no son completamente periódicas. Si
bien estos cuasicristales tienen unidades ensambladas que aparentemente siguen ciertas normas, no presentan
una repetición real como las redes de Bravais.
El estudio de este tipo de estructuras se disparó a partir de una primera observación realizada por Schetchman
y otros en 19844 . Al tomar el patrón de DRX de una aleación de Al-Mn enfriada rápidamente, en ese trabajo
evidenciaron estructuras con simetrı́a de rotación de orden 5, la cual es incompatible con cualquier simetrı́a
periódica. Estos materiales no presentan periodicidad al analizar rangos en longitudes grandes, aunque en
algunos aspectos de corto alcance muestran rasgos de estructuras cristalinas.

3. Electrones en un potencial periódico (basado en el texto de Ashcroft)

En una red de Bravais, los electrones están sometidos a un potencial periódico: los iones positivos son centros
de atracción, mientras que los electrones más ligados a sus núcleos generan cierta repulsión. Esta periodicidad
en el potencial se sintetiza como
U (r + R) = U (r) (para cualquier R de la red).
Como el perı́odo de este potencial es de algunos Å, y por ende comparable a la longitud de onda de de Broglie
tı́pica que veı́amos en el modelo de Drude-Sommerfeld, está claro que debemos recurrir a una descripción
cuántica. Idealizamos el cristal descripto, de manera que el sólido ofrece un potencial perfectamente periódico;
más adelante veremos en qué podrı́an influir las imperfecciones que presentan los cristales reales (impurezas,
dislocaciones, etc.). En el esquema de electrones independientes no hay interacción entre electrones, de modo
que el potencial periódico considerado en nuestra descripción es un potencial efectivo resultante de todas las
interacciones posibles.
La ecuación de Schrödinger estacionaria para un electrón en este potencial periódico
 
~2 2
Ĥψ = − ∇ + U (r) ψ = ε ψ ,
2m
permite inferir ciertas propiedades para la solución ψ que buscamos, a través del teorema de Bloch.

3.1. Teorema de Bloch: Las soluciones individuales de la ecuación de Schrödinger estacionaria pueden
escribirse como
ψnk (r) = eik·r unk (r) , con unk (r + R) = unk (r) . (4)

El factor unk (r) es entonces una función periódica, con el mismo perı́odo de la red cristalina, ya que aquı́ R es
un vector arbitrario de la red de Bravais. Pronto se aclarará el significado de estos vectores k, que nos permiten
explicitar que si bien las “ondas de Bloch” ψnk (r) no son periódicas, cumplen
ψnk (r + R) = eik·R ψnk (r) , o en general, ψ(r + R) = eik·R ψ(r) . (5)

3.1.1. Primera prueba del teorema

Comencemos recordando que el operador T̂R de traslación según R se define mediante la relación5
T̂R f (r) = f (r + R) .
Como Ĥ es periódico,
       
T̂R Ĥ ψ = T̂R Ĥψ = Ĥ(r + R) ψ(r + R) = Ĥ(r) T̂R ψ = Ĥ T̂R ψ ,
4 D. Shechtman, I. Blech, D. Gratias y J. Cahn, “Metallic phase with long-range orientational order and no translational sym-

metry”, Phys. Rev. Lett. (1984) 53, 1951-1953.


5 De la mecánica cuántica sabemos que, como p̂ = −i~∇, p̂/~ es el generador de desplazamientos, con lo cual T̂ (i/~)R·p̂ =
R = e
eR·∇ (unitario).
3.1 Teorema de Bloch 15

es decir, [T̂R , Ĥ] = 0, como debı́amos esperar. Esto significa que podemos elegir ψ para que sea autoestado
simultáneamente de T̂R y Ĥ:
Ĥ ψ = ε ψ y T̂R ψ = c(R) ψ .

Por construcción, también se cumple que T̂R T̂R′ = T̂R′ T̂R = T̂(R+R′ ) : pueden aplicarse sucesivas traslaciones
a ψ, obteniendo
T̂R′ T̂R ψ = c(R′ ) c(R) ψ = c(R + R′ ) ψ .

Como T̂R es unitario, sabemos que debe cumplirse |c(R)| = 1 . En particular, para los vectores primitivos {aj }
de la red podemos denotar c(aj ) = ei 2π αj (αj ∈ R). Para un vector cualquiera de la red entonces
 n1  n2  n3
R = n1 a1 + n2 a2 + n3 a3 ⇒ c(R) = c(a1 ) c(a2 ) c(a3 ) ,

de manera que si elegimos k = α1 b1 + α2 b2 + α3 b3 en el espacio recı́proco (no en la red recı́proca), donde los
bℓ son los vectores primitivos de la red recı́proca, esto es equivalente a eik·R , ya que se cumple bℓ · aj = 2π δℓj
(ejercicio). Reuniendo todos estos elementos tenemos que

ψ(r + R) = T̂R ψ = eik·R ψ(r) ,

lo que demuestra el teorema, de acuerdo a la expresión (5).

Condición de contorno de Born - von Karman

Al igual que en el modelo de Drude-Sommerfeld para electrones libres, consideramos un fragmento ter-
modinámico de nuestro sistema para imponer condiciones de contorno periódicas, de modo que nuestra de-
scripción reproduzca la misma fı́sica (contenida en ψ) al desplazarnos una “distancia termodinámica” Nj aj en
la dirección de cada vector primitivo aj de nuestra red de Bravais

ψ(r + Nj aj ) = ψ(r) 1 ≪ Nj ∈ N ; (6)

aquı́ estamos involucrando entonces un sistema con N = N1 N2 N3 celdas primitivas. Aplicando el teorema de
Bloch a cualquiera de estos desplazamientos

ψnk (r + Nj aj ) = ei Nj k·aj ψnk (r) ,

la igualdad (6), llamada condición de Born - von Karman, implica que debe cumplirse

3
X mj
ei Nj k·aj = 1 , y como k= αj b j ⇒ ei 2π Nj αj = 1 ⇒ αj = (mj ∈ Z) ,
j=1
Nj

o lo que es equivalente,
3
X mj
k= bj . (7)
j=1
Nj

De esta expresión se infiere que el volumen en el espacio recı́proco asociado a cada estado con un valor de
k permitido para nuestras soluciones es
 
b1 b2 b3 1
d3 k = · × = b1 · (b2 × b3 ) .
N1 N2 N3 N

Dicho de otra manera, el número de estados k —asociados con las soluciones de la ecuación de Schrödinger—
contenidos en una celda primitiva de la red recı́proca es N (números de sitios del cristal). Como el volumen
unitario de la red recı́proca es (2π)3 /v , el volumen asociado con cada k permitido es d3 k = (2π)3 /V , es decir,
la misma asociación que realizamos al desarrollar el modelo de electrones libres de Sommerfeld en la §1.2.
Pronto pondremos en evidencia cómo son las soluciones ψnk en relación a los sitios R de la red; por ahora,
podemos ver un ejemplo de la construcción de las ondas de Bloch en la figura siguiente (tomada del texto de
Marder).
16 3 Electrones en un potencial periódico

3.1.2. Segunda prueba del teorema

A partir de la condición de Born - von Karman, podemos proponer soluciones ψ que tengan la periodicidad
del sistema ({Nj aj }) X
ψ(r) = ck ei k·r ,
k
es decir, una expansión de Fourier que respeta la periodicidad macroscópica a través de los valores permitidos
para k. Para el potencial al que está sometido el electrón también proponemos una expansión de Fourier, en
este caso respetando la periodicidad de la red de Bravais
X X
U (r) = UK ei K·r = UG ei G·r ,
K G

donde la suma abarca todos los vectores de la red recı́proca, cambiando la notación de K a G solo para no
confundir con k . Las ondas ei G·r son ortogonales (al integrar en el volumen v de una celda primitiva cualquiera),
de modo que los coeficientes UG se relacionan con el potencial U (r) a través de
Z
1 ∗
UG = d3 r e−i G·r U (r) = (U−G ) . (8)
v C
La última igualdad vale porque el potencial U (r) es real. Conviene elegir el 0 de la energı́as para que se anule
el término independiente de esta expansión, es decir
Z
1
U0 = d3 r U (r) = 0 .
v C
En los muchos casos en que el potencial es par (además de periódico), es decir U (−r) = U (r), las expresiones
anteriores demuestran que los coeficientes UG son reales (ejercicio).
Con las expansiones propuestas, podemos reescribir la ecuación de Schrödinger independiente del tiempo,
para lo cual notamos que
p̂2 ψ ~2 2 X ~2 k 2 X X ′
=− ∇ ψ= ck ei k·r y Uψ= UG ck ei (k+G)·r = UG ck′ −G ei k ·r .
2m 2m 2m
k G,k G,k′

Entonces "  #
~2 2 X ~2 k 2 X
− ∇ ψ + (U − ε) ψ = ei k·r − ε ck + UG ck−G = 0 .
2m 2m
k G

Como el segundo miembro corresponde a una expansión en ondas planas ei k·r , que son ortogonales, para que
valga la identidad deben anularse todos los coeficientes que las acompañan, es decir el corchete
 2 2 
~ k X
− ε ck + UG ck−G = 0 . (9)
2m
G

En lugar de resolver una ecuación diferencial para ψ, la ecuación de Schrödinger se transformó en un sistema
de ecuaciones que deben satisfacer los coeficientes ck con los que expandimos a ψ. Si bien la expresión anterior
3.1 Teorema de Bloch 17

aparentemente relaciona coeficientes ck para muchos valores de k, es importante señalar que en realidad solo
están conectados algunos k con otros k′ que difieren en vectores G de la red recı́proca. Sin embargo, al explicitar
la condición de contorno de Born - von Karman encontramos que todos los valores permitidos para k no exceden
el volumen de una celda primitiva de la red recı́proca (ver (7)), por lo que las conexiones aludidas solo se darán
en situaciones excepcionales, como veremos pronto.
Además, cada vez que en la expresión anterior aparece un coeficiente ck , aparecen todos los ck+G , de manera
que cada solución propuesta en lugar de ser ψk (r) = ck ei k·r se escribe
!
X X
i (k+G)·r i k·r i G·r
ψk (r) = ck+G e =e ck+G e ; (10)
G G

el factor entre paréntesis es la expansión de Fourier de una función con el perı́odo impuesto por las ondas planas
asociadas con la red recı́proca, es decir con la periodicidad de la red de Bravais. Con esto se completa entonces
la demostración del teorema de Bloch.

El vector k introducido en cada solución individual (4) se denomina momento cristalino del electrón, y no
debe confundirse con su momento lineal, ya que de algún modo contiene información acerca de la periodicidad
del potencial y los efectos de interferencia en las funciones de onda resultantes. Más adelante se aclarará mejor
el significado de k cuando analicemos estos electrones de Bloch bajo la acción de campos externos.
Un rasgo importante del momento cristalino k se refleja en la relación (10), que sugiere que la información
correspondiente a un k es equivalente a cualquier otro k + G trasladado a otra celda primitiva en el espacio
recı́proco. Esto significa que siempre puede escogerse el momento cristalino en la primera zona de Brillouin
(PZB), ya que allı́ está contenida toda la información relacionada con nuestras soluciones.
Una vez que tenemos caracterizado k, notamos que el número cuántico n señalado en ψnk indica que para
cada ecuación diferencial de Schrödinger pueden aparecer varias soluciones: la condición de periodicidad para
unk equivale a plantear un problema restringido a una celda primitiva del espacio directo, es decir un volumen
finito, donde las condiciones de contorno tı́picamente imponen un conjunto de autoenergı́as discretizadas. Esto
también puede verse al explicitar la acción de Ĥ sobre las ondas de Bloch
 
Ĥ ei k·r unk = ε ei k·r unk ,

resulta una ecuación diferencial en la que podemos identificar cierto operador Ĥk dependiente de k actuando
sobre las uk  2 
~
Ĥk uk = (−i ∇ + k)2 + U (r) uk = ε unk .
2m
Ya que no hay restricciones de antemano sobre k, lo pensamos como un parámetro que puede variar continua-
mente: para cada uno de ellos habrá en principio distintas soluciones, identificadas mediante el ı́ndice n.
Si bien puede mantenerse k en la PZB para describir un sistema, suele extenderse el análisis a todo el espacio
recı́proco, teniendo presente que la información se repetirá al trasladarnos a las diferentes celdas de Wigner-Seitz
del espacio k. Esto significa que siempre se cumple

ψn,k+G (r) = ψn,k (r) y εn,k+G (r) = εn,k (r) ∀ G de la red recı́proca.

Debido a que εn,k es periódico en k y además continuo, para cada n presenta un valor máximo y otro mı́nimo,
de manera que εn,k está contenido en esa banda de energı́as; de la Mecánica Cuántica además sabemos que
pueden existir brechas (gaps) de energı́a entre bandas contiguas. Esta información constituye lo que se denomina
estructura de bandas de un sólido, y en breve intentaremos encontrar soluciones aproximadas en algunos
casos simples.
Para cada banda n, denotando alternativamente εn (k) = εn,k , puede verse que el electrón tiene una velocidad
media (velocidad de grupo) dada por
 
1 1 ∂εn
vn (k) = ∇k εn (k) = .
~ ~ ∂k

Es decir, a pesar de las interacciones de los electrones con los átomos de la red, tenidas en cuenta en el potencial
periódico, las soluciones estacionarias predicen un movimiento sin que se degrade la velocidad de los paquetes
de onda con los que los representamos. Más adelante volveremos sobre estas cuestiones, con la esperanza de que
nos inunde esa tranquilidad que anhelamos.
18 3 Electrones en un potencial periódico

3.1.3. Superficie de Fermi

Como sabemos, en el estado fundamental el principio de exclusión no permite que todos los electrones ocupen
el estado individual de mı́nima energı́a, sino que se van llenando los estados con energı́a creciente εn (k) ≤ εF
hasta la energı́a de Fermi. A diferencia del modelo de electrones libres, las energı́as εn (k) no tienen una forma
explı́cita sencilla, y hay que tener la precaución de mantener k en la primera zona de Brillouin para no repetir
estados en nuestra construcción.
En el estado fundamental del conjunto de electrones pueden darse dos situaciones bien diferentes. Por un
lado, se completan algunas bandas de menor energı́a, y las bandas restantes quedan vacı́as, con una brecha
(gap) entre la última banda llena y la siguiente: si a temperatura ambiente Ta la brecha de energı́as es bastante
mayor que la excitación térmica kB Ta el material es aislante, mientras que cuando esta brecha es comparable a
kB Ta se trata de un semiconductor 6 . Como el número de estados disponibles en cada banda es igual al número
de celdas primitivas del cristal (número de k en la PZB), solo puede existir una brecha de energı́as cuando el
número de electrones aportados por cada celda primitiva es par, ya que la degeneración por espı́n hace intervenir
2 electrones por cada una —esta condición es necesaria, pero no suficiente.
La otra situación que puede ocurrir es que algunas bandas se llenan parcialmente, de manera que εF queda
contenida en el medio de una banda (o varias bandas): en este caso el material es un conductor metálico, y la
superficie εn (k) = εF que limita los estados ocupados de los libres se denomina superficie de Fermi. En el caso
anterior, la energı́a de Fermi se hallaba en el medio de un gap, y no era posible una relación similar a la de un
conductor: un sólido presenta propiedades metálicas cuando es posible definir una superficie de Fermi.

3.1.4. Densidad de estados

Al estudiar la contribución de los electrones a una propiedad termodinámica Q de un material, debemos


considerar el aporte de todos los estados (n, k) individuales ocupados
Z
X Q X d3 k
Q=2 Qn (k) o bien q = lı́m =2 Qn (k) .
V →∞ V
n PZB (2π)3
n,k

La integral debe abarcar una celda primitiva de la red recı́proca, por ejemplo la PZB. Tı́picamente Qn (k)
depende solo de εn (k), de modo que en términos de la densidad de estados g(ε) que habı́amos definido en §1.2.1,
el cálculo requerido es del tipo
Z X
q= dε g(ε) Q(ε) , donde g(ε) = gn (ε) ,
n

y en particular para la banda n


Z
d3 k 
gn (ε) = 3
δ ε − εn (k) .
PZB 4π
Otra forma de construir estas cantidades es imaginando una colección de superficies S(ε) en el espacio k, cada
una con energı́a ε constante, de manera que realizamos el cambio de variables k → ε, evaluando de este modo
Z
dS
gn (ε) dε = 3
δk ,
Sn (ε) 4π

donde δk es la proyección ortogonal a S(ε) de los incrementos en k necesarios para pasar de S(ε) a S(ε+ dε).
Todas estas cantidades pueden relacionarse mediante

dε = ∇εn (k) · δk = |∇εn (k)| δk ,

de modo que Z
dS 1
gn (ε) = 3
.
Sn (ε) 4π |∇εn (k)|
Como εn (k) es periódica y acotada, |∇εn (k)| puede anularse dentro de una celda primitiva, lo que provocarı́a
una divergencia en la expresión anterior: estas singularidades de van Hove son integrables en 3D, y suelen ocurrir
en puntos de especial interés, por lo que las encontraremos pronto en casos concretos.
6 Intrı́nseco, como lo llamaremos más adelante.
3.2 Potencial periódico débil 19

3.2. Potencial periódico débil (mezclado con el texto de Dresselhaus)


Si el potencial U se anula, la ecuación de Schrödinger es la de la partı́cula libre, y las soluciones son ondas
planas que solo deben respetar la periodicidad macroscópica de nuestro sistema (otra forma de convencerse
sobre los N valores permitidos de k), y las autoenergı́as son

~2 k 2
εo (k) = .
2m
Cuando el potencial
√ U (r) 6= 0 no altera demasiado las autoenergı́as individuales ni las soluciones de ondas planas
ψko (r) = (1/ V )eik·r (o |ki en la notación de Dirac), entonces es posible encarar el problema considerando a
U (r) como una perturbación independiente del tiempo. En este contexto, estimamos las autoenergı́as mediante
las correcciones
2
X |hk| U |k′ i|
ε(k) = εo (k) + hk| U |ki + .
| {z } o (k′ )6=εo (k)
εo (k) − εo (k′ )
ε
1er orden
Es directo verificar que la corrección de primer orden simplemente resulta el coeficiente U0 , que se anula en
virtud de nuestra elección para el cero de las energı́as7 . Entonces es necesario tener en cuenta las correcciones
de segundo orden, para lo cual expresamos los elementos de matriz como
Z Z
1 ′ 1
hk| U |k′ i = d3 r ei (k −k)·r U (r) = d3 r ei q·r U (r) ,
V V V V
donde sustituimos q = k′−k. Como r recorre todo el volumen V del sólido, puede representarse como un vector r ′
de una celda primitiva trasladado hasta r mediante un vector Rn (n = (n1 , n2 , n3 ) enteros) de la red de Bravais,
es decir r = r ′ +Rn . La integral anterior puede entonces realizarse acumulando las integrales correspondientes
a cada celda unidad de volumen v = V /N , y teniendo presente que el perı́odo del potencial es el de la red,
 
N1 ,N 2 ,N3 Z N1 ,N 2 ,N3 Z
1 X ′
3 ′ i q·(r +Rn ) 1 X
i q·Rn  ′

hk| U |k i = d r e ′
U (r + Rn ) =  e d3 r ′ ei q·r U (r ′ ) ,
V v V v
n=(1,1,1) n=(1,1,1)

En términos de los vectores primitivos {aℓ } y {bj } de la red directa y recı́proca, respectivamente, expresamos
P3 P3
Rn = ℓ=1 nℓ aℓ y q = j=1 αj bj ; en particular, recordemos que se satisface (7), es decir αj = mj /Nj , con
mj ∈ Z. Teniendo presente que se cumple aℓ·bj = 2π δℓj , la suma entre paréntesis puede resolverse exactamente
(ejercicio)  
N1 ,N 2 ,N3 3 Nj 3  
X Y X  nj Y 1 − ei 2π mj
ei q·Rn =  ei 2π αj = .
j=1 n =1 j=1
e−i 2π mj /Nj − 1
n=(1,1,1) j

La última igualdad vale siempre que ei 2π αj = ei 2π mj /Nj 6= 1 : en ese caso, la sumatoria se anula (porque mj
es entero), y por lo tanto tampoco hay corrección de segundo orden en las energı́as. Sin embargo, cuando
αj = mj /Nj es entero todos los términos dentro del corchete aportan con 1 unidad, y el producto de las sumas
P3
parciales es N1 N2 N3 = N . Esa situación se da cuando q = k′ −k = j=1 αj bj coincide entonces con un vector
G de la red recı́proca. El elemento de matriz que buscábamos resulta
Z
N ′
hk| U |k′ i = d3 r ′ ei G·r U (r ′ ) δk′−k,G = UG δk−k′,G ,
V v
donde en la última expresión cambiamos el signo de k′ − k, según la definición (8) de UG . Resumiendo, la
teorı́a de perturbaciones nos permite afirmar que las energı́as ε(k) son muy parecidas a las de los electrones
libres cuando los estados representados por k no están conectados con otro k′ mediante un desplazamiento por
un vector de la red recı́proca —por supuesto, siempre dentro de la primera zona de Brillouin, ya que todos los
estados k se corresponden con cualquier otro k′ = k−G, fuera de la PZB. Sin embargo, cuando nos aproximamos
al borde de la PZB, el denominador de la expresión anterior se anula, y justamente el momento cristalino se
corresponde con el de otro extremo de la celda primitiva del espacio recı́proco. Entonces la expresión
2 2
2m X |UG | ~2 k 2 2m X |UG |
ε(k) = εo (k) + 2 = + 2 2 (11)
~2 2
k −k ′ 2m ~ k 2 − |k − G|
G G
k′ ∈ PZB k−G ∈ PZB

7 Aun cuando no se anulara, representarı́a una corrección constante para todos los niveles, por lo que de cualquier modo resulta

irrelevante.
20 3 Electrones en un potencial periódico

2
nos indica dos cosas importantes: por un lado, que cuando se cumple la condición de Laue k 2 = |k − G| , el
denominador del último término se anula; por el otro, que cuando eso ocurre las correspondientes autoenergı́as
son idénticas, es decir hay degeneración y debemos retomar los cálculos mediante la teorı́a de perturbaciones
apropiada.
Ası́, una vez que identificamos los momentos cristalinos de la PZB que son equivalentes (idéntica autoenergı́a),
recordemos que debemos efectuar un cambio de base para diagonalizar la matriz asociada con la perturbación
(construida con los elementos hk| U |k−Gi) en el subespacio asociado a la degeneración, lo que nos lleva a
correcciones a ε(k) en primer orden en la nueva base, que tı́picamente levantan la degeneración8 . Por ejemplo,
si solo hay un G1 que conecta dos estados de la PZB, es decir k1 y k1 −G1 , necesitamos resolver

εo (k) + ε(1) (k) − ε hk| U |k−G1 i


=0. (12)
hk−G1 | U |ki εo (k−G1 ) + ε(1) (k−G1 ) − ε

Aquı́ debe tenerse en cuenta que las correcciones de primer orden ε(1) en la base {|ki} se anulan, y que en
realidad, para k = k1 , εo (k1 −G1 ) = εo (k1 ). Todo esto puede verse también volviendo a la ec. (9)
 2 2 
~ k X
− ε ck + UG ck−G = 0 .
2m
G

y considerando en el ejemplo previo un único estado con G = +G1 conectado con el k = k1 de interés (un
solo sumando), vinculado con otra ecuación que involucra a k = k1 −G1 con un único término G = −G1 en la
sumatoria: el sistema de ecuaciones resultante para ck1 y ck1−G1
  2 2 
 ~ k1

 − ε ck1 + UG1 ck1 −G1 =0

 2m
 2  (13)
 2

 ~ |k 1 −G 1 |

 U−G1 ck1 + − ε ck1−G1 = 0
2m

tiene solución no trivial cuando se cumple la condición (12) anterior, notando que hk−G1 | U |k1 i = UG1 = (UG1 ) .
Resolviendo entonces el determinante (12) obtenemos
2
(ε − εo (k)) (ε − εo (k−G1 )) = |UG1 | (14)
s 2
εo (k) + εo (k−G1 ) εo (k) − εo (k−G1 )
⇒ ε= ± + |UG1 |2 ,
2 2

En particular, cuando se cumple la condición de


Laue mencionada arriba, es decir cuando el vector k
alcanza exactamente el plano de Bragg,
ε(k1 ) = εo (k1 ) ± |UG1 | ,
con lo cual las energı́as que para la partı́cula libre
con k = k1 valı́an ~2 k12 /(2m), ahora pasan a separarse
2|UG1 |. Además, de la (14) vemos que
 
∂ε ~2 G1
= k1 − ,
∂k k=k1 m 2
es decir, ∇k es paralelo al plano de Bragg: las super-
ficies de ε constante son perpendiculares al plano de
Bragg. Para estos casos, si volvemos a la (13) para el caso de UG1 real (U (r) par), concluimos que ck1 =
± sgn(UG1 ) ck1−G1 . Entonces, cuando UG1 > 0   
 2 2 G1 · r
 |ψ(r)| ∝ cos

 , ε = εo (k1 ) + |UG1 |
2
 
 G1 · r
 |ψ(r)|2 ∝ sen2 , ε = εo (k1 ) − |UG1 | ,


2
mientras que cuando UG1 < 0
8 Para un repaso muy veloz, puede consultarse http://quechua.fis.uncor.edu/cuantica2/clases-mc2.pdf, §4
3.2 Potencial periódico débil 21
  
 2 2 G1 · r

 |ψ(r)| ∝ sen , ε = εo (k1 ) + |UG1 |
 2
 
 2 2 G1 · r
ε = εo (k1 ) − |UG1 | .

 |ψ(r)| ∝ cos
 ,
2

La obtención de estas estructuras para un problema unidimensional de parámetro a es bastante sencilla, como
ocurre con el potencial U (x) = −Vo cos(2π x/a) (ejercicio), que puede extenderse fácilmente a una sumatoria
de términos similares, siempre respetando la periodicidad de la red (con múltiplos de 2π/a).
Para estructuras en 2 o 3 dimensiones, el problema se complica principalmente al momento de encontrar en
qué casos se dan las degeneraciones: el desafı́o es hallar los G que intervienen en la sumatoria del miembro de la
izquierda de (11), ya que el resto del desarrollo es similar al presentado para el caso en que contribuye un único
término. Lo habitual es proveer la descripción a lo largo de una curva definida entre puntos de alta simetrı́a del
sistema: en cada tramo se da una parametrización y se traza una curva como en un sistema unidimensional.

3.2.1. Construcción de las superficies de Fermi

Como dijimos arriba, un potencial periódico débil distorsiona la esfera de Fermi, cuando las caracterı́sticas del
sistema impone que esta se intersecte con los planos de Bragg. Lejos de estos planos la esfera no se modifica, pero
cuando se cumple la condición de Laue y analizamos estados k donde ocurre degeneración, la distorsión no se
da repentinamente, sino que empieza a hacerse notoria en las proximidades de estos planos. Como mencionamos
más arriba, las brechas de energı́a se dan de manera que en esos puntos ∇k ε es paralelo al plano de Bragg.
Obviamente, las superficies de Fermi de un metal se obtienen una vez que se ha calculado correctamente la
estructura de bandas para un determinado modelo. En la figura siguiente (tomada del texto de Simon) se
ejemplifican algunos casos para estructuras bcc (potasio y litio) y fcc (cobre).

Zonas de Brillouin Está claro que para realizar la


construcción descripta es necesario ubicar adecuada-
mente los planos de Bragg. Para ello conviene recor-
dar que estos siempre bisectan a los vectores de la red
recı́proca, por lo que es posible dar como definición
alternativa para la primera zona de Brillouin al con-
junto de todos los k que pueden alcanzarse sin cruzar
ningún plano de Bragg. Del mismo modo, la segunda
zona de Brillouin es el conjunto de todos los puntos del
espacio k a los que puede llegarse atravesando solo un
plano de Bragg. En general se define la n-ésima zona
de Brillouin como el conjunto de puntos que pueden al-
canzarse desde el origen habiendo cruzado exactamente
(n−1) planos de Bragg.
(imagen tomada del texto de Kaxiras)
22 4 LCAO: tight-binding (enlace fuerte)

4. Combinación Lineal de Orbitales Atómicos: tight-binding (enlace


fuerte) (basado en el texto de Kaxiras)
En ciertos casos la aproximación de potencial periódico débil no resulta adecuada: los átomos no pueden con-
siderarse como aislados, y el solapamiento de orbitales electrónicos de átomos vecinos es importante. Entonces
es conveniente utilizar funciones de onda asociadas con esos átomos, es decir, considerar electrones fuertemente
ligados a ellos, en lugar de procurar una aproximación a partir de las ondas planas que identifican a las partı́cu-
las libres. El método de “enlace fuerte” (tight-binding) consiste precisamente en representar los estados de
los electrones construyendo funciones de onda a partir de la combinación lineal de orbitales atómicos (linear
combination of atomic orbitals, LCAO). Obviamente este método no puede ser adecuado para metales, donde
los electrones de valencia se comparten a lo largo de toda la red cristalina.
Utilizamos la notación originada en las soluciones atómicas asociadas a un potencial central, de manera que
los números cuánticos λ = (n, ℓ, m) se corresponden con las autofunciones individuales φλ (r) que obtenı́amos en
Mecánica Cuántica. Con esos orbitales, centrados en cada sitio R′ de la red, construimos una base {χk,λ } para
los electrones del cristal
1 X ik·R′
χk,λ (r) = √ e φλ (r − R′ ) . (15)
N R′
Estos elementos satisfacen el teorema de Bloch, es decir se cumple (ejercicio)

χk,λ (r + R) = eik·R χk,λ (r) .

Con esta base, las autofunciones individuales para los electrones pueden escribirse como combinación lineal de
aquellos orbitales λ que intervienen X (n)
ψn,k (r) = ckλ χkλ (r) ,
λ
que deben satisfacer la ecuación de Schrödinger estacionaria
X hD E D Ei
(n)
Ĥψnk (r) = εn (k) ψn,k (r) ⇒ χkµ Ĥ χkλ − εn (k) χkµ χkλ ckλ = 0 . (16)
λ

Aquı́ solo interviene un único k porque elegimos nuestra base de modo que

hψnk | ψn′ k′ i ≃ δ(k−k′ ) ,

donde k y k′ pertenecen a la PZB.


La relación (16) es en realidad nuestra ecuación de autovalores, donde
D E 1 X ik·(R′ −R′′ )
χkµ χkλ = e hφµ (r−R′′ ) | φλ (r−R′ )i definiendo R = R′ −R′′
N ′ ′′
R ,R
1 X ik·R X
= e hφµ (r) | φλ (r−R)i = eik·R hφµ (r) | φλ (r−R)i
N
R,R
′ R

involucra los “elementos de matriz de solapamiento” hφµ (r) | φλ (r−R)i. Del mismo modo (ejercicio)
D E X
χkµ Ĥ χkλ = eik·R hφµ (r)| Ĥ |φλ (r−R)i
R

contiene los elementos de matriz de Ĥ entre diferentes estados. Una aproximación importante de este modelo
es que los estados intervinientes están bastante localizados, es decir

hφµ (r) | φλ (r−R)i = δµ,λ δR,0 ,

de manera que los elementos de matriz de solapamiento se anulan excepto cuando analizamos estados del mismo
átomo (R = 0) y con el mismo orbital (µ = λ). Con el mismo criterio se elige

hφµ (r)| Ĥ |φλ (r−R)i = ελ δµ,λ δR,0

distinto de cero para orbitales del mismo átomo (R = 0), o bien para primeros vecinos separados por vectores
dpv X
hφµ (r)| Ĥ |φλ (r−R)i = Vλµ δR,dpv ,
pv
4.1 Cadena monoatómica con orbitales s o p 23

que no se anula aunque se trate de distintos átomos, y posiblemente de diferentes orbitales (todos los otros
elementos de matriz se anulan). Los coeficientes Vλµ se denominan elementos de matriz de “hopping” (salto).
Resumiendo, es necesario construir todos estos elementos de matriz para resolver la ecuación secular (16),
y con ella encontrar la estructura de bandas determinadas por las relaciones εn (k). Una forma alternativa de
ver el problema es pensar que el hamiltoniano Ĥo asociado al átomo aislado localizado en algún sitio de la red,
para el cual conocemos las soluciones φλ , es perturbado por el potencial W (r) asociado con el resto de la red.
Considerando entonces Ĥ = Ĥo +W (r), el método perturbativo nos permite estimar las correcciones a primer
orden X hD E D Ei
(n)
χkµ W (r) χkλ − (εn (k) − εµ ) χkµ χkλ ckλ = 0 .
λ

Esta relación permite evidenciar que los autovalores εn (k) proveen los corrimientos desde las autoenergı́as
originales εµ para el átomo
D aislado, debido
E al efecto del potencial W (r) asociado al resto del cristal; por este
motivo, a los factores χkµ W (r) χkλ se denominan “integrales de campo cristalino”, en contraposición al
efecto de los orbitales compartidos, a los que se atribuye un campo ligante.

4.1. Ejemplo: cadena monoatómica con orbitales s o p


Para facilitar la comprensión del método, analizamos el caso de una cadena monoatómica unidimensional
con parámetro a, en la que solo intervienen orbitales s o p: todos estos átomos tienen asociado un orbital s, o
todos tienen un orbital p, es decir en las sumatorias anteriores interviene solamente λ = s o solamente λ = p. En
este caso hay una única coordenada x, asociada a una única componente k en el espacio recı́proco, por lo que,
escribiendo los vectores de la red como R′ = ma x̂, los elementos de la base (15) se escriben

1 X
χk,λ (x) = √ ei k ma φλ (x − ma) .
N m=−∞

En este caso
hφλ (x) | φλ (x − ma)i = δm,0 ,
y además
hφλ (x)| Ĥ |φλ (x − ma)i = ελ δm,0 hφλ (x)| Ĥ |φλ (x − ma)i = γλ δm,±1 ,
(mismo átomo) (primeros vecinos)

donde γλ representa los coeficientes de hopping. Como aquı́


interviene siempre un único orbital λ, ψnk (x) = ck χk,λ (x)
contiene un único sumando, al igual que la ecuación de
autovalores (16), cuya resolución resulta muy sencilla (ejer-
cicio):

ε(k) = ελ + 2 γλ cos(ka) (ck = 1) .

Como los orbitales s tienen simetrı́a esférica, los coeficientes


de hopping correspondientes
Z
γs = dx φ∗s (x) Ĥ(x) φs (x − a) ,

son siempre negativos (ejercicio), ya que las φs son autofun-


ciones asociadas a estados ligados, de manera que la relación
anterior corresponde al gráfico superior. Por el contrario, los
orbitales p son impares, con lo cual la región abarcada por
φp > 0 se torna negativa al aplicar Ĥ, de modo que la inte-
gral para γp resulta positiva. El gráfico para ε(k) entonces
resulta como el de la figura inferior. Vale la pena comparar
cualitativamente estas curvas con las correspondientes a las
de un potencial periódico débil.
La generalización a 2D es directa, y constituye un
ejemplo simple en la descripción de una red cuadrada.
Queda como ejercicio mostrar que en este caso (solo
24 4 LCAO: tight-binding (enlace fuerte)

λ = s o solo λ = p) la relación de dispersión resulta

ε(k) = ελ + 2 γλ [cos(kx a) + cos(ky a)]

(por supuesto, el mismo razonamiento lleva a la generalización en 3D).


Las expresiones obtenidas para las relaciones de dispersión en d dimensiones permiten expresar el rango de valores
de ǫ abarcado por cada banda —el “ancho de banda”— como (ejercicio)

w = 4 d γλ .

4.2. Ejemplo: red cuadrada con orbitales s y p


En esta red bidimensional monoatómica de parámetro a, a cada sitio pueden asociarse 4 orbitales: s, px , py y pz .
Los elementos de matriz de solapamiento resultan
D E X
hφµ (r) | φλ (r−R)i = δλ,µ δR,0 ⇒ χkµ χkλ = eik·R hφµ (r) | φλ (r−R)i = δλ,µ ,
R

mientras que los elementos hφµ (r)| Ĥ |φλ (r−R)i son distintos de cero solo para R = ±ax̂, ±aŷ o 0 . Las diferentes
combinaciones φµ , φλ son

εs = hφs (r)| Ĥ |φs (r)i


εp = hφpx (r)| Ĥ |φpx (r)i = φpy (r) Ĥ φpy (r) = hφpz (r)| Ĥ |φpz (r)i

hφs (r)| Ĥ |φpα (r)i = 0 (α = x, y, z) , hφs (r)| Ĥ |φpα (r±ax̂)i = 0 (α = y, z)

hφs (r)| Ĥ |φpα (r±aŷ)i = 0 (α = x, z)

Vss = hφs (r)| Ĥ |φs (r±ax̂)i = hφs (r)| Ĥ |φs (r±aŷ)i


Vsp = hφs (r)| Ĥ |φpx (r−ax̂)i = − hφs (r)| Ĥ |φpx (r+ax̂)i = hφs (r)| Ĥ φpy (r−aŷ) = − hφs (r)| Ĥ φpy (r+aŷ)
Vppσ = hφpx (r)| Ĥ |φpx (r±ax̂)i = φpy (r) Ĥ φpy (r±aŷ)
Vppπ = hφpx (r)| Ĥ |φpx (r±aŷ)i = φpy (r) Ĥ φpy (r±ax̂) = hφpz (r)| Ĥ |φpz (r±ax̂)i = hφpz (r)| Ĥ |φpz (r±aŷ)i
 
hφpα (r)| Ĥ φpβ (r±ax̂) = hφpα (r)| Ĥ φpβ (r±aŷ) = hφpα (r)| Ĥ φpβ (r) = 0 (α, β = x, y, z ; α 6= β)

Como en las discusiones anteriores, el hecho de que los orbitales s sean isotrópicos y que los p sean impares permite
concluir que varios de los elementos de matriz anteriores se anulan, mientras que muchos otros resultan idénticos. Con
todos estos coeficientes podemos evaluar

hχks (r)| Ĥ |χks (r)i = hφs (r)| Ĥ |φs (r)i + eik·ax̂ hφs (r)| Ĥ |φs (r−ax̂)i + e−ik·ax̂ hφs (r)| Ĥ |φs (r+ax̂)i +
+ eik·aŷ hφs (r)| Ĥ |φs (r−aŷ)i + e−ik·aŷ hφs (r)| Ĥ |φs (r+aŷ)i
= εs + 2 Vss [cos(kx a) + cos(ky a)] ,

y también

hχks (r)| Ĥ χkpx (r) = 2 i Vsp sen(kx a) , hχks (r)| Ĥ|χkpy (r)i = 2 i Vsp sen(ky a) ,
 
χkpz (r) Ĥ χkpz (r) = εp + 2 Vppπ cos(kx a) + cos(ky a) ,
χkpx (r) Ĥ χkpx (r) = εp + 2 Vppσ cos(kx a) + 2 Vppπ cos(ky a) ,
D E
χkpy (r) Ĥ χkpy (r) = εp + 2 Vppπ cos(kx a) + 2 Vppσ cos(ky a) .

Con estos elementos escribimos las expresiones correspondientes y podemos resolver (numéricamente) el sistema de
ecuaciones para cada k. A diferencia de los casos unidimensionales, en estos problemas se analiza el comportamiento de
la relación de dispersión en puntos de la red recı́proca con alta simetrı́a; para ello se construyen recorridos entre

Γ = (kx , ky ) = (0, 0) , W ó M = (π/a, π/a) , X = (π/a, 0) ,

parametrizando: ∆(t) = (1 − t)(π/a, 0) en el tramo X-Γ; Σ(t) = t(π/a, π/a) entre Γ y M ; y de M a X, Z(t) =
(π/a, (1 − t)π/a), con 0 ≤ t ≤ 1 en todos los casos. En la gráfica siguiente (tomada del texto de Kaxiras) se muestran
las curvas correspondientes a las relaciones de dispersión asociadas con este sistema cuando se fijan los parámetros en
εs = −8,0 eV, Vss = −2,0 eV, Vsp = −2,1 eV, Vppσ = +4,4 eV, Vppπ = −1,8 eV y εo = 0 eV. Claramente se ve que no siempre
están separadas las bandas cuando k alcanza un plano de Bragg (¿dónde están en este caso?).
4.3 Funciones de Wannier 25

4.3. Funciones de Wannier


No siempre es posible una descripción adecuada mediante la combinación lineal de orbitales atómicos (tight binding),
ni tampoco es adecuada la hipótesis de potencial periódico débil. En tales casos pueden utilizarse expansiones similares
a las planteadas en el modelo de tight binding
X
ψn,k (r) = fn (R, r)eik·R ,
R

es decir, un desarrollo que tiene en cuenta la periodicidad de ψnk como función de la variable k al trasladarla en un vector
G cualquiera de la red recı́proca, ya que eiG·R = 1 . Como siempre, los coeficientes de cada una de estas componentes se
determina aprovechando la ortogonalidad de estas ondas en la PZB
Z
1
fn (R, r) = d3 k e−ik·R ψnk .
vZB PZB
Puede verse que es necesario que la dependencia de estos coeficientes con R y r sea de la forma fn (R, r) = fn (r −R),
para que efectivamente se cumpla (ejercicio) el teorema de Bloch
ψnk (r + R) = eik·R ψnk (r) . (5)
Se deja también como ejercicio mostrar que las funciones de Wannier fn resultan ortogonales si están centradas en
distintos sitios de red o corresponden a diferentes bandas, es decir
Z
d3 r fn∗ (r−R) fn′ (r−R′ ) ∝ δn,n′ δR,R′ ,

de manera que conforman una base alternativa para encontrar los niveles electrónicos en un sólido cristalino.
Entre las muchas aplicaciones de las funciones de Wannier se encuentran intentos para describir propiedades de
transporte, influencia de impurezas en los niveles electrónicos, y diversos fenómenos magnéticos en sólidos. Estos temas
se discutirán en las secciones siguientes, aunque no profundizaremos en los cálculos basados en estas funciones.

Alternativamente a este método se han propuesto diferentes aproximaciones para describir la estructura electrónica
en distintas situaciones, como las llamadas “funciones de onda de valencia”, el “método celular”, el modelo de “ondas
planas aumentadas”, el de “ondas planas ortogonalizadas”, etc.

5. Dinámica de electrones: aproximación semiclásica (basado en el texto de


Ashcroft)

La construcción que fuimos desarrollando permite describir el estado de un electrón en un sólido cristalino mediante
una función de onda que respete el teorema de Bloch (4). A diferencia de la descripción clásica mediante ondas planas,
26 5 Dinámica de electrones: aproximación semiclásica

utilizamos las correspondientes ondas de Bloch

ψnk (r) = eik·r unk (r) , con unk (r + R) = unk (r) .

El objetivo de la aproximación semiclásica es retomar las descripciones originalmente propuestas en los modelos de
Drude-Sommerfeld, pero considerando valores medios más realistas provistos mediante estas ondas de Bloch, las cuales
involucran elementos representativos de la naturaleza cuántica de los fenómenos descriptos, ası́ como de la periodicidad
de la red cristalina analizada.
Anteriormente sugerimos que la velocidad media de los electrones de Bloch con vector de onda k está dada por
1 ∂εn (k)
vn (k) = . (17)
~ ∂k
Para demostrarlo, es necesario recordar que las ondas de Bloch ψnk (r) son autofunciones del hamiltoniano individual,
es decir
~2 2
 
Ĥ ψnk (r) = − ∇ + U (r) ψnk (r) = εn (k) ψnk (r) .
2m
Como ψnk (r) = eik·r unk (r),
h  i h i
∇2 ψnk = ∇ · ∇ eik·r unk = ∇ · eik·r (ik + ∇) unk = eik·r (ik + ∇)2 unk ,

con lo cual la ecuación de Schrödinger resulta


 2
~ (ik + ∇)2

Ĥ ψnk = eik·r − + U (r) unk = eik·r εn (k) unk (r) .
2m

Esto equivale a
~2
Ĥk unk = εn (k) unk , con Ĥk =(−i ∇ + k)2 + U (r) ,
2m
es decir, las εn (k) también son los autovalores del operador Ĥk , cuyas autofunciones son las unk . Este resultado es
particularmente útil, ya que permite considerar pequeñas modificaciones a un valor de k, cuyo efecto en las autoenergı́as
puede escribirse como
1 X ∂ 2 εn
εn (k + q) = εn (k) + ∇k εn · q + qj qℓ + O(q 3 ) . (18)
2 ∂kj ∂kℓ
j,ℓ

Como εn (k + q) debe ser autovalor de

~2
 2
~2 q 2

~
Ĥk+q = (−i ∇ + k + q)2 + U (r) = Ĥk + q · (−i ∇ + k) + ,
2m m 2m

las modificaciones a εn (k) pueden considerarse como resultado de la perturbación entre corchetes. Para q pequeños
tenemos en cuenta solo los términos hasta el primer orden, de modo que la perturbación será

~2
∆Ĥk+q ≈ q · (−i ∇ + k) ,
m
cuyo efecto puede estimarse mediante teorı́a de perturbaciones a primer orden, utilizando las autofunciones unk (r)
correspondientes a Ĥk

~2
D E Z 
∆εn (k) = unk ∆Ĥk+q unk = d3 r u∗nk (−i ∇ + k) unk · q .
m v

Comparando con la (18), identificamos

~2 ~2
Z Z
∇k εn = d3 r u∗nk (−i ∇ + k) unk = d3 r ψnk

(−i ∇) ψnk .
m v m v

La última igualdad se cumple ya que, como vimos, −i∇ eik·r unk = eik·r (−i∇+k) unk . La relación obtenida es suma-


mente importante, ya que (−i~∇)/m es el operador velocidad, de manera que la integral en el miembro de la derecha
involucra su valor de expectación hvi en el autoestado ψnk . De este modo queda demostrada la asociación (17) para la ve-
locidad media correspondiente a cada estado k de la banda n . Es interesante destacar que el principio de correspondencia
nos lleva naturalmente a realizar esta asociación, que también podrı́a plantearse en el contexto del teorema de Ehrenfest,
teniendo en cuenta que la velocidad de grupo refleja el movimiento conjunto del paquete de ondas asociado al electrón.
Cada solución estacionaria ψnk tiene asociada entonces una velocidad media vn (k) constante; como ya señalamos,
esta se mantendrı́a en ese valor indefinidamente. No puede argumentarse que las colisiones con los núcleos degrada ese
estado, pues dichas interacciones ya han sido incluidas en el potencial periódico efectivo U (r). En realidad el resultado
de electrones que se propagan sin atenuación se corresponde con el modelo de cristal perfecto, donde las interferencias
constructivas dan como consecuencia una onda estacionaria para describir el estado del electrón. Nuestra intuición siempre
27

nos lleva a pensar en sucesivas dispersiones, las cuales efectivamente ocurren en un cristal real y como consecuencia
implican que los metales siempre ofrecen cierta resistencia eléctrica. Esto tiene lugar porque en los cristales reales existen
imperfecciones como iones faltantes en algunos sitios (vacancias), impurezas (sustituciones), dislocaciones, etc., además
de vibraciones térmicas que alteran la rigidez que supone la periodicidad de una red de Bravais.
Más adelante tendremos en cuenta las dispersiones mencionadas y su influencia en los fenómenos de transporte.
Ahora nos abocaremos a describir adecuadamente los tramos entre esas colisiones, valiéndonos del modelo semiclásico,
que se basa en la expresión previa para las velocidades medias, y su evolución como respuesta a los diferentes campos
externos aplicados. Este modelo trata los campos externos desde un enfoque clásico, mientras que el efecto del potencial
se analiza a través de una descripción cuántica, que se refleja en la estructura de bandas εn (k).
Para desarrollarlo, asociamos a cada electrón una posición r, un vector de onda k y un ı́ndice n correspondiente a
una dada banda, y nos basamos en las siguientes hipótesis:
• el ı́ndice n es una constante de movimiento: las transiciones entre bandas no están permitidas en este modelo;
• la evolución del vector posición está dada por las ecuaciones de movimiento
 
1 ∂εn (k) 1
ṙ = vn (k) = ; ~k̇ = −e E(r, t) + vn (k) × H(r, t) ; (19)
~ ∂k c

• los electrones deben respetar el principio de exclusión, por lo que en cada banda es imposible que compartan un
estado con determinados k en la primera zona de Brillouin y coordenada de espı́n.

Implicancias y alcance del modelo


Varias caracterı́sticas de esta aproximación se infieren directamente, antes de encarar algún ejemplo concreto. Por
ejemplo, el hecho de que los campos externos no provoquen transiciones entre bandas tiene como consecuencia notable que
los números de electrones en cada banda se mantienen fijos. Las propiedades del material en cuanto a los fenómenos de
transporte estarán regidas por las poblaciones de cada banda: aquı́ se pondrá en evidencia la relevancia de las expresiones
que puedan obtenerse para la determinación de la estructura de bandas, como las descriptas en capı́tulos anteriores.
La movilidad de los electrones en las bandas varı́a, porque están regidas por diferentes relaciones de dispersión εn (k).
Está claro que en el análisis correspondiente a una determinada temperatura T (en general próxima a la temperatura
ambiente), descartaremos aquellas bandas para las cuales todas sus energı́as excedan la energı́a de Fermi εF en varias
veces kB T , ya que estarán completamente desocupadas. Pronto veremos que tampoco es necesario considerar aquellos
estados cuyas energı́as sean bastante menores que εF , con lo cual se restringe mucho el número de portadores de carga
que deben ser tenidos en cuenta en nuestra descripción.
Es importante señalar que cuando U (r) se hace demasiado pequeño, el modelo semiclásico no puede utilizarse:
cualquier campo eléctrico E constante aplicado harı́a crecer k indefinidamente, aunque como no pueden provocarse
transiciones entre bandas, el electrón no puede superar la energı́a máxima de la banda donde se encuentra. Esto significa
que el potencial debe tener una intensidad mı́nima para que pueda emplearse este modelo; las condiciones que deben
satisfacer entonces los campos externos en relación con la red cristalina se resumen como
 2  2
εgap (k) e~H εgap (k)
→ eEa ≪ → ~ωc = ≪
εF mc εF
(ωc = eH/(mc) es la frecuencia ciclotrónica). Aquı́ a está relacionada con las constantes de la red, y εgap (k) es la diferencia
entre las energı́as εn (k) en dos bandas diferentes con el mismo valor de k. La primera de estas restricciones siempre se
cumple en los metales, aunque en aislantes (y algunos semiconductores) esta condición puede fallar, y campos eléctricos
muy intensos pueden inducir una “ruptura eléctrica” (chisporroteo) provocando una transición interbandas. También
debe prestarse atención al caso de campos magnéticos muy intensos, que pueden hacer que no se cumpla la segunda de
las restricciones anteriores.
A estas limitaciones deben agregarse dos condiciones extras; una relacionada con la frecuencia ω de los campos
electromagnéticos aplicados
~ω ≪ εgap
para evitar la posibilidad de inducir transiciones interbandas mediadas por un único fotón; y también debe cumplirse
que la longitud de onda de los campos aplicados sea suficientemente grande
λ≫a,
de manera que los paquetes de onda de los electrones sean adecuadamente descriptos.

Bandas llenas no conducen


Notando que para cualquier función periódica en el espacio k , f (k + G) = f (k), donde G es un vector de la red
recı́proca, se cumple Z Z
If (G) = d3 k f (k + G) = d3 k f (k) ,
PZB PZB
28 5 Dinámica de electrones: aproximación semiclásica

es decir, If resulta independiente de G, podemos escribir


Z Z
dIf d f (k + G) d f (k + G)
=0= d3 k = d3 k .
dG PZB dG PZB dk
En particular, tomando G = 0, Z
d f (k)
d3 k =0.
PZB dk
Para describir la conducción a partir del desplazamiento de los electrones, debemos computar la densidad de corriente

d3 k 1 ∂εn (k)
Z
j = (−e) 3
,
PZB 4π ~ ∂k
mientras que para el transporte de energı́a tenemos

d3 k d3 k 1 ∂ [εn (k)]2
Z Z
1 ∂εn (k) 1
jε = 3
εn (k) = .
PZB 4π ~ ∂k 2 PZB 4π 3 ~ ∂k

Tanto εn como ε2n son funciones periódicas, con el perı́odo de la red recı́proca, de modo que aplicando el resultado
anterior, vemos que en una banda completa (donde barremos todos los estados k ocupados) se cumple

j=0 y jε = 0 (banda llena) .

Esto nos permite afirmar que las bandas que están completas no contribuyen a los fenómenos de transporte. Dicho de
otro modo, la conducción de un material se debe solamente a las bandas parcialmente llenas: justamente eso es lo que
proponı́an los modelos de Drude-Sommerfeld, ya que solo se consideraban los electrones “de valencia” aportados por los
átomos a la banda de conducción. Por otro lado, cuando un sólido tiene todas las bandas completas, no tiene portadores
disponibles para la conducción, y resulta aislante eléctrico y térmico (en lo relativo al transporte debido a los electrones).
Vale la pena recordar que como el número de estados disponibles en cada banda es dos veces el número de sitios de
la red cristalina, para que un sólido cristalino sea aislante debe aportar un número par de electrones por celda primitiva
—ası́ cierto número de bandas se llenará por completo. Sin embargo, hay muchos materiales que aportan un número par
de electrones por celda, pero por el solapamiento entre sus bandas de energı́a, tienen bandas parcialmente llenas y por
lo tanto resultan conductores.

5.1. Movimiento en un campo eléctrico constante (corriente continua)


En el caso en que las fuerzas aplicadas se deben a un campo eléctrico, la ecuación de movimiento (19) tiene como
solución
eE 
k(t) = ko − t ko ≡ k(0) .
~
Aquı́ se pone nuevamente en evidencia el hecho de que una banda llena no aporta a la conducción, ya que la magnitud
de la evolución de todos los vectores k es siempre la misma: los momentos cristalinos forzados a salir por una cara de la
PZB “entran” por la cara opuesta ocupando los estados que simultáneamente se fueron liberando a la misma velocidad.
La corriente inducida no necesariamente será proporcional a k, porque, como ya mencionamos, el momento cristalino
no solo refleja la acción de las fuerzas externas, sino también la estructura del potencial periódico de la red. Pero sı́
sabemos que la corriente debe ser proporcional a la velocidad media v(k), que evolucionará con t a través de la evolución
de k(t) :  
 eE
v k(t) = v ko − t .
~
Aquı́ encontramos un resultado que fácilmente nos lle-
va al paroxismo: v es periódica con k (y acotada), y como εp +γp ε(k)
k varı́a linealmente con t, si E es paralelo a algún vec- v(k) 2aγp
tor de la red recı́proca, la corriente inducida por el campo +
~
será oscilatoria. Podemos ejemplificar estas “oscilaciones de
Bloch” en el caso que resolvimos mediante tight-binding en
una dimensión para orbitales λ = p o s
εp 0
1 ∂ε 2 a γλ
ε(k) = ελ +2 γλ cos(ka) ⇒ v = =− sen(ka) .
~ ∂k ~
Como en la PZB −π ≤ ka ≤ +π, hay valores de k para los
que la aceleración es contraria al campo aplicado: evidente- 2aγp

mente esto refleja la acción del potencial periódico, además ~
del efecto debido al campo externo. Conviene notar que en εp −γ
p
particular aquı́ se da que v(ka → ±π) → 0, es decir que
aunque el campo externo trata de trasladar k a través del −π/a 0 π/a
plano de Bragg que delimita la PZB (en el sentido de −E), k
5.1 Movimiento en un campo eléctrico constante 29

la velocidad se reduce hasta anularse, produciéndose una reflexión de Bragg: similar a las que observábamos para DRX,
aunque en este caso se trata de los electrones.
De la expresión anterior para v(k) podemos explicitar la dependencia con t

2 a γp
 
eEa
v(t) = + sen t − ko a ,
~ ~

donde se evidencian las oscilaciones que mencionábamos. Si entre colisiones los electrones pudieran trasladarse en el
espacio k una distancia mayor que las dimensiones de una zona de Brillouin, estas oscilaciones se traducirı́an como
corriente alterna, lo cual es imposible. Sin embargo, ese trayecto recorrido entre colisiones es muchos órdenes de magnitud
menor, de manera que estas oscilaciones de Bloch nunca se concretan.
Al desarrollar la separación entre bandas para electrones en un potencial periódico débil, evidenciamos otra forma
de visualizar que los electrones se frenan al arrimarse a un plano de Bragg: allı́ es donde ocurren degeneraciones en las
energı́as y vimos que al diagonalizar las perturbaciones, las soluciones resultaban mezclas de ondas planas en todas las
direcciones involucradas, por lo que las correspondientes velocidades medias se anulan. Por último, también conviene
pensar que el potencial efectivo hace que ocurran interferencias constructivas o destructivas entre las ondas transmitidas
y reflejadas desde el conjunto de la red cristalina: cuando el campo eléctrico aumenta la energı́a de los electrones, esas
interferencias van cambiando, y a medida que se acerca a la energı́a superior de una banda (borde de una zona de
Brillouin), la probabilidad de que la función de onda se refleje completamente va aumentando hasta hacerse igual a 1
(100 % reflexión, o transmisión nula) en el plano de Bragg.

5.1.1. Huecos
Los estados libres en una banda de energı́a suelen pensarse como “ausencia de electrones” con su carga negativa,
o presencia de “huecos” con una carga positiva opuesta. La conveniencia de esta alternativa se pone de manifiesto al
analizar el efecto Hall: como vimos en los problemas de la Guı́a 1, en algunos casos la predicción de los coeficientes
resulta inadecuada, e incluso se los obtiene con el signo cambiado.
Para verificar que las dos descripciones resultan equivalentes en lo que respecta a los fenómenos de transporte,
notemos que en el cálculo de la densidad de corriente eléctrica, el aporte de los electrones de una banda parcialmente
llena es
d3 k
Z
j = (−e) v(k) ,
k ocup 4π

donde solo se abarca los estados k ocupados. Pero como v(k) es periódica,

d3 k d3 k d3 k
Z Z Z
v(k) = v(k) + v(k) = 0 .
(P)ZB 4π k ocup 4π k desoc 4π

Entonces podemos reescribir la contribución de los electrones al transporte de carga como

d3 k
Z
j = (+e) v(k) ,
k desoc 4π

Esto demuestra que da lo mismo pensar que los portadores de carga son los electrones (negativos) de una banda par-
cialmente llena, o los huecos (positivos) correspondientes a los estados desocupados de esa banda. Por supuesto, los
huecos son partı́culas ficticias, pero como proveen la misma descripción, optaremos por la alternativa que resulte más
conveniente. Lo que debe quedar claro es que no podemos mezclar las dos descripciones: o elegimos las cargas negativas
(e− ) o bien trabajamos con los huecos (h+ ) de cada banda involucrada. Cuando las bandas están casi llenas, lo más
conveniente es describir su aporte considerando los huecos, porque son pocos portadores de carga (positiva); por la misma
razón, cuando hay pocos electrones en una banda, lo más razonable es elegir las cargas negativas. Exactamente eso es lo
que haremos en breve para estudiar los semiconductores, que a temperatura ambiente tienen unos pocos electrones en
la banda de conducción, y, correspondientemente, unos pocos huecos en la banda de valencia.
Cuando estudiamos sistemas que se hallan en equilibrio (o en estados muy próximos), los niveles desocupados suelen
estar cerca de la energı́a máxima de una banda. Si ε(k) es máxima para cierto ko , como ε′ (ko ) = 0, siempre podemos
aproximar
ε(k) ≈ ε(ko ) − A(k − ko )2 , (con A > 0) .
Por analogı́a con el caso de partı́culas libres, se define una masa efectiva m∗ > 0 de manera que ~2 /(2m∗ ) = A . De este
modo, en las proximidades de ko se cumple

1 ∂ε ~ dv(k) ~
v(k) = ≈ − ∗ (k − ko ) ⇒ a= = − ∗ k̇ ,
~ ∂k m dt m

es decir, la aceleración es opuesta a k̇. Observando la ecuación de movimiento


 
1
~k̇ = −e E + v(k) × H , (19)
c
30 5 Dinámica de electrones: aproximación semiclásica

notamos que cuando un electrón (cargado negativamente) que ocupa estados con energı́as próximas a la máxima de una
banda es sometido a campos externos, su dinámica se corresponde con la de una masa m∗ < 0. Es más razonable cambiar
de signo en ambos miembros, de manera que tanto la carga como la masa sean positivas: justamente hemos afirmado que
los huecos pueden asociarse a cargas positivas, cuya evolución al aplicar campos externos es la que esperamos, cuando
su masa (positiva) es m∗ .
A menudo la aceleración a no es paralela a k̇. La restricción sobre estados próximos a la máxima energı́a de una
banda es flexible, pero siempre es importante la correcta asociación del momento cristalino con una carga positiva o
negativa: la condición se establece según el signo de la proyección de a sobre k, extendiendo el criterio presentado en la
situación anterior. Para que k̇ · a < 0 debe cumplirse
∂2ε
 
dv d 1 ∂ε 1X
k̇ · = k̇ · = k̇i k̇j < 0 ,
dt dt ~ ∂k ~ ij ∂ki ∂kj

o lo que es equivalente,
X ∂2ε
∆i ∆j < 0
ij
∂ki ∂kj
para cualquier vector ∆. Esto es lo que ocurre en las proximidades de un máximo, pues al apartarnos de ko las modi-
ficaciones a ε deben ser negativas (ε decrece). En este caso entonces, en un entorno de ko , podemos asociar los estados
electrónicos con la evolución de una carga positiva, es decir, elegimos la descripción mediante un hueco, representativo
de los estados electrónicos desocupados, y próximos al tope de una banda.
Para incluir los casos en que a no es paralela a k̇ se define el tensor de masa efectiva M mediante la relación
 −1  1 ∂2ε 1 ∂vi
M (k) ij = ± 2 =± ,
~ ∂ki ∂kj ~ ∂kj
donde el signo + se aplica a la descripción de estados k próximos a un mı́nimo (e− ) y el signo −, a estados próximos a
un máximo (h+ ). De este modo podemos escribir
dv
a= = ±M−1(k) ~k̇
dt
y las ecuaciones de movimiento (19) en una expresión similar a la de una masa clásica puntual
 
1
M(k) a = ∓e E + v(k) × H .
c

La importancia del tensor de masa efectiva se pone de manifiesto al describir estados próximos a los bordes de las
zonas de Brillouin (o a los planos de Bragg), donde la relación entre las energı́as y los momentos cristalinos se aparta
notoriamente de la correspondiente a partı́culas libres. En particular, este es el caso de los semiconductores, que tienen
unos pocos estados desocupados en el tope de la banda de valencia, y ocupados algunos de los estados de menor energı́a
de la banda de conducción.

5.2. Movimiento en un campo magnético uniforme


La respuesta ante campos magnéticos externos constituye uno de los temas centrales del estudio de la materia
condensada. El caso más sencillo corresponde a la aplicación de un campo magnético uniforme, en el que expresamos las
ecuaciones de movimiento
1 ∂ε(k) 1
ṙ = v(k) = , ~k̇ = (−e) v(k) × H .
~ ∂k c
Puede verse que kk ≡ k·H/|H| se mantiene constante, ya que las variaciones de k son perpendiculares al campo. Por
otro lado, como además k̇ es normal a v(k) = ∇k ε, los cambios de k siempre mantienen al momento cristalino en una
superficie de ε(k) constante: tanto kk como ε(k) son entonces constantes de movimiento. Las trayectorias de los electrones
en el espacio k siempre son curvas que resultan de la intersección de superficies equipotenciales con planos normales al
campo H.
En el espacio real la proyección de las órbitas electrónicas en un plano normal a H es

r⊥ = r − Ĥ(Ĥ · r) (Ĥ = H/|H|) ,

y podemos analizar el movimiento del electrón si multiplicamos vectorialmente por izquierda a la ecuación de movimiento
por H, pues ası́ extraemos la componente ṙ⊥ normal a H
eH h i eH
H × ~k̇ = − ṙ − Ĥ(Ĥ · ṙ) = − ṙ⊥ ,
c c
donde hemos utilizado la relación general A × (B × C) = B(A · C) − C(A · B). Entonces podemos integrar la última
igualdad para obtener
~c
r⊥ (t) − r⊥ (0) = − Ĥ × [k(t) − k(0)] . (20)
eH
5.3 Campos eléctrico y magnético perpendiculares y uniformes 31

El miembro de la izquierda representa la órbita proyectada, que resulta igual a la órbita en el espacio k por un factor de
escala ~c/(eH) rotada 90◦ alrededor de H.
Si los electrones pudieran describirse como partı́culas libres en el sólido, las superficies equipotenciales son esféricas,
pues ε = ~2 k2 /(2m): el campo magnético generarı́a órbitas en el espacio k que serı́an cı́rculos, ya que ε y kz (= |kk |)
deben ser constantes, como dijimos más arriba. En el espacio real, estas órbitas rotadas también son cı́rculos, que es el
resultado que esperamos para electrones libres sometidos a un H constante. En general las órbitas semiclásicas en un
sólido real no son cı́rculos, y en muchos casos ni siquiera resultan órbitas cerradas.

5.3. Campos eléctrico y magnético perpendiculares y uniformes


Cuando tenemos ambos campos aplicados, al incorporar el campo eléctrico en la ecuación (20) podemos reescribirla
como
~c
r⊥ (t) − r⊥ (0) = − Ĥ × [k(t) − k(0)] + wt ,
eH
donde w ≡ (c/H)E × Ĥ (ejercicio). Esto implica que la órbita en el espacio real sigue siendo la del espacio k rotada,
desplazándose ahora con velocidad w, perpendicular a E y H. Para analizar cómo son las trayectorias k(t) podemos
expresar
e ∂ ε̄
~k̇ = − ×H , con ε̄(k) = ε(k) − ~k · w (ejercicio).
c~ ∂k
El mismo análisis que hicimos antes nos permite concluir que, aunque ε̄(k) no es una función periódica, esta cantidad es
una constante de movimiento. Esto significa que las órbitas en el espacio k evolucionan en las intersecciones de planos
perpendiculares al campo H con superficies de ε̄(k) constantes.

En el caso de campo magnético intenso (igual o superior a unos 104 gauss = 1T) y las ε̄ resultan muy parecidas a las
ε, las corrientes inducidas por los campos aplicados pueden cambiar de manera notoria si las órbitas de los electrones
resultan cerradas o bien si se tienen algunos estados con órbitas abiertas. En el primer caso (órbitas cerradas), como
el campo es muy intenso, estas órbitas pueden cruzarse varias veces entre colisiones sucesivas, o lo que es equivalente, el
perı́odo de las órbitas es pequeño frente a los tiempos de relajación τ . Para calcular la corriente inducida necesitamos
estimar la velocidad media entre colisiones v, ya que sabemos que la densidad de corriente es j = −nev. Entre t = 0 y
t = τ podemos plantear
r⊥ (τ ) − r⊥ (0) ~c k(τ ) − k(0)
=− Ĥ × +w .
τ eH τ
Como las órbitas son cerradas y el campo es alto, la contribución del primer término de la izquierda es muy pequeña
frente a w, por lo que la corriente inducida en el plano transversal al campo resulta
nec
j⊥ ≃ −new = − E×H .
H
(Por supuesto, si nuestro análisis se basa en el transporte de huecos, debe asignarse la carga positiva (+e) correspondiente,
y el número de huecos nh por unidad de volumen.) La fuerza de Lorentz entonces hace que los portadores de carga no
tomen energı́a del campo eléctrico, sino que se desplazan provocando corrientes perpendiculares al campo E.
Una forma de evidenciar este efecto es a través del coeficiente Hall correspondiente, el que resulta
1 1
RH = − (para e− ) , RH = + (para h+ ) .
nec nh ec
El coeficiente de la izquierda es exactamente el que habı́amos obtenido mediante la descripción de Drude-Sommerfeld.
Obviamente este sólo es válido cuando los portadores de interés son electrones, mientras que si consideramos bandas casi
llenas, donde es conveniente pensar que los responsables del transporte de carga son los huecos, se agrega la alternativa
de cálculo mediante la expresión de la derecha. Claramente, estas predicciones permiten abarcar el signo correcto del
coeficiente de Hall en las situaciones que resultaban conflictivas para la descripción de Drude-Sommerfeld. En algunos
casos deben considerarse varias bandas, en las cuales se cumple que las órbitas son cerradas (para electrones y huecos) y
por lo tanto son válidas las expresiones anteriores: la corriente total en este caso debe involucrar al número efectivo de
portadores de carga nef = n − nh , resultando
1
RH = − .
nef ec
Cuando en los materiales pueden darse órbitas abiertas al menos en una banda, los resultados cambian notoria-
mente: los electrones ahora no pueden realizar un movimiento periódico, y entonces las colisiones no logran neutralizar
los impulsos adquiridos en la dirección de E, de manera que los electrones consumen energı́a del campo eléctrico. Si en
alguna región del espacio real una órbita recorre una dirección n̂(r), si n̂(r)·E 6= 0 habrá una componente de la corriente
según n̂(r). Aunque no entraremos en detalles de cuentas, puede descomponerse el tensor de conductividad para escribir

j = σ1 (n̂·E)n̂ + σ 2 · E , (21)

donde σ 2 es un tensor que decae como H −2 (como en el caso de órbitas cerradas); σ1 en cambio es un escalar que
cuando H → ∞ se hace constante. Esto implica que el coeficiente Hall se aparta de la forma sencilla de las expresiones
32 5 Dinámica de electrones: aproximación semiclásica

anteriores, y la estructura geométrica del primer término de la derecha en (21) implica que la magnetorresistencia a
campo alto no está acotada cuando H → ∞. Al contrario de lo que ocurre con un gas de electrones libres, donde la
magnetorresistencia ρxx es constante e independiente del campo, en la situación de órbitas abiertas ρxx depende del
campo, y cuando H → ∞ diverge como H 2 . Esto está ı́ntimamente asociado con la estructura de la superficie de Fermi,
y se han diseñado experimentos para determinarla a partir del relevamiento de la magnetorresistencia.

5.4. Dispersión de electrones y fenómenos de transporte


La construcción de un hamiltoniano que provea una descripción realista de la respuesta de un sólido a campos
externos, tanto electromagnéticos como térmicos, es una tarea compleja; mucho más difı́cil es resolverlo. Pero sabemos
que los cristales perfectos que hemos descripto ofrecerı́an resistencia eléctrica nula, lo que solo ocurre excepcionalmente
en los superconductores. En los materiales reales diferentes procesos desvı́an su respuesta de las situaciones ideales
descriptas; sin embargo, tener en cuenta en detalle las dispersiones sufridas por los electrones es sumamente complicado,
por lo que se recurre a técnicas estadı́sticas para estimar su efecto en promedio, utilizando las ecuaciones de movimiento
clásicas.
La aproximación de electrones independientes debe complementarse con perturbaciones representativas de estas
dispersiones, que ocurren por la presencia de defectos (vacancias, dislocaciones, sustituciones, etc.) o impurezas en la red
cristalina, y también por desviaciones de la estructura a través del tiempo, como ocurre en el caso de las vibraciones
colectivas. Además deberı́an contemplarse las interacciones entre los electrones que se desplazan, aunque en realidad este
efecto resulta mucho menos importante.
En un evento de dispersión, un electrón originalmente asociado al momento cristalino k cambia a otro estado iden-
tificado con k′ . Esta transición se representa mediante la cantidad Wk,k′ , definida como la probabilidad por unidad de
tiempo de que un electrón con momento k sufra una interacción que lo lleve a un estado final con momento cristalino
en un entorno d3 k′ de k′ —por supuesto, siempre que el estado final k′ no se encuentre ocupado (por el principio
de exclusión). En el caso general los electrones se mantienen en la misma banda, y además se espera que los eventos
de dispersión no modifiquen las coordenadas de espı́n, lo que puede perder validez si ocurre una dispersión magnética.
Entonces esta definición permite representar con

Wk,k′ dt d3 k′
(2π)3

la probabilidad de que en el intervalo (t, t+ dt) un electrón con k sea dispersado hacia estados d3 k′ alrededor de k′ sin
cambiar su espı́n.
Si contamos con la distribución de probabilidades g(k) que represente la ocupación de los estados asociados a cada
momento cristalino k, la probabilidad de que el estado k′ esté desocupado es 1−g(k′ ). Entonces la probabilidad total
por unidad de tiempo de que el electrón tenga alguna colisión que lo lleve hacia un estado cualquiera k′ 6= k puede
expresarse como
d3 k ′
Z
1 h

i
= W k,k ′ 1 − g(k ) .
τ (k) (2π)3
En esta expresión se pone en evidencia que τ depende de k, a diferencia de lo propuesto en la §1.1. Para encontrar g(k)
conviene notar que por unidad de tiempo su disminución debe ser igual al producto de la fracción de electrones en un
entorno d3 k de k (igual a g(k) d3 k) por la probabilidad total de colisionar, cambiando del estado k al k′ (dada por
1/τ (k)), es decir
d3 k ′
  Z
dg g(k) h i
=− = −g(k) 3
Wk,k′ 1 − g(k′ ) .
dt sal τ (k) (2π)
De manera análoga, habrá electrones originalmente con k′ que colisionan con probabilidad Wk′,k pasando al estado k,
de manera que esto incrementa la población de estados representada por g(k)

dg
 h i Z d3 k ′
= 1 − g(k) Wk′,k g(k′ ) .
dt ent (2π)3

Reuniendo estas dos contribuciones, escribimos el cambio total de g(k) por efecto de las colisiones como

d3 k ′
  Z  i
dg h

i

h
=− Wk,k g(k) 1 − g(k ) − Wk ,k g(k ) 1 − g(k)
′ ′ . (22)
dt col (2π)3

En presencia de un campo externo


 
1 
F (r, k) = −e E + v(k) × H = ~k̇ ,
c

se pone en evidencia que la distribución g(k) depende también de r, además de depender de t, porque no hemos planteado
una situación necesariamente estacionaria: esto significa que las derivadas anteriores deben entenderse como derivadas
parciales que aı́slan el efecto de las colisiones. Los cambios que se producen en g por unidad de tiempo, se deberán
5.4 Dispersión de electrones y fenómenos de transporte 33

a los que se producirı́an si no hubiera dispersiones más los asociados a las variaciones (22) inducidas por colisiones.
Explicitando entonces la derivada total de g con respecto a t, se deja como ejercicio mostrar que esto conduce a la
ecuación de transporte de Boltzmann

 
∂g ∂g 1 ∂g ∂g
+v· +F · = (23)
∂t ∂r ~ ∂k ∂t col

Para el caso de dispersiones causadas por interacciones que pueden considerarse débiles, los elementos Wk,k′ pueden
obtenerse mediante teorı́a de perturbaciones dependientes del tiempo. Por ejemplo, para tener en cuenta dispersiones
con ni impurezas por unidad de volumen descriptas mediante el potencial de interacción V (r), se arriba a la expresión

2π 2
ni δ ε(k) − ε(k′ ) k V k′

Wk,k′ = .
~
Esta relación se deriva utilizando la regla de oro de Fermi, que involucra la restricción de ε(k) = ε(k′ ) : cuando no se
cumple esta igualdad, entonces Wk,k′ = 0, o lo que es lo mismo, solo tienen lugar dispersiones elásticas. Además se
cumple que Wk′,k = Wk,k′ , en virtud de que V (r) debe ser hermitiano; esta condición también se conoce como “balance
detallado”, y se deja como ejercicio verificar que la (22) se reduce a

d3 k ′
  Z
dg h i
=− 3
Wk,k′ g(k) − g(k′ ) .
dt col (2π)

La ecuación de transporte de Boltzmann permite modelar la conductividad eléctrica, dar cuenta de efectos ter-
moeléctricos, describir la ley de Wiedemann-Franz, y también analizar fenómenos de transporte en nanoestructuras.
Aquı́ presentaremos sucintamente los pasos para obtener algunas de estas cantidades en casos de campos externos sim-
ples.
Por un lado se plantea la situación en que los campos externos son débiles, por lo que la distribución g(r, k) puede
pensarse como una perturbación a la de equilibrio go (ε), resultando adecuada la estimación linealizada

g(r, k) = go (ε) + g1 (r, k) .

Esto se complementa computando el miembro de la derecha en la ec. (23) en la llamada “aproximación de tiempo de
relajación”  
∂g g − go g1
=− =− .
∂t col τ τ

5.4.1. Conductividad eléctrica de un metal (basado en los textos de Dresselhaus y Economou)


En el caso de campo eléctrico estático (DC) y campo magnético nulo, nos interesa relacionar la densidad de corriente

j con E a través del tensor de conductividad σ

j = σ ·E (24)
Como el campo no depende de t, se anula el primer término de (23) (∂g/∂t = 0), mientras que para el segundo término
podemos suponer que
∂g ∂go ∂go
≃ = ∇T ,
∂r ∂r ∂T
de modo que cuando no hay gradientes de temperatura este término también se anula. Entonces en el tercer término
solo interviene F = qE, con q = ±e, según se trate de huecos o electrones. De este modo
   
∂g q ∂go ∂g1 q ∂go ∂ε ∂go
· k̇ = + ·E = ·E =q v(k) · E ,
∂k ~ ∂k ∂k ~ ∂ε ∂k ∂ε

donde omitimos el término ∂g1 /∂k · E, de segundo orden en E (campos débiles). Utilizando la aproximación de tiempo
de relajación,
∂g ∂go g1 ∂go
· k̇ = q v(k) · E = − ⇒ g1 (k) = −qτ E · v(k) .
∂k ∂ε τ ∂ε
Con estos elementos podemos estimar la densidad de corriente
Z Z  Z 
q 3 q 3 q 3
j= d k v(k) g(k) = d k v(k) g1 (k) + 3 d k v(k) go (k) .
4π 3 4π 3 4π

donde el último término se anula porque la distribución go corresponde al caso libre de campo externo. Sustituyendo la
expresión obtenida para g1 ,
q2 E
Z
∂go
j=− 3
· d3 k τ (k) v(k) v(k) ,
4π ∂ε
34 6 Clasificación de sólidos

y comparando con (24), identificamos

q2
Z
↔ ∂go
σ=− d3 k τ (k) v(k) v(k) .
4π 3 ∂ε

Estas integrales pueden evaluarse para los diferentes valores de ε que intervienen, descomponiendo k para abarcar
desplazamientos sobre superficies equipotenciales ( dS) y normales a ellas ( dk⊥ ), de modo que
Z Z Z
 3   dε
· d k= · dS dk⊥ = · dS .
|∇k ε|

El tensor de conductividad puede computarse entonces como

q2
Z
↔ τ v v ∂go
σ = − 3 dS dε ,
4π |∇k ε| ∂ε

donde hacemos hincapié en el hecho de que go es la distribución de equilibrio termodinámico sin campos aplicados,
es decir, la distribución de Fermi-Dirac. Para temperaturas bajas (como la temperatura ambiente), y aproximando los
electrones de conducción de un metal como partı́culas libres, −∂go /∂ε puede reemplazarse por una delta de Dirac, con
lo cual la expresión anterior se simplifica
q2
Z
↔ τ vv
σ=− 3 dS .
4π ~ εF v
En una red cúbica, la simetrı́a anula los elementos no diagonales de este tensor y para los valores cuadráticos medios de
cada componente se cumple (ejercicio) hvα2 i = v 2 /3, (α = x, y, z), resultando idénticos los tres elementos diagonales:

q2 τ v 2 /3 q2
Z Z
τv
σ=− 3 dS =− 3 dS .
4π ~ εF v 4π ~ εF 3

Recordando las definiciones de velocidad e impulso de Fermi para electrones libres

N 1 4πkF3
n= = ~kF = mvF ,
V 4π 3 3
reobtenemos la expresión de Drude (1) para la conductividad (ejercicio).
La descripción de la conductividad térmica quedó sugerida al comienzo de esta sección, al mencionar los gradientes
de temperatura: en el caso en que estos no se anulan, la inclusión de ese término permite la descripción de ese fenómeno,
ası́ como de los efectos termoeléctricos mencionados en la sección §1. Del mismo modo podrı́an incluirse los campos
magnéticos externos en esta descripción, para obtener información acerca de los coeficientes Hall y la magnetorrestistencia.

6. Clasificación de sólidos (basado en el texto de Ashcroft)

6.1. Metales y no metales


Una de las aplicaciones más interesantes de la teorı́a de bandas se da en la descripción del diferente comportamiento
en las propiedades de conducción de los materiales. Como ya hemos dicho, los sólidos se dividen en dos grandes clases:
metales y no metales, y dentro de estos últimos encontramos a los aislantes y los semiconductores. La distinción se genera,
como ya establecimos, según las bandas estén completas o a medio llenar.
Un ejemplo claro es el sodio, cuyos 11 electrones en un átomo aislado se disponen en la configuración [1s2 2s2 2p6 ] 3s1 ;
los 10 electrones internos completan capas cerradas y apenas se modifican para conformar las bandas en un sólido, de
modo que no pueden contribuir a la corriente eléctrica. Por eso siempre nos interesa la banda más energética ocupada,
este caso la banda 3s. Como sabemos, esta puede acomodar 2N electrones, si el número total de celdas unitarias es N .
En la estructura bcc del Na cada celda contiene un solo átomo, que contribuye con su electrón de valencia 3s, de manera
que el número de electrones que ocupan la banda más externa es N , llenándola solo hasta la mitad: el sodio entonces se
comporta como un metal. Lo mismo ocurrirá con todos los elementos alcalinos (Li, K, Rb, etc.), todos con capas cerradas
más un único electrón ns de valencia. Un ejemplo similar es el de Cu, Ag, Au, llamados “metales nobles”, que también
aportan solo un electrón ns a la última banda.
Por otro lado, el diamante es un ejemplo claro de aislante. La configuración electrónica del átomo de carbono aislado
es 1s2 2s2 2p2 , y al conformar la estructura del diamante se mezclan los estados 2s y 2p con probabilidades similares (se
“hibridizan”) dando lugar a dos bandas separadas por la brecha correspondiente; como estas bandas surgen de mezclar
4 estados y cada celda unitaria aporta dos átomos (ver §2.2), pueden alojar 8N electrones; pero cada átomo contribuye
con 4 electrones, de modo que la banda de valencia se llena completamente y este material resulta aislante.
6.2 Clasificación de aislantes 35

Ya mencionamos que cuando las brechas de energı́a son pequeñas comparadas con la excitación térmica9 , algunos
electrones pueden promoverse hacia la banda de conducción, y estos materiales se denominan semiconductores. Ejemplos
tı́picos son el Si y el Ge, que conforman una estructura tipo diamante, pero con brechas entre las últimas bandas de
interés de alrededor de 1 eV y 0,7 eV, respectivamente —mientras que en el diamante es de unos 5,5 eV. En algunos casos
esta brecha se anula por completo, o incluso las bandas llegan a solaparse: estos materiales se denominan semimetales,
y ejemplos de ellos son Bi, As, Sb y Sn blanco.
Hay casos en los que se conjugan diferentes caracterı́sticas que confieren propiedades particulares de conducción. Por
ejemplo el Mg tiene valencia 2 ([Ne] 3s2 ) y cristaliza en una estructura hexagonal compacta, con un átomo por celda
primitiva. La banda 3s deberı́a estar completa y por lo tanto ser aislante, pero este material resulta conductor: en realidad
no hay contradicción, porque las bandas 3s y 2p se solapan, de modo que el Mg posee bandas incompletas, presentando
un comportamiento metálico. Lo mismo ocurre con Be, Ca, Zn y otros metales divalentes. Por esta razón habı́amos dicho
que un número impar de electrones de valencia por celda unidad implica un material conductor, mientras que con un
número par, no necesariamente tenemos un aislante.
Dentro de esta clasificación general, y siempre considerando propiedades fı́sicas, hay diferencias menores que dependen
de la distribución espacial de los electrones de valencia. En los metales la distribución espacial de los electrones de valencia
no está tan concentrada en las proximidades de los iones, como ocurre con los aislantes.

6.2. Clasificación de aislantes


Hay tres tipos de aislantes, reconocidos “tradicionalmente” según los enlaces entre sus iones. Por supuesto, esta
clasificación no es tan rigurosa, y siempre pueden encontrarse distintas imprecisiones: tanto que aquı́ presentamos cuatro
tipos de aislantes.

6.2.1. Cristales covalentes


En estos cristales las distribuciones electrónicas espa-
ciales no se hallan localizadas en torno a los iones de la red,
como en el caso de los metales, aunque no exhiben bandas
parcialmente llenas en el espacio k. Además, los electrones
de valencia no se distribuyen uniformemente entre los sitios
de red (en los metales son casi ondas planas), sino que se
encuentran localizados en ciertas direcciones preferenciales,
que en la quı́mica se denominan “enlaces” o “ligaduras”. El
diamante es también un ejemplo de cristal covalente, en el
cual la presencia electrónica se concentra preferentemente
en los segmentos que unen a los átomos primeros vecinos.
Lo mismo ocurre con los elementos de la columna IV de la
tabla periódica: Si, Ge, Sn gris.
A menudo suelen pensarse los enlaces metálicos como ligaduras covalentes que se extienden mucho más en el espacio.

6.2.2. Cristales moleculares


Los gases nobles solidifican en redes fcc monoatómicas y constituyen los ejemplos más claros de este tipo de cristales;
el nombre de “molecular” pretende también incluir al hidrógeno y al nitrógeno sólidos. La configuración muy estable de
capas completamente llenas en el átomo aislado se ve apenas perturbada en el sólido. Si lo pensamos en el contexto de
tight-binding, los niveles apenas se desdoblan en bandas muy estrechas, próximas a las energı́as originales, permaneciendo
los orbitales muy localizados en la proximidad de los núcleos. La estructura del sólido se cohesiona más débilmente que en
otros tipos de enlaces, mediante las llamadas fuerzas de van der Waals o de dipolo fluctuante. Estas interacciones decaen
muy rápidamente con la separación entre iones, lo que explica su baja intensidad, y la consiguiente baja temperatura de
fusión de estos sólidos.

6.2.3. Cristales iónicos


Estos sólidos se componen de un elemento metálico y otro no metálico, y también tienen concentrada la distribución
de carga alrededor de ciertos núcleos de la red, aunque en este caso algunos electrones se mantienen muy lejos del átomo
originario, para adosarse estrechamente al componente del otro tipo. Un ejemplo es el cloruro de sodio, y es habitual
pensar que está conformado por iones aislados Na+ y Cl− , rodeados de distribuciones de carga apenas perturbadas al
constituir el sólido. Las intensas fuerzas electrostáticas entre los iones son determinantes sobre las propiedades de los
cristales iónicos, muy diferentes de los moleculares.
Es habitual simplificar estos sólidos imaginando los iones como esferas cargadas impenetrables, que se mantienen
ligadas por la atracción electrostática entre cargas de diferente signo. El principio de exclusión de Pauli completa la idea
9 Conviene repasar la cuenta de vez en cuando: kB Tamb ≃ 0,026 eV.
36 7 Cristal armónico

de impenetrabilidad, ya que los electrones se acomodan hasta que van cerrando capas alrededor de alguno de los núcleos.
Esta idea de esferas impenetrables trae aparejado el concepto de “radio iónico”, que surge de considerar que las esferas
están empaquetadas dejando el mı́nimo espacio vacı́o entre ellas. Estos radios toman valores tı́picos entre 0,30 Å (Be++ )
y 2,2 Å (I− ).

6.2.4. Enlace de hidrógeno


Si bien el átomo de hidrógeno neutro tiene un solo electrón, a menudo estos átomos conectan otros dos para conformar
una estructura. Suele simplificarse este enlace pensando que el hidrógeno prácticamente transfiere su electrón a un átomo
al que se liga, de modo que la carga positiva del protón remanente atrae a otro átomo electronegativo. El hidrógeno queda
siempre conectado a dos átomos de tipo A o de distinto tipo, conformando enlaces simétricos A-H-A o bien asimétricos.
Este tipo de ligaduras son responsables de los enlaces entre las dobles hélices del ADN y juegan un rol fundamental
en los mecanismos de reproducción genética. En quı́mica inorgánica el ejemplo más conocido es el agua, en particular en
la forma de hielo: cada oxı́geno está rodeado por 4 hidrógenos de enlace en una configuración tetraédrica.

7. Cristal armónico (basado en el texto de Ashcroft)

Hasta ahora propusimos modelos con sitios de red fijos (inmóviles), aunque sabemos que la masa de los iones no es
infinita, sino que están ligados a sus posiciones de equilibrio por fuerzas intensas. Si bien esa descripción nos permite
dar cuenta de muchos fenómenos dominados por los electrones de conducción o por el tipo de enlaces entre iones, las
limitaciones del modelo de cristal estático se ponen especialmente en evidencia al describir las propiedades termodinámicas
de los aislantes, resultando obvio que deben considerarse otros grados de libertad en los sólidos.
No solo notamos en nuestros desarrollos que faltó considerar contribuciones a los calores especı́ficos de los metales,
sino que tampoco hay forma de desarrollar modelos para la expansión térmica de los sólidos. Los modelos que incorporan
colisiones prevén que los tiempos de relajación deben depender de la temperatura, ya que en muchos casos las dispersiones
de los electrones se originan en las vibraciones colectivas de los núcleos de la red. Las fallas de la ley de Wiedemann-Franz
en las predicciones a temperaturas intermedias pueden explicarse solo a partir de interacciones con las oscilaciones de
los núcleos, lo mismo que la conductividad térmica de los aislantes o la transmisión del sonido en un sólido. También
la reflectividad de algunos cristales resulta incompleta sin incorporar los modos normales de vibración, lo mismo que la
dispersión inelástica de la luz (que da origen a la espectroscopı́a Raman). Además hay evidencias de estos movimientos
colectivos en resultados de difracción de rayos x donde los picos se desplazan y modifican su intensidad, y también en
experimentos de dispersión de neutrones.
Por todos estos motivos, las vibraciones de una red cristalina han sido motivo continuo de estudio, y actualmente
resultan imprescindibles para técnicas experimentales y desarrollos teóricos en diferentes áreas.

7.1. Cristal armónico clásico


Consideramos que las posiciones de equilibrio de los N iones son sitios R de una red de Bravais, desde las cuales
observamos desplazamientos pequeños u(R). Para llevar a cabo una descripción clásica necesitamos una expresión para
el hamiltoniano total correspondiente a estos osciladores. La energı́a potencial cuando los núcleos están en sus posiciones
de equilibrio puede escribirse en términos del potencial de interacción φ entre los iones
1 X N X
Uo = φ(R − R′ ) = φ(R)
2 ′
2 R
R,R


(las sumas deben barrer todos los sitios R o R de la red). En una configuración arbitraria cada ion se ubica en una
posición R + u(R); como pensamos desplazamientos u(R) pequeños, podemos desarrollar el potencial en serie de Taylor
alrededor del equilibrio
1 X  1 X 
u(R)−u(R′ ) · ∇φ(R−R′ ) + uµ (R)−uµ (R′ ) φµν (R−R′ ) uν (R)−uν (R′ ) ,
   
U = Uo +
2 ′
4 ′
R,R R,R
µ,ν=x,y,z

donde φµν (R) ≡ ∂ 2 φ/∂Rµ ∂Rν . El primer término de la derecha es una constante, y por lo tanto, irrelevante para analizar
la dinámica del sistema, por lo cual tomamos Uo = 0 como el cero de las energı́as. Por otro lado, el segundo término de
la derecha se anula, pues ∇φ está evaluado en las posiciones de equilibrio, donde φ tiene un mı́nimo. Esta expansión que
tiene en cuenta solo hasta el segundo orden se denomina ingeniosamente “aproximación armónica”.
Es importante señalar que al buscar la solución para este problema es necesario imponer condiciones de contorno:
como siempre, esperamos que la descripción fı́sica se repita luego de desplazarnos Nµ celdas en las direcciones µ según los
vectores primitivos {aµ }. Estas condiciones de contorno periódicas son similares a las condiciones de Born - von Karman.
7.1 Cristal armónico clásico 37

Definiendo X
Dµν (R−R′ ) = δR,R′ φµν (R−R′′ ) − φµν (R−R′ ) , (25)
R′′

se deja como ejercicio mostrar que es posible escribir el potencial armónico como
1 X
U= uµ (R) Dµν (R−R′ ) uν (R′ ) .
2 ′
R,R
µ,ν

Esta expresión resultará muy conveniente al analizar cristales tridimensionales.

7.1.1. Red unidimensional monoatómica


Describamos una red de Bravais unidimensional con parámetro a, de manera que los sitios de red pueden expresarse
como R = nax̂, con n ∈ Z. Si solo hay interacción entre primeros vecinos, el potencial armónico se escribe
1 X  2
U= K u na − u (n + 1)a ,
2 n

donde K ≡ φ′′ (a), y φ(x) representa la interacción entre dos iones separados una distancia x. Si los núcleos (todos
idénticos) tienen masa M , las ecuaciones de movimiento resultan

∂U    
M ü(na) = − = −K 2u na − u (n − 1)a − u (n + 1)a . (26)
∂u(na)
Para encontrar los modos normales proponemos soluciones

u na, t ∝ ei(kna−ωt) ,


que respeten la condición periódica en la cadena de N iones


 
u (n + N )a = u na ,

que equivale a pensar en una cadena circular en lugar de una lineal. Al imponer esta restricción sobre las soluciones
propuestas encontramos los valores posibles para k
2π m
eikN a = 1 ⇒ k= (m ∈ Z) .
a N
Es interesante notar que solo hay N valores relevantes de k: si a un determinado m sumamos N , los desplazamientos de
cada sitio permanecen inalterados, ya que
2π m+N
  2π m  2π m

ei a N na−ωt = ei a ( N +1)na−ωt = ei a N na−ωt · 1 .

Esto es equivalente a afirmar que si a un determinado k le sumamos 2π/a repetimos la descripción para los desplaza-
mientos: análogamente a lo que elegı́amos en el caso de los momentos cristalinos para las ondas de Bloch, elegimos k en
el intervalo [−π/a, π/a].

Sustituyendo las soluciones u na, t propuestas en las ecuaciones de movimiento (26),
h i
−ω 2 M = −K 2 − e−ika − e+ika = −2K 1 − cos(ka)
 

r r
2K   K ka
⇒ ω(k) = 1 − cos(ka) = 2 sen .
M M 2
Los desplazamientos entonces resultan
(
cos(kna − ωt) ω(k)

u na, t ∝ p
sen(kna − ωt) 2 K/M
es decir, dos soluciones para cada k, como esperábamos,
ya que la ecuación diferencial es de segundo grado. Como
tenemos N valores posibles para k, habrá un total de 2N
posibles soluciones, que se superpondrán para conformar
la solución global y la contribución individual dependerá
de las condiciones iniciales del problema. Cada una de las
soluciones individuales representa una onda que se propaga k
con velocidad c = ω/k, de manera que la velocidad de grupo
de la solución global (superposición de las individuales) será −π/a 0 π/a
v = ∂ω/∂k.
38 7 Cristal armónico

Observamos que para k ≪ π/a, es decir longitudes de onda λ mucho mayores que el parámetro de red, vale la
aproximación r
K
ω=a |k| ,
M
que corresponde a una relación de dispersión lineal. En este caso la velocidad de grupo v coincide con c = ω/k, y resulta
independiente de k. Pero en medios discretos, cuando λ se hace comparable con a, la relación deja de ser lineal. En
particular cuando k → π/a, v → 0.
Cuando hay interacción más allá de los primeros vecinos, el planteo no cambia demasiado, aunque el resultado para
la relación de dispersión se complica, como vemos en uno de los problemas de los prácticos.

7.1.2. Red unidimensional con base


Supongamos ahora que contamos con dos iones iguales (de masa M ) por celda primitiva, unos en los sitios na y los
otros, en na + d, con d < a/2. Nuevamente planteamos interacciones solo entre primeros vecinos, con dos tipos de fuerzas
relacionadas con las diferentes separaciones que proponemos. Llamamos u1 (na) a los desplazamientos de los primeros
iones desde sus posiciones de equilibrio en na; del mismo modo, u2 (na) representa los desplazamientos de los otros iones
desde na + d. Entonces podemos escribir
K X  2 G X   2
U= u1 na − u2 na + u2 na − u1 (n + 1)a ,
2 n 2 n

de donde las ecuaciones de movimiento resultan


 ∂U      
 M ü1 (na) = − ∂u1 (na) = −K u1 na − u2 na − G u1 na − u2 (n − 1)a

 M ü2 (na) = − ∂U = − K u2 na − u1 na − G u2 na − u1 (n + 1)a .



      
∂u2 (na)

Nuevamente proponemos soluciones oscilatorias, permitiendo la opción de dos amplitudes (complejas) ǫ1 y ǫ2 diferentes

u1 na, t = ǫ1 ei(kna−ωt) u2 na, t = ǫ2 ei(kna−ωt) .


 
,

Sustituyendo en las ecuaciones movimiento,

 M ω 2 − (K + G) ǫ1 K + Ge−ika ǫ2 = 0
   
+

K + Ge+ika ǫ1 M ω 2 − (K + G) ǫ2 = 0
  
+

Para tener soluciones (ǫ1 , ǫ2 ) no triviales debe anularse el determinante del sistema de ecuaciones, es decir
2 2
M ω 2 − (K + G) = K + Ge−ika = K 2 + G2 + 2KG cos(ka)


K +G 1 p 2
=⇒ ω2 = ± K + G2 + 2KG cos(ka) .
M M

Reemplazando en las ecuaciones anteriores vemos que q


2(K+G)
ω(k)
ika M
ǫ2 K + Ge 
=∓ |ǫ2 | = |ǫ1 | .
ǫ1 |K + Geika | q
2K
M
En este caso hay 2 soluciones para cada k, es decir 2N mo- q
2G
dos normales: la relación de dispersión tiene 2 ramas. El M

comportamiento cualitativo de la rama inferior es similar


al de la red monoatómica: en particular para ka ≪ π se
cumple ω = ck, como sucede con las ondas de sonido, por
lo cual se la llama rama acústica. La rama superior se de-
nomina rama óptica porque, como veremos en seguida, se
asocia a la respuesta de los cristales a la radiación electro- k
magnética. La figura muestra las curvas para el caso en que
−π/a 0 π/a
K > G.
Analicemos el comportamiento de ambas ramas para ka ≪ π, cuando podemos aproximar

(ka)2
cos(ka) ≈ 1 − , ǫ2 = ∓ǫ1 ,
2
donde el signo − vale para la rama óptica y el + para la rama acústica: esto significa que en este rango, los modos
acústicos activan oscilaciones en fase en los átomos de cada celda, mientras que las asociadas con los modos ópticos se
7.1 Cristal armónico clásico 39

dan en oposición de fase. Justamente por este motivo se denomina rama óptica, porque en el caso de cristales iónicos, la
radiación electromagnética induce desplazamientos opuestos en iones de signo contrario. En este lı́mite entonces
r s
2(K + G) 2 KG
ωO = − O(ka) , ωA = (ka) .
M 2M (K + G)

Vemos que también en este caso, para la rama acústica la velocidad de grupo es ω/k, al igual que en las ondas acústicas.
Para ka = π, los modos ópticos resultan
r
2K
ωO = , con ǫ2 = −ǫ1 ,
M
es decir los iones oscilan en oposición de fase (y con la misma amplitud). Análogamente, para la rama acústica tenemos
r
2G
ωA = , con ǫ2 = ǫ1 ,
M
de modo que las celdas oscilan como un todo: ambos iones en fase y siempre con idéntica amplitud (como si el resorte
de constante K no se elongara).
Si una de las interacciones es mucho más intensa que la otra, es decir si K ≫ G, obtenemos las aproximaciones
 r   
2K G
 ωO = 1+O , ǫ1 ≈ −ǫ2



M K
(K ≫ G) r     
 2G ka G
 ωA = sen 1+O , ǫ1 ≈ ǫ2


M 2 K
En este caso ωO es casi independiente de k, y se deja como ejercicio mostrar que los desplazamientos se dan como si cada
celda contuviera una molécula aislada, con las dos masas unidas por el resorte oscilando siempre en oposición de fase.
La rama acústica en cambio se corresponde con una cadena lineal de masa 2M , ya que se mueven en fase y siempre con
igual amplitud (otro ejercicio).
Finalmente, cuando los valores de K y G se hacen cada vez más parecidos, los resultados convergen a la descripción
de una red monoatómica simple con parámetro de red a/2, cuya verificación también se deja como ejercicio.

7.1.3. Red tridimensional monoatómica


Si utilizamos la matriz D(R − R′ ) integrada por los elementos Dµν (R − R′ ) definidos en (25), podemos escribir el
potencial armónico como
1 X T
U= u (R) D(R−R′ ) u(R′ ) ,
2 ′ R,R

si pensamos a u(R) como un vector columna. Esta matriz D posee importantes propiedades de simetrı́a, algunas de las
cuales explicitamos aquı́. Por definición los elementos φµν son simétricos,

φµν (R) = φνµ (R) ⇒ Dµν (R) = Dνµ (R) .

Además, como φµν (−R) = φµν (R) (por eso las expresiones para U tienen ese factor 1/2), puede mostrarse que (dos
ejercicios) X
Dµν (−R) = Dµν (R) = δR,0 φµν (R−R′ ) − φµν (R) .
R′

También se cumple (otro...) X X


Dµν (R) = 0 ⇔ D(R) = 0 ,
R R

que puede deducirse independientemente, pensando que cuando todos los desplazamientos son idénticos, es decir u(R) = d
∀ R, volvemos al mı́nimo de potencial, pues solo se trata de un desplazamiento global del cristal.
Utilizando estas propiedades, las ecuaciones de movimiento pueden escribirse como
∂U X X
M üµ (R) = − =− Dµν (R−R′ ) uν (R′ ) ⇔ M ü(R) = − D(R−R′ ) u(R′ ) .
∂uµ (R) ′ ′
R ,ν R

Como en los casos unidimensionales, proponemos u(R, t) = ǫ ei(k·R−ωt) , donde el vector polarización ǫ representa en
principio 3 amplitudes. Aplicando las condiciones de contorno periódicas (Born - von Karman)

u(R + Nj aj ) = u(R) {aj } vectores primitivos

encontramos que, para una red con N = N1 N2 N3 celdas primitivas, los vectores k permitidos se escriben
n1 n2 n3
k= b1 + b2 + b3 nj ∈ Z ,
N1 N2 N3
40 7 Cristal armónico

donde los {bj } son los vectores primitivos de la red recı́proca, que cumplen bj · aℓ = 2πδjℓ . Siguiendo el mismo ra-
zonamiento que hicimos para las redes unidimensionales, concluimos que hay N = N1 N2 N3 distintas posibilidades para
vectores k diferentes (una restricción similar a la que nos llevaba a limitar los momentos cristalinos para las ondas de
Bloch a la PZB).
Sustituyendo las soluciones propuestas en las ecuaciones de movimiento, queda como ejercicio mostrar que se arriba
a
M ω 2 ǫ = D̃(k) ǫ ,
donde la “matriz dinámica” D̃ se define como
X
D̃(k) = D(R) e−ik·R .
R

Estas ecuaciones tienen 3 soluciones para cada k, de modo que tendremos 3N modos normales. Utilizando las simetrı́as
de D(R), puede verse que (ejercicio)
1X h i X X k·R
D̃(k) = D(R) eik·R + e−ik·R − 2 = D(R) [cos(k · R) − 1] = −2 D(R) sen2 ,
2 R R R
2

es decir, D̃ es par con k y real. Como cualquier matriz real y simétrica, D̃(k) tiene 3 autovectores ǫ1 , ǫ2 y ǫ3 reales

D̃(k) ǫj = λj (k) ǫj (k)

que expanden el espacio k y pueden elegirse ortogonales

ǫj (k) · ǫℓ (k) = δj,ℓ j, ℓ = 1, 2, 3 .

Como M ω 2 ǫ = D̃(k) ǫ, despejamos ω(k) r


λj (k)
ωj (k) = .
M
Los modos normales con vector k tienen asociados vectores polarización ǫj y estas frecuencias. Al igual que en una
dimensión, para cada una de las 3 ramas, cuando |k| es pequeño resulta ω ∝ |k|, de modo que

k2 X 
 
X k·R 2 k
D̃(k) = −2 D(R) sen2 ≈− k̂ · R D(R) k̂ ≡ ,
R
2 2 R k

o sea que
ωj = cj (k̂) k , (27)
P  2
donde cj (k̂) es la raı́z cuadrada de los autovalores de 1/(2M ) R k̂ · R D(R).
La resolución de las ecuaciones anteriores suele complicarse mucho, por lo que se las encara numéricamente
Obviamente, una vez que encontramos los modos normales, logramos diagonalizar las matrices D̃(k), de manera
que debemos describir osciladores desacoplados. Esto es equivalente a pensar en una transformación de coordenadas
{R} → {Q}, de manera que las coordenadas normales u(Q) nos permiten escribir la energı́a potencial del sistema de
osciladores como
1X
U= D(Q) [u(Q)]2 .
2 Q
Está claro que en esta sumatoria tenemos tantos sumandos como en la red de Bravais original. Lo más importante de
las cuentas precedentes es que al fabricar un hamiltoniano con términos cuadráticos en las coordenadas e impulsos gen-
eralizados podemos aplicar el teorema de equipartición de la energı́a: cada término aporta entonces kB /2 a la capacidad
calorı́fica total. Si computamos la capacidad calorı́fica por unidad de volumen, el aporte de una red tridimensional de N
núcleos es nkB /2 (donde n = n/V ).

Red tridimensional con base Cuando se agregan átomos a la celda primitiva, el planteo formal es similar al del
problema en una dimensión, por lo que aquı́ sólo nos concentraremos en los aspectos más relevantes que resultan al
buscar las soluciones. Al igual que en el caso unidimensional, en las relaciones de dispersión aparecen las ramas ópticas;
si tenemos p iones por celda primitiva, esperamos que al resolver las ecuaciones de movimiento surjan 3pN modos
normales: entre ellos habrá 3 ramas acústicas, mientras que las 3(p − 1) restantes serán ramas ópticas, es decir que las
correspondientes frecuencias de oscilación no se anulan en el lı́mite de longitudes de onda grandes (|k| pequeños).

7.1.4. Conexión con la teorı́a de la elasticidad (con agregados del texto de Economou)
La teorı́a clásica de la elasticidad ignora la estructura microscópica de un sólido y lo describe como un medio continuo.
Cualquier fragmento pequeño de sólido puede desplazarse un cierto u(r) en las vecindades de su posición original r de
equilibrio. La hipótesis básica de esta teorı́a es que la densidad de energı́a se modifica solo por estos desplazamientos, más
precisamente por sus primeras derivadas. Si estas deformaciones ocurren lentamente y acompañan distorsiones integrales
7.1 Cristal armónico clásico 41

en cada celda primitiva (u(r) señala los apartamientos de la celda como un todo), es posible conectar la teorı́a clásica de
la elasticidad con la descripción de las vibraciones de la red que dimos más arriba. Por simplicidad, restringimos entonces
nuestra descripción a una red monoatómica.
Las propiedades de simetrı́a de D descriptas en la sección anterior nos permiten dar una expresión alternativa para
el potencial armónico
1 X  T
u(R′ )−u(R) D(R−R′ ) u(R′ )−u(R) .
 
U=
4 ′
R,R

Para compatibilizar los fenómenos descriptos, imaginamos que u(r) es una función continua de r, que coincide con la
u(R) de interés cuando r se ubica en el sitio de red R. En el caso de que la perturbación varı́e lentamente al abarcar
varios sitios de red, en primer orden podemos aproximar

u(R′ ) = u(R) + (R′ −R) · ∇u(r) ,


r=R

de manera que
v X ∂uµ (R) ∂uν (R)
U= Eαµνβ ,
2 ∂xα ∂xβ
Rµναβ

donde hemos definido el tensor Eαµνβ de rango 4 como


1 X
Eαµνβ = − Rα Dµν (R)Rβ .
2v R

Como u(r) varı́a lentamente, la expresión anterior para U puede expresarse como una integral
Z
1 X ∂uµ (r) ∂uν (r)
U= d3 r Eαµβν .
2 V ∂xα ∂xβ
αβµν

Estas expresiones aparentemente muy complicadas pueden simplificarse bastante: lo más inmediato es el hecho de que al
intercambiar los ı́ndices µ con ν, Eαµβν no cambia; lo mismo ocurre al intercambiar α con β. Además, como la energı́a
del cristal no puede cambiar al realizar una rotación infinitesimal de un ángulo δω = δω n̂ alrededor de una dirección
arbitraria n̂, mediante la cual cada vector R se traslada según δu(R) = δω × R, es directo mostrar que U debe depender
de las derivadas ∂uµ (r)/∂xα solo en la forma simétrica
 
1 ∂uµ ∂uα
ǫαµ = + .
2 ∂xα ∂xµ

ǫαµ es conocido como tensor de deformaciones (strain tensor).

En lo relativo a la elasticidad de un material, para nosotros es familiar la ley de Hooke, o la compresibilidad medida
a través del módulo de Young Y . Podemos hacer una conexión sencilla pensando en una varilla de longitud ℓ y corte
transversal cuadrado de lado a (área a2 ) que se deforma longitudinalmente δℓ por acción de una fuerza F . La relación
entre esta fuerza y la deformación longitudinal es por definición
F δℓ
=Y .
a2 ℓ
A esta deformación se agrega una compresión transversal asociada
δa δℓ
= −σ ,
a ℓ
donde σ se denomina coeficiente de Poisson y también depende del material. Cuando en un sólido las deformaciones
provocan una fuerza f ∆V sobre el elemento de volumen ∆V , podemos pensar que esta es la resultante de las tensiones
que recibe sobre su superficie: sobre la cara cuya normal se halla en la dirección β aparece una fuerza por unidad de
área en la dirección α que se representa mediante el tensor de tensiones Tαβ . La fuerza resultante sobre este elemento de
volumen tendrá entonces componente α
I X Z X Z
∂Tαβ
Tαβ dSβ = dV = fα dV ,
∂xβ
β β

donde utilizamos el teorema de la divergencia. Concluimos que la fuerza es entonces la divergencia del tensor de tensiones
X ∂Tαβ
fα = .
∂xβ
β

Entonces podemos reescribir la definición del módulo de Young para una varilla en la dirección x cuando no hay fuerzas
en las direcciones y o z como Txx = Y ǫxx .
42 7 Cristal armónico

Al desplazarse cada elemento del sólido, podemos imaginar que se activa un sistema de resortes acoplados, que son los
que transmiten las ondas acústicas. Para evidenciarlo, consideramos nuestra varilla de área transversal a2 , despreciando
cambios en las direcciones y o z, lo que equivale a suponer nulo el coeficiente de Poisson. Los tensores de deformaciones
y de tensiones tienen solo una componente de interés: planteamos la ecuación de Newton para un elemento diferencial
tomando la fuerza como la divergencia del tensor de tensiones

∂ 2 ux ∂Txx ∂ǫxx
ρ = fx = =Y .
∂t2 ∂x ∂x
Como ǫxx = ∂ux /∂x, obtenemos la conocida ecuación de ondas

∂ 2 ux ∂ 2 ux
ρ 2
=Y ,
∂t ∂x2
p
correspondiente a una perturbación que se desplaza con velocidad cℓ = Y /ρ. Para una onda tridimensional deben
considerarse tres polarizaciones: una longitudinal y dos transversales. En un medio isotrópico las respectivas velocidades
resultan s s
Y (1 − σ) Y
vℓ = ; vt = .
ρ(1 + σ)(1 − 2σ) 2ρ(1 + σ)
En un cristal cualquiera no hay solo dos constantes elásticas Y y σ, y su número total depende de la simetrı́a del cristal:
en uno cúbico hay tres constantes independientes, mientras que en un romboédrico (celda unitaria cúbica estirada según
una diagonal), seis.

7.2. Cristal armónico cuántico


El principio de correspondencia nos permite asociar osciladores cuánticos a cada modo normal encontrado en las
secciones anteriores. Cada modo normal de una rama j con frecuencia ωj (k) aportará al sistema una energı́a (nkj +
1/2)~ωj (k), con nkj = 0, 1, 2, . . . La energı́a que puede intercambiarse con estos osciladores está entonces cuantizada,
ya que la mı́nima cantidad que puede intercambiarse es ~ωj (k). Estos cuantos de energı́a se denominan “fonones”, en
alusión a su relación con las ondas acústicas.
En el caso de una red monoatómica simple sabemos que tenemos 3N modos normales. La energı́a total asociada a
estos osciladores cuánticos desacoplados es entonces
X 1

E= nkj + ~ωj (k)
2
k,j

(j señala cada rama que surge de la relación de dispersión). En el contexto del ensamble canónico, para conectar con
la termodinámica debemos calcular la función partición, que nos permite encontrar la energı́a libre de Helmholtz por
unidad de volumen !
F kB T X −βE
r 1
f≡ =− ln e , β≡ ,
V V r
kBT

donde la suma debe abarcar todos los estados r compatibles con las restricciones del problema.
Como todos los osciladores son independientes, la función partición total Z3N es igual el producto de las particiones
zkj asociadas a cada oscilador
∞ ∞  n e−β~ωj (k)/2
e−β~ωj (k)(nkj +1/2) = e−β~ωj (k)/2
Y X X
Z3N = zkj , con zkj = e−β~ωj (k) = .
k,j nkj =0 n=0
1 − e−β~ωj (k)

Entonces
1 X ~ωj (k) kB T X  
f= + ln 1 − e−β~ωj (k) ,
V 2 V
k,j k,j

de donde (ejercicio)
∂(βf ) 1 X ~ωj (k) 1 X ~ωj (k)
u= = +
∂β V,n V
k,j
2 V
k,j
eβ~ωj (k) − 1

El primer término de la derecha corresponde a la energı́a de punto cero uo = u(T = 0), ya que la sumatoria del segundo
término se anula cuando T → 0. Esta expresión general nos permite encontrar el calor especı́fico (por unidad de volumen)
cv , siempre que conozcamos la distribución de poblaciones ωj (k).
Para temperaturas altas, es decir para β → 0, podemos aproximar (ejercicio)

1 X ~ωj (k) kB T X
u(T ) ≈ uo + ≈ uo + [1 + O(β)] ,
V β~ωj (k) [1 + β~ωj (k)/2 + . . . ] V
k,j k,j
7.2 Cristal armónico cuántico 43

de donde concluimos que, tal como lo predice la clásica, se cumple cv → 3nkB . La expresión anterior nos permite además
T →∞
proporcionar una primera corrección a cv en el lı́mite de altas temperaturas.
Cuando realizamos los cálculos para una red con una base de p núcleos por celda primitiva, habrá 3 ramas acústicas
(cada una con N modos), y 3(p − 1) ramas ópticas. Las expresiones anteriores solo cambian en el hecho de que deben
involucrar 3pN osciladores desacoplados (en lugar de 3N ), de manera que tendremos 3pN contribuciones en las sumato-
rias. Por supuesto, estas sumas sobre k se convierten en integrales cuando pasamos al lı́mite termodinámico, ya que la
variable k se vuelve continua.
En el régimen de bajas temperaturas (β → ∞), en esa integral debe contemplarse la inclusión de todas las ramas en
el ı́ndice j . En este caso las frecuencias altas (~ω ≫ kB T ) no contribuirán apreciablemente a la energı́a interna o al calor
especı́fico: para considerar el aporte de las frecuencias bajas sabemos que solo es necesario incluir las 3 ramas acústicas,
ya que en este lı́mite las ramas ópticas no tendrán incidencia. Si bien en la sección anterior desarrollamos explı́citamente
el hamiltoniano clásico para una red tridimensional monoatómica, puede mostrarse que también en una red con base
vale la aproximación (27) para |k| pequeños, de modo que para evaluar el aporte de las ramas acústicas consideramos
ωj = cj (k̂) k al computar la energı́a interna para bajas temperaturas
X Z d3 k ~cj (k̂)k
u = uo + 3
.
j
(2π) e β~cj (k̂)k
−1

Sustituyendo x ≡ ~cj (k̂)k/(kB T ) obtenemos


Z ∞
∂ (kB T )4 3 dx x3
cv = ,
∂T (~c)3 2π 2 0 ex − 1
3
donde tomamos 1/c3 como el valor medio de 1/ cj (k̂) en todas las orientaciones


Z
1 1X dΩ
= 3 ,
c3 3 j

4π cj (k̂)

y la integral (independiente de T ), puede reescribirse como


Z ∞ ∞ Z ∞ ∞
dx x3 X 3 −nx
X 1 π4
x
= dx x e = 6 4
=
0 e −1 n=1 0 n=1
n 15

(buscamos esa sumatoria por ejemplo en la tabla Schaum). Reuniendo toda esta información, obtenemos el compor-
tamiento de cv a bajas temperaturas, el cual concuerda con los datos logrados experimentalmente
3
2π 2 kB kB T

cv ≈ (T → 0) .
5 ~c

Para el rango de temperaturas intermedias es necesario conocer más detalles acerca de las distribuciones ωj (k).
Veremos dos alternativas, que en realidad ya presentamos en otras ocasiones.

7.2.1. Esquema de Debye


En este modelo se extiende la suposición de que todas las ramas del espectro vibracional se representan solo mediante
3 ramas (acústicas) en las que ω = ck. Además, las integrales en el espacio k, que deberı́an abarcar la PZB, se sustituyen
por integrales en una esfera de radio kD que contiene los N vectores k permitidos. Análogamente a lo que desarrollamos
en cómputos anteriores, podemos ver que el volumen en el espacio k asociado a 1 vector k posible es (2π)3 /V , de manera
que el volumen asociado a los N vectores k es
3
N 4 3 kD
(2π)3 = πkD ⇒ n= .
V 3 6π 2
Con estas identificaciones,
kD
k3
 Z 
∂ 3~c
cv = dk .
∂T 2π 2 0 eβ~ck − 1
Definimos la frecuencia de Debye ωD como la máxima frecuencia de los modos normales presentes en el sistema, que
se conecta con la temperatura de Debye ΘD mediante la relación
kB ΘD = ~ωD = ~c kD .
ΘD da una idea sobre la temperatura a partir de la cual todos los modos normales participan en los intercambios de
energı́a del sistema, y su valor puede variar aproximadamente entre 100 K y 2000 K. Si en la expresión anterior realizamos
el cambio de variable x ≡ ~ck/(kB T ) obtenemos
3 Z ΘD /T
x4 e x

T
cv = 9nkB dx .
ΘD 0 (e − 1)2
x
44 8 Lı́mites de la aproximación de una partı́cula

Para el lı́mite de bajas temperaturas puede aproximarse la integral por el resultado de integrar entre 0 e ∞, de modo
que (ejercicio)
3 3
12π 4
 
T T
cv = nkB ≃ 234 nkB .
5 ΘD ΘD

7.2.2. Modelo de Einstein


En lugar de representar las ramas ópticas por la relación de Debye con k grande, pueden mantenerse esas relaciones
para las 3 ramas acústicas, mientras que para las ópticas se recurre a la aproximación de Einstein, en la que se asigna
una frecuencia constante ω(k) = ωE . Entonces cada rama óptica aporta a la densidad de energı́a por unidad de volumen
n~ωE
uopt = ,
e~ωE /(kB T ) − 1
de modo que si hay r ramas ópticas, su aporte al calor
especı́fico por unidad de volumen es
2
e~ωE /(kB T )

~ωE
copt
v = rnkB 2 .
kB T

e~ωE /(kB T ) − 1

Si bien el modelo de Debye es posterior al de Einstein y


surgió porque a bajas temperaturas era evidente que debı́an
contribuir en mayor grado las frecuencias bajas, está claro
que en el esquema de Debye no se tiene en cuenta de ningún
modo el aporte de las ramas ópticas, cuyas frecuencias son
mayores que las acústicas. Por este motivo suelen elegirse
alternativamente uno u otro modelo, adaptándolos según el
caso.

7.3. Medición de relaciones de dispersión


Mediante la irradiación de un material y la detección del producto resultante es posible extraer información sobre
la energı́a intercambiada con la muestra utilizada. Para esto suelen utilizarse rayos x o neutrones, prestando especial
atención a los ángulos de dispersión de la radiación, en configuraciones experimentales similares a las de los experimentos
de difracción. En aquellos casos el interés estaba puesto en las dispersiones elásticas de neutrones o fotones, es decir sin
que los cuantos de radiación perdieran la energı́a E con la que inciden: solo su impulso p cambia a p′ con |p′ | = |p|,
cumpliéndose la ley de Bragg (condición de von Laue) —o lo que es lo mismo, el cristal puede absorber un impulso ~K,
donde K es un vector de la red recı́proca (ver §2.3.1).
Cuando se analizan los casos de absorción o emisión de un fonón de la rama j con vector de onda k y energı́a ~ωj (k),
los cuantos de radiación emergente tienen impulso p′ con |p′ | 6= |p| y energı́a E ′ 6= E: la energı́a y el impuso totales
deben conservarse
E ′ = E ± ~ωj (k) , p′ = p ± ~k + ~K ,
donde el signo “+” corresponde a la absorción de un fonón (su energı́a e impulso son transferidos a la radiación emergente),
mientras que el signo “−” señala la emisión de un fonón (la radiación pierde esa energı́a).
Los instrumentos de medición realizan un barrido discreto de energı́as y ángulos de dispersión de la radiación, aunque
la asignación de valores en esos intervalos corresponde a una visualización de los fenómenos dentro de un continuo de
posibilidades. En el caso de radiación electromagnética con longitudes de onda en el rango visible, las pérdidas de
energı́a son muy pequeñas, pero los interferómetros modernos pueden discriminarlas: el reciente desarrollo de láseres con
diferentes longitudes de onda hizo que la espectroscopı́a Raman tuviera una importante evolución, y actualmente resulta
imprescindible en los estudios de ciencia de materiales.

8. Lı́mites de la aproximación de una partı́cula (basado en el texto de Ashcroft)

Vimos que la teorı́a de Bloch resuelve satisfactoriamente el problema de un electrón en un potencial periódico. El
sistema fı́sico que representamos mediante el hamiltoniano que involucra a un solo electrón presenta algunas dificultades,
relacionadas con las interacciones entre electrones, que son de diferente naturaleza, y que no pueden incluirse en un
potencial periódico efectivo. En particular, sabemos que las funciones de onda conjuntas Ψ de sistemas donde intervienen
muchas partı́culas de espı́n 1/2 deben ser antisimétricas ante permutaciones entre pares, lo que es imposible reflejar a
través de la resolución de un problema con un solo electrón.
45

La ecuación de Scrödinger para el hamiltoniano correspondiente a los electrones en presencia de los iones inmóviles10
de un sólido es
~2 X 2 X 1X e2
ĤΨ = − ∇ℓ Ψ + Uion (rℓ )Ψ + Ψ = EΨ ,
2m 2 |rℓ − rℓ′ |
ℓ ℓ ′ ℓ6=ℓ

donde el potencial de interacción con los iones en los sitios de la red cristalina R es
X 1
Uion (r) = −Ze2 .
R
|r − R|

Esta idea de núcleos inmóviles que interactúan con la nube de carga que trasladan los electrones es conocida como
aproximación de Born-Oppenheimer, y si bien se adecua perfectamente a este caso, no puede aplicarse en sistemas en
los que las posiciones de los núcleos se ven afectadas por la evolución de los electrones.
Cuando el número N de electrones que interviene en este sistema es algo mayor que 10, la resolución resulta imposible,
por lo que se recurre a métodos aproximados llamados “autoconsistentes”, que presentamos sintéticamente a continuación.
Si las soluciones individuales se denotan con ψj , la densidad de electrones por unidad de volumen puede escribirse
X
n(r) = |ψj (r)|2 .
j

Entonces la energı́a de interacción entre electrones puede expresarse como

e2 n(r ′ )
Z
Uee (r) = d3 r ′ ,
|r − r ′ |

donde no es necesario “descontar” la interacción consigo mismo, ya que es despreciable frente a la contribución de los
otros 1020 . La función de onda conjunta para partı́culas distinguibles es Ψ = ψ1 (r) ψ2 (r) ... ψN (r), de modo que la
ecuación de Schrödinger puede separarse como

~2 2  
− ∇ℓ ψℓ + Uion (r) + Uee (r) ψℓ = ǫℓ ψℓ .
2m
Estas son las ecuaciones de Hartree, y componen un sistema de N ecuaciones para las N funciones de onda individuales
ψℓ , las cuales intervienen (todas ellas) en la construcción de la energı́a de interacción Uee entre pares: por este motivo se
denomina “autoconsistente”. Para su resolución deben llevarse a cabo iteraciones, que permitan estimar cada vez mejor
Uee , a medida que las funciones de onda convergen a las soluciones correctas.
También es posible procurar una resolución aproximada del problema, recurriendo al principio variacional, es decir,
minimizando el valor de expectación EΨ para el hamiltoniano total

EΨ = Ψ Ĥ Ψ (hΨ | Ψi = 1) .

Utilizando multiplicadores de Lagrange εj para los vı́nculos hψj | ψj i = 1, las condiciones de extremo para la estimación
anterior pueden escribirse
δEΨ δ X Z 3 ′ ∗ ′ ( ′
∗ − ∗ εj d r ψj (r ) ψj r ) = 0 .
δψℓ (r) δψℓ (r) j
Estas ecuaciones coinciden con las de Hartree, aunque resta superar la discrepancia que surge en relación con la solución
formal: hay interacción electrostática de cada electrón con los otros electrones, pero no con ellos mismos.
Los problemas de la descripción precedente se resuelven respetando el principio de exclusión de Pauli, es decir
construyendo una función de onda conjunta Ψ antisimétrica que incorpore adecuadamente la dependencia de los estados
con las coordenadas espaciales {rℓ } y las de espı́n {σℓ }, a través de todas las permutaciones posibles p entre pares
1 X
Ψ(r1 , σ1 , . . . , rN , σN ) = √ (−1)p ψp1 (r1 , σ1 ) ψp2 (r2 , σ2 ) · · · ψpN (rN , σN ) .
N! p

Esta construcción se conoce con el nombre de determinante de Slater, y pone en evidencia que los electrones no pueden
considerarse como partı́culas independientes, aun cuando la interacción electrostática entre ellos pudiera ser poco im-
portante. En los casos en los que el hamiltoniano no involucra los espines, las funciones de onda individuales pueden
factorizarse, es decir ψℓ (rℓ , σℓ ) = φℓ (rℓ ) χ(σℓ ). Introducimos entonces estas funciones en la estimación del valor de
expectación del hamiltoniano, lo que, siempre que hψℓ | ψj i = 1, nos conduce a (ejercicio)

~2 2 e2
XZ 3   Z
∗ 1X 2
EΨ = d r ψj (r) − ∇ + Uion (r) ψj (r) + d3 r d3 r ′ |ψj (r)|2 ψℓ (r ′ ) −
j
2m 2 |r − r ′|
j,ℓ
Z 2
1 X e
− d3 r d3 r ′ δσ ,σ ψj∗ (r) ψj (r ′ ) ψℓ∗ (r ′ ) ψℓ (r) .
2 |r − r ′ | j ℓ
j,ℓ

10 Computamos por separado las vibraciones colectivas del material.


46 9 Semiconductores

Aplicando el principio variacional, es decir, exigiendo la condición de extremo para EΨ , obtenemos las ecuaciones de
Hartree-Fock
~2 2 XZ 3 ′ e2
− ∇ ψj (r) + Uion (r) ψj (r) + Uee (r) ψj (r) − d r ψℓ∗ (r ′ ) ψj (r ′ ) ψℓ (r) δσj ,σℓ = εj ψj (r) .
2m |r − r ′ |

El último término del miembro izquierdo no aparece en las ecuaciones de Hartree: se denomina “término de intercambio”
para diferenciarlo del término directo Uee , y corresponde a energı́as surgidas por la naturaleza de las partı́culas indis-
tinguibles. Este efecto aparece en cualquier sistema de partı́culas idénticas, es decir también interviene en los cálculos
de orbitales para átomos aislados, o en los estudios de niveles moleculares. Sin embargo, para un sólido este término
agrega demasiadas complicaciones y las correcciones que aporta suelen ser menores, salvo cuando se trata de un potencial
Uion débil, donde la aproximación de ondas planas puede resultar adecuada y entonces la energı́a de intercambio cobra
relevancia. En ese caso, después de algunas cuentas que omitimos, la estimación para la energı́a del sistema resulta

3 e 2 kF
 
3
E=N εF − .
5 4 π

Esta es exactamente la energı́a que obtenı́amos sin tener en cuenta la antisimetrı́a de las funciones de onda conjuntas,
corregidas por intercambio a través del segundo término del corchete: este es el valor asignado a la energı́a de intercambio,
y para los casos en que la aproximación de partı́cula libre resulta inapropiada, Slater propuso agregar esa energı́a local
para reflejar el efecto que surge a raı́z de la indistinguibilidad de las partı́culas, evitando complicaciones en los cálculos. Si
bien este método es aparentemente rudimentario, en muchos estudios se lo ha mantenido, y se lo invoca como método de
Hartree-Fock-Slater. Por supuesto, todas las expresiones anteriores deben modificarse adecuadamente cuando los espines
aparecen en el hamiltoniano, con el cuidado adicional debido a que las ψj (rj , σj ) no podrán factorizarse.
Entre las muchas alternativas para superar los inconvenientes de cálculo, mencionamos el método de Thomas-Fermi,
que propone reescribir Uion y el término de intercambio a partir de la densidad local de carga −e n(r), que por supuesto
también se expresa en términos de las soluciones buscadas; paralelamente, se aproxima la energı́a cinética del conjunto
como función de la densidad electrónica. De este modo se da cuenta de las energı́as de interacción con los iones, incluyendo
el apantallamiento, además de las interacciones entre los electrones.
Si bien las ecuaciones de Hartree-Fock conducirı́an a resultados exactos, su resolución se torna imposible en sistemas
termodinámicos. El modelo de Thomas-Fermi es una alternativa sencilla y rápida de estimar las soluciones, pero en
muchos casos resulta muy impreciso, en particular porque representa una energı́a cinética alta donde hay alta densidad
electrónica, pero no tanto donde los ∇ψ son importantes. Entre ambas descripciones se encuentran las ecuaciones de
Kohn-Sham, que reescriben las funciones de onda individuales de manera que se obtienen ecuaciones de Schrödinger
separadas; sin embargo, las autoenergı́as y autofunciones resultantes no corresponden a los electrones por separado, sino
que se denominan autoestados de Kohn-Sham, y la interpretación fı́sica correcta se aplica a las densidades electrónicas
encontradas.
Todos los modelos que se desarrollaron en base a cálculos que utilizan la densidad electrónica espacial son cono-
cidos bajo el nombre de “teorı́a de funcionales de densidad” (DFT). Aunque formalmente fue planteado por Kohn y
colaboradores (1964) para ser utilizado en materia condensada, su uso se popularizó rápidamente en otros sistemas
que involucran muchos electrones, como átomos aislados o moléculas, y le mereció a Kohn el premio Nobel en quı́mica
(1998). Entre las principales correcciones que se incluyen en estos desarrollos se encuentra la llamada interacción de in-
tercambio, relacionada con la interdependencia entre las evoluciones de electrones con espines antiparalelos, no incluidas
originalmente en el método de Hartree-Fock.

9. Semiconductores (basado en los textos de Ashcroft y Marder)

Esencialmente los semiconductores son malos aislantes, que a 0 K tienen las bandas de valencia llenas, separadas
de las de conducción por una pequeña brecha de energı́as εg > 2 eV. A temperatura ambiente, pronto veremos que la
ocupación de la banda de conducción es proporcional a e−βεg /2 ≃ 10−9 , donde β = 1/(kB T ) = 40 eV−1 y εg ≃ 1 eV. Esto
significa que la conductividad eléctrica crece exponencialmente con T , al contrario de lo que ocurre en metales, donde las
dispersiones reducen la conductividad (σ = ne2 τ /m) al aumentar la temperatura. En particular, a temperatura ambiente
las resistividades tı́picas de un semiconductor pueden oscilar entre 10−3 y 109 Ω cm, mientras que en un metal estas son
≈ 10−6 Ω cm y en un buen aislante, 1022 Ω cm. Estos rasgos atı́picos atrajeron la atención cientı́fica ya en el siglo XIX, y
se mantiene vigente en la actualidad.
Las impurezas en los semiconductores juegan un rol crucial en sus propiedades, aun cuando sus concentraciones sean
tan bajas como 1/1010 . La comprensión de su influencia en el material semiconductor en cuestión, y el control de su
concentración en el mismo permite utilizar estas impurezas para proveer importantes propiedades de transporte, lo que
se tornó posible mediante el notable desarrollo de la industria electrónica a través de los últimos 60 años. Por ejemplo, la
resistividad del Ge dopado con Sb puede reducirse en un factor 1012 con la concentración de impurezas; por este motivo,
9.1 Poblaciones en equilibrio termodinámico 47

cuando se trata de materiales preparados a propósito, no se habla de impurezas sino de “dopantes”, ya que no se trata
de un defecto del material.
Las brechas de energı́a εg pueden medirse con buena precisión mediante absorción óptica, aunque también es posible
inferir los valores de εg de la dependencia de la conductividad con la temperatura, como veremos más adelante. Cuando
se ilumina un semiconductor con radiación electromagnética de frecuencia ω, esta lo atraviesa más o menos libremente
hasta que la frecuencia de los fotones alcanza para que ~ω supere εg , y entonces hay un abrupto crecimiento de la
absorción de esa radiación. Si bien los procesos que ocurren son bastante complejos, podemos resaltar algunos rasgos
sobre estas determinaciones mediante absorción óptica:

a) En una transición que involucre un fotón deben conservarse la energı́a y el impulso totales. En Si y Ge, el mı́nimo
εc de las energı́as ε(k) en la banda de conducción no está en el punto Γ = (0, 0, 0), donde se encuentra el máximo εv
de la banda de valencia: se trata de “semiconductores indirectos”, y las transiciones que acompañan la absorción
o emisión de los fotones con energı́a ~ω son mediadas por fonones que permiten balancear la energı́a y el momento
totales, aunque su energı́a resulta irrelevante en las mediciones, excepto en semiconductores con brechas indirectas
excepcionalmente pequeñas. Si bien estos materiales son ampliamente utilizados, muchas aplicaciones ópticas
requieren semiconductores directos como el GaAs, en el que los dos extremos que determinan εg se ubican en
k = 0.
b) Al reducir la energı́a de los fotones casi hasta el borde de la banda, donde se espera que la absorción óptica se
anule, suelen aparecer uno o más picos estrechos: reflejan “excitones”, es decir, pares electrón-hueco ligados, cuyas
energı́as pueden hallarse apenas debajo de las energı́as asociadas con un solo electrón.
c) Los fotones con ~ω < εg se siguen absorbiendo (mucho menos que las energı́as mayores) debido a la presencia de
impurezas.

Como señalamos en §5.1.1 pueden ajustarse las relaciones de dispersión cerca de los respectivos extremos de cada
banda
~2 T −1

 ε(k) = εc + k M k conducción, e−


2
2
 ε(k) = εv − ~ kT M−1 k valencia, h+ ,


2
donde M es el tensor de masa efectiva correspondiente. En el máximo de la banda de valencia, el Si, el Ge y el GaAs
presentarı́an una degeneración 3 si no interviniera el espı́n de los electrones; sin embargo, la interacción espı́n-órbita
desdobla las bandas en k = 0 donde ocurre ese máximo, dejando la de mayor energı́a con degeneración 2: allı́ las curvaturas
son diferentes, lo que implica movilidades distintas, aludiendo entonces a huecos pesados y huecos livianos, ambos con
su respectiva contribución al transporte. En virtud de la alta simetrı́a asociada con Γ, las correspondientes superficies
de energı́a allı́ resultan esféricamente simétricas, de manera que los tensores de masa reducida son proporcionales a la
identidad.

9.1. Poblaciones en equilibrio termodinámico


Si gc (ε) es la densidad de estados en la banda de conducción, el número de electrones por unidad de volumen en esa
banda puede escribirse Z ∞
1
n(T ) = dε gc (ε) β(ǫ−µ) ,
εc e +1
mientras que en la banda de valencia el número de huecos por unidad de volumen es
Z εv   Z εv
1 1
p(T ) = dε gv (ε) 1 − β(ǫ−µ) = dε gv (ε) −β(ǫ−µ) ,
−∞ e +1 −∞ e +1

donde gv (ε) es la densidad de estados en esa banda. Estas densidades se simplifican para semiconductores no degenerados,
es decir, con probabilidades muy pequeñas para ocupar bordes de banda, lo que ocurre cuando se cumple εc − µ ≫ kB T
y µ − εv ≫ kB T —a menudo se toma como criterio práctico εc − µ > 3kB T , teniendo presente que la excitación térmica
es bastante menor que las brechas εg . En estos semiconductores no degenerados, n ∼ 1019 e− /cm3 o menos, por lo que
presentan un comportamiento muy diferente de los metales, en los que n ∼ 1022 e− /cm3 .
En los dispositivos electrónicos, la densidad de dopantes suele alcanzar para que no se cumpla el criterio de semicon-
ductor no degenerado. Sin embargo, muchas veces las propiedades de estos dispositivos son condicionadas por regiones
poco dopadas, mientras que las muy dopadas funcionan como corto-circuito y pueden ignorarse.
Cuando el semiconductor es no degenerado, las expresiones anteriores pueden aproximarse como

n(T ) = Nc (T ) e−β(ǫc −µ) , p(T ) = Pv (T ) e−β(µ−ǫv ) , (28)

donde definimos las cantidades Nc (T ) y Pv (T ), independientes de µ, como


Z ∞ Z εv
Nc (T ) = dε gc (ε) e−β(ǫ−εc ) y Pv (T ) = dε gv (ε) e−β(ǫv −ε) . (29)
εc ∞
48 9 Semiconductores

Las exponenciales de estas últimas expresiones hacen que en las integrales pesen mucho los bordes de cada banda: en
lugar de tomar las g(ε) como constantes, conviene recurrir a las expansiones cuadráticas cerca de los extremos para
escribir
d3 k ~2 T −1
Z  
gc (ε) = δ ε − εc − k M k ,
(2π)3 2
que puede expresarse en una base que diagonalice M, con lo cual
!
d3 k ~2 X kα 2
Z
gc (ε) = δ ε − εc − ,
(2π)3 2 α=x,y,z mα

donde mα son los elementos diagonales de M. Definiendo


 
k1 k2 k3
mn = (m1 m2 m3 )1/3 y q= √ ,√ ,√ ,
m1 m2 m3
puede reescribirse
3/2 3/2
~2 q 2
Z  
mn
3
p mn
gc (ε) = 2 d q δ ε − εc − = 2 (ε − εc ) Mc ,
(2π)3 2 ~3 π 2
donde Mc es el número de mı́nimos simétricamente equivalentes de la banda de conducción —en el caso del Si Mc = 6,
mientras que para el Ge Mc = 8. Entonces podemos avanzar con el cálculo de las integrales (29), definiendo para el caso
3/2 3/2 3/2
de los huecos mp = mpℓ + mpp , es decir teniendo en cuenta la contribución de los huecos livianos (pℓ) y los pesados
(pp), arribando a (ejercicio)
 3/2  3/2
1 2mn kB T 1 2mp kB T
Nc (T ) = M c , P v (T ) =
4 π~2 4 π~2
(¿por qué en Pv (T ) no aparece un factor equivalente a Mc ?).

Semiconductores intrı́nsecos y extrı́nsecos


Para encontrar las poblaciones n(T ) y p(T ) de equilibrio es necesario conocer el potencial quı́mico µ, aunque afortu-
nadamente el producto de estas poblaciones no depende de µ

n(T ) p(T ) = Nc Pv e−βεg (εg = εc −εv ) .

Este resultado, conocido como “ley de acción de masas”, implica que para cada temperatura alcanza con conocer la
población de uno de los portadores para determinar la del otro. La presencia de impurezas en el semiconductor es
determinante para lograrlo, por lo que hay que diferenciar la situación de un cristal puro o semiconductor intrı́nseco del
caso de un cristal con impurezas agregadas controladamente (dopantes) o semiconductor extrı́nseco.
Cuando se trata de un semiconductor intrı́nseco, a cada electrón en la banda de conducción corresponde un hueco
en la banda de valencia, es decir ni (T ) = pi (T ), lo que nos permite despejar
√  
ni (T ) = Nc Pv e−βεg /2 = Nc e−β(ǫc −µ) = Pv e−β(µ−ǫv ) ,

de manera que el potencial quı́mico para un semiconductor intrı́nseco se escribe


ni εg 3 mp 1
µi = kB T ln + εc = εv + + kB T ln − kB T ln Mc .
Nc 2 4 mn 2
Podemos encontrar la energı́a de Fermi para este sistema como el lı́mite de µi para bajas temperaturas
εg
εF =µi → εv + ,
T →0 2
o sea, justo entre εv y εc .
En el caso de un semiconductor extrı́nseco, al utilizar ciertas impurezas como dopantes, la fı́sica cambia drásticamente.
Como las concentraciones de estos dopantes siguen siendo pequeñas, pueden utilizarse expresiones similares a las (28):
los valores de las integrales para Nc (T ) y Pv (T ) no varı́an sustancialmente, pero el potencial quı́mico se acercará a la
banda de valencia o de conducción, según la naturaleza de las impurezas, y esto tendrá una incidencia importante a
través de las exponenciales de las expresiones (28). Con esta idea, para el caso general de semiconductor extrı́nseco no
degenerado, suelen escribirse las poblaciones de las bandas de interés en términos de las poblaciones del semiconductor
intrı́nseco
n(T ) = ni (T )eβ(µ−µi ) y p(T ) = ni e−β(µ−µi ) .
Las impurezas desbalancean el equilibrio de estas poblaciones, es decir, ∆n ≡ n − p 6= 0; no obstante sigue valiendo la
ley de acción de masas, es decir (ejercicio)
p
(∆n)2 + 4n2i
 
n ∆n
n p = n2i ⇒ = ± . (30)
p 2 2
9.2 Niveles de impurezas 49

Con estas expresiones podemos explicitar el nivel (relativo) de impurezas como función del potencial quı́mico
∆n
= 2 senh [β(µ − µi )] .
ni
La validez de las expresiones anteriores se basa en el hecho de que estamos analizando el régimen no degenerado, de
modo que siempre se cumple ∆n ≪ ni (∼ 1017 ≪ 1022 ).

9.2. Niveles de impurezas


Algunas impurezas son átomos que aportan un electrón extra a la banda de conducción, y por ese motivo se denominan
dadoras. En cambio cuando proveen huecos extra, es decir, pueden alojar fácilmente un electrón de la banda de valencia,
se denominan aceptoras.
Las impurezas dadoras son átomos de mayor valencia que la de la matriz, es decir, disponen de más electrones “para
compartir” que los átomos del semiconductor puro. Por ejemplo, el Ge (Za = 32) cuenta con 4 electrones de valencia por
ion, y puede presentar impurezas de As (Za = 33), que comparte 5 electrones por átomo; en la red cristalina, el átomo
de arsénico se comporta casi como uno de germanio, pero su núcleo suma una carga positiva +e extra en un sitio fijo
de la red, junto con su electrón de valencia adicional. Supongamos entonces que tenemos Nd impurezas dadoras por
unidad de volumen, que representan a Nd cargas +e dispersas irregularmente en sitios fijos de la red acompañadas por
Nd electrones. Cada uno de esos núcleos en el estado fundamental puede ligarse a un electrón: si se tratara de átomos
aislados, esta energı́a de ligadura para el As serı́a de 9,81 eV; pero como la impureza está inmersa en la estructura del
semiconductor, la energı́a requerida para romper este enlace se reduce considerablemente hasta 0,013 eV. El motivo de
esta reducción es que un electrón en presencia de este centro con carga +e se mueve dentro del semiconductor “anfitrión”
de constante dieléctrica ǫ con una masa efectiva m∗ en el vacı́o: esto puede representarse con un átomo de hidrógeno
que en el centro de atracción tiene una carga +e/ǫ, por lo cual el potencial involucra el producto de las cargas −e2 /ǫ en
lugar de −e2 , actuando sobre una masa m∗ en lugar de m. Entonces el radio de la primera órbita de Bohr, en lugar de
ao = ~2 /(me2 ), en este caso es (ejercicio)
m
r o = ∗ ǫ ao ,
m
con lo cual la autoenergı́a del estado fundamental resulta
m∗ 1
Eo = × 13,6 eV
m ǫ2
en lugar de me4 /(2~2 ) = 13,6 eV. Valores tı́picos de r rondan los 100 Å, es decir, las funciones de onda se extienden
bastante sobre el medio dieléctrico, lo que justifica el enfoque macroscópico que hemos planteado. En general las energı́as
de ligadura de estos átomos ficticios son muy chicas (unas 1000 veces menores) comparadas con las brechas entre las
bandas de conducción y de valencia: las impurezas dadoras agregan niveles electrónicos apenas por debajo de εc .
El mismo razonamiento puede aplicarse a impurezas
aceptoras, que tienen menor valencia (en general, un elec- g(ε)
trón menos) que los átomos de la matriz —un ejemplo es
impurezas de Ga (Za = 31) en Ge (Za = 32). En este caso estados
estados dadores
puede pensarse que aparece una carga −e en un sitio fijo aceptores
de la red (el átomo dopante), y un hueco ligado a él en el
cristal. Quedan como ejercicio los detalles para completar valencia conducción
la descripción, y aquı́ destacamos que como resultado, se
agrega un nivel electrónico εa apenas por encima de εv . Re-
specto de la brecha de energı́a debe cumplirse una relación εg ε
análoga a la del caso anterior, es decir, εa − εv resulta bas-
tante menor que εg . εv εc
Algunos ejemplos tı́picos de impurezas aceptoras en Si o Ge son B, Al, Ga, In y Tl; mientras que impurezas dadoras
comunes son P, As, Sb y Bi. Como dijimos, los niveles agregados por estas impurezas están muy cerca de εv o de εc , es
fácil conseguir su excitación térmica, para que los electrones sean promovidos a la banda de conducción en el caso de las
impurezas dadoras, o se remuevan de la banda de valencia en el caso de las impurezas aceptoras. En ambas situaciones se
agregan portadores de carga que contribuyen notoriamente a las propiedades de transporte en los semiconductores: las
impurezas dadoras aportan electrones a la banda de conducción, mientras que las aceptoras generan huecos en la banda
de valencia.

Contribución al transporte
Para evaluar la población de estas impurezas en el equilibrio termodinámico, necesitamos multiplicar el número de
sitios dadores Nd (aceptores Na ) por el número medio hnid (hpia ) de ocupación asociado a cada sitio, que puede evaluarse
como X
nr e−β(εr −µnr )
r
hnid = X ,
e−β(εr −µnr )
r
50 9 Semiconductores

donde las poblaciones que deben considerarse son nr = 0, nr = 1 con espı́n up y energı́a εd , nr = 1 con espı́n down y
energı́a εd , y el caso nr = 2 no puede darse por la repulsión coulombiana entre electrones. Esto implica que

2 e−β(εd −µ) 1
hnid = = 1 β(εd −µ) ,
1 + 2 e−β(εd −µ) 2
e +1

de donde el número de electrones por unidad de volumen en los sitios dadores resulta
Nd
nd = 1 β(εd −µ) .
2
e +1

Los niveles aceptores aportan huecos que contribuyen al transporte, y para analizar su población es conveniente
pensar que la aparición de un hueco en la banda de valencia complementa la población de los sitios asociados con las
impurezas aceptoras. Pensando en la aparición de una carga negativa −e fija en la red, ligada a una carga positiva +e, a
cada uno de los Na sitios corresponden 1 o 2 huecos (ausencia de 1 o 0 electrones en esos estados), pero no 0 porque esto
corresponde a 2 electrones que, como en el caso anterior, descartamos por la alta energı́a involucrada en su repulsión
coulombiana. De esta manera se obtiene (ejercicio)

eβ(µ−εa ) + 1
hnia = 1 β(µ−εa ) .
2
e +1

Como el número medio de huecos hpia es el complemento de hnia , es decir hpia = 2 − hnia , el número de huecos por
unidad de volumen asociados a los sitios aceptores resulta
Na
pa = 1 β(µ−εa ) .
2
e +1

Población de los niveles en equilibrio térmico a T > 0


Cuando las impurezas no son dopantes, es decir no se han agregado deliberadamente, la descripción se complica, y
es necesario analizar las diferentes situaciones que pueden darse, ya que las poblaciones de portadores en cada banda
no coinciden. En el caso en que Nd ≥ Na , habrá Na electrones de los Nd agregados (siempre por unidad de volumen)
que en el estado fundamental pueden pasar a los niveles aceptores: a T = 0 la banda de valencia entonces está llena y
también están completos los niveles aceptores disponibles, quedando Nd −Na niveles dadores ocupados, y la banda de
conducción, vacı́a.
A T > 0 se redistribuyen los electrones en los diferentes estados disponibles, debiendo balancearse las poblaciones
de manera que el número de electrones en la banda de conducción n más los que están en los niveles dadores nd deben
superar a la población de T = 0, Nd −Na en una cantidad idéntica a la población de huecos en la banda de valencia p
más la de los huecos pa asociados con los niveles aceptores, de modo que se cumple

n + n d = Nd − Na + p + pa .

Nuevamente suponemos que la energı́a de excitación térmica es suficientemente pequeña, es decir,

εd − µ ≫ kB T y µ − εa ≫ kB T .

Como εa y εd están muy cerca de los bordes de la brecha de energı́as, esta condición apenas modifica las suposiciones
anteriores. Ası́, la excitación térmica ioniza casi por completo las impurezas, dejando poblaciones muy pequeñas en los
sitios agregados, es decir nd ≪ Nd y pa ≪ Na , de manera que el balance anterior puede aproximarse como

∆n = n − p ≃ Nd − Na .

Utilizando esta aproximación en la relación (30) que encontramos anteriormente, resulta


 
n 1 Nd − Na Nd − Na
q
= (Nd − Na )2 + 4n2i ± ⇒ = 2 senh [β(µ − µi )] .
p 2 2 ni

Esta relación nos permite explicitar la dependencia del potencial quı́mico con la temperatura, siempre que se mantengan
válidas las aproximaciones introducidas.

9.3. Semiconductores inhomogéneos y electrónica


Entre los motivos que despiertan mayor interés por estudiar los semiconductores se encuentran sus numerosas apli-
caciones a la electrónica. El hecho de que la concentración de portadores sea mucho menor que en los metales da lugar
a fenómenos que siempre resultaron novedosos respecto del transporte de carga.
Como la brecha de energı́a εg en el caso del germanio es bastante pequeña, las fluctuaciones de la temperatura
ambiente pueden ser suficientemente altas como para que la población de la banda de conducción varı́e mucho, al punto
9.3 Semiconductores inhomogéneos y electrónica 51

que las propiedades de transporte se modifican demasiado como para que este material resulte útil en la electrónica. En
el silicio, en cambio, εg es el doble que en el Ge, y por lo tanto su respuesta se altera mucho menos con los cambios de
temperatura; además siempre se forma en su superficie una capa de sı́lice (SiO2 ), que al ser aislante suma otra propiedad
favorable, por lo que el Si suele ser muy utilizado en desarrollos electrónicos.
También se ha buscado combinar átomos de valencia similar al Ge o el Si, de manera que se compensen las propiedades
de elementos con valencia 3 y 5. Uno de los compuestos semiconductores más comunes es el arseniuro de galio (GaAs),
con εg = 1,44 eV, y otro del grupo de “semiconductores III-V” es el antimoniuro de indio (SbIn), aunque en este caso con
εg = 0,17 eV. Paralelamente se han estudiado compuestos con valencias más distantes, como los “semiconductores II-VI”,
combinando elementos de segundo y sexto grupos de la tabla periódica; ejemplos de este tipo son PbSe, PbTe y PbS. Y
recientemente se ha avanzado en semiconductores más complicados, involucrando incluso más de dos elementos en ellos.
Antes de avanzar con las descripciones de los diferentes efectos que deseamos estudiar, recordemos que la atracción
entre iones y electrones hace que siempre sea necesario invertir cierta energı́a para extraer electrones de un material,
aun en el caso de utilizar el modelo de electrones libres en un conductor. Esta energı́a se denomina función trabajo y
puede determinarse experimentalmente mediante diferentes métodos, que no necesitamos detallar aquı́; de todos modos
tendremos presente esta función trabajo en los análisis que desarrollamos a continuación.

Diodo Schottky Cuando se ponen en contacto un metal y


un semiconductor “tipo n”, es decir con impurezas dadoras, vacı́o
si la función trabajo φs del semiconductor es menor que la
del metal φm , y el potencial quı́mico, mayor, para estable- φm φs εc
cer el equilibrio fluyen electrones de los sitios dadores hacia µ µ
el metal. Se genera entonces una zona de “vaciamiento” εv
(depletion) en el semiconductor, surgiendo una carga espa- metal tipo n
cial positiva porque se fueron los electrones que establecı́an
el equilibrio, y por lo tanto aparece una diferencia de po-
tencial en esa región. Como el potencial quı́mico en esta vacı́o
situación se iguala, se produce el llamado curvado de ban-
φm φs εc
das mostrado en la figura.
µ + eV (x)
Al aplicar un voltaje en esta unión, se producen efec-
tos muy diferentes según el signo que este tenga. Cuando εv
metal tipo n
el potencial en el metal se sube respecto del semiconduc-
tor, la barrera que deben atravesar los electrones se reduce,
de manera que pueden fluir atraı́dos hacia el metal, gen-
erándose una corriente. En cambio cuando el potencial del vacı́o
metal cambia en el sentido contrario, los electrones ven una
barrera φb mayor y por ende no puede circular corriente en φb εc − eV (x)
ese sentido. Por ello estas uniones metal-semiconductor se µ = εF
conocen como rectificadores. Si el acoplamiento involucra metal εv − eV (x)
un semiconductor “tipo p”, es decir con impurezas acep- tipo n
toras, el efecto es similar, respondiendo a una descripción
análoga a la anterior.
Uniones semiconductoras (p-n) En este caso se in-
volucran dos semiconductores, que al entrar en contacto
ε reacomodan electrones en un entorno cercano a la unión
para igualar los potenciales quı́micos. A medida que los
electrones entran y los huecos salen, el voltaje de la región
εF
p empieza a reducirse y el de la región n a incrementarse,
niveles niveles εF aumentando la diferencia de potencial electrostático entre
dadores aceptores
εF ellos en esta región de vaciamiento. Nuevamente, se provo-
ca el curvado de bandas cuando visualizamos el equilibrio
con el potencial quı́mico como constante a través de este
n p n p acoplamiento. Cuando se aplica un voltaje externo, según
su signo circula fácilmente corriente gracias al desnivel de
energı́a, o bien este se torna tan elevado que impide que en la dirección opuesta fluyan cargas.
Las uniones p-n tienen múltiples aplicaciones, y entre las más sencillas podemos citar el efecto fotovoltaico, que
ocurre al iluminar uno de estos acoplamientos: la absorción de energı́a electromagnética permite la creación de pares
e− - h+ , de manera que al tener disponibilidad de portadores de carga circula corriente, la que desaparece cuando se
interrumpe la iluminación: los electrones son atraı́dos hacia la región n y los huecos, hacia la región p (¿seguro?). Esto
permite diseñar celdas solares con este tipo de montajes, constituyendo la mayor fuente de energı́a suministrada para el
transporte en el espacio exterior (principalmente fabricadas de silicio).
Este mismo principio permite explicar el proceso inverso: el diodo emisor de luz (LED: light-emitting diode) se
activa haciendo circular corriente en el sentido opuesto, de manera que cuando las cargas atraviesan la unión p-n se libera
energı́a, en general como luz visible. Avanzando un poco más en este análisis arribamos a los láseres semiconductores
52 10 Magnetismo

o láseres de inyección, en los que la emisión de luz es un proceso mecano-cuántico en el que debe producirse una
“inversión de población” (mayor ocupación en los estados excitados que en los de menor energı́a), y la emisión de la luz
coherente es asistida mediante una onda estacionaria en cierta condición de resonancia para la región activa de la unión
p-n. Los desarrollos tecnológicos recientes han permitido diseñar diferentes estructuras de semiconductores compuestos
que permiten abarcar todo el espectro de luz visible e incluso rangos más extendidos. Las emisiones de GaAs en el
infrarrojo permiten operar los diferentes controles remotos de televisores, equipos de audio, etc. La luz azul lograda con
GaN ha dado lugar a muchos avances, como la mayor compresión de información en los dispositivos de almacenamiento
(un ejemplo es el sistema Blu-Ray), y ha sido motivo del premio Nobel de Fı́sica en 2014, ya que permitió completar la
iluminación económica mediante leds.
También se utilizan uniones dobles, en particular para diseñar transistores: si el acoplamiento es p-n-p, uno de los
semiconductores se dopa pesadamente con impurezas aceptoras (denominándose estructura p+-n-p), de manera que la
diferencia de portadores de carga en las distintas regiones hace que la corriente se estabiliza cuando por una unión
circula una pequeña corriente como contrapartida para una corriente más elevada en el otro contacto. El transistor es
justamente utilizado para entregar una señal de salida que se corresponde con cierta señal de entrada, pudiendo servir
como rectificador, amplificador, oscilador, etc.
Entre otras muchas aplicaciones de las uniones p-n vale la pena mencionar el “enfriamiento Peltier”, en el que se
aprovecha la diferencia de potencial que puede lograrse en la zona activa de estos acoplamientos para compensar la
agitación térmica, provocando importantes gradientes de temperatura en regiones espaciales muy reducidas.
La creciente miniaturización de los dispositivos se ha facilitado en los últimos años, logrando que la electrónica
de semiconductores se torne notablemente económica, a pesar de que en sus inicios la fabricación era rudimentaria y
bastante a tientas. Actualmente pueden acomodarse cada vez más circuitos electrónicos en un área de 1 cm2 , utilizando
frecuentemente la llamada tecnologı́a planar, que utiliza una superficie de Si muy bien protegida por la capa de óxido
estable que se forma sobre él. Un gran cristal de silicio se corta en láminas finas llamadas “wafers” de algunas décimas
de mm o menos. El dopaje con dadores o aceptores se realiza mediante procesos de difusión, en regiones previamente
atacadas con ácido para quitar el óxido, habitualmente regulando la temperatura en hornos muy controlados. El conjunto
de los procesos involucrados es muy complejo, todos ellos controlados por computadoras, y hoy permiten fabricar estos
cristales de hasta 30 cm de diámetro, los que pueden contener alrededor de 700 chips/cm2 . En algunos casos, unos de
estos wafers puede costar hasta 250.000 dólares.
Una forma de sopesar los cambios ocurridos es comparando el número de transistores que pueden alojarse en estos
chips: en 1970 un chip contenı́a unos 1000 transistores, mientras que en el año 2000 ese número ascendió a 256.000.000.
Actualmente se cuenta con dispositivos electrónicos de apenas 40 nm, y seguramente pronto se superarán lı́mites impen-
sados hace poco tiempo.

10. Magnetismo (basado en el texto de Ashcroft)

Antes de abordar el estudio de propiedades magnéticas en los sólidos conviene repasar la relación entre trabajo
magnético realizado sobre un sistema termodinámico y las variaciones en los potenciales termodinámicos asociados al
mismo. Cuando expresamos este trabajo como (consideramos el caso en que Be k M̄ )
d̄W = Be dM̄ ,
el campo Be debe referirse a la inducción magnética externa (excluyendo el campo local) y M̄ representa el momento
magnético total del sistema, es decir, es una variable extensiva. Para compatibilizar con las presentaciones de muchos
libros de texto podemos utilizar el momento magnético por unidad de volumen M = M̄ /V . Por otro lado vale la pena
aclarar que si bien en algún sistema de unidades Be = He , es conveniente diferenciar entre el campo magnético H y la
inducción magnética B, para que en la expresión anterior siempre tengamos cantidades de energı́a intercambiada.
También es importante notar que la energı́a libre de Helmholtz en un sistema magnético siempre es la transformada
de Legendre de la energı́a interna U , donde cambiamos S por T
F (T, M̄ , N ) = U − T S (V se mantiene constante).
Entonces al expresar una variación diferencial de este potencial
dF = −S dT + Be dM̄ + µ dN
identificamos la ecuación de estado  
∂F
Be = .
∂ M̄ T,N

En cambio la energı́a libre de Gibbs G = F − Be M̄ transforma además M̄ por Be , con lo cual


 
∂G
dG = −S dT − M̄ dBe + µ dN ⇒ M̄ = − ,
∂Be T,N
10.1 Cálculo general de susceptibilidades atómicas 53

y la susceptibilidad magnética (isotérmica) se escribe

1 ∂2G
   
∂M
χ= =− .
∂Be T,N V ∂Be2 T,N

10.1. Cálculo general de susceptibilidades atómicas


Al describir las propiedades magnéticas de un sólido siempre pensamos en la contribución de los electrones como
partı́culas cargadas orbitando alrededor de los núcleos. Para ello construimos primero la energı́a cinética de cargas q en
movimiento (asociadas a un ion), abarcando la contribución de cada masa, que en ausencia de campo resulta
X p̂2i
To = .
i
2m

En presencia de un campo magnético externo B 11 recurrimos a la transformación p̂ → p̂ − (q/c)A(r), para lo cual


tenemos libertad en la elección del potencial vector A(r) : en particular para un campo B uniforme podemos utilizar
1
A= B×r , que cumple B =∇×A y ∇·A=0.
2
Definiendo Ai = A(ri ) y utilizando el hecho de que p̂i · Ai = Ai · p̂i (ejercicio), puede mostrarse que cuando se aplica
un campo magnético externo B la energı́a cinética resulta
X p̂2i X (i) q2 X 2
T = − µ̂L · B + Ai ,
i
2m i
2mc2 i

(i) (i)
donde µ̂L = q/(2mc)L̂i es el momento magnético asociado al movimiento orbital. Cuando la carga q es negativa, µ̂L
se opone a L̂i : este es justamente el caso de los electrones con q = −e, de manera que, si elegimos B = B ẑ (ejercicio),

µB e2 B 2 X 2
xi + yi2 ,

T = To + L̂ · B + 2
~ 8mc i
P
donde µB = e~/(2mc) es el magnetón de Bohr, y L̂ = i L̂i es el momento orbital total del átomo.
Cuando identificamos el espı́n del electrón, hicimos la asociación con una carga −e que girarı́a sobre su eje, en
cuyo caso encontramos una relación análoga para el momento magnético intrı́nseco µ̂s y el momento angular intrı́nseco
ŝ = (~/2)σ̂ del electrón (utilizando las matrices de Pauli σ̂)
e
µ̂s = −go ŝ ,
2mc

donde go ≃ 2 es el factor de Landé. De este modo podemos explicitar las correcciones al hamiltoniano Ĥ para cada ion
a partir del hamiltoniano Ĥo en ausencia de campo (no hay interacciones entre iones)

µB e2 B 2 X 2
xi + yi2 .
 
Ĥ = Ĥo + L̂ + go Ŝ · B +
~ 8mc2 i

Vale la pena notar que si bien los nucleones tienen espı́n 1/2 como los electrones, su contribución a la interacción es
despreciable, ya que su momento magnético intrı́nseco es varios órdenes de magnitud menor (10−6 - 10−8 veces). Vemos
entonces que la presencia del campo externo modifica al hamiltoniano original de los iones a través del sumando

µB e2 B 2 X 2
xi + yi2 .
 
∆Ĥ = L̂ + go Ŝ · B + 2
~ 8mc i

Pronto veremos que los corrimientos de energı́as respecto del caso de campo nulo son pequeños, por lo que podemos
pensar a ∆Ĥ como una perturbación, es decir
2
X n ∆Ĥ n′
En = Eno + n ∆Ĥ n + . (31)
En − En′
En′ 6=En

Para estimar el tamaño de las correcciones, primero conviene comparar el término lineal en B con el cuadrático.
Salvo que se anule, cualquier componente de n L̂ + go Ŝ n es del orden de ~, de modo que

µB B  e~B
· n L̂ + go Ŝ n = O(µB B) ≃ = ~ωc .
~ mc
11 Simplificamos la notación para Be .
54 10 Magnetismo

Para un campo de 104 gauss (intenso), esta energı́a es bastante pequeña, pues resulta ~ωc ≃ 10−4 eV. En el caso del
término cuadrático en B, notemos que n x2i + yi2 n ≃ a2o , es decir el cuadrado de las distancias interatómicas de la
red, de modo que " #
2
e2 B 2
 
2 2 eB 2 ~ωc
n x i + yi n = O ma o ≈ ~ω c .
8mc2 mc e2 /ao
El denominador del paréntesis del miembro derecho es aproximadamente 27 eV, por lo que el aporte de este término será
10−5 veces el anterior: esta contribución será entonces despreciable aun para campos B intensos, siempre que la anterior
no se anule.

10.2. Aislantes con todas las capas llenas


Si los iones del sólido tienen todas sus capas completas, el momento angular total L se anula, y también el espı́n total
S = 0. En ese estado que notamos como |0i se cumple
Jˆ |0i = L̂ + Ŝ |0i = L̂ |0i = Ŝ |0i = 0 |0i

(para cualquier proyección).
Por lo tanto en este caso las correcciones de primer orden para las autoenergı́as se anulan, de modo que el corrimiento
del estado fundamental resulta
e2 B 2 D X 2  E e2 B 2 D X 2 E
∆Eo = 2
0 xi + yi2 0 = 0 ri 0 ,
8mc 12mc2
P 2 P 2 P 2
donde utilizamos el hecho de que xi = yi = ri /3. Recordando que en virtud del acoplamiento con la fuente
de campo, los valores de expectación de estos hamiltonianos están asociados con la entalpı́a magnética Eo = Uo − B M̄ ,
podemos encontrar la susceptibilidad para este caso derivando respecto de B y cambiando el signo ( dEo = T dS − M̄ dB)
N ∂ 2 (∆Eo ) e2 N D X 2 E
χ=− 2
=− 0 ri 0 .
V ∂B 6mc2 V
Esta cantidad resulta siempre menor que 0, y es conocida como susceptibilidad diamagnética de Larmor. Para estimar
la magnitud de estas χ, notemos que en cada ion con Zi electrones puede computarse
1 X
hr2 i = 0 rj2 0 ,
Zi j

donde la suma abarca todos los electrones del ion; entonces la susceptibilidad molar se escribe
 2 2 *  +
2
molar e2 2 e NA a3o r
χ = −Zi NA 2
hr i = −Zi .
6mc ~c 6 ao

En esta expresión nos encontramos con la constante de estructura fina e2 /(~c) ≃ 1/137, el número de Avogadro NA ,
el radio de Bohr ao = ~2 /(me2 ) = 0,529 Å, y sabemos que h(r/ao )2 i ∼ 1. Con todo esto resulta |χ| ≈ 10−5 , es decir
susceptibilidades sumamente pequeñas. La respuesta diamagnética (χ < 0) de aislantes que a temperatura ambiente se
encuentran en su estado fundamental se estima adecuadamente mediante este desarrollo.

10.3. Reglas de Hund


Cuando un sólido se conforma con iones cuyas capas están parcialmente llenas, el comportamiento magnético es muy
diferente, y para profundizar el análisis conviene recordar cómo se acomodan los electrones de un átomo en el estado
fundamental. En un átomo aislado los estados electrónicos individuales con momento angular ℓ pueden tener 2ℓ + 1
proyecciones según z, combinadas con 2 orientaciones de espı́n, de manera que en cada capa ℓ entran 2(2ℓ+1) estados
diferentes; dicho de otro modo, el número n de electrones que puede alojar es a lo sumo 2(2ℓ+1) (respetando el principio
de exclusión). Si los electrones no interactuaran entre sı́, cuando una capa está parcialmente llena, el estado fundamental
serı́a degenerado, ya que habrı́a distintas configuraciones posibles, distribuyendo los n electrones en los diferentes estados
individuales; sin embargo, no solo hay interacción coulombiana entre electrones, sino también interacción espı́n-órbita,
con lo cual se modifican las energı́as de cada configuración posible.
Para iones no muy pesados, en los que la interacción espı́n-órbita no es tan fuerte, el llenado de estados individuales
para conforman el estado fundamental del átomo se explica con reglas simples, basadas en predicciones teóricas y
observaciones experimentales.

Acoplamiento de Russell-Saunders: Si bien Ĥ rigurosamente no conmuta con L̂ ni con Ŝ, en el esquema de


Russel-Saunders se asume que el acoplamiento espı́n-órbita es pequeño: en primera aproximación puede verse que esos
conmutadores son casi nulos, con lo cual para el ion como un todo se utilizan los números cuánticos L, Lz , S, Sz , J
y Jz , autovalores asociados a los operadores L̂2 [~2 L(L+1)], L̂z [~Lz ], Ŝ 2 , Ŝz , Jˆ2 , Jˆz (totales). Como en capas llenas
L = S = J = 0, estos números cuánticos son representativos de las capas a medio llenar (además del ion completo).

En base a esto, para determinar la configuración del estado fundamental nos basamos entonces en las reglas de Hund.
10.4 Aislantes con capas parcialmente llenas 55

Primera regla de Hund: S toma el máximo valor posible. (espines desapareados)

Segunda regla de Hund: L toma el máximo valor compatible con la primera regla
(En general resulta útil analizar el máximo valor posible de Lz ).

Tercera regla de Hund: Si la capa está ocupada hasta la mitad de sus estados (n ≤ 2ℓ+1), J = |L−S|; si en cambio
n ≥ 2ℓ+1, entonces J = L+S.

Los estados atómicos se describen de manera compacta mediante la llamada notación espectroscópica
2S+1
LJ ,

y al igual que para los estados individuales asociamos los estados L = 0, 1, 2, 3, 4, . . . respectivamente con las letras
S, P, D, F, G, . . . (mayúsculas para señalar el sistema conjunto). Por ejemplo, en el caso del berilio (Z = 4), cuya config-
uración electrónica es (1s)2 (2s)2 , como ℓi = 0 para todos los electrones resulta L = 0; también S = 0, ya que todos los
espines están “apareados” y se cancelan las sumas en los estados (1s) y en los (2s). Por lo tanto el estado fundamental
del Be es 1S0 , y en este caso no precisamos recurrir a las reglas de Hund.
Pero con más electrones la situación se complica, como ocurre al analizar el boro (Z = 5): el quinto electrón ocupa
un orbital 2p, con ℓ = 1 y s = 1/2 , de manera que resulta S = 1/2 y L = 1, y los valores posibles para J son 1/2 y 3/2,
es decir, podrı́amos tener un estado 2P1/2 o 2P3/2 . Con la tercera regla de Hund lo resolvemos, ya que la ocupación es
menos de la mitad, con lo cual J = |L−S| = 1/2, y el estado fundamental del boro se representa como 2P1/2 .
El último ejemplo que analizamos aquı́ es el vanadio (Z = 23), cuya configuración electrónica es [Ar] (3d)3 (4s)2 . Los
3 electrones de los orbitales 3d pueden estar desapareados, de manera que el máximo valor para S es 3/2; como se
encuentran con los mismos números cuánticos n, ℓ y ms , no pueden compartir los valores de mℓ , de manera que el
valor de la proyección M resultante de sumar 3 espines con mℓ = −2, −1, 0, 1, 2 puede tomar valores extremos M = −3 o
M = +3; esto nos indica que el máximo valor de L compatible con estas proyecciones es 3. Como hay menos de la mitad
de los 10 electrones que caben en la subcapa 3d, el valor que debe tomar J es |3 − 3/2| = 3/2, y el estado fundamental
para el V se escribe 4F3/2 .
Con estos elementos estamos en condiciones de analizar la respuesta magnética de sólidos que no cuentan con las
capas completamente llenas.

10.4. Aislantes con capas parcialmente llenas


Para describir la respuesta de estos aislantes distinguimos dos situaciones muy diferentes, según el número cuántico
J se anule o no.

1. J = 0 Esta situación se da cuando falta un electrón para tener la capa llena hasta la mitad (ejercicio). Como la
degeneración de este estado debe ser 2J +1, evidentemente no está degenerado. Puede mostrarse además que en (31) el
término (µB /~)B · n L̂ + go Ŝ n siempre se anula, de modo que es necesario computar el término cuadrático, y la
corrección a la energı́a del estado fundamental resulta
 2
e2 B 2 D X 2  E 1 X 0 µB B · L̂ + go Ŝ n
∆Eo = 2
0 xi + yi2 0 − .
8mc ~ En − Eo
|ni6=|0i

Entonces, tomando B = B ẑ, la susceptibilidad para este caso resulta


2
  
N ∂ 2 (∆Eo ) N  e2 D X 2 E 2µ2 X 0 L̂z + go Ŝz n
2
χ=− = − 0 x + y 0 − B  .

i i
V ∂B 2 V 4mc2 ~ En − Eo

|ni6=|0i

El primer término se corresponde con la susceptibilidad diamagnética de Larmor, mientras que el segundo siempre agrega
una contribución paramagnética, conocida como paramagnetismo de Van Vleck. El comportamiento magnético de estos
materiales depende de la competencia entre estas componentes diamagnética y paramagnética —por supuesto, salvo en
los casos en que a temperatura ambiente puedan ocuparse otros estados además del fundamental.

2. J 6= 0 Ahora la corrección de primer orden es la predominante, y además el estado fundamental en ausencia de


campo está (2J +1) veces degenerado. Esto significa que para computar las perturbaciones de primer orden es necesario
diagonalizar la matriz JLSJz L̂+go Ŝ JLSJz′ para las (2J+1) proyecciones posibles Jz y Jz′ (en el estado fundamental


J, L y S están fijos). Esta diagonalización se simplifica bastante utilizando el teorema de Wigner-Eckart, ya que L̂+go Ŝ
56 10 Magnetismo

es un operador vectorial (o un tensor de rango 1) en un espacio de Hilbert de dimensión 2J +1 (todas las proyecciones
Jz ). Entonces debe cumplirse
JLSJz L̂ + go Ŝ JLSJz′ = g(JLS) JLSJz Jˆ JLSJz′ ,


donde el factor g(JLS) es independiente de Jz y Jz′ . Esta expresión involucra en realidad tres igualdades, una para cada
una de las tres componentes de los operadores. Como JLSJz Jˆz JLSJz′ = ~Jz δJz ,Jz′ nos concentramos en la identidad
anterior para esta componente
JLSJz L̂z + go Ŝz JLSJz′ = g(JLS) ~Jz δJz ,Jz′ .


Evidentemente, el miembro de la derecha ya es diagonal en la base de estados con Jz bien definidos. El término per-
turbativo se desdobla entonces según Jz , es decir toma (2J +1) valores diferentes. Para encontrar g(JLS) partimos del
teorema de Wigner-Eckart para L̂ + go Ŝ · Jˆ

JLSJz L̂ + go Ŝ · Jˆ JLSJz′ = g(JLS) JLSJz Jˆ2 JLSJz′ ,




teniendo presentes las identidades


 2  2
Ŝ 2 = Jˆ − L̂ = Jˆ2 + L̂2 − 2L̂ · Jˆ , L̂2 = Jˆ − Ŝ = Jˆ2 + Ŝ 2 − 2Ŝ · Jˆ .

Se deja como ejercicio desarrollar estas igualdades para reexpresar la identidad anterior como
go + 1 go − 1 L(L + 1) − S(S + 1)
g(JLS) = −
2 2 J(J + 1)
(suele simplificarse esta expresión aproximando go = 2).
Siempre pensando en B = B ẑ, es frecuente considerar la corrección a la autoenergı́a del estado fundamental
µB B
∆Eo = g(JLS) JLSJz Jˆz JLSJz′
~
como la interacción −µ̂ · B del campo con un dipolo magnético de magnitud µ̂ ≡ − µB g(JLS)/~ Jˆ, lo cual sólo es
 

válido en la base donde Jˆz es diagonal.


En general, a temperatura ambiente estas autoenergı́as se separan; de todos modos la excitación térmica kB T no
alcanza para llevar el sistema al primer estado excitado.

10.4.1. Sistema de iones idénticos (no interactuantes)


Ahora que tenemos descriptos los corrimientos de energı́a causados por la aplicación de un campo magnético externo,
podemos plantear la función partición z1 para cada ion de momento angular total J, asumiendo que no hay interacción
magnética entre iones (son independientes) y definiendo γ = µB g(JLS)
+J
X eβγB(J+1/2) − e−βγB(J+1/2)
z1 (T, B) = e−βγBJz = .
Jz =−J
eβγB/2 − e−βγB/2

Planteando para el sistema conjunto de N iones ZN = z1N , queda como ejercicio obtener la energı́a libre de Gibbs
(−kB T ln ZN ), y de allı́ derivar la magnetización por unidad de volumen
N
M= γ JBJ (βγBJ) ,
V
donde introducimos la función de Brillouin
 
2J + 1 2J + 1 1 x
BJ (x) = coth x − coth .
2J 2J 2J 2J
En el lı́mite de temperaturas bajas (β → ∞), puede verificarse que M → (N/V )γJ, que corresponde a todos los dipolos
T →0
µ orientados según B. Sin embargo, en general se cumple que kB T ≫ γB, porque γB/kB > 10 K cuando B = 104 gauss
(campo intenso): entonces tı́picamente debe evaluarse la función de Brillouin en valores de x pequeños, donde podemos
aproximar
1 1
(x ≪ 1) coth x ≈ + x + O(x3 ) ,
x 3
con lo cual obtenemos
N (gµB )2 J(J + 1)
χ= (kB T ≫ gµB B) .
V 3 kB T
Vemos que en este régimen se satisface la ley de Curie, es decir, χ ∝ 1/T , caracterı́stica de paramagnetos que se orientan
preferentemente con el campo aplicado, contraponiéndose al desorden térmico.
Vale la pena enfatizar que esta susceptibilidad paramagnética toma valores aproximados entre 10−2 y 10−3 , es decir
unas 500 veces mayor que la susceptibilidad diamagnética de Larmor, por lo cual evidentemente predomina la respuesta
paramagnética.
10.5 Interacciones entre electrones y estructura magnética 57

10.4.2. Metales: paramagnetismo de Pauli


Los electrones de la banda de conducción no están localizados, de manera que la descripción anterior no resulta
adecuada. Considerando solo el espı́n de esos electrones (no su movimiento orbital), cada uno aporta ∓µB al momento
magnético total (porque s = 1/2 y go = 2), según esté alineado u opuesto al campo aplicado. Cuando se tienen n+ espines
con sus momentos magnéticos alineados con el campo y n− opuestos (por unidad de volumen), la magnetización será
entonces
M = µB (n+ − n− ) .
A partir de la densidad de estados g(ε) para los estados con energı́a ε cuando no hay campo magnético, podemos deducir
las g± (ε) asociadas con n± . Como solo se trata de un corrimiento en las energı́as

1
g± (ε) = g(ε ± µB B) ,
2
y recurriendo a la distribución de Fermi f (ε) obtenemos el número de espines alineados u opuestos al campo por unidad
de volumen Z  
1
n± = dε g± (ε) f (ε) f (ε) = β(ε−µ) .
e +1
Como el número total n de electrones por unidad de volumen es la suma de n+ y n− , contamos con una condición
extra para el potencial quı́mico. Analizamos primero el caso no degenerado (ε − µ ≪ kB T ), en el que la distribución
anterior puede aproximarse como f (ε) ≈ e−β(ε−µ) /2 (parecido a la estadı́stica de Maxwell-Boltzmann). Entonces las
cuentas reproducen el esquema paramagnético de la sección anterior, con J = s = 1/2, cumpliendo con la ley de Curie de
manera análoga.
Más a menudo se trabaja con sistemas degenerados, donde se hace notorio el carácter fermiónico de las partı́culas.
Como para B = 104 gauss (campo intenso) µB B ≈ 10−4 εF puede expandirse g± a primer orden, obteniendo en este caso
(ejercicio) Z
M = µ2B B dε g ′ (ε) f (ε) = µ2B B g(εF ) ⇒ χPauli = µ2B g(εF ) .

Esta última relación es conocida como susceptibilidad paramagnética de Pauli, y resulta 1000 veces menor que el para-
magnetismo que se origina en los iones fijos de la red.
Por otro lado, puede registrarse el diamagnetismo atribuido a la traslación de los electrones de conducción, para lo
cual es necesario describirlos cuánticamente, ya que mediante la clásica es imposible. A bajas temperaturas y campos
suficientemente altos se pone en evidencia la cuantización de las órbitas electrónicas, dando lugar a los niveles de Landau
que vimos en Mecánica Estadı́stica. De ese modo se logra obtener la respuesta magnética de los electrones desplazándose
en un conductor, fenómeno conocido como diamagnetismo de Landau; la susceptibilidad χLandau resultante es comparable
con la anterior, aunque algo menor
1
χLandau = − χPauli ,
3
de modo que también resulta bastante menor que la contribución asociada a los iones fijos.

10.5. Interacciones entre electrones y estructura magnética


La magnetización espontánea de algunos sólidos pone en evidencia las interacciones magnéticas entre los electrones
de un sólido. Recordemos entonces cómo son las interacciones dipolares entre dos dipolos m1 y m2 separados según un
vector r
1 
U = 3 m1 · m2 − 3(m1 · r̂)(m2 · r̂) .
r
Teniendo presente que las magnitudes de los dipolos magnéticos asociados a cada ion son

e~
m1 ≈ m2 ≈ gµB ≈ ,
mc
puede estimarse la magnitud de la interacción
2 
(gµB )2 e2 ao  3 e 2 e2
  
1  ao  3
U≈ ≈ ≈ Ry 1 Ry = .
r3 ~c r ao 1372 r 2ao

Cuando tomamos como distancia entre iones r ≈ 2 Å, la magnitud de esta interacción es sumamente pequeña, de modo
que este análisis no conduce a una desripción satisfactoria para las magnetizaciones espontáneas de algunos materiales.
En realidad la contribución más importante proviene de interacciones electrostáticas: a pesar de que los hamiltonianos
no dependen de las interacciones entre momentos magnéticos intrı́nsecos, surgen efectos que resultan en respuestas
magnéticas. Por ejemplo, cuando el hamiltoniano de dos electrones se escribe

~2
∇21 + ∇22 + V (r1 , r2 ) ,

Ĥ = −
2m
58 10 Magnetismo

es decir, no intervienen las coordenadas de espı́n, la antisimetrı́a de las funciones de onda conjuntas queda condicionada
por los estados de espı́n de los electrones. Sabemos que la función de onda de espı́n resultante es antisimétrica para el
estado singlete (S = 0) y simétrica para los estados triplete (S = 1). Como en el estado fundamental la función de onda
espacial de este sistema debe ser simétrica ante permutaciones (no lo demostramos aquı́), para que la función de onda
global sea antisimétrica, el estado de espı́n total sólo puede ser el singlete. Si bien no es fácil generalizar para varias
partı́culas, está claro que también aparecerán estos “efectos magnéticos” en los diferentes estados de un sistema para el
cual el hamiltoniano no afecta las coordenadas de espı́n.
Si solo se consideran las coordenadas de espı́n en un sistema de dos electrones, como
3~2  2 3~2 ˆ
Ŝi |χi i = |χi i y Ŝ 2 = Ŝ1 + Ŝ2 = I + 2Ŝ1 · Ŝ2 ,
3 2
analizando los autovalores de Ŝ 2 y las autoenergı́as esperadas puede verse que un hamiltoniano independiente de espı́n
puede escribirse como (ejercicio)
J
Ĥ = − 2 Ŝ1 · Ŝ2 , con J = Es − Et ,
~
donde Es es la energı́a asociada al estado fundamental (singlete) y Et la del estado excitado (triplete).
Con este ejemplo en mente, resulta razonable pensar que en un sistema de muchos espines (como es un sólido) las
interacciones entre pares son similares a la anterior (aunque en realidad el hamiltoniano sea independiente de los espines),
por lo cual se adopta como válida la expresión
X
Ĥ = − Jij Ŝi · Ŝj ,
i<j

donde las Jij se denominan constantes del acoplamiento de intercambio. Este “hamiltoniano de Heisenberg” no tiene
mayor justificación que el ejemplo que vimos para dos espines, aunque ha servido para modelar muchas estructuras
magnéticas. La forma precedente corresponde al intercambio directo, y como dijimos está relacionada con la interacción
coulombiana directa entre iones; a veces dos iones magnéticos interactúan a través de un ion no magnético (todas las
capas cerradas), en cuyo caso se la llama interacción de superintercambio.
A veces en la interacción intervienen electrones de capas f parcialmente llenas de tierras raras, también llamados
metales raros, que son los elementos con número atómico entre 57 (La) y 71 (Lu), más el Sc (21) y el Y (39). En estos
casos además del intercambio directo que señalamos arriba, los electrones f pueden acoplarse mediante interacciones
con los electrones de conducción, surgiendo el denominado intercambio indirecto, que puede resultar más fuerte que el
directo, según cómo sea el solapamiento de estos orbitales f .

10.5.1. Estructuras magnéticas


Cuando en un sólido los momentos magnéticos localizados en los sitios de una red de Bravais no interactúan con
el entorno, en ausencia de campo externo su orientación es aleatoria y por lo tanto el momento magnético promedio
inducido en cada ion es nulo. Sin embargo, en algunos sólidos al reducir el campo aplicado hasta cero, puede quedar una
magnetización remanente, también llamada magnetización espontánea, que corresponde a un ordenamiento preferencial
de estos momentos magnéticos individuales. Este fenómeno llamado ferromagnetismo se da por debajo de cierta “tem-
peratura de Curie” Tc , y algunos ejemplos de átomos ferromagnéticos son el Fe (Tc =1043 K), Co (1388 K), Ni (627 K),
Gd (293 K), Dy (85 K), etc. Cuando por debajo de cierta temperatura Tc existe cierto ordenamiento pero los momentos
magnéticos se cancelan por completo, el material se denomina antiferromagnético, y los casos más simples se componen
de dos redes idénticas intercaladas, cada red con magnetización no nula, que se cancela con la de la otra red; ejemplos
de antiferromagnetismo se dan en el MnO (Tc =122 K), FeO (198 K), Co (291 K), NiO (600 K), etc.
Los materiales ferromagnéticos tienen todos sus iones con momentos magnéticos medios no nulos, resultando en
una magnetización espontánea distinta de cero. Los denominados ferrimagnéticos poseen magnetización espontánea no
nula, aunque algunos momentos magnéticos se anulan en algunos de sus iones; este es el caso de la magnetita (Fe3 O4 ,
Tc =858 K), CoFe2 O4 (Tc =793 K), NiFe2 O4 (Tc =858 K), etc.
Por debajo de la temperatura de Curie Tc , con campo nulo, suelen analizarse diferentes comportamientos para
caracterizar la respuesta de los materiales. Como vimos en Termodinámica, los distintos exponentes crı́ticos dan cuenta
de esto, como el exponente β asociado con la dependencia de la magnetización espontánea en función de T
M (T ) ∼ (Tc − T )β (T < Tc ) .
Este exponente β toma valores tı́picos entre 0,33 y 0,37. La susceptibilidad magnética diverge a medida que la temperatura
desciende hasta la temperatura de Curie, lo que se caracteriza con el exponente γ
χ ∼ (T − Tc )−γ (T > Tc )
que toma valores alrededor de 1,3 - 1,4. También se releva el calor especı́fico a campo nulo a través del exponente α
 
∂s
cH (T ) = T ∼ (T − Tc )−α ,
∂T H
cuyos valores pueden rondar 0,1 o menos.
10.5 Interacciones entre electrones y estructura magnética 59

10.5.2. Ferromagneto de Heisenberg


Describimos un sistema de iones interactuando entre pares mediante el modelo anterior, y además sometido a un
campo externo B ẑ: en cada sitio R de la red se encuentra un ion que tiene asociado un operador de espı́n Ŝ(R), de
manera que el hamiltoniano conjunto resulta
1 X gµB B X
Ĥ = − Ŝ(R) · Ŝ(R′ ) J(R − R′ ) − Ŝz (R) . (32)
2 ′
~ R
R,R

Las constantes de acoplamiento tienen unidades de [energı́a/~2 ] y dependen de la distancia entre iones, cumpliendo la
relación
J(R − R′ ) = J(R′ − R) ≥ 0 ,
es decir, favorece que los espines estén alineados en la misma dirección (ferromagneto). Denotando con |Sz iR a la función
de onda de espı́n para el sitio R con proyección Sz (Ŝz (R) |Sz iR = ~ Sz |Sz iR ), si la interacción fuera muy débil el
estado fundamental |0i tendrı́a todos los espines alineados con el campo (Sz = S), cumpliéndose
Y
Ŝz (R) |SiR = ~ S |SiR → |0i = |SiR .
R⊗

Si para cada sitio de red definimos los operadores de subida y bajada como es habitual

Ŝ± (R) = Ŝx (R) ± iŜy (R) ,

cuya acción ya conocemos p


Ŝ± (R) |Sz iR = ~ (S ∓ Sz )(S + 1 ± Sz ) |Sz ± 1iR ,
podemos reescribir el hamiltoniano del sistema como
1 X gµB B X 1 X
Ĥ = − J(R − R′ ) Ŝz (R) Ŝz (R′ ) − Ŝz (R) − J(R − R′ ) Ŝ− (R′ ) Ŝ+ (R) .
2 ′
~ R
2 ′
R,R R,R

Como Ŝ+ (R) |Sz = SiR = 0, al aplicar Ĥ al estado fundamental, la última suma no aporta, y como |0i es autoestado
de Ŝz (R), entonces

~2 S 2 X
Ĥ |0i = Eo |0i ⇒ |0i es autoestado de Ĥ , con Eo = − J(R − R′ ) − N gµB BS .
2 ′
R,R

Para comprobar que efectivamente es el estado fundamental, podemos evaluar

Eo′ = 0′ Ĥ 0′ para algún 0′ 6= |0i .

Debido a que los iones tienen espı́n S, sabemos que S ≤ Sz ≤ S. Además al sumar Ŝ(R) + Ŝ(R′ ) el espı́n resultante de
cada par tendrá una magnitud Sp ≤ S + S = 2S . Como en Ĥ (32) interviene
1 2 1 
Ŝ(R) · Ŝ(R′ ) = Ŝ(R) + Ŝ(R′ ) − Ŝ 2 (R) + Ŝ 2 (R′ ) ,

2 2
y h0′ | Ŝ 2 (R) |0′ i = h0′ | Ŝ 2 (R′ ) |0′ i = ~2 S(S + 1), podemos establecer cotas para los términos que conforman Eo′ . Por un
lado
1 D 2 E 1 1
0′ Ŝ(R) · Ŝ(R′ ) 0′ = Ŝ(R) + Ŝ(R′ ) − 2~2 S(S + 1) ≤ ~2 (2S)(2S + 1) − ~2 S(S + 1) = ~2 S 2
2 |0′ i 2 2

y además 0′ Ŝz (R) 0′ = ~Sz ≤ ~S, de modo que


1 X gµB B X
Eo′ ≥ − J(R − R′ ) ~2 S 2 − ~S = Eo .
2 ′
~ R
R,R

Como esto se cumple para cualquier estado |0′ i =


6 |0i, lo que hemos mostrado es que efectivamente Eo es la energı́a del
estado fundamental, que no es otro que |0i.
Si bien todo sugiere que un planteo similar puede aplicarse al caso antiferromagnético, es importante mencionar que
no resulta sencillo avanzar con los cálculos, y solo es posible establecer cotas poco precisas para el estado fundamental.
Para algunos casos sencillos se ha logrado la resolución, por ejemplo para una red unidimensional de espines 1/2, o bien
para sistemas de pocos espines (no necesariamente 1/2).

A T = 0 un ferromagneto se encuentra entonces en su estado fundamental, es decir, todos los iones con Sz = S y por
lo tanto la magnetización saturada
N
M (T = 0) = gµB S .
V
60 10 Magnetismo

Para T > 0 es preciso promediar los diferentes estados con los correspondientes factores e−βE , según la energı́a E asociada
a cada estado. Como siempre, a temperaturas bajas solo contribuyen estados de baja energı́a, lo que permite estimar
el comportamiento magnético de un ferromagneto a temperaturas suficientemente bajas. Un estado |Ri con todos los
espines saturados con Sz = S excepto el ion en R, que tiene Sz = S −1, siempre puede escribirse
1
|Ri = √ Ŝ− (R) |0i .
2~S
Estos estados siguen siendo autoestados de los términos de Ĥ que involucran Ŝz , pero ahora hay que notar que
Ŝ+ (R) |Ri =
6 0. En cambio pueden utilizarse las siguientes relaciones (ejercicio)

Ŝ− (R′ ) Ŝ+ (R) |Ri = 2~2 S R′ , Ŝz (R′ ) |Ri = ~ (S − δR,R′ ) R′ ,

de manera que X
Ĥ |Ri = Eo |Ri + gµB B |Ri + ~2 S J(R − R′ ) |Ri − R′ ,
 

R′

lo que significa que |Ri no es autoestado de Ĥ. En realidad Ĥ |Ri es una combinación lineal de |Ri y otros estados con
un solo espı́n bajado de la máxima proyección S. Tomando
1 X ik·R
|ki = √ e |Ri (33)
N R

se deja como ejercicio ver que se cumple


" #
X  
2 ik·R
Ĥ |ki = Eo + gµB B + ~ S J(R) 1 − e |ki ≡ Ek |ki .
R

Recordando que J(−R) = J(R), podemos escribir


X k·R
E (k) ≡ Ek − Eo = 2~2 S J(R) sen2 + gµB B .
R
2

Como los |ki combinan estados con Sz = S −1 en un solo R y el resto con Sz = S, el espı́n total del sistema suma
N S−1. La probabilidad de encontrar Sz = S−1 en el sitio R es | hk | Ri |2 = 1/N , idéntica para todos los R y todos los k.
Si descomponemos los operadores Ŝ según la dirección del campo (ẑ) y la normal al mismo, la función correlación
transversal entre espines en un estado k es el valor de expectación de

Ŝ⊥ (R) · Ŝ⊥ (R′ ) = Ŝx (R) Ŝx (R′ ) + Ŝy (R) Ŝy (R′ ) .

Se deja como ejercicio mostrar que


2~2 S
k Ŝ⊥ (R) · Ŝ⊥ (R′ ) k = cos[k · (R − R′ )] para R 6= R′ ,
N
que puede entenderse pensando
p que en promedio cada espı́n tiene una pequeña componente normal al momento magnético
promedio (M ) del orden de 2~2 S/N .
Las funciones (33) se denominan “ondas de espı́n”, y al estudiar los cuantos de energı́a transportados por estas ondas
suele hablarse de “magnones”. A temperaturas finitas en el sistema aparecen estados excitados, que corresponden a
desviaciones del estado fundamental con cierta orientación preferencial: el rol de estas ondas es similar al de los fonones,
es decir transportan energı́a, contribuyendo no solo a transmitir una señal magnética, sino también a posibles flujos de
calor. Según la orientación de los espines contribuyen en distinta medida a la conductividad eléctrica o a los fenómenos
termoeléctricos
Para el cómputo de la magnetización del sistema, conviene notar que los cuantos de estas ondas de espı́n se consideran
partı́culas indistinguibles con espı́n 0, de modo que pueden describirse mediante la estadı́stica de Bose-Einstein. Si las
poblaciones del estado |ki se denotan como {nk }, la energı́a del sistema es
X
E ({nk }) = nk E (k) ,
k

con lo cual podemos construir la población media n(k) de cada estado y computar la magnetización M a temperatura
T , teniendo presente que el T = 0 M ∝ N S, mientras que cada onda |ki reduce el aporte al momento magnético en 1
unidad
" #  Z 
1 1 X V 3 1
n(k) = nk = βE (k) → M (T ) = M (0) 1 − n(k)×1 = M (0) 1 − d k .
e −1 NS N S(2π)3 eβE (k) − 1
k

Como a campo nulo


X k·R
E (k) = 2~2 S J(R) sen2
R
2
10.6 Aplicaciones 61

y todos los J > 0, para considerar que solo se pueblan las ε pequeñas (T bajas), tomamos |k| pequeños y aproximamos

~2 S X
E (k) ≈ J(R) (k · R)2 .
2 R

Esto nos permite simplificar la expresión para M (T ), y con algunas otras hipótesis sobre J(R) se puede avanzar con los
cálculos, que no completaremos aquı́.

Las ondas de espı́n también surgen al describir materiales antiferromagnéticos, y los cálculos se tornan aún más
complejos. En todos los casos, lo acertado de un modelo se pone en evidencia cerca del punto crı́tico, como en cualquier
sistema donde coexistan diferentes fases: en este caso se trata de la fase ferromagnética (o antiferromagnética) con la fase
paramagnética. Para simplificar los cálculos se ha recurrido a numerosos modelos simplificativos, uno de los más comunes
es la llamada teorı́a de campo medio, en la que la interacción de cada espı́n con el resto del sistema se reemplaza por un
campo promedio producto de la interacción con el entorno: ese efecto se agrega al campo externo, y ese campo externo
resultante depende de la magnetización (la orientación media de los espines). Con este modelo se predice adecuadamente la
transición de fase paramagnética-ferromagnética, aunque a temperaturas bajas las descripciones no resultan adecuadas,
ni tampoco el efecto de las ondas de espı́n; no obstante, ha sido muy utilizado en diferentes desarrollos, utilizándose
también mediante analogı́as en sistemas no magnéticos.

10.6. Aplicaciones
Los múltiples usos de los imanes han hecho crecer continuamente su demanda, y siempre se está buscando mejorarlos
o abaratarlos. En la práctica, como los mejores imanes suelen ser duros y quebradizos, muchas veces se los fabrica
embebiendo materiales en polvo en resinas, comprimidos (previa aplicación de un campo intenso para alinear los espines)
y tratados térmicamente.
La “dureza” de un imán se cuantifica mediante el campo coercitivo, como se llama al valor de campo magnético
necesario para reestablecer al material el estado desmagnetizado (M = 0): para los imanes duros el campo coercitivo
es alto, mientras que para los blandos es pequeño. Los imanes convencionales son los basados en hierro, con diferentes
agregados, los más habituales son Al, Ni y Co, y son conocidos comercialmente como Alnico, Alcomax, etc. Con el tiempo
se lograron altas coercitividades con aleaciones de Sm y Co, luego con ferritas de Ba o Sr, y también con diferentes tierras
raras, como es el caso del Nd2 FeB, que además del alto campo coercitivo se caracterizan por una alta magnetización
remanente. A gran escala estos imanes se utilizan para suspender materiales, como ocurre con los trenes de alta velocidad.
Recientemente la microelectrónica ha utilizado cada vez más frecuentemente imanes en sus desarrollos. En algunos
dispositivos modernos, además de la carga transportada resulta de interés el espı́n de los electrones. Los avances logrados
en la preparación de capas delgadas y en estructuras multicapas han permitido el desarrollo de la magnetoelectrónica,
también llamada espintrónica: mientras en los circuitos electrónicos usuales los espines están orientados arbitrariamente,
en la espintrónica se orientan en una determinada dirección, lo que permite controlar el flujo de corriente. Ası́ se aplican
campos intensos para manipular datos en las computadoras, por ejemplo en los cabezales de lectura de discos rı́gidos.
También vale la pena mencionar los sensores magnéticos en la tecnologı́a de automóviles, ingenierı́a mecánica y en
medicina.
En generaciones previas de estas tecnologı́as se aprovechaban los cambios en la resistencia eléctrica de una capa
ferromagnética al aplicar un campo externo. El almacenamiento de datos se basa en pequeños dominios magnéticos que
representan “0” y “1”, y para leerlos, las variaciones en la resistencia eléctrica sirven para detectar los campos magnéticos
superficiales, y por lo tanto relevar la información digital.
En multicapas de Fe (ferromagnético) y Cr (no magnético) se observó un acoplamiento paralelo o antiparalelo de
las magnetizaciones de Fe, dependiendo del espesor de las capas de Cr. La resistencia eléctrica del conjunto depende
fuertemente del tipo de acoplamiento, y la alta sensibilidad que se logra con este ensamble permite el almacenamiento
de datos con densidades muy superiores a las anteriores. Además, este efecto ha permitido el diseño de “válvulas de
espı́n” para regular el paso de corriente a través de estas estructuras: se aplica un campo externo intenso que modifica
la magnetización de las capas de Fe, cambiando bruscamente su conductividad12 .
Las uniones magnéticas de tunelamiento consisten de tres capas, dos ferromagnéticas que envuelven una capa aislante
de óxido metálico, cuyo espesor es de apenas 1 nm: la corriente entre las capas ferromagnéticas puede circular libremente
por efecto túnel cuando la magnetización de las capas es paralela; en cambio cuando se oponen, la resistencia crece
notoriamente. De este modo, la magnetización de una de las capas se mantiene fija y la información digital se almacena
modificando la otra, consiguiéndose aun una mayor densidad de datos.
Los ejemplos mencionados evidencian el altı́simo potencial de la magnetoelectrónica, que hasta ahora se ha volcado
principalmente en el almacenamiento de datos digitales. Esta evolución se pone de manifiesto por ejemplo en el espectac-
ular crecimiento de la densidad de datos almacenados en un disco rı́gido: entre 1956 y 2000 la densidad de datos por cm2
aumentó 10.000.000 de veces, pasando de 310 bits/cm2 a 2,6 Gb/cm2 ; en 2011 esta densidad alcanzó los 65 Gb/cm2 y en
2015 ascendió a 200 Gb/cm2 . El crecimiento de esa densidad ya no es tan impactante, y el lı́mite pronto estará impuesto
12 Estos fenómenos están ı́ntimamente ligados con el descubrimiento de la magneto-resistencia gigante en 1988, que ha merecido

el premio Nobel en 2007.


62 10 Magnetismo

por los tamaños de las estructuras nanométricas que permiten delimitar los dominios magnéticos correspondientes a una
unidad de información. Por este motivo, recientemente la búsqueda también se ha desplazado a otros tipos de almace-
namiento, como es registrar los bits manipulando estados fermiónicos propios de los electrones de un sistema13 : si bien
se aspira a elevar la capacidad en 5 órdenes de magnitud, al dı́a de hoy apenas se han informado los primeros intentos.

13 Moon y otros, “Quantum holographic encoding in a two-dimensional electron gas”, Nature Nanotechnology 4 (2009) 167.

También podría gustarte