Las fórmulas, así como las definiciones y referencias matemáticas complicadas, que se han evitado en otras partes del ensayo, se han reunido en este capítulo, junto con varios apéndices matemáticos.
Lista de apartados
En el texto se aplican las expresiones autosemejante y autoafín (otro neologismo) a conjuntos, independientemente de que sean o no acotados (sin que ello conlleve, espero, ninguna ambigüedad). En muchas discusiones acerca de la turbulencia, y en artículos míos anteriores, también se emplea el término autosemejante en un sentido «genérico» que incluye el de autoafín, pero en este ensayo el sentido genérico es el de invariancia por cambio de escala.
1. Autosemejanza
En el espacio euclídeo RE, una razón real r > 0 permite definir una transformación de homotecia, que transforma el punto x = {x1, …, xδ, …, xE) en el punto r(x) = (rx1, …, rxδ, …, rxE), y transforma por tanto el conjunto S en el conjunto r(S). Véase Hutchinson (1981).
CONJUNTOS ACOTADOS. Un conjunto acotado S es autosemejante, con respecto a la razón r y a un entero N, si es la reunión de N subconjuntos disjuntos, congruentes cada uno de ellos con r(S). Congruente significa idéntico excepto traslación y/o rotación.
Un conjunto acotado S se dice autosemejante, con respecto a las razones r1, …, r(N), cuando es la reunión de N subconjuntos disjuntos congruentes, respectivamente, con r(n)(S).
Un conjunto aleatorio acotado S se dice estadísticamente autosemejante, con respecto a la razón r y a un entero N, si es la reunión de N partes disjuntas, de la forma r(Sn), donde cada uno de los N conjuntos Sn es congruente en distribución con S.
CONJUNTOS NO ACOTADOS. Un conjunto no acotado S se dice autosemejante con respecto a la razón r, cuando el conjunto r(S) es congruente con S.
2. Autoafinidad
En el espacio euclídeo de dimensión E, una colección de razones reales positivas r = (r1, …, rδ, …, rE) define una afinidad, que transforma cada punto x = (x1, …, xδ, …, xE) en el punto
r(x) = r(x1, …, xδ, …, xE) = (r1x1, …, rδxδ, …, rExE),
y transforma por tanto el conjunto S en el conjunto r(S).
CONJUNTOS ACOTADOS. Se dice que un conjunto acotado S es autoafín, con respecto a la razón vectorial r y a un entero N, si S es reunión de N partes disjuntas congruentes cada una de ellas con r(S).
CONJUNTOS NO ACOTADOS. Un conjunto no acotado S es autoafín, con respecto a la razón vectorial r, cuando el conjunto r(S) es congruente con S.
La definición anterior se aplica a menudo bajo las condiciones siguientes: (a) S es el grafo de una función X(t) de un tiempo escalar t en un espacio vectorial euclídeo E − 1 dimensional; (b) r1 = … rδ … = rE−1 = r; (c) rE ≠ r. En este caso, se tiene la definición directa siguiente: una función vectorial de variable real X(t) es autoafín, con respecto al exponente a y al tiempo focal t0, si existe un exponente log rE/log r = α > 0 tal que para todo h > 0 la función h−αX[h(t − t0)] es independiente de h.
SEMIESTABILIDAD DE LAMPERTI. Lamperti (1962, 1972) llama semiestables a los conjuntos aleatorios autoafines no acotados.
ALOMETRÍA. En el capítulo 17 se observa que, cuando la altura de un árbol botánico cambia en un factor r, el diámetro del tronco lo hace en un factor r3/2. De hecho, los puntos cuyas coordenadas vienen dadas por medidas lineales de los árboles están relacionados por una afinidad. Los biólogos denominan alométricas a dichas figuras.
CONJUNTOS FRACTALES BROWNIANOS
Debido a la proliferación de distintas clases de conjuntos brownianos, la terminología es necesariamente rebuscada, y a veces hasta plúmbea.
1. Función browniana real de variable real
Se denota con esta expresión el movimiento browniano ordinario clásico, también conocido como función de Wiener, función de Bachelier, o función de Bachelier-Wiener-Lévy. La pesada definición siguiente permite una clasificación fácil de las distintas generalizaciones.
PREMISAS, (a) La variable temporal t es un número real, (b) La variable espacial es un número real, (c) El parámetro H es H = 1/2. (d) La probabilidad Pr(X<x) viene dada por la función error erf(x), que es la distribución de la variable aleatoria gaussiana reducida con 〈X〉 = 0 y 〈X2〉 = 1.
DEFINICIÓN. La función browniana real de variable real B(t) es una función aleatoria tal que para todo t y todo Δt,
Pr([B(t + Δt) − B(t)]/|Δt|H < x) = erf(x).
REPRESENTACIÓN POR UN RUIDO GAUSSIANO BLANCO. La función B(t) es continua pero no diferenciable, en el sentido de que B'(t) no existe como función ordinaria, sino como función generalizada (distribución de Schwartz). Esta B'(t) se conoce como ruido gaussiano blanco. Se puede expresar B(t) como integral de B'(t).
AUTOAFINIDAD. El concepto de distribución de probabilidad de una variable aleatoria se puede generalizar a funciones aleatorias. Tomando B(0) = 0, la función cambiada de escala t−1/2B(ht) tiene una distribución de probabilidad independiente de h. Esta propiedad escalante es un ejemplo de autoafinidad.
ESPECTRO. En términos de análisis espectral o armónico, la densidad espectral de B(t) es proporcional a f−1−2H, esto es, a f−2. Sin embargo, el significado de la densidad espectral f−2 requiere un razonamiento especial, pues la función B(t) no es estacionaria, mientras que la teoría usual de Wiener-Khinchin de la covarianza y el espectro se refiere a funciones estacionarias. Esta discusión se pospone por tanto al apartado «Weierstrass».
NO DIFERENCIABILIDAD. La función B(t) es continua y no diferenciable. Este tema también se analizará mejor en el apartado «Weierstrass».
REFERENCIAS. Los trabajos de Lévy (1937-1954 y 1948-1965) tienen una fama bien ganada por su críptica elegancia y su estilo personalísimo (véase el capítulo 40). Sin embargo, su profundidad intuitiva y su simplicidad son incomparables.
Las referencias sistemáticas recientes, a la medida de las necesidades de grupos muy diversos de matemáticos, científicos e ingenieros, son demasiado numerosas para dar aquí una lista de ellas, pero la de Knight (1981) parece prometedora. (Desgraciadamente, decide no incluir «resultados relativos a la dimensión o a la medida de Hausdorff de las trayectorias muéstrales, por elegantes que sean, pues no parecen tener aplicaciones conocidas [!] y no parecen… realmente necesarios para una comprensión general del material directamente aplicable; por otra parte… temas tales como la no diferenciabilidad por doquier de las trayectorias muéstrales… parecen indicar algo concreto acerca de la extrema irregularidad de las mismas»).
2. Funciones brownianas generalizadas
Cada hipótesis de la sección anterior es susceptible de generalización, y cada proceso obtenido al generalizar una o más de dichas suposiciones es significativamente distinto de la B(t) de partida, y tiene también aplicaciones importantes.
(a) El tiempo real (escalar) t puede ser sustituido por un punto de un espacio euclideo RE, con E > 1, de una circunferencia, o de una esfera.
(b) La X real (escalar) puede sustituirse por un punto P de un espacio euclideo RE, con E > 1, por un punto de una circunferencia, o de una esfera.
(c) El parámetro H puede tomar valores distintos de 1/2. Con la distribución gaussiana erf, H puede tomar cualquier valor del intervalo 0 < H < 1.
(d) Se puede cambiar la distribución gaussiana erf por otra distribución no gaussiana de las que se discuten en el apartado «Estable según Lévy».
B(t) se puede generalizar también por medio de su representación por un ruido. Este procedimiento da resultados sustancialmente distintos.
3. Eliminación de la tendencia
La variación de la función browniana real de variable real B(t) entre t = 0 y t = 2π se descompone en: (a) la tendencia, definida por B*(t) = B(0) + (t/2n) [B(2π) − B(0)], y (b) un resto oscilante BB(t). En el caso de la B(t) browniana, ambos términos resultan ser estadísticamente independientes.
LA TENDENCIA. La gráfica de la tendencia B*(t) es una recta con una pendiente aleatoria gaussiana.
EL PUENTE BROWNIANO. El término oscilante «sin tendencia» BB(t) es idéntico en distribución a un puente browniano, que se define como una función browniana real de variable real con la ligadura B(2n) = B(0).
EL ABUSO EN LA ELIMINACIÓN DE LA TENDENCIA. Al enfrentarse con muestras de origen desconocido, muchos especialistas en estadística aplicada, que trabajan en economía, meteorología y otros campos parecidos, se precipitan descomponiéndolas en una tendencia y una oscilación (más otros términos periódicos añadidos). Suponen implícitamente que los sumandos son atribuibles a mecanismos distintos y que son estadísticamente independientes.
Esta última suposición implícita es totalmente injustificada, excepto si la muestra es generada por B(t).
4. Funciones brownianas reales sobre una circunferencia
PUENTE BROWNIANO CERRADO. Tómese la función periódica de t que sobre el intervalo de tiempo 0 < t ≤ 2π coincide con un puente browniano BB(t), y elíjase un Δt al azar (uniformemente) en [0, 2n[. La función BB(t + Δt) es estadísticamente estacionaria (véase el apartado «Estacionariedad…»), y se puede representar por una serie aleatoria de Fourier-Brown-Wiener. Los coeficientes son variables aleatorias gaussianas independientes, con fases totalmente aleatorias y módulos proporcionales a n−1. En otras palabras, el espectro discreto es proporcional a n−2, esto es, a f−2, y la energía espectral acumulada para frecuencias superiores a f es ∼ f−1.
CONSECUENCIA PRÁCTICA. La simulación de B(t) se debe llevar a cabo necesariamente sobre un intervalo de tiempo finito. Si se toma dicho intervalo como [0, 2π[, la simulación puede basarse en métodos de Fourier discretos y finitos. Se calcula el puente browniano mediante una transformada rápida de Fourier y se le añade la tendencia aleatoria necesaria.
REFERENCIAS. El artículo de Paley y Wiener (1934) tiene fama merecida por su álgebra implacable. Sin embargo, la profundidad de sus párrafos explicativos, en los capítulos IX y X, aún son dignos de leerse. Recomiendo Kahane (1968) aunque sólo a los matemáticos, pues nunca enuncia los resultados en su sencillo contexto originario.
PUENTE BROWNIANO CERRADO IMPAR. Las funciones B0(t) = 1/2[BB(t) − BB(t + π)] y BE(t) = 1/2[BB(t) + BB(t + π)] son, respectivamente, las sumas de las componentes armónicas pares e impares de la función puente BB(t). La componente impar tiene la propiedad de poderse obtener directamente en función de un ruido gaussiano blanco B'(t) sobre la circunferencia:
B0(t) = ∫−π0B'(t − s)ds − ∫ 0πB'(t − s)ds.
FUNCIÓN BROWNIANA DE VARIABLE REAL EN LA CIRCUNFERENCIA. Partiendo de B(t), elimínese la parte entera y multiplíquese el resto por 2π. El resultado nos da la posición de un punto sobre la circunferencia unidad. La razón principal por la que se menciona esta función browniana de variable real en la circunferencia es evitar confundirla con alguna de las otras funciones anteriores, que son algo muy distinto.
5. Funciones brownianas fraccionarias reales de variable real
Para definir esta función, que denotamos por BH(t), se parte de la función browniana ordinaria, real y de variable real, y se cambia el exponente H = 1/2 por cualquier otro valor real comprendido entre 0 y 1. Los casos con H ≠ 1/2 son los propiamente fraccionarios.
Todas las BH(t) son continuas y no diferenciables. La primera referencia a dichas funciones que he podido encontrar está en Kolmogorov (1940). En Mandelbrot y Van Ness (1968) se citan otras referencias dispersas, así como diversas propiedades. Véase también Lawrance y Kottegoda (1977).
CORRELACIÓN Y ESPECTRO. Como se prueba fácilmente, [BH(t + Δt) − BH(t)]2 = [Δt]2H. La densidad espectral de BH(t) es proporcional a f−2H−1. El exponente no es entero, y ésta es una de las razones por las que propuse el calificativo de fraccionaria para BH(t).
RUIDO GAUSSIANO FRACCIONARIO DISCRETO. Se define como la sucesión de incrementos de BH(t) correspondientes a incrementos unitarios sucesivos del tiempo. Su correlación es
2−1[|d + 1|2H − 2|d|2H + |d − 1|2H]
CORRELACIONES A LARGO PLAZO. PERSISTENCIA Y ANTIPERSISTENCIA. Tómese BH(0) = 0 y defínanse los incrementos pasado y futuro como −BH(−t) y BH(t), respectivamente. Se tiene que:
〈−BH(−t)BH(t)〉
= 2−1{〈[BH(t) − BH(−t)]2〉 − 2〈[BH(t)]2〉}
= 2−1(2t)2H − t2H
Dividiendo por 〈BH(t)〉2 = t2H, se obtiene la correlación, que resulta ser independiente de t e igual a 22H−1 − 1. En el caso clásico, H = 1/2, la correlación es nula, como era de esperar. Para H > 1/2, la correlación es positiva, lo que indica que hay persistencia, y llega a valer 1 cuando H = 1. Si H < 1/2, la correlación es negativa, lo que indica antipersistencia, y alcanza el valor −1/2 para H = 0.
El hecho de que esta correlación tenga que ser independiente de t, incluso en los casos en que no se anula, es una consecuencia obvia de la autoafinidad de BH(t).
Sin embargo, la mayoría de especialistas en procesos estocásticos empiezan sorprendiéndose y/o inquietándose ante el hecho de que la correlación entre el pasado y el futuro pueda ser independiente de t, y no anularse.
CONSECUENCIA PRÁCTICA QUE AFECTA A LA SIMULACIÓN. Para generar una función aleatoria para todos los valores de t enteros comprendidos entre t = 0 y t = T, se acostumbra a elegir un algoritmo de antemano, sin tener en cuenta para nada T, y ejecutarlo durante un tiempo T. Los algoritmos necesarios para generar las funciones brownianas fraccionarias, por contra, dependen necesariamente de T.
En Mandelbrot (1971f) se describe un generador rápido de los incrementos discretos de BH(t). (Este artículo tiene un error de imprenta potencialmente muy perturbador: en la primera fracción de la pág. 545 hay que restar 1 al numerador y añadirlo a la fracción resultante).
DIMENSIONES FRACTALES. Para la gráfica se tiene D = 2 − H. Para el conjunto de ceros se tiene D = 1 − H. Véase Adler (1981).
6. Función browniana fraccionaria real sobre la circunferencia o el toro
Las funciones brownianas fraccionarias reales sobre la circunferencia son menos intrínsecas que las funciones del subapartado 4. La más simple es la suma de una serie de Fourier-Brown-Wiener fraccionaria, definida como aquélla que tiene coeficientes independientes y gaussianos, fases totalmente aleatorias, y módulos de los coeficientes proporcionales a n−H−1/2. Una función browniana fraccionaria real sobre un toro es la suma de una doble serie de Fourier con las mismas propiedades.
ADVERTENCIA. Una analogía superficial podría sugerir que la función browniana fraccionaria real sobre la circunferencia podría ser obtenida por el mismo procedimiento que se aplica en el caso no fraccionario: calculando la tendencia B*H(t) de una función browniana fraccionaria real de variable real, eliminándola de BH(t) y formando una función periódica por repetición.
Desafortunadamente, la función periódica que se obtiene por este procedimiento y la suma de la serie de Fourier con coeficientes n−H−1/2 son funciones aleatorias distintas. En particular, la serie de Fourier es estacionaria, mientras que la repetición de BH(t) después de eliminar la tendencia no lo es. Por ejemplo, si se toma un pequeño intervalo a ambos lados de t = 0, el puente repetido que resulta de eliminar la tendencia une dos trozos no consecutivos de BH(t). La concreción que implica la definición del puente basta para que el resultado sea continuo, pero no para que sea estacionario. No es idéntico en distribución, por ejemplo, a un pedacito pequeño formado por dos trozos consecutivos a ambos lados de t = π.
OBSERVACIONES ACERCA DE LA SIMULACIÓN. El cálculo de una función browniana fraccionaria real de variable real por métodos de Fourier discretos y finitos es teóricamente imposible, y aunque en la práctica factible, es muy truculento. El procedimiento más directo consiste en (a) calcular la función real sobre la circunferencia apropiada, (b) desecharla excepto una porción limitada que corresponde a un pequeño subintervalo del periodo 2n, pongamos 0 < t < t*, y (c) añadirle una componente de muy baja frecuencia calculada aparte. Cuando H → 1, este t* debe tender a 0.
DIMENSIONES FRACTALES. Para la gráfica entera, D = 2 − H (Orey 1970). Si el conjunto antiimagen de un cierto valor es no vacío, D = 1 − H. Este resultado se encuentra en Marcus, 1976 (consolidando el teorema 5, pág. 146, de Kahane 1968).
TRANSICIÓN CRÍTICA EN H = 1. La serie de Fourier-Brown-Wiener, con coeficientes gaussianos independientes proporcionales a n−H−1/2 converge a una suma continua para todos los H > 0. Cuando H cruza el valor H = 1, la suma se hace diferenciable. Por contra, el proceso browniano fraccionario sólo está definido para H menores que 1. Esta diferencia en los valores admisibles de H confirma que ambos procesos son completamente diferentes. Sugiere también que los fenómenos físicos de transición crítica podrían modelizarse con funciones brownianas reales de variable real, pero no con funciones definidas sobre la circunferencia.
7. Trayectorias brownianas fraccionarias vectoriales de variable real (o en la circunferencia)
En el caso vectorial con variable en la circunferencia y con H < 1, la dimensión de la trayectoria es min(E, 1/H). Este resultado es parte del Teorema 1, pág. 143, de Kahane (1968).
8. Distintas formas de integro-diferenciación fraccionaria
La manera más simple de transformar la función browniana real de variable real B(t) en BH(t) consiste en escribir:
BH(t) = [Γ(H + 1/2)]−1 ∫ −∞t (t − s)H−1/2dB(s).
Esta integral es divergente, pero los incrementos del tipo BH(t) − Bh(0) son convergentes. Se trata de un promedio móvil del núcleo (t − s)H−1/2, y es una transformación clásica aunque un tanto oscura, que los matemáticos puros conocen como integral o diferencial fraccionaria de Riemann-Liouville de orden H + 1/2.
HEURÍSTICA. La idea de que el orden de derivación o de integración no tiene por qué ser entero se comprende mejor en términos espectrales. En efecto, la integración ordinaria de una función periódica equivale a multiplicar los coeficientes de Fourier de la función por 1/n, y la integración ordinaria de una función no periódica equivale a multiplicar su transformada de Fourier (si está definida) por 1/f. Por tanto, la operación que multiplica la transformada de Fourier por la potencia fraccionaria (1/f)H+1/2 se puede llamar razonablemente integro-diferenciación fraccionaria. Como el espectro del ruido blanco es f−0, el espectro de BH(t) es (1/f)2(H+1/2) = f−2H−1 (como ya habíamos anunciado).
REFERENCIAS. La transformación de Riemann-Liouville tiene muchas otras aplicaciones (Zygmund 1959, II, pág. 133, Oldham y Spanier 1974, Ross 1975, Lavoie, Osier y Tremblay 1976). La menos conocida en el campo de la probabilidad (con referencias que se remontan a Kolmogorov, 1940) está comentada en Mandelbrot y Van Ness (1968).
EFECTO SOBRE LA REGULARIDAD. Cuando el orden H − 1/2 es positivo, la transformación de Riemann-Liouville es una forma fraccionaria de integración, pues aumenta la regularidad de la función. La regularidad equivale a la persistencia local, pero la regularidad obtenida por integración se hace extensiva a las propiedades globales de la función. Cuando H − 1 /2 < 0, la transformación de Riemann-Liouville es una forma fraccionaria de derivación, pues intensifica la irregularidad que depende del comportamiento local.
APLICACIÓN A LAS FUNCIONES BROWNIANAS. Para una función browniana real definida en la circunferencia, H no tiene cota superior. La integración fraccionaria de orden H − 1/2 > 1/2 aplicada a una función browniana real definida en la circunferencia, da una función diferenciable. En las funciones brownianas reales de variable real, por el contrario, H − 1/2 puede valer como máximo 1/2, y BH(t) no es diferenciable.
En ambos tipos de funciones brownianas, la irregularidad local prohíbe derivar más allá de H − 0, es decir, del orden −1/2.
EXTENSIÓN BILATERAL DE LA INTEGRO-DIFERENCIACIÓN FRACCIONARIA. El hecho de que la definición clásica de Riemann-Liouville sea marcadamente asimétrica en t es completamente aceptable si t es el tiempo. Pero aquellos casos en los que t pueda «discurrir» en cualquier sentido exigen una definición simétrica. Yo propongo
BH(t) = [Γ(H + 1/2)]−1
[∫−∞t(t − s)H−1/2dB(s) − ∫ t∞|t − s|H−1/2dB(s)]
9. Funciones brownianas reales de varias variables
Lévy (1948, 1957, 1959, 1963, 1965) introdujo las funciones brownianas de un espacio n sobre la recta real, donde Ω puede ser RE con la distancia ordinaria |PP0|, una esfera en RE+1 con la distancia definida sobre una geodésica, o un espacio de Hilbert. En cualquiera de estos casos, B(P) − B(P0) es una variable aleatoria gaussiana de media nula y varianza G(|PP0|), con G(x) = x. Entre otras referencias vale la pena citar McKean (1963) y Cartier (1971).
REPRESENTACIÓN POR RUIDO GAUSSIANO BLANCO CUANDO Ω ES UNA ESFERA. Este B(P) se construye en el modo descrito en el capítulo 28: extiéndase una sábana de ruido blanco sobre una esfera y tómese B(P) igual a la integral de dicho ruido sobre el hemisferio cuyo polo norte es P. En realidad yo prefiero la variante que toma 1/2 de la integral sobre dicho hemisferio menos 1/2 de la integral sobre el otro hemisferio. Esto generaliza el segundo proceso del subapartado 4 anterior.
REPRESENTACIÓN POR RUIDO GAUSSIANO BLANCO CUANDO Ω ES RE (CHENTSOV, 1957). En este caso interviene un algoritmo más complicado, debido a Chentsov, y para visualizarlo más fácilmente trabajaremos con E = 2 y B(0, 0) = 0. Tomemos un cilindro auxiliar de radio 1 y coordenadas u y e, y dispongamos sobre él una sábana de ruido blanco. De acuerdo con la modificación del algoritmo propuesta en Mandelbrot (1975b), se integra este ruido sobre el rectángulo comprendido entre θ y θ + dθ y entre 0 y u. Se obtiene así una función browniana real de variable real que se anula para u = 0 y que se denota por B(u, θ, dθ). Para cada (x, y) del plano, las componentes brownianas reales de variable real B(xcosθ + ysenθ, θ, dθ) son estadísticamente independientes, y su integral sobre θ es B(x, y).
10. Funciones brownianas fraccionarias reales de varias variables
Gangolli (1967), precedido en algunos puntos por Yaglom (1957), generaliza B(P) para el caso en que G(x) = x2H. Pero no consigue llegar a un algoritmo explícito para construir la función resultante. Mandelbrot (1975b) lo hace generalizando el método de Chentsov y sustituyendo cada B(u, θ, dθ) por una función browniana fraccionaria real de variable real definida bilateralmente.
Para D véase Yoder (1974, 1975).
Para simulaciones mediante TFR, véase Voss (1982).
11. Transformadas no lineales de los ruidos gaussianos fraccionarios
Dado un G(x) distinto de G(x) = x, formemos ∑t=1TG{BH(t) − BH(t − 1 )}, e interpolemos linealmente para los valores no enteros de T. El resultado, que denotaremos por BG(T) − BG(0), es asintóticamente escalante si existe una función A(T) tal que limT→∞A(T){BG(T) − BG(0)} es no degenerado para todo hε(0, 1). Murray Rosenblatt había estudiado el caso G(x) = x2 − 1. Taqqu (1975) demuestra que el problema depende del rango hermitiano de G, definido como el orden del término inferior en el desarrollo de G en serie hermitiana. En Taqqu (1979) y Dobrushin (1979) se pueden encontrar resultados más recientes de este estilo.
DIMENSIÓN Y RECUBRIMIENTO DE UN CONJUNTO (O DE SU COMPLEMENTARIO) MEDIANTE BOLAS
Tanto la dimensión fractal que propongo como todas sus variantes aceptables no son conceptos topológicos sino métricos. Esto significa que se trabaja en un espacio métrico Ω, es decir, un espacio en el que está definida convenientemente la distancia entre cada par de puntos. Una bola cerrada (respectivamente, abierta) de centro Ω y radio ρ es el conjunto de todos los puntos cuya distancia a Ω es ≤ ρ (respectivamente <ρ). (Las bolas son macizas y las esferas son sus superficies).
Dado un subconjunto acotado S de Ω, hay muchos métodos para recubrirlo con bolas de radio ρ. A menudo, como en los ejemplos que se examinan en este apartado, dichos métodos implican de manera natural un concepto de dimensión. En los casos fundamentales, dichos conceptos dan valores idénticos. En otros, no obstante, dan valores distintos.
1. Cantor y Minkowski
El método más tosco de recubrimiento, introducido por Cantor, parte de una bola centrada en cada punto de S, y toma la reunión de las mismas como una versión alisada de S, que llamaremos S(ρ).
Supongamos además que Ω es un espacio euclídeo E-dimensional. En tal caso, está definido el concepto de volumen (vol) y
vol {bola d-dimensional de radio ρ} = γ(d)ρd,
con
γ(d) = [Γ(1/2)]d/Γ(1 + d/2).
Cuando S es un cubo de volumen mucho mayor que ρ3,
vol[S(ρ)] ~ vol[S].
Cuando S es un cuadrado de área mucho mayor que ρ2,
vol[S(ρ)] ~ 2 ρ área[S].
Cuando S es un segmento de longitud mucho mayor que ρ,
vol[S(ρ)] ∼ πρ2 longitud[S].
Concretando más, llamemos «contenido» al volumen, área o longitud, según convenga, y sea d la dimensión estándar. Si V denota la expresión
V = vol[S(ρ)]/γ(E − d) ρE−d,
tenemos que los cubos, cuadrados y segmentos cumplen que contenido[S] = limρ→0V.
Esta fórmula no es, contra lo que pudiera parecer, una relación sin importancia entre conceptos igualmente inocuos. Un ejemplo debido a H. A. Schwartz (publicado en 1882) demuestra que, cuando se triangula un cilindro circular de maneta cada vez más fina, la suma de las áreas de los triángulos no siempre converge al área del cilindro. Para evitar este comportamiento paradójico, Minkowski intentó reducir la longitud y el área al concepto simple y bien fundamentado de volumen, por el método anterior de recubrir S con bolas.
Sin embargo, se plantea de entrada una ligera complicación: puede darse el caso de que V no converja cuando ρ tiende a 0.
Cuando esto ocurre, el concepto de límite se sustituye por los conceptos gemelos de lim sup y lim inf. A cada número real A del intervalo ]lim inf, lim sup[ le corresponde al menos una sucesión ρm → 0 tal que
limm→∞{vol[S(ρm)/γ(E − d) ρmE−d} = A.
Pero no existe dicha sucesión si A < lim inf o A > lim sup. Aceptadas estas definiciones, Minkowski (1901) define, respectivamente, d-contenido superior y d-contenido inferior de S como
lim supρ→0{vol[S(ρ)]/γ(E − d)ρE−d}
y
lim infρ→0{vol[S(ρ)]/γ(E − d) ρE−d}
Si son iguales, su valor es el d-contenido de S. Minkowski observa que, para las figuras euclídeas estándar, existe una D tal que si d > D, el contenido superior de S se anula, y si d < D el contenido inferior de S es infinito.
2. Bouligand
La generalización de la definición de Minkowski a valores no enteros de d se debe a Bouligand (1928, 1929). En particular, el anterior lim inf, que podría ser fraccionario, debería llamarse dimensión de Minkowski- Bouligand DMB.
Bouligand se dio cuenta de que la DMB es a veces contraria a la intuición, y en general no es tan conveniente como la D de Hausdorff-Besicovitch. Pero a menudo es idéntica a ésta y más fácilmente calculable, cosa que la hace útil. En Kahane y Salem (1963, pág. 29), se discute el caso E = 1, confirmándose que a menudo DMB coincide con D, y nunca es menor pero puede ser mayor.
3. Pontrjagin y Schnirelman; Kolmogorov y Tihomirov
Entre todos los recubrimientos de bolas de radio ρ del subconjunto S de un espacio métrico Ω, el más económico es, por definición, el que emplea el mínimo número de bolas. Si S es acotado, dicho número mínimo es finito y puede denotarse por N(ρ). Pontrjagin y Schnirelman (1932) introducen la expresión
lim infρ→0 log N(ρ)/log(1/ρ)
como definición alternativa de dimensión.
Este planteamiento es desarrollado por Kolmogorov y Tihomirov (1959), quienes se inspiran en la teoría de la información de Shanon para llamar ρ-entropía de S a log N(ρ). Hawkes (1974) llama dimensión de entropía inferior a la dimensión correspondiente, y a la variante que se obtiene sustituyendo el lim inf por el lim sup la llama dimensión de entropía superior. Hawkes demuestra que la dimensión de Hausdorff-Besicovitch es, como mucho, igual a la dimensión de entropía inferior, que no siempre coincide con la superior.
Kolmogorov y Tihomirov (1959) también estudian M(ρ), definido como el mayor número de puntos de S tales que sus distancias mutuas son mayores que 2ρ. Para los subconjuntos de la recta se tiene que N(ρ) = M(ρ). Pero para otros conjuntos,
lim infρ→0 log M(ρ)/log(1/ρ)
define una nueva dimensión.
▯ Kolmogorov y Tihomirov (1959) llaman capacidad a log M(ρ). Esta expresión es poco afortunada, pues dicho término tiene un significado distinto, más justificado y más antiguo, en la teoría del potencial. En particular, no hay que caer en la tentación de llamar dimensión de capacidad a la dimensión correspondiente al párrafo anterior. Véase «Potenciales», 3. ▮
4. Besicovitch y Taylor; Boyd
Si Ω es [0, 1], o la recta real, vimos en el capítulo 8 que un polvo S está completamente determinado por su complementario, que es la reunión de los intervalos abiertos maximales, los huecos (en algunos métodos de construcción, cada hueco es una trema).
POLVO DE CANTOR TRIÁDICO C EN [0, 1]. Las longitudes de los huecos suman 1 y siguen la distribución hiperbólica Pr(U>u) = FU−D. Por tanto, la longitud λn del n-ésimo hueco por tamaños decrecientes tiene un orden de magnitud de n−1/D.
SUBCONJUNTOS DE LA RECTA CON MEDIDA DE LEBESGUE NULA. Besicovitch y Taylor (1954) estudian el comportamiento de los λn cuando n → ∞. Existe un exponente real DBT tal que la serie ∑λnd converge para d > DBT (y en particular converge a 1 para d = 1). Así, DBT es el ínfimo de los números reales d tales que ∑λnd < ∞. Se puede demostrar que DBT > D. Hawkes (1974, pág. 707) demuestra que DBT coincide con la dimensión de entropía superior, pero puede ser más fácil de calcular.
ADVERTENCIA. Si S no es de medida nula, DBT no es una dimensión. Está relacionado con uno de los exponentes del capítulo 15 y con la Δ del capítulo 17.
EXPONENTE DE EMPAQUETAMIENTO APOLONIANO. DBT tiene un homólogo en el caso del empaquetamiento apoloniano (capítulo 18). Fue introducido en 1966 por Z. A. Melzak, y Boyd (1973b) demostró que (como era de esperar) es la dimensión de Hausdorff-Besicovitch del conjunto residual.
DIMENSIÓN (DE FOURIER) Y HEURISTICA
Sea μ(x) una función no decreciente de x ∈ [0,1]. Si la reunión de los intervalos abiertos maximales en que μ es constante es el complementario del conjunto cerrado S, se dice que dμ(x) tiene como soporte S. La transformada de Fourier-Stieltjes de μ es
û(f) = ∫ exp(ifx) dμ(x).
Las μ más regulares dan la tasa de decrecimiento más rápida posible de û. Sea DF el mayor número real tal que por lo menos una función μ(x) con soporte S cumple
û(f) = o(|f|−DF/2+ε) cuando f → ∞ para todo ε > 0.
pero para ningún μ(x) se cumple que
û(f) = o(|f|−DF/2−ε) cuando f → ∞ para algún ε > 0.
Aquí «a = o(b), para f → ∞» significa que limf→∞(a/b) = 0.
Cuando S es todo el intervalo [0, 1], DF es infinita. Por contra, si S es un punto, DF = 0. Y siempre que S tenga medida de Lebesgue nula, DF es finita y como mucho igual a la dimensión de Hausdorff-Besicovitch D de S. La desigualdad DF ≤ D indica que las propiedades armónicas y las propiedades fractales de S están relacionadas, aunque no tienen por qué ser idénticas.
Para demostrar que dichas dimensiones pueden ser efectivamente distintas, supongamos que S es una parte de la recta con DF = D. Si se considera el mismo S como subconjunto del plano, D no cambia, pero DF se hace 0.
DEFINICIÓN. Un modo conveniente de resumir algunas propiedades armónicas de S es llamar dimensión de Fourier de S a DF.
CONJUNTOS DE SALEM. La igualdad DF = D caracteriza una clase de subconjuntos llamados conjuntos de unicidad o de Salem (Kahane y Salem 1963, Kahane 1968).
REGLA DEL PULGAR Y HEURÍSTICA. Los fractales de interés en los casos estudiados tienden a ser conjuntos de Salem. Como a menudo es más fácil calcular DF a partir de los datos, nos puede servir como una estimación de D.
CONJUNTOS DE SALEM NO ALEATORIOS. Un polvo de Cantor no aleatorio es un conjunto de Salem sólo cuando r satisface ciertas propiedades de la teoría de números.
CONJUNTOS DE SALEM ALEATORIOS. Un polvo de Cantor aleatorio es un conjunto de Salem cuando el azar basta para romper todas las regularidades aritméticas.
El ejemplo original, debido a R. Salem, es muy complejo. El siguiente ejemplo es el polvo de Lévy: denotando la escalera de Lévy (lámina 405) por L(x), Kahane y Mandelbrot (1965) demuestran que el espectro de dL(x) es casi idéntico en cuanto a media al espectro de la función browniana fraccionaria real de variable real, y es una forma regularizada del espectro de la función de Gauss-Weierstrass.
▯ Kahane (1968, teorema 1, pág. 165 y 5, pág. 173) demuestra que la imagen del conjunto compacto S de dimensión 5 por una función browniana fraccionaria real de variable real de exponente H es un conjunto de Salem con D = min(1, Δ/H). ▮
EL POLVO DE CANTOR NO ES UN CONJUNTO DE SALEM. El polvo triádico de Cantor fue obtenido originariamente por Georg Cantor al buscar un conjunto de unicidad (véase Zigmund 1959,1, pág. 196), pero dicha búsqueda fracasó. (Cantor abandonó entonces el análisis armónico y —¡como alternativa!— fundó la teoría de conjuntos). Denotemos por C(x), por ejemplo, la escalera de Cantor (lámina 121). El espectro de dC(x) tiene la misma forma global que el de dL(x), pero contiene ocasionalmente unos máximos muy agudos de magnitud no decreciente, y esto implica que DF = 0. Véase Hille y Tamarkin (1929).
Estos máximos son de la mayor importancia en la teoría de los conjuntos de unicidad, aunque en la práctica es poco probable que sean significativos. La mayoría de estimadores de la densidad espectral tenderán a pasar por alto los máximos y recoger sólo el fondo regido por D.
FRACTALES (SOBRE LA DEFINICION DE LOS)
Aunque el término fractal se define en el capítulo 3, sigo pensando que lo mejor sería no dar ninguna definición (como hice en mi ensayo de 1975).
La razón más inmediata es que, como veremos, la definición dada excluye ciertos conjuntos que uno preferiría considerar incluidos.
Profundizando un poco más, en mi definición intervienen D y DT, pero parece que el concepto de estructura fractal es más fundamental que D o que DT. En el fondo, la importancia de los conceptos de dimensión se ha incrementado con su nuevo e inesperado uso.
En otras palabras, debería ser posible definir las estructuras fractales por la propiedad de ser invariantes según una cierta clase de transformaciones regulares. Pero esta tarea no parece nada fácil. Para poner un ejemplo de su dificultad en un contexto estándar, recordemos que ciertas definiciones de número completo ¡excluyen los reales! En el estado de cosas actual, la necesidad principal es distinguir los fractales fundamentales de los conjuntos estándar de la geometría euclidea. Y esta necesidad sí la satisface mi definición.
Mi evidente falta de entusiasmo debe ser compartida por muchos matemáticos eminentes a quienes se les pasó por alto mi definición de 1977. No obstante, la explicaré un poco mejor.
1. Definición
Según la primera definición aparecida en la introducción de mi ensayo de 1977, un conjunto fractal es un subconjunto de un espacio métrico tal que
dimensión D de Hausdorff-Besicovitch > dimensión topológica DT.
Con una sola excepción, los fractales de este libro son conjuntos de un espacio euclideo de dimensión E < ∞, y se puede decir que son fractales euclídeas. La excepción está en el capítulo 28: la costa browniana sobre una esfera, que se puede considerar un fractal riemanniano.
2. Crítica. Dimensiones parcialmente aritméticas y dimensiones puramente fractales
La definición matemática anterior es rigurosa pero sólo provisional, y sería bueno mejorarla, aunque diversos cambios aparentemente naturales podrían ser poco afortunados.
Hace tiempo, cuando buscaba la forma de medir las propiedades que posteriormente se llamarían fractales, opté por la dimensión D de Hausdorff-Besicovitch, porque había sido estudiada con muchísimo cuidado. El hecho de que tratados como el de Federer (1969) creyeran necesario introducir múltiples variantes, distintas de D en algunos detalles, es desconcertante. No obstante, hay buenos motivos para posponer la consideración de esos detalles.
Además, ante varias posibles dimensiones para escoger, hay que evitar aquéllas en que intervengan claramente factores extraños. Así, la D no tiene ninguna faceta aritmética, contrariamente a lo que ocurre tanto con la dimensión de Fourier DF (pág. 360) como con el exponente de Taylor y Besicovitch (pág. 359 y Kahane, 1971, pág. 89).
3. Casos dudosos de Hausdorff
Los casos dudosos son siempre un problema. A priori, de una curva rectificable con D = 1 se puede tanto decir que es fractal como que no lo es, y lo mismo ocurre con cualquier conjunto tal que D = DT, pero cuya medida de Hausdorff con la función de prueba h(ρ) = γ(D)ρ0 es infinita (no puede anularse). O lo que es más molesto aún, la escalera del diablo de Cantor (lámina 121) intuitivamente es un fractal, pues presenta claramente muchas escalas de longitud. Por ello, aunque se tenga que D = DT = 1, repugna tener que decir que no es fractal (véase pág. 373). A falta de otros criterios, tracé la línea divisoria de modo que la definición fuera corta. Si se encuentra una buena razón para ello, dicha definición deberá ser modificada. (Véase más adelante el punto 8).
4. Reformulación de la definición
La «dimensión de capacidad» (véase el subapartado POTENCIALES, 4) satisface los criterios expuestos en el subapartado 2 anterior, por la sencilla razón de que su valor es idéntico a D. Por tanto, otra definición de fractal es un conjunto tal que
Dimensión de capacidad de Frostman > dimensión topológica.
5. Tiempos fractales, intrínseco y local
En el capítulo XII del Fractals de 1977 se pueden encontrar algunos materiales no elaborados sobre el tema.
MEDIDA DE HAUSDORFF Y DIMENSIÓN DE HAUSDORFF-BESICOVITCH
Algunas buenas referencias generales sobre este tema son Hurewicz y Wallman (1941), Billingsley (1967), Rogers (1970) y Adler (1981).
1. Medida de Carathéodory
La reflexión de que «el concepto general de volumen o magnitud es indispensable en las investigaciones de las dimensiones de los conjuntos continuos» ya se le ocurrió a Cantor. Atendiendo a la dificultad del problema, Lebesgue duda que Cantor pudiera llegar a algún resultado interesante. Carathéodory (1914) relanza la misma idea, y Hausdorff (1919) la pone en práctica.
Un método clásico de evaluación del área de una figura plana empieza aproximando S por un conjunto de cuadrados muy pequeños y sumando los lados de dichos cuadrados elevados a la potencia D = 2. Carathéodory (1914) generaliza este enfoque tradicional. Para no depender de unos ejes coordenados sustituye los cuadrados por discos, y se esfuerza en no hacer uso del conocimiento previo de que S es una figura euclídea estándar de dimensión conocida y contenida en un RE conocido.
Nótese, pues, que cuando una figura plana considerada como parte del espacio tridimensional es recubierta mediante discos, forzosamente se la recubre también mediante bolas que tienen tales discos como ecuadores. Por tanto, para no prejuzgar la forma plana de S, basta con recubrirlo a base de bolas en vez de discos. Cuando S es efectivamente una superficie, su contenido aproximado se obtiene sumando expresiones de la forma πρ2, correspondientes a todas las bolas del recubrimiento. Y, en general, una figura estándar de dimensión d nos exige sumar expresiones del tipo h(ρ) = γ(d)ρd, donde la función γ(d) = [Γ(1/2)]d/Γ(1 + d/2) ya se ha definido antes, en este mismo capítulo, como el contenido de una bola de radio unidad. Sobre esta base, Carathéodory (1914) generaliza los conceptos de «longitud» y «área» para algunas figuras no estándar.
2. Medida de Hausdorff
Hausdorff (1919) va más allá que Carathéodory y permite que d sea fraccionario (la función γ(d) se expresa de manera que siga teniendo sentido). Así, en vez de limitarse a potencias de ρ, puede usarse cualquier función de prueba h(ρ) positiva que tienda a 0 con ρ.
Además, como una bola no es más que el conjunto de puntos cuya distancia a un centro Ω no es mayor que un radio ρ dado, este concepto sólo depende de si hay definida una distancia, y sigue estando definido aun cuando el espacio Ω no sea euclídeo. Como ya se ha señalado, tales espacios se denominan métricos; así pues, la medida de Hausdorff es un concepto métrico.
Dada una función h(ρ) de prueba (o de «gauge»), podemos decir que la medida de un recubrimiento finito del conjunto S mediante bolas de radio ρm, es ∑h(ρm). Para conseguir una máxima economía en el recubrimiento, se consideran todos los recubrimientos con bolas de radios menores que ρ, y se busca el ínfimo
infρm<ρ∑h(ρm).
Cuando ρ → 0, la condición ρm < ρ se hace cada vez más restrictiva. Por tanto, la expresión inf ∑h(ρm) tiene que ser creciente, y por tanto debe tener límite,
limρ→0 infρm<ρ∑h(ρm),
el cual define la h-medida del conjunto S, y puede ser finito y positivo, infinito o nulo.
Cuando h(ρ) = γ(d)ρd, la h-medida se dice que es d-dimensional. Más concretamente, y por la presencia del factor γ(d), se la denomina medida d-dimensional normalizada.
Cuando h(ρ) = 1/log |ρ|, la h-medida se denomina logarítmica.
3. La función de prueba intrínseca de un conjunto
Dado el conjunto S, se dice que h(ρ) es intrínseca de S, y se denota por hS(ρ), si la hS-medida de S es positiva y finita. Esta medida se podría llamar medida fractal de S.
La función de prueba de las figuras estándar de la geometría euclídea siempre tiene la forma hS(ρ) = γ(D)ρD, para un cierto valor entero de D. Hausdorff demostró que las hS(ρ) = γ(D)ρD con valores no enteros de D, son intrínsecas para los polvos de Cantor y las curvas de Koch.
Por otra parte, en el caso de fractales aleatorios típicos, incluso en el caso de que sean estadísticamente autosemejantes, la hS(ρ) existe pero es más complicada. Puede tener, por ejemplo, la forma hS(ρ) = ρD |log ρ|. En tal caso, la h-medida de S con respecto a h(ρ) = γ(d)ρd es nula, y por tanto la figura tiene menos «sustancia» que si fuera D-dimensional, pero más que si fuera (D-ε)-dimensional. Un ejemplo lo tenemos en el movimiento browniano plano, para el que Lévy obtiene hS(ρ) = ρ2log log(1/ρ). (Véase Taylor, 1964).
Como la medida bidimensional de cualquier conjunto acotado plano es finita, las funciones de prueba de la forma ρ2/log(1/ρ) no son intrínsecas de ningún conjunto plano.
Buena parte del trabajo de determinar hS(ρ) para conjuntos aleatorios ha sido realizado por S. J. Taylor, solo o en colaboración con otros; una referencia es Pruitt y Taylor (1969).
4. Dimensión de Hausdorff-Besicovitch: definición
Se sabe que, si S es bidimensional, basta con calcular la h-medida de Hausdorff para h(ρ) = πρ2. Sin embargo, la medida de Hausdorff se ha definido de modo que no haga falta conocer D previamente. Si uno trata con una figura estándar de dimensión desconocida, calculará primero la medida para todas las funciones de prueba h(ρ) = γ(d)ρd con d entera, y si la longitud es infinita y el volumen nulo, la figura sólo puede ser bidimensional.
Besicovitch generalizó la esencia de esta última conclusión a los casos en los que d no es entera y S no es una figura estándar. Demostró que para todo conjunto S existe un valor real D tal que la d-medida es infinita para d < D y nula para d > D.
Esta D se denomina dimensión de Hausdorff-Besicovitch de S.
Para un físico, esta definición significa que D es una dimensión crítica.
La medida de Hausdorff D-dimensional de un conjunto S D-dimensional puede ser cero, infinita o positiva y finita. Hausdorff sólo había considerado esta tercera categoría más simple, y demostró que incluía los conjuntos de Cantor y las curvas de Koch. Si además el conjunto S es autosemejante, se puede ver fácilmente que su dimensión de semejanza debe ser igual a D. Por otra parte, vimos que los conjuntos aleatorios típicos tienen medida aleatoria nula en su dimensión intrínseca.
Durante mucho tiempo Besicovitch fue el autor o coautor de casi todos los artículos sobre este tema. Mientras que Hausdorff es el padre de la dimensión no estándar, se puede decir que Besicovitch se convirtió en la madre.
CODIMENSIÓN. Cuando Ω es el espacio RE, D ≤ E, y E − D es lo que se denomina codimensión.
5. Producto directo de conjuntos (dimensiones aditivas)
Supongamos que S1 y S2 pertenecen, respectivamente, a un E1-espacio y a un E2-espacio, y denotemos por S el conjunto del E-espacio (E = E1 + E2) obtenido por producto cartesiano de S1 y S2. (Si E1 = E2 = 1, S es el conjunto de puntos (x, y) del plano, tales que x ∈ S1 e y ∈ S2).
La regla es que, si S1 y S2 son «independientes», la dimensión de S es la suma de las dimensiones de S1 y S2.
El concepto de «independencia» incorporado a esta regla resulta inesperadamente difícil de plantear y demostrar de modo general. (Véase Marstrand, 1954a, 1954b; Hawkes, 1974; Mattila, 1975). Por suerte, la intuición suele ser una buena guía en los diversos casos a estudiar, como por ejemplo los presentados en esta obra.
6. Intersección de conjuntos (codimensiones aditivas)
La regla es la siguiente. Cuando S1 y S2 son conjuntos independientes de un E-espacio y
codimensión (S1) + codimensión (S2) < E,
la suma de la izquierda es casi con seguridad igual a
codimensión (S1 ⋂ S2).
Cuando la suma de codimensiones es >E, uno se suele encontrar con que la dimensión de la intersección es casi con seguridad nula.
En particular, dos conjuntos de la misma dimensión no se cortan si D ≤ E/2. La dimensión E = 2D se puede llamar crítica.
Hay que destacar que, como las trayectorias brownianas tienen D = 2, dos trayectorias brownianas se cortan sí E < 4 y no se encuentran si E ≥ 4.
La regla se puede generalizar de manera inmediata a la intersección de más de dos conjuntos.
AUTOINTERSECCIONES. El conjunto de puntos de S de multiplicidad k se puede considerar como la intersección de k réplicas de S. Uno se siente tentado de probar si, en lo que respecta a la dimensión de la intersección, dichas k réplicas pueden considerarse independientes. En un ejemplo al menos, esta conjetura resulta ser correcta. S. J. Taylor (1966), generalizando unos resultados de Dvofetzky, Erdös y Kakutani, estudia las trayectorias de los movimientos browniano y de Lévy en R1 y en R2.
La dimensión de la trayectoria es D, y la dimensión de los conjuntos de puntos de multiplicidad k es max[0, E − k(E − D)]. La conjetura de Taylor es que el resultado es válido en cualquier RE para todos los valores posibles de k.
7. Proyecciones de conjuntos
La regla es que, cuando un fractal S de dimensión D se proyecta según una dirección independiente de S sobre un subespacio euclídeo de dimensión E0, la proyección S cumple
dimensión S = min(E0, D).
APLICACIÓN. Supongamos que x1 ∈ S1 y x2 ∈ S2, siendo S1 y S2 dos fractales de RE, de dimensiones D1 y D2. Sean a1 y a2 dos números reales no negativos, y definamos el conjunto S formado por los puntos de la forma x = a1x1 + a2x2. La dimensión D de este S cumple que
max(D1, D2) ≤ D ≤ min(E, D1 + D2).
La demostración consiste en tomar el producto directo de RE por RE y luego proyectar.
En caso de que haya independencia, tiende a ser válida la cota superior. Cuando D = E = 1, S puede ser bien un fractal, bien un conjunto que contiene intervalos.
8. Subordinación de conjuntos (dimensiones multiplicativas)
Véase el capítulo 32.
9. La sucesión de las subdimensiones
Cuando la función de prueba intrínseca de S es hs(ρ) = γ(D)ρD, las propiedades fractales son plenamente descritas por D. Cuando
hs(ρ) = ρD[log(1/ρ)]Δ1[log log(1/ρ)]Δ2,
la descripción de las propiedades fractales de S es más complicada. Se necesita la sucesión D, Δ1, Δ2. Las Δm se pueden llamar dimensiones subordinadas o subdimensiones.
Las subdimensiones podrían ayudar a responder la pregunta de si son o no fractales los casos dudosos que se comentaban en el subapartado «Fractal», 3. Podría ser útil considerar fractales aquellos S con D = DT pero al menos con una Δ no nula.
LAS FUNCIONES INDICADOR Y COINDICADOR
Dado un conjunto S, la función indicadora J(x) se define clásicamente como aquélla en que J(x) = 1 si x ∈ S y J(x) = 0 si x ∈ S. Cuando S es un polvo de Cantor, una red de Sierpinski (tamiz o alfombra) o cualquier otra figura de otras varias clases de fractales, J(x) no es lo que más conviene. A menudo encuentro más útil sustituir J(x) por otra función C(x), introducida por mí, y para la que ahora propongo el nombre de indicadora.
C(x) es una media ponderada aleatoria de las funciones características de los huecos de S. En otras palabras, C(x) es constante en cada hueco, y sus valores en los distintos huecos son variables aleatorias independientes que obedecen a la misma distribución.
C(x) se introduce y estudia en Mandelbrot 1965c, 1967b y 1967i, con el nombre más antiguo (y que puede inducir a confusión) de función nuclear.
VARIABLES Y FUNCIONES ALEATORIAS ESTABLES SEGÚN LÉVY
La distribución hiperbólica es de una simplicidad formal inmejorable, y es invariante por truncación (véase el apartado «Cambio de escala y truncación»). Pero las otras transformaciones que la dejan invariante no son importantes. Mucho más importantes son las distribuciones invariantes por adición. Sólo son asintóticamente hiperbólicas, y Paul Lévy les asignó una denominación tremendamente manida: «distribuciones estables». Introdujo también los procesos estables en los que intervienen tanto las distribuciones estables como las hiperbólicas.
Antes de mi trabajo las variables estables se consideraban «patológicas» y hasta «monstruosas», con la única excepción del vector aleatorio de Holtsmark que se discute en el subapartado 9. Mis principales aplicaciones de tales variables se han presentado en los capítulos 31, 32 y 37, y en el subapartado 4 de la sección siguiente se cita una aplicación a la genética.
REFERENCIAS. Son numerosas. El material sobre estabilidad presentado en Feller (1966, volumen II) es completo pero disperso, por lo que es difícil encontrarlo cuando se necesita. Lamperti (1966) es una buena introducción. Gnedenko y Kolmogorov (1954) se recomienda todavía. Lukacs (1970) recoge muchos detalles útiles. Los grandes tratados originales de Lévy (1925, 1937-1954) no satisfacen a todo el mundo, dado el especial estilo de su autor (véase el capítulo 40).
1. La v. a. gaussiana es escalante por adición
Se sabe que la distribución gaussiana tiene la propiedad siguiente. Sean G1 y G2 dos variables aleatorias gaussianas independientes, con
[G1] = [G2] = 0; [G12] = σ12, [G2] = σ22.
Su suma G1 + G2 satisface
[G1 + G2] = 0; [G1 + G2]2= σ12 + σ22.
Y lo que es más importante, G1 + G2 es también gaussiana. Así pues, la propiedad gaussiana es invariante por adición de variables aleatorias independientes. Dicho de otro modo, la ecuación funcional
(L)s1X1 + s2X2 = sX,
junto con la relación subsidiaria
(A:2)s12 + s22 = s2,
admite la gaussiana como solución posible. De hecho, fuera de cambios de escala, la gaussiana es la única distribución que satisface simultáneamente (L) y (A:2).
Además, si se combina (L) con la relación subsidiaria alternativa 〈X2〉 < ∞, la gaussiana vuelve a ser la única solución.
(L) fue objeto de un estudio serio por Lévy (1925), que la llama estabilidad. Dondequiera que haya peligro de ambigüedad, suelo usar el término más incómodo de estabilidad según Lévy.
2. La variable aleatoria de Cauchy
Como los científicos con espíritu práctico tienden a dar por sentado que 〈X2〉 < ∞, se piensa generalmente que la única distribución estable es la gaussiana. Esto no es así en absoluto, como reconoció por vez primera Cauchy (1853, pág. 206). El ejemplo de Cauchy es una variable aleatoria que había sido considerada anteriormente por Poisson y que se conoce actualmente como «variable de Cauchy reducida». Satisface
Pr(X>−x) = Pr(X<x) = 1/2 + π−1 arctg x,
por lo que
densidad de Cauchy = 1/[π(1 + x2)].
Cauchy demostró que esta variable era solución de la combinación de (L) con la relación subsidiaria alternativa
(A:1)s1 + s2 = s.
Para la variable de Cauchy, 〈X2〉 = ∞, y de hecho 〈X〉 < ∞. Por tanto, para expresar la idea obvia de que la escala del producto de X por una s no aleatoria es igual a s veces la escala de X, hay que medir esta escala por una magnitud que no sea la media cuadrática. Una candidata es la distancia entre los cuartiles Q y Q', donde Pr(X<Q') = Pr(X>Q) = 1/4.
Muy a menudo la variable de Cauchy sirve de contraejemplo, como en Bienaymé (1853, págs. 321-321). Véase también Heyde y Seneta (1977).
MODELO GENERADOR GEOMÉTRICO. La fórmula anterior, Pr(X<x) = (1/2) + π−1 arctg x, se puede plasmar geométricamente situando el punto W sobre la circunferencia u2 + v2 = 1, con una distribución de probabilidad uniforme, y definiendo X como la abscisa del punto en que el radio que pasa por W corta la recta v = 1. Por las mismas razones, la variable Y, definida como la ordenada del punto de intersección de dicho radio con la recta u = 1, sigue la misma distribución que X. Como Y = 1/X, tenemos que la inversa de la variable de Cauchy es ella misma.
Además, siempre que tengamos que OW = (X, Y) es un vector aleatorio isotrópicamente distribuido en el plano, Y/X es una variable de Cauchy. En particular, el cociente de dos variables gaussianas independientes es una variable de Cauchy.
3. Recurrencias del movimiento browniano
Combinemos ahora la ecuación (L) con
(A:0,5)s10,5 + s20,5 = s0,5
La solución es la variable aleatoria cuya densidad es 0 si x < 0, y que en caso contrario es igual a
p(x) = (2π)−1/2exp(−1/2x)x−3/2.
La cantidad p(x)dx es la probabilidad de encontrar que una función browniana con B(0) = 0 satisfaga también B(t) = 0 para algún t comprendido entre x y x + dx.
4. Variables estables según Lévy generales
Cauchy consideró también la relación subsidiaria generalizada
(A:D)s1D + s2D = sD,
SOLUCIONES SIMÉTRICAS. Basándose en cálculos formales, Cauchy afirmó que, para todo D, la combinación de (L) con (A:D) tiene una solución, la variable aleatoria de densidad
π−2∫0∞ exp(−uD) cos(ux) du.
Pólya y Lévy demostraron que, cuando se cumple 0 ≤ D ≤ 2, la afirmación de Cauchy está efectivamente justificada, y las distribuciones de Cauchy y Gauss son dos casos particulares. Pero en el caso D > 2, la afirmación de Cauchy no es válida, pues la densidad formal escrita expresada más arriba toma valores negativos, lo cual es absurdo.
SOLUCIONES ASIMÉTRICAS EXTREMAS. Lévy demostró además que la combinación de (L) y (A:D) admite soluciones asimétricas. La función generatriz (transformada de Laplace) de la más asimétrica de ellas está definida y es igual a exp(gD).
OTRAS SOLUCIONES ASIMÉTRICAS. La solución general de la combinación de (L) y (A:D) es una diferencia ponderada de dos soluciones independientes e idénticamente distribuidas, con asimetría máxima. La costumbre es denotar los pesos por (1 + β)/2 y (1 − β)/2.
GENERALIZACIÓN FINAL DE (L). Sin variar (A:D), sustituyamos la condición (L) por
(L*)s1X1 + s2X2 = sX + constante.
Cuando D ≠ 1, este cambio no importa mucho, pero si D = 1 aparecen nuevas soluciones, que se conocen como variables de Cauchy asimétricas.
MUTANTES BACTERIANOS. Mandelbrot (1974d) demuestra que el número total de mutantes en un cultivo bacteriano viejo (el problema de Luria-Delbrück) es una variable estable según Lévy con asimetría máxima.
5. Forma de las densidades estables según Lévy
Aparte de tres excepciones: D = 2 con β = 0, D = 1 con β = 0, y D = 1/2 con β = 1, no se conoce una forma analítica cerrada para las distribuciones estables según Lévy, pero las propiedades de las tres excepciones simples se pueden generalizar a los otros casos.
En todos los casos asimétricos extremos con 0 < D < 1, la densidad se anula para x < 0. El hecho de que la densidad gaussiana sea exp(−1/2x2) se generaliza en las colas cortas de todos los casos asimétricos extremos con 1 < D < 2. La densidad es ∝ exp(−c|x|D/(D−1)).
Para x → ∞ la densidad de Cauchy es ∝ (π)−1x−D−1 y la densidad de recurrencia browniana es ∝ (2π)−1/2x−D−1. Y en general, para todo D ≠ 2, la densidad en las colas largas es ∝ x−D−1.
De lo contrario, el comportamiento de p(u) se debe obtener numéricamente. En Mandelbrot (1960e) se encuentran algunas gráficas para 1 < D < 2 en el caso asimétrico extremo, con comentarios adicionales relativos a los valores de D muy próximos a 2. En Mandelbrot (1962p) y Mandelbrot (1963b) se dan las gráficas correspondientes al caso simétrico. Las técnicas de transformada rápida de Fourier aligeran esa tarea. (Véase Dumouchel 1973, 1975).
6. La desigualdad de los sumandos y la agregación resultante
Sean X1 y X2 dos variables aleatorias independientes con la misma densidad de probabilidad p(u). La densidad de probabilidad de X = X1 + X2 es
p2(u) = ∫−∞∞p(y)p(u − y) dy.
Si se conoce la suma u, la densidad condicional de cada sumando y es p(y) p(u − y)/p2(u). Examinemos con más detenimiento la forma de esta densidad.
EJEMPLOS. Cuando p(u) es una gaussiana de varianza unidad, y por tanto una función unimodal (sólo tiene un máximo), la distribución condicional es una gaussiana centrada en u/2 y su varianza es 1/2, que es independiente de u (véase CONJUNTOS FRACTALES BROWNIANOS, 3). Cuando u → ∞, los valores relativos de los sumandos se aproximan cada vez más entre sí.
Cuando p(u) es una densidad de Cauchy reducida, que también es unimodal, se distinguen dos casos distintos. Cuando |u| < 2, cosa que ocurre la mitad de las veces, la distribución condicional es también unimodal, y el valor más probable es también u/2. Por el contrario, si |u| > 2, el valor u/2 se convierte en el menos probable (localmente). Para |u| = 2, la distribución condicional se bifurca en dos «ojivas» distintas centradas respectivamente en la proximidad de y = 0 y de y = u. Para u → ∞ estas ojivas son cada vez más difícilmente distinguibles de las ojivas de Cauchy centradas en 0 y en u.
Cuando p(u) es una densidad de recurrencia browniana, la situación es parecida al caso de Cauchy aunque más extrema, con una densidad condicional bimodal de probabilidad > 1/2.
Corolario: considérense tres pasos sucesivos por el cero de un paseo aleatorio, Tk−1, Tk y Tk+1. Si Tk+1 − Tk−1 es grande, lo más probable es que el paso Tk se agrupe muchísimo ya hacia Tk−1 ya hacia Tk+1, y lo menos probable, que se sitúe a mitad de camino entre ambos. ▯ Este resultado está relacionado con un célebre resultado de teoría de la probabilidad contrario a la intuición, la ley del arcoseno de Lévy. ▮
Consideremos a continuación la distribución condicional de U, sabiendo que la suma de M variables Ug toma un valor u muy grande. En el caso gaussiano, el resultado más probable es que cada sumando Ug sea próximo a u/M. En el caso de Cauchy, y en el de la recurrencia browniana, por el contrario, el resultado más probable es que todos los sumandos menos uno sean más bien pequeños.
LA TRAMPA OCULTA EN LA IDEA DE CONTRIBUCIONES «IDÉNTICAS» A UNA SUMA. Si los sumandos son a priori idénticos, en el sentido de obedecer a la misma distribución, los valores a posteriori pueden ser casi iguales (como en el caso gaussiano) o distintos en grado diverso (como en el caso estable según Lévy cuando la suma es muy grande).
7. Límites centrales no estándar. Papel de las variables hiperbólicas
Dada una sucesión infinita Xn de variables aleatorias independientes con idénticas distribuciones, el problema del límite central consiste en preguntarse si es o no posible escoger unos pesos aN y bN de modo que la suma aN∑1NXn − bN tenga un límite no trivial para N → ∞.
En el caso estándar 〈X2〉 < ∞, la respuesta es estándar y afirmativa: aN = 1/√N y bN ~ 〈Xn〉√N, y el límite es gaussiano.
El caso no estándar 〈X2〉 = ∞ es muchísimo más complejo: (a) no se pueden escoger siempre los aN y bN; (b) cuando se puede, el límite estable no es gaussiano; (c) una condición suficiente para que el exponente del límite sea D es que la distribución de las Xn sea asintóticamente hiperbólica con exponente D (capítulo 38); (d) la condición necesaria y suficiente se encuentra en las referencias del principio de este apartado.
8. Funciones estables según Lévy reales y de variable real
Se trata de funciones aleatorias con incrementos independientes, estacionarios y tales que la variable aleatoria X(t) − X(0) es estable según Lévy. El factor de escala a(t), que hace que [X(t) − X(0)]a(t) no dependa de t, tiene que ser de la forma a(t) = t−1/D. Este proceso generaliza el movimiento browniano ordinario a D ≠ 2.
La propiedad más sorprendente de X(t) es que es discontinua y presenta saltos.
CASO D < 1. Aquí la X(t) sólo contiene saltos; el número de saltos entre t y t + Δt con valor absoluto mayor que u es una variable aleatoria de Poisson de valor esperado igual a |Δt|u−D.
Las cantidades relativas de saltos positivos y negativos son (1 + β)/2 y (1 − β)/2. El caso asimétrico extremo β = 1 sólo contiene saltos positivos; se llama subordinador estable, y sirve para definir la escalera de Lévy de las láminas 286 y 287.
PARADOJA. Como para u−D → 0 para u → 0, el número de saltos esperado es infinito, independientemente de lo pequeño que sea Δt. El hecho de que la probabilidad asociada sea infinita parece paradójico. Pero esta sensación se esfuma cuando uno comprueba que la suma acumulada de los saltos con u < 1 es finita. Esta conclusión parece natural cuando uno se da cuenta de que la longitud esperada de un salto pequeño es finita y
∝ ∫01Du−D−1u du = D∫01u−D du < ∞
CASO 1 < D < 2. Ahora la última integral es divergente, con lo que la contribución total de los saltos pequeños es infinita. Como consecuencia de ello, X(t) contiene una parte continua y una parte discontinua; ambas son infinitas pero su suma es finita.
9. Vectores y funciones estables según Lévy
Cambiemos la ecuación funcional (L) de la definición de estabilidad, convirtiendo la X en un vector aleatorio X. Dado un vector unitario V, está claro que el sistema formado por las dos ecuaciones (L) y (A:D) admite soluciones consistentes en el producto de V por una variable escalar estable.
Lévy (1937-1954) demuestra que la solución general no es más que la suma de las soluciones elementales correspondientes a todas las direcciones del espacio, ponderadas por una distribución sobre la esfera unidad. Estas contribuciones pueden ser discretas (finitas o numerablemente infinitas) o continuas. Para que el vector X sea isótropo, las contribuciones elementales deben estar distribuidas uniformemente en todas las direcciones.
FUNCIONES VECTORIALES DEL TIEMPO ESTABLES SEGÚN LÉVY. Estas funciones admiten el mismo tipo de descomposición (en suma de saltos que obedecen a una distribución hiperbólica) que una función escalar estable. El tamaño y dirección de dichos saltos se rigen por una distribución sobre la esfera unidad.
DISTRIBUCIÓN DE HOLTSMARK. El trabajo de Holtsmark en espectroscopia sobrevivió tras su reformulación en términos de atracción newtoniana (Chandrasekhar, 1943); y hasta la aparición de mis trabajos representó la única aplicación concreta de las distribuciones estables según Lévy. Supongamos que tenemos una estrella en O y que, por todo el espacio, tenemos estrellas de masa unidad, distribuidas de forma mutuamente independiente y con una densidad esperada δ. ¿Cuál es la atracción total que dichas estrellas ejercen sobre O? Poco después del descubrimiento por Newton de la ley de proporcionalidad inversa a r2, el reverendo Bentley le escribió indicándole que la atracción de las estrellas contenidas en un pincel delgado dΩ' con vértice en O tiene un valor esperado infinito, y lo mismo ocurre con la atracción de las estrellas contenidas en el pincel dΩ'', simétrico del anterior con respecto a O. La conclusión de Bentley era que la diferencia entre dichos infinitos era indeterminada.
El problema de Holtsmark, tal como se plantea habitualmente, evita esta dificultad ocupándose únicamente del exceso por encima del valor esperado, de la atracción que realmente se produce. Empezamos con las estrellas contenidas en el dominio limitado por el pincel anterior de ángulo sólido dΩ y las esferas de radios r y r + dr. Cada una ejerce una atracción u = r−2, y su número es una variable de Poisson de valor esperado δ|dΩ|d(r3) = δ|dΩ||d(u−3/2)|. Por tanto, la atracción excedente con respecto al valor esperado tiene la función característica
exp{δ|dΩ|∫0∞[exp(iζu) − 1 − iζu]|d(u−3/2)|}.
Y ésta corresponde a una variable estable según Lévy de exponente 3/2 y β = 1. Según el subapartado 6 anterior, es muy probable que una u positiva grande se deba a la presencia de una sola estrella cerca de 0, independientemente de la densidad de estrellas en el resto; y para valores grandes de u, la distribución de U se comporta como la distribución de la atracción de la estrella más próxima.
La atracción excedente global es, pues, un vector estable según Lévy isótropo con D = 3/2.
La estabilidad significa aquí que si hay dos nubes de estrellas rojas y azules, respectivamente, distribuidas uniformemente, las fuerzas ejercidas sobre O por cada nube, o por ambas, difieren sólo en un factor de escala, pero no en la forma analítica de sus distribuciones.
10. Funciones aleatorias estables de varias variables
En Mandelbrot (1975b) se generaliza la construcción de Chentsov (1957) de la función browniana real de varias variables.
11. Dimensiones
Los primeros cálculos de la dimensión de un proceso estable para el caso no gaussiano se encuentran en McKean (1955) y en Blumenthal y Getoor (1960c, 1962). Una referencia que además incluye bibliografía es Pruitt y Taylor (1969).
12. Escalantes por adición ponderada (Mandelbrot 1974c, f)
Como ya se ha comentado en este mismo capítulo dentro del subapartado FRACTALES NO LAGUNARES 4, Mandelbrot (1974c,f) presenta una familia de generalizaciones de las variables estables según Lévy, que implican una generalización de la condición de estabilidad de Lévy (L), en la que los pesos siμ son aleatorios.
HEURISTICA DE LIPSCHITZ-HÖLDER
A pesar de que en este ensayo las propiedades locales se reflejan en las globales, la dimensión fractal es en origen una propiedad local. Por tanto, en el caso del grafo de una función continua arbitraria X(t), D tiene que relacionarse con otras propiedades locales. Una de las más útiles es el exponente a de Lipschitz-Hölder (LH). La condición de LH en t+ significa que
X(t) − X(t0) ~ |t− t0|α, para 0 < t − t0 < ε,
y análogamente para t−. El exponente global de LH en [t', t''] es λ[t', t''] = inft'≤t≤t''α. A menos que X(t) sea constante, λ ≤ 1.
HEURÍSTICA LH Y D. Dado un α, el número de cuadrados de lado r necesarios para recubrir el grafo de X entre los instantes t y t + r es aproximadamente igual a rα−1. De este modo se puede recubrir el grafo de X(t) para t ∈ [0, 1] por medio de N cuadrados, y por un argumento dimensional se llega a D = log N/log(1/r). Este modo de estimar D se llamará aquí heurística de Lipschitz-Hölder, y es sólido y eficiente.
EJEMPLOS. Cuando X es diferenciable para todo t entre 0 y 1, si no consideramos los puntos en que X'(t) = 0, se tiene α = 1 en todas partes, y el número de cuadrados necesarios para recubrir el grafo es N ~ rα−1(1/r) = r−1. Se sigue que D = 1, como en efecto ocurre.
Cuando X(t) es una función browniana, ordinaria o fraccionaria, se puede demostrar que α ≡ λ = H. El N heurístico es N ~ rH−1−1, y por tanto D = 2 − H, que de nuevo concuerda con la D conocida.
▯ Para la función del apartado WEIERSTRASS…, Hardy (1916) demuestra que α ≡ H. De ahí la conjetura de que la dimensión de Hausdorff-Besicovitch es 2 − H. ▮
El caso de la escalera de Cantor es totalmente distinto. Ahora X varía sólo para aquellos valores de t pertenecientes a un polvo fractal de dimensión fractal Δ < 1, y α depende de t. Dividamos [0, 1] en 1/r intervalos temporales de longitud r. En r−δ de dichos intervalos se tiene α = Δ, mientras que en los demás a no está definido, pero si se giran levemente los ejes coordenados, se tiene α = 1. Por tanto, el valor heurístico del número de cuadrados del recubrimiento es r−1 + rδ−1r−δ = 2r−1, y la dimensión heurística es D = 1. Éste es efectivamente el caso, como ya se indicó en la leyenda de la lámina correspondiente.
Además, la suma de una función browniana y de una escalera de Cantor con Δ < H da D = 2 − H y λ = 5, de donde 1 < D < 2 −λ.
RESUMEN. La desigualdad heurística 1 ≤ D ≤ 2 − λ. Esta conjetura se confirma en Love y Young (1937) y Besicovitch y Ursell (1937). (Véase también Kahane y Salem, 1963, pág. 27).
ACERCA DE LA DEFINICIÓN DE «FRACTAL». En el apartado «fractales»…, se dice que sería bueno ampliar el dominio del término fractal para poder incluir la escalera de Cantor. ¿Habría que decir que una curva es fractal cuando λ < 1 y α es próximo a λ para «un número suficientemente grande» de valores de t? Prefiero no tomar este camino, pues tales ampliaciones son complicadas y distinguen entre DT = 0 y DT > 0.
FUNCIONES VECTORIALES PLANAS DE UNA VARIABLE. Sean X(t) e Y(t) dos funciones continuas con LH-exponentes λ1 y λ2. La heurística sugiere que para recubrir el grafo de la función vectorial de componentes X(t) e Y(t) para t ∈ [0, 1] hacen falta como mucho rλ1+λ2−3 cubos de lado r. De donde se sigue que 1 ≤ D ≤ 3 − (λ1 + λ2). Para la trayectoria del movimiento browniano plano ordinario, esto da la D = 2 correcta.
PROYECCIONES. Formemos ahora una trayectoria continua por proyección de {X(t), Y(t)} sobre el plano (x, y). Cuando λ1 = λ2 = λ, la heurística sugiere que hacen falta 1/r cuadrados de tamaño rλ, por lo cual 1 ≤ D ≤ min(2, 1/λ). Análogamente, consideremos la trayectoria continua de una función {X(t), Y(t), Z(t)} cuyas componentes tengan unos exponentes λ idénticos. La heurística sugiere que 1 ≤ D ≤ min(3, 1/λ). Cuando λ1 ≠ λ2, la trayectoria continua de {X(t), Y(t)} se tiene que recubrir con cuadrados de rmax λ, por tanto
1 ≤ D ≤ 2 − max{0, (λ1 + λ2 − 1)/max(λ1, λ2)}.
Love y Young (1937) confirman todos estos resultados.
En el capítulo XII del Fractals de 1977 se encuentran materiales sobre este tema (relacionado con las curvas de Peano).
MUSICA: DOS PROPIEDADES ESCALANTES
La música tiene al menos dos propiedades escalantes dignas de mención.
LAS ESCALAS MUSICALES TEMPLADAS Y SU RELACIÓN CON EL ESPECTRO DE FRECUENCIAS DE LA FUNCIÓN DE WEIERSTRASS MODIFICADA. El uso más general de la raíz latina scala (= escalera) no se corresponde, naturalmente, con el término escalante que aparece a lo largo de todo este libro, sino con el concepto de escala musical, la cual implica un espectro discreto que se conserva si multiplicamos las frecuencias. En una escala templada las frecuencias están distribuidas logarítmicamente. Así, por ejemplo, la escala dodecafónica corresponde a la base b = 21/12. Como consecuencia de ello, las notas fundamentales de cada instrumento musical componen una gran parte de los tonos bajos de la totalidad de su banda de frecuencias, pero sólo una pequeña parte de los tonos altos.
Si se extrapola a las frecuencias altas o bajas inaudibles se obtiene un espectro idéntico al de la función de Weierstrass (modificada, pág. 389b) con el mismo valor de b. En consecuencia, para añadir tonos bajos a una composición musical, basta con añadir nuevos instrumentos capaces de producirlos.
Dado que el teorema de Euler-Fourier representa la función periódica más general como una serie de armónicos linealmente espaciados, las funciones que representan la sucesión de las notas fundamentales en la composición musical más general son funciones muy restringidas.
LA MÚSICA COMO RUIDO ESCALANTE (1/f) (R. F. VOSS). Un segundo aspecto escalante de la música se refiere a la variación temporal de distintas medidas de la señal acústica, como por ejemplo su potencia (medida por el cuadrado de su intensidad), o su frecuencia instantánea (medida por la tasa de pasos por cero de la señal audio). Voss y Clarke (1975) y Voss (1978) —véase también Gardner (1978)— observan que en las obras de compositores tan distintos como Bach, Beethoven y The Beatles, las dos medidas anteriores de la señal acústica son ruidos escalantes, ruidos 1/f como los que se describen en la pág. 254.
Y a la inversa, si se produce música aleatoria por medio de una fuente física de ruido externa, con un espectro 1/fB y diversos exponentes escalantes, Voss y Clarke (1975) y Voss (1978) encuentran que el sonido resultante es casi «musical» cuando la causa es un ruido 1/f.
Éste fue un descubrimiento totalmente inesperado, pero como muchos de los descubrimientos incluidos en este ensayo, resulta «natural» a posteriori. El argumento que prefiero es que las composiciones musicales son, como su propio nombre indica, compuestas. Primero, se subdividen en movimientos caracterizados por tempos globales y/o niveles de volumen distintos. Los movimientos también se dividen del mismo modo. Y los maestros insisten en que hay que «componer» cada pieza musical hasta las menores subdivisiones significativas. El resultado es a la fuerza escalante.
Sin embargo, este dominio escalante no alcanza hasta intervalos de tiempo del orden de una nota. Las frecuencias superiores se rigen por mecanismos completamente distintos (entre los que se cuentan la resonancia de los pulmones, de las cajas de violín y de los tubos de los instrumentos de viento de madera). Por tanto, para las energías altas el espectro se parece más a f−2 que a f−1.
Atendiendo a la definición de lagunaridad dada en el capítulo 34, un conjunto no lagunar del espacio RE debería intersecar cualquier cubo o esfera de dicho espacio. En términos matemáticos, debería ser denso por doquier, y en consecuencia no cerrado. (¡El único conjunto cerrado y denso por doquier en RE es él mismo!) En este apartado se demuestra que tales fractales efectivamente existen, pero su naturaleza es muy distinta de los fractales cerrados del resto de este libro. Un síntoma indicativo es que la dimensión de Hausdorff-Besicovitch sigue siendo calculable, pero las dimensiones de semejanza y de Minkowski-Bouligand son iguales a E, en vez de serlo a la D de Hausdorff-Besicovitch.
1. Intermitencia relativa
Los fenómenos a los que atañen las fractales no lagunares se encuentran dispersos por todo este ensayo, en el sentido de que muchos de los casos de fractales naturales de que trato invalidan algún saber incuestionable relativo a la naturaleza.
En el capítulo 8 olvidamos que, entre error y error, el ruido que causa los errores fractales se debilita pero no desaparece.
En el capítulo 9 no tuvimos en cuenta la existencia de materia interestelar. No cabe duda de que su distribución es por lo menos tan irregular como la de las estrellas. En realidad, la imposibilidad de definir una densidad es mayor y más generalmente aceptada para la materia interestelar que para la estelar. Citando a de Vaucouleurs (1970), «parece difícil de creer que, mientras la materia visible está notablemente agrupada y arracimada a cualquier escala, el gas intergaláctico invisible sea uniforme y homogéneo… [su] distribución tiene que estar íntimamente relacionada con… la distribución de galaxias». Otros astrónomos hablan de mechones y telarañas intergalácticos.
Y en el capítulo 10 los hojaldres de disipación turbulenta son obviamente una imagen supersimplificada de la realidad.
Al final del capítulo 9 se habla brevemente de la imagen fractal de la distribución de minerales. Aquí, el uso de fractales cerradas implica que, fuera de las zonas donde el mineral es extraíble, la concentración de cobre es nula. En realidad es muy pequeña en la mayoría de lugares, pero no se puede suponer que sea nula en ninguna parte.
En todos los casos, se vaciaban algunas regiones de menor interés inmediato para poder así manejar conjuntos fractales cerrados, pero en última instancia dichas regiones se tienen que llenar. Esto puede conseguirse por medio de un nuevo híbrido, los fractales no lagunares. Por poner un ejemplo, una distribución no lagunar de masa en el cosmos sería aquella en que ningún lugar del espacio estuviera vacío, pero, para cada par de umbrales pequeños θ y λ, una proporción de masa mayor que 1 − λ se concentrara en una porción de espacio de volumen relativo menor que θ.
2. Una cita de De Wijs y comentario
Las circunstancias intuitivas básicas que piden a voces las fractales no lagunares se describen en De Wijs (1951), quien hace una «hipótesis de trabajo» que vale la pena resumir.
«Consideremos una [masa de mineral] de tonelaje W y calidad media M. Con un corte imaginario partimos dicha masa en dos mitades del mismo tonelaje W/2, con una calidad media distinta. Si aceptamos que la calidad media de la mitad más rica es (1 + d)M, la calidad de la más pobre tendrá que ser (1 − d)M, para que la calidad media del conjunto sea M… Un segundo corte imaginario divide el cuerpo en cuatro partes del mismo tonelaje W/4, y calidades medias (1 + d)2M, (1 + d)(1 − d)M, (1 + d)(1 − d)M y (1 − d)2M. Con un tercer corte tenemos 23 = 8 bloques, a saber, uno de calidad media (1 + d)3M, 3 bloques de (1 + d)2(1 − d)M, 3 bloques de (1 −d)2(1 + d)M y uno de (1 −d)3M. Uno puede imaginarse la división continua en bloques cada vez más pequeños…
»El coeficiente d como medida de la variabilidad es un sustituto adecuado de los intangibles colectivos [tan queridos por quienes piensan que la estimación de la mena es más un arte que una ciencia], y las deducciones estadísticas basadas en esta medida pueden suprimir el laberinto de reglas empíricas y técnicas intuitivas».
COMENTARIO. De Wijs ni tan siquiera aborda el estudio de los aspectos geométricos de este modelo, y ni él ni sus, por lo demás notables, seguidores (G. Matheron entre ellos) tuvieron el menor atisbo de los fractales. Sin embargo, si se supone que la densidad de la mena no depende de la calidad, lo que equivale a suponer que el tonelaje es igual al volumen, resulta que el mismo esquema había sido investigado precisamente con fines totalmente distintos por el matemático puro A. S. Besicovitch y sus discípulos.
Adelantándonos al subapartado siguiente, si se continúa indefinidamente el esquema (reinterpretado) de De Wijs, la mena coagula en un fractal no lagunar. Para definir su dimensión en la forma acostumbrada, D = log N*/log 2, es necesario definir log N* como
log N* = −∑πilogπi,
donde π1 = (1 + d)3, π8 = (1 − d)2, π2 = π3 = π4 = (1 + d)2(1 − d), y π5 = π6 = π7 = (1 + d)(1 − d)2.
CONCLUSIÓN. La conjetura de De Wijs es buena, pero el coeficiente d no es una medida conveniente, pues sólo se aplica a un modelo. La medida apropiada de la variabilidad de la mena es D.
3. Coagulación ponderada de Besicovitch
Para apreciar mejor los resultados de Besicovitch los presentaremos en [0, 1] con b = 3.
HIPÓTESIS. Partimos de una masa distribuida sobre [0, 1] con densidad igual a 1 y la repartimos entre los tercios multiplicándola por los tres pesos W0, W1 y W2 que cumplen las siguientes condiciones:
(A) 1/3 W0 + 1/3 W1 + 1/3 W2 = 1, que expresa la conservación de la masa e implica que cada Wi está acotado por b. La cantidad 1/3 Wi, que es la masa del i-ésimo tercio, se denotará por πi.
(B) Se excluye la distribución uniforme Wi ≡ 1/3.
(C) W0W1W2 > 0; que excluye en particular la construcción de Cantor, correspondiente a W0 = 1/2, W1 = 0, W2 = 1/2.
Los estadios posteriores de la cascada proceden de un modo análogo y, por ejemplo, las densidades de los subremolinos son W02, W0W1, W0W2, W1W0, W12, W1W2, W2W0, W2W1, W22.
CONCLUSIONES. Iterando el proceso indefinidamente, llegamos a los siguientes resultados, debidos sobre todo a Besicovitch y Eggleston. (Billingsley 1965 es una muy buena exposición).
(A) Singularidad. Fractal de Besicovitch. La densidad es asintóticamente nula en casi todos los puntos. El conjunto de puntos en los que la densidad asintótica no es nula (y es infinita) se llamará fractal de Besicovitch, B. Está formado por los puntos de [0, 1] cuya expresión ternaria es tal que el cociente
k−1(número de «íes» en los primeros k «dígitos»)
converge a πi. Tales puntos forman un conjunto abierto: el límite de una sucesión de puntos del conjunto no tiene por qué pertenecer al mismo.
(B) No lagunaridad. La distribución límite de la masa es densa por doquier: aún asintóticamente, ningún intervalo abierto, por pequeño que sea, está totalmente vacío. La masa comprendida entre 0 y t crece estrictamente con t. Aunque en términos relativos los puntos en los que ∏W no converge hacia 0 son relativamente pocos, su número absoluto garantiza que la masa contenida en cualquier intervalo [t', t''] tiene un límite no nulo para k → ∞.
(C) La dimensión de Hausdorff-Besicovitch de B. Es
D = −(π1logπ1 + π2logπ2 + π3logπ3).
Formalmente D es una «entropía» tal y como se define en termodinámica, o también una «información» en el sentido de Shanon (véase Billingsley, 1965).
(D) La dimensión de semejanza de B. Es 1. En efecto, B es autosemejante con N = 3 y r = 1/3, de donde Ds = log 3/log 3 = 11; la razón por la que se ha añadido el índice S quedará clara enseguida. Análogamente, las variantes tridimensionales tienen dimensión 3. En este caso Ds no puede tener mucho significado físico: en primer lugar, no depende de los Wi, siempre y cuando éstos satisfagan las condiciones impuestas; en segundo lugar, si se sustituye B por el polvo de Cantor límite, Ds salta de 1 a log 2/log 3.
Además, una distribución fractalmente homogénea ya no puede basarse en la autosemejanza. En efecto, si atribuimos pesos iguales a todos los fragmentos de longitud 3−k, la distribución resultante es uniforme sobre [0, 1]. No guarda ninguna relación con los valores de las Wi, y difiere de la medida por la cual el propio conjunto ha sido generado. Pasando también al polvo de Cantor límite, esta distribución uniforme se convierte bruscamente en otra altamente poco uniforme.
(E) La dimensión de semejanza del «conjunto de concentración» de B. Es D. La cuestión es que la medida de Besicovitch se puede aproximar por una medida fractalmente homogénea cuya dimensión de semejanza es igual a la D de Hausdorff-Besicovitch. Concretando más, después de un gran número k de pasos de la cascada, la aplastante mayoría de una masa inicialmente uniforme se ha concentrado en 3kD intervalos triádicos de longitud 3−k, los cuales no están uniformemente distribuidos sobre [0, 1], pero su separación máxima tiende a 0 cuando k → ∞
COMENTARIO. Hay que distinguir entre el «conjunto total» necesario para abarcar toda la masa y el «conjunto parcial» donde se concentra el grueso de la masa. Ambos son autosemejantes, pero sus dimensiones de semejanza respectivas, D y Ds son distintas. Véase el subapartado 5.
4. Coagulación ponderada aleatoria (Mandelbrot, 1974f,c)
En Mandelbrot (1974f,c) se introduce una generalización natural y rica del esquema de Besicovitch, que se desarrolla más a fondo en Kahane y Peyrière (1976).
El efecto de cada estadio de la cascada es multiplicar las densidades en los b3 subremolinos de cada remolino por unos pesos aleatorios, independientes e idénticamente distribuidos, Wi.
Después de k estadios de una cascada de coagulación ponderada, el número de remolinos en los que se ha concentrado el grueso de la masa es del orden de bkD* de un total de b3k, donde
D* = −[Wlogb(r3W)] = 3 − [WlogbW].
En particular, si W es discreta y las probabilidades de sus posibles valores wi, son, respectivamente, pi, se tiene que
D* = 3 − ∑piwilogbwi.
EN EL CASO D* > 0, D = D*. La medida generada por la coagulación aleatoria es aproximada por una medida fractalmente homogénea de dimensión D = D*, obtenida como se indica en el capítulo 23.
EN EL CASO D* < 0, D = 0. El número de celdas no vacías tiende asintóticamente a 0, y por tanto el límite es casi con toda seguridad vacío.
En resumen, el portador de la masa es aproximado por un conjunto cerrado con D = max(0, D*).
SECCIONES. Análogamente, la masa contenida en las secciones lineales o planas se concentra en un número relativamente pequeño de remolinos, respectivamente b(D*−1) de un total de b2, y b(D*−2) de un total de b. Por tanto, las secciones son no degeneradas si, respectivamente, D* > 1 o D* > 2, y son aproximadas por fractales cuyas dimensiones respectivas son D* − 1 y D* − 2. Por tanto, las dimensiones de las secciones siguen la misma regla que en el caso de fractales lagunares.
NUEVAS VARIABLES ALEATORIAS, INVARIANTES POR SUMA PONDERADA. Denotemos por X la variable aleatoria que rige la masa asintótica en un remolino de cualquier orden k, o su sección por una recta o plano de dimensión Δ. He demostrado que X satisface las ecuaciones funcionales
(1/C)∑g=0C−1XgWg = X,
donde C = bΔ, las v. a. Wg y Xg son independientes, y la igualdad significa distribuciones iguales. Esta ecuación generaliza la ecuación (L) que discutíamos en el subapartado «Estable según Lévy…». Las soluciones generalizan las variables estables según Lévy; se discuten en las referencias citadas de Mandelbrot y de Kahane y Peyrière.
5. Coagulación aleatoria y función lognormal límite (Mandelbrot, 1972j)
Mandelbrot (1972j) abandona la trama de remolinos que tanto la coagulación absoluta como la ponderada tomaban prestada de Cantor. Los remolinos no están prescritos de antemano, sino que se generan por el mismo mecanismo estadístico que genera distribución de masa en el interior de los propios remolinos. Además, la estratificación discreta de los remolinos se convierte en un continuo.
FUNCIÓN LOGNORMAL LÍMITE. MOTIVACIÓN. Procederemos por modificaciones sucesivas de la coagulación ponderada, realizadas (por simplicidad) sobre una función L(t) de una variable.
Después del n-ésimo paso, la densidad de la coagulación ponderada es una función Yn(t) tal que ΔlogYn(t) = logYn+1(t) − logYn(t) es una función escalonada que varía cuando t es un múltiplo entero de b−n = rn, y sus valores entre esos instantes son variables aleatorias independientes de la forma logW. Supongamos ahora que ΔlogW es lognormal con media −1/2(logb) y varianza μlogb. Se tiene entonces que la covariancia entre ΔlogYn(t) y ΔlogYn(t + τ) es μ(logb)(1 − |τ|/rn) en el intervalo |τ| < rn y se anula fuera del mismo. Esta ΔlogYn(t) no es gaussiana, puesto que la distribución conjunta de sus valores para dos (o más) valores de t no es una variable aleatoria gaussiana multidimensional.
Primera modificación. Sustituimos cada ΔlogYn(t) por ΔlogY*n(t) definida como la función aleatoria gaussiana cuya covariancia (apenas distinta de la anterior) es μ(logb)exp(− |τ|/rn). El resultado conserva el mismo «intervalo de dependencia» que el original, pero rompe las fronteras discretas entre los remolinos de duración rn.
Segunda modificación. Sustituimos el parámetro discreto nlogb por un parámetro continuo X. La suma de diferencias finitas ΔlogY*n(t) se convierte ahora en una integral de diferencias infinitesimales dlogλ(t), de media −1/2μdλ y variancia μdλ y los remolinos pasan a ser continuos.
DEFINICIÓN DE L(t). Consideremos el límite
L(t) = L∞(t) = limλ→∞Lλ(t).
La variable aleatoria logLλ(t) es gaussiana con media 〈logLλ(t)〉 = −1/2λμ y varianza σ2logLλ(t) = λμ. Esto garantiza que 〈Lλ(t)〉 = 1 para todo λ. Pero el límite de LΛ(t) puede ser no degenerado o casi con certeza nulo. Esta cuestión no ha sido resuelta matemáticamente aún, pero no me cabe la menor duda de que los siguientes argumentos heurísticos pueden ser objeto de tratamiento riguroso. Los expongo para las funciones L(x) más interesantes de una variable tridimensional.
EL CONJUNTO DE CONCENTRACIÓN DE UNA MEDIDA LOGNORMAL LÍMITE. Para hacerse una idea del conjunto en el que Lλ(t) no es pequeña, sino sumamente grande, conviene usar cuadrados de referencia de lado rn. No se trata de subremolinos superpuestos, sino de un simple dispositivo de medida. Cuando n > 1 y x es fijo, la lognormal Lnlogb(x) tiene una probabilidad altísima de ser muy próxima a 0, de donde resulta que es sumamente pequeña en la mayor parte de su dominio.
Como Lnlogb(x) es continua, varía poco sobre una celdilla de lado rn, y por tanto la deducción del conjunto de concentración de la coagulación ponderada con una W lognormal también es aplicable al modelo que nos ocupa. Despreciando términos logarítmicos, el número de celdillas que contribuyen a la parte más importante de Lnlogb(x) tiene el valor esperado Q = (r−n)D*, con D* = 3 − μ/2.
Cuando μ > 6, de modo que D* < 0, Q < 0 para λ → ∞, y L(x) es casi con certeza degenerada.
Cuando 4 < μ < 6, de modo que 0 < D* < 1, L(x) es no degenerada con D = D*, pero sus trazas sobre planos y rectas son casi con certeza degeneradas.
Cuando 2 < μ < 4, de modo que 1 < D* < 2, L(x) y sus trazas sobre planos son no degeneradas, con dimensiones D* y D* − 1, pero sus trazas sobre rectas son casi con certeza degeneradas.
Cuando 0 < μ < 2, de modo que 2 < D* < 3, L(x) y sus trazas sobre planos y sobre rectas son no degeneradas, con dimensiones D*, D* − 1 y D* − 2.
6. Dimensión del concentrado de una medida
El estudio de la intermitencia relativa sugiere, no obstante, otras definiciones de dimensión. En vez de un subconjunto de un espacio métrico, consideremos una medida μ(S) definida sobre un espacio acotado Ω (en un σ-anillo conveniente que incluya las bolas), con las propiedades siguientes: (A) cuando S es una bola, μ(S) > 0 y μ(Ω) = 1, y por tanto «el conjunto en el que μ > 0» es idéntico a Ω; (B) sin embargo, la intuición sugiere que μ «se concentra» en una parte muy pequeña de Ω. Buscamos nuevas maneras de cuantificar (B).
Dado ρ > 0 y 0 < λ < 1, consideremos los conjuntos ∑λ para los que μ(Ω − ∑λ) < λ. Denotemos por N(ρ, ∑λ) el ínfimo del número de bolas de radio ρ necesarias para recubrir ∑λ, y definamos
N(ρ, λ) = inf N(ρ, ∑λ).
Las expresiones
lim infα↓0log N(α, α)/log (1/α)
lim infρ↓0log N(ρ, λ)/log (1/ρ)
lim infλ↓0lim infρ↓0logN(ρ, λ)/log (1/ρ)
que se asemejan a dimensiones, están detrás de ciertas estimaciones heurísticas que me parecieron útiles, y sería bueno disponer de un estudio riguroso. Naturalmente, las estimaciones heurísticas sustituyen inf N(Δ, λ) por el yN(Δ, ∑λ) correspondiente a algún recubrimiento ∑λ razonable.
En el capítulo XII del Fractals de 1977 se puede encontrar material adicional sobre este tema y sobre sistemas de numeración de base no entera.
POTENCIALES Y CAPACIDADES. DIMENSIÓN DE FROSTMAN
La dimensión D de Hausdorff-Besicovitch tiene un papel central en la teoría moderna de potenciales clásicos y potenciales generalizados (Marcel Riesz) mediante núcleos de la forma |u|−F, donde F ≠ E − 2. Entre los recientes tratamientos matemáticos no elementales de la teoría del potencial, yo prefiero el de duPlessis (1970, capítulo 3) y también el más detallado de Landkof (1966-1972).
1. Conjetura
Veremos que el valor especial D = 1 está íntimamente relacionado con el potencial newtoniano en R3. Esta relación está en la base de los comentarios del capítulo D, relativos a las diversas teorías cosmológicas que predicen D = 1, como las de Fournier y de Jeans-Hoyle.
Tendría que ser posible reformular dichas teorías como corolarios de la gravitación newtoniana.
Así pues, la desviación del valor observado D ~ 1,23 con respecto a 1 debería poderse atribuir a efectos no newtonianos (relativistas).
2. Dimensión y potenciales: Heurística
Como se dijo en el capítulo 10, Bentley y Newton sabían que el efecto del cielo en llamas de Kepler («paradoja de Olbers») tiene un homólogo en términos de potenciales gravitatorios. Supongamos que E = 3, que la masa M(R) contenida en una esfera de radio R centrada en Ω es ∝ RD con D = 3, y que el núcleo del potencial es el newtoniano R−F, con F = 1. La masa en una capa de espesor dR y radio R es ∝ RD−1, por lo que el potencial total en Ω, que viene dado por ∝ ∫R−FRD−1dR = ∫R dR, diverge en el infinito. No se tiene divergencia en el infinito si D = 3 y F > 1, cosa que implicaría un potencial no newtoniano. En los modelos de Fournier-Charlier se consiguen los mismos resultados con F = 1 y D < 1.
La condición de convergencia en el infinito para la integral general ∫RD−1−FdR es evidentemente D < F. Y la condición de convergencia en el origen es D > F. De este argumento se tiene una relación biunívoca entre D y F, que en particular relaciona D = 1 con F = 1.
3. Potencial y capacidad
Esta conexión fue reforzada por G. Pólya y G. Szegö, y Frostman (1935) le dio la forma definitiva. El principal avance consiste en que el argumento no se limita a un solo origen Ω y considera todos los puntos de un conjunto S (compacto). Consideremos una unidad de masa distribuida sobre S de modo que el dominio du contenga la masa dμ(u). En el punto t, el núcleo |u|−F da la función potencial
∏(t) = ∫|u − t|−Fdμ(u).
De la Vallée Poussin empleó el concepto físico de capacidad electrostática para medir el «contenido» de un conjunto. La idea consiste en que si S tiene una capacidad C(S) grande, se puede barajar la masa total μ de modo que el potencial máximo sea lo más pequeño posible.
Definición. Tómese el supremo del potencial en todos los puntos t, luego el ínfimo con respecto a todas las distribuciones posibles de la unidad de masa sobre S, y finalmente defínase
C(S) = {inf[supt∏(t)]}−1.
Si se usa el núcleo 1/r, el potencial mínimo es el que se logra en la práctica con cargas eléctricas en un conductor.
Definición equivalente. [C(S)]−1 es el ínfimo, entre todas las distribuciones de masa soportadas por S, de la energía definida por la integral doble
∬|t − u|−Fdμ(u)dμ(t).
4. La D como dimensión de Frostman
Hay una relación simple entre C(S) y F. Cuando el exponente F empleado en la definición de C(S) es mayor que la D de Hausdorff-Besicovitch, la capacidad C(S) es nula, lo que significa que incluso la distribución de masa sobre S «más eficiente» da un potencial que se hace infinito en algún lugar. Por otra parte, si F es menor que D, la capacidad de S es positiva. Así pues, la dimensión de Hausdorff-Besicovitch también es una dimensión de capacidad en el sentido de Pólya y Szegö. Esta identidad está demostrada con toda generalidad en Frostman (1935).
Los detalles de la relación entre la medida de capacidad y la medida de Hausdorff en dimensión D son complicados; véase Taylor (1961).
5. Dimensión «anómala»
Los físicos asocian los núcleos |u|−F, con F ≠ E − 2, a espacios con la dimensión euclídea «anómala» 2 − F. (No creo que este uso pretenda implicar ninguna generalización efectiva de E a reales positivos no enteros). Si se tienen en cuenta (a) la conexión entre D y F (Frostman) y (b) el papel de D en la descripción de los cúmulos de galaxias (establecida en el capítulo 10 de este ensayo), la terminología de dimensión anómala lleva a las afirmaciones siguientes: una dimensión fractal D = 1 para las galaxias no es anómala, pero la dimensión fractal observada D ~ 1,23 parece implicar la inmersión en un espacio de dimensión anómala.
La distribución hiperbólica es la única distribución tal que la variable truncada y cambiada de escala «U/u0, sabiendo que U/u0 > 1» obedece a una distribución independiente de u0. Esta propiedad es la base de la conexión entre la distribución hiperbólica y los escalantes.
DEMOSTRACIÓN. Supongamos que tenemos una distribución de partida P(u), con la v. a. cambiada de escala y truncada W = U/u0 que obedece a la distribución condicional habitual P(wu0)/P(u0). Queremos que esta distribución condicional sea la misma para u0 = h' y para u0 = h''. Escribamos v' = log h' y v'' = log h'', y consideremos R = log P(u) como función de v = log u. La identidad que deseamos P(uh')/P(h') = P(uh'')/P(h'') implica que R(v' + v) − R(v') = R(v'' + v) − R(v'') para cualquier valor de v, v' y v''. Esto requiere que R dependa linealmente de v.
LA DIMENSIÓN DE SEMEJANZA: SUS PELIGROS
Ciertos conjuntos abiertos (que no contienen sus puntos límite) presentan una discrepancia seria entre sus dimensiones.
El conjunto de los extremos de las tremas del conjunto de Cantor es autosemejante, con las mismas N y r que el propio polvo de Cantor, y por tanto tiene la misma dimensión de semejanza. Pero es numerable, con lo que su dimensión de Hausdorff-Besicovitch es 0. Si a este polvo se le añaden los puntos límite, se obtiene de nuevo el polvo de Cantor y desaparece la discrepancia «en beneficio» de la dimensión de semejanza, que es la característica más importante de este conjunto.
Un segundo ejemplo muy simple, al que denomino conjunto de Besicovitch, se estudia en el apartado «Fractales no lagunares», 3.
En el empleo científico de palabras del léxico corriente se combinan (a) diversos significados intuitivos, que dependen del usuario, y (b) definiciones formales, que seleccionan un significado especial y lo encuadran en un marco matemático. Los términos estacionario y ergódico son de los pocos sobre los que los matemáticos están de acuerdo en cuanto a significado. Pero mi experiencia me dice que los ingenieros, los físicos y los estadísticos prácticos tienen poco en cuenta la definición matemática, y su visión es más restringida. Y yo prefiero una visión más amplia todavía. Estos malentendidos o preferencias son reveladores.
LA DEFINICIÓN MATEMÁTICA. Un proceso X(t) es estacionario si la distribución de X(t) es independiente de t, la distribución conjunta de X(t1 + τ) y X(t2 + τ) es independiente de τ, y lo mismo ocurre —para todo k— con las distribuciones conjuntas de X(t1 + τ)… X(tk + τ).
PRIMERA CONCEPCIÓN ERRÓNEA (FILOSOFÍA). Es un lugar común que sólo pueden tener cabida en la ciencia aquellos fenómenos que se rigen por reglas invariables. La estacionariedad se malinterpreta a veces en este sentido: muchos piensan que, para que un proceso sea estacionario, basta con que las reglas que lo rigen no cambien con el tiempo. Pero este enunciado resumido no es válido. Por ejemplo, el incremento B(t1 + τ) − B(t2 + τ) del movimiento browniano es gaussiano con media y varianza independientes de τ. Esta regla, así como la regla que define el conjunto de ceros del movimiento browniano, es independiente de τ. Sin embargo, la estacionariedad se refiere específicamente a las reglas que gobiernan los valores del proceso en sí. Y para el movimiento browniano estas reglas no son independientes del tiempo.
SEGUNDA CONCEPCIÓN ERRÓNEA (ESTADÍSTICOS PRÁCTICOS). Muchas técnicas (y muchos programas de ordenador envasados) que se anuncian como «análisis de series temporales estacionarias» tienen un alcance muchísimo más limitado de lo que se desprendería de esta etiqueta. Ello es inevitable, pues la estacionariedad matemática es un concepto demasiado general para que una sola técnica pueda valer en todos los casos. Debido a ello, los estadísticos promueven entre su clientela la opinión de que el concepto de «serie temporal estacionaria» se reduce a los conceptos mucho más restringidos que las técnicas corrientes pueden manejar. Y, aun en el caso de que se tomen la molestia de comprobar la «solidez» de sus técnicas, sólo contemplan desviaciones mínimas de la hipótesis más simple, y no consideran las desviaciones más drásticas permitidas por la estacionariedad.
TERCERA CONCEPCIÓN ERRÓNEA (INGENIEROS Y FÍSICOS). Muchos investigadores creen (debido en parte a la concepción errónea anterior) que la estacionariedad afirma que los procesos de la muestra «pueden moverse arriba y abajo, pero manteniéndose en cierto modo estadísticamente igual». Esta visión resumida era válida en un estadio informal anterior, pero ahora tampoco lo es. La definición matemática se refiere a las reglas generatrices, no a los objetos generados por ellas. Cuando los matemáticos encontraron por primera vez procesos estacionarios con muestras sumamente erráticas, se maravillaron de que la noción de estacionariedad pudiera abarcar una variedad tan grande de comportamientos inesperados. Desafortunadamente, esta es una clase de comportamientos de la que muchos prácticos dicen que no es estacionaria.
UNA ZONA GRIS. No cabe duda de que la frontera entre los procesos estacionarios y los no estacionarios cae en algún lugar entre el ruido gaussiano blanco y el movimiento browniano, pero lo que no está claro es su localización exacta.
LOS RUIDOS ESCALANTES COMO COTA. Los ruidos gaussianos escalantes del capítulo 27 nos dan una acotación más fina que la anterior, al ser su densidad espectral de la forma ∫−B con B > 0. Para el ruido gaussiano blanco se tiene B = 0; para el movimiento browniano B = 2 y, para diversos fines, la frontera entre los procesos estacionarios y los no estacionarios se sitúa en distintos valores de B.
Tratando de evitar la «catástrofe infrarroja», los matemáticos sitúan la frontera en B = 1, pues ∫01f−B df < ∞ equivale a B < 1.
Pero el comportamiento de una muestra de ruido escalante varía de modo continuo en B = 1. En realidad, el cambio entre B = 0 y B > 0 es más visible, tanto que frente a una muestra cualquiera con B > 0 los especialistas suelen decir que no es estacionaria. Y suelen ser consecuentes, afirmando que los datos que tienen el aspecto de una muestra con B > 0 deben representarse con un modelo no estacionario. Por otra parte, pienso que si se excluye B > 1 la definición de estacionario no es suficientemente general en muchos casos.
PROCESOS ESPORÁDICOS CONDICIONALMENTE ESTACIONARIOS. Por ejemplo, la teoría de ruidos fractales (capítulo 8) sugiere que el proceso de los ceros brownianos es estacionario en un sentido débil. En efecto, supongamos que hay al menos un cero entre t = 0 y t = T. El resultado es un proceso aleatorio que depende del parámetro adicional extrínseco T. Yo observé que la distribución conjunta de los valores X(τ + tm) es independiente de t siempre que los instantes τ + tm caigan entre 0 y T. Así pues, el proceso no estacionario de los ceros brownianos contiene en forma latente toda una familia de procesos aleatorios que satisfacen, todos ellos, una forma condicional de la estacionariedad, cosa que a veces es suficiente.
Los procesos de esta familia están tan íntimamente relacionados entre sí que Mandelbrot (1967b) argumenta que habría que considerarlos como un solo proceso estocástico generalizado, que se llamaría proceso esporádico. Comparado con un proceso estocástico estándar, la novedad es que la medida de todo el espacio de muestra Ω es μ(Ω) = ∞. Por lo cual no puede ser normalizado a μ(Ω) = 1. La aceptación de μ(Ω) = ∞ para variables aleatorias se remonta al menos a Rényi (1955). Para evitar que μ(Ω) = ∞ lleve a una catástrofe, la teoría de variables generalizadas supone que nunca son observadas directamente, sino sólo condicionadas a algún suceso C tal que 0 < μ(C) < ∞.
Aunque las variables aleatorias de Rényi tienen una importancia limitada, las funciones esporádicas son importantes. En particular, permiten que Mandelbrot (1967b) conjure algunos casos de catástrofe infrarroja, justificando así ciertos ruidos escalantes con B ∈ [1, 2].
ERGODICIDAD, MEZCLA. Un segundo concepto que está sujeto a interpretaciones distintas es el de ergodicidad. En la literatura matemática, la ergodicidad se divide en múltiples formas de mezcla. Algunos procesos presentan mezcla fuerte y otros mezcla débil. Tal como se presentan dichos procesos en los libros de matemáticas, parece que la distinción no tenga apenas nada que ver con el estudio de la naturaleza. Pero en realidad sí tiene, ¡y con creces! En particular, los ruidos escalantes con 0 < B < 1 presentan mezcla débil pero no fuerte.
CUARTA CONCEPCIÓN ERRÓNEA (RELATIVA A LA VALIDEZ DE LA CONVERGENCIA LÍMITE DE B(t)). Generalmente se piensa que decir que X(t) es estacionario es lo mismo que decir que su suma acumulada X*(t) = ∑ts0X(s) se puede normalizar de modo que converja al movimiento browniano. Los matemáticos saben desde hace mucho que esta creencia es injustificada (Grenander y Rossenblatt, 1957). Y en muchos de los casos considerados en esta obra intervienen funciones X(t) que contradicen dicha creencia, ya sea por el efecto Noé (〈X2(t)〉 = ∞) o por el efecto José (dependencia infinita, como en los ruidos f−B con B > 0). Sin embargo, casi todos mis casos han sido desechados a priori en algún momento por algún «experto» que sostenía que los fenómenos de base eran manifiestamente no estacionarios, con lo que mis modelos estacionarios están condenados. Este argumento es falso, pero psicológicamente importante.
CONCLUSIÓN. La frontera entre los procesos matemáticamente estacionarios y los no estacionarios fomenta discusiones que están por encima de la semántica. En la práctica, hay procesos con un pie a cada lado de dicha frontera, que no son intuitivamente estacionarios, pero pueden tener interés científico. Resultan además necesarios en la totalidad del presente ensayo y en el resto de mi trabajo de investigación.
CUESTIONES DE VOCABULARIO: «LAPLACIANO», «BENIGNO» O «CALMADO» CONTRA «ERRANTE». De nuevo se hace indispensable recurrir a nuevas voces. Permítaseme proponer calmado como (a) sinónimo de lo que los matemáticos llaman «estacionario y tal que X*(t) converge a B(t)», y (b) una palabra que expresa la idea intuitiva de lo que ciertos especialistas tienden a llamar «estacionariedad». Los antónimos alternativos serían inquieto y errante.
En un artículo anterior (Mandelbrot, 1973f) se usan (en vez de calmado) las voces laplaciano y benigno. Esta última significa «inocuo, fácilmente controlable»; y es aplicable a esta clase de azar del que uno puede confiar en que no producirá ninguna de las configuraciones variadas y disparatadas que hacen el azar errante tanto más difícil, y tanto más interesante.
ANÁLISIS ESTADÍSTICO USANDO R/S
Dos supuestos relativos a las series temporales se daban por sentados en estadística práctica: que 〈X2〉 < ∞, y que X presenta dependencia a corto plazo. Sin embargo, he demostrado (capítulo 37) que, a menudo, los registros empíricos con colas largas se interpretan mejor aceptando que 〈X2〉 = ∞. Y la primera vez que se planteó la cuestión de si un registro es débilmente dependiente (corto plazo) o fuertemente dependiente (largo plazo) fue cuando introduje la dependencia a largo plazo para interpretar el fenómeno de Hurst (capítulo 27).
La mezcla de colas largas y dependencia a muy largo plazo podría haber sido estadísticamente inmanejable, debido a que las técnicas estándar de segundo orden encaminadas a la dependencia (correlación, espectros) presuponen invariablemente 〈X2〉 < ∞. Aunque hay una alternativa.
Uno puede olvidarse de la distribución de X(t) y abordar la dependencia a largo plazo por medio del análisis del recorrido estandarizado, también llamado análisis R/S. Esta técnica estadística, introducida por Mandelbrot y Wallis (1969c), y cuyo fundamento matemático se presenta en Mandelbrot (1975w), se refiere a la distinción entre los plazos corto y muy largo. La constante que introduce se denota por J y se llama Coeficiente de Hurst o Exponente R/S, y puede tomar cualquier valor entre 0 y 1.
El significado de J puede ser descrito aún sin haberlo definido. El valor especial J = 1/2 es característico de las funciones aleatorias independientes, de las markovianas y de otras con dependencia a corto plazo. Por tanto, la ausencia de dependencia estadística no periódica a muy largo plazo en registros empíricos o en funciones muéstrales puede investigarse comprobando si la hipótesis J = 1/2 es estadísticamente aceptable. De no ser así, la intensidad de la dependencia a muy largo plazo viene cuantificada por J − 1/2, cuyo valor puede ser estimado a partir de los datos.
La virtud principal de este método de ataque es que el exponente J es robusto con respecto a la distribución marginal. Es decir, además de ser útil cuando los datos de fondo o las funciones aleatorias son cuasi gaussianos, también lo es cuando X(t) está tan lejos de ser gaussiana que 〈X(t)2〉 diverge, en cuyo caso ninguna de las técnicas de segundo orden sirve.
DEFINICIÓN DEL R/S ESTADÍSTICO. Para tiempo t continuo se define X*(t) = ∫0tX(u)du, X2*(t) = ∫0tX2(u)du, y X*2 = (X*)2. Para tiempos discretos i, se define X*(0) = 0, X*(t) = ∑ti=1X(t), donde [t] es la parte entera de t. Para cada d > 0 (demora) definimos el recorrido ajustado de X*(t) en el intervalo de tiempo entre 0 y d, como
R(d) = max0≤u≤d{X*(u) − (u/d)X*(d)}
− min0≤u≤d{X*(u) − (u/d)X*(d)}
Luego evaluamos la desviación típica de la muestra de X(t),
S2(d) = X2*(d)/d − X2(d)/d2.
La expresión Q(d) = R(d)/S(d) es el estadístico R/S o recorrido autoajustado y autoestandarizado de X*(t).
DEFINICIÓN DEL EXPONENTE R/S, J. Supongamos que existe un número real J tal que, para d → ∞, (1/dJ)[R(d)/S(d)] converge en distribución a una variable aleatoria límite no degenerada. Mandelbrot (1975w) demuestra que esto implica que 0 < J < 1. Se dice entonces que la función X tiene J como exponente R/S con un prefactor R/S constante.
Supongamos, con más generalidad, que el cociente [1/dJL(d)][R(d)/S(d)] converge en distribución a una variable aleatoria no degenerada, donde L(d) denota una función de variación lenta en el infinito, es decir, una función que satisface L(td)/L(d) → 1, para d → ∞ y para todo t > 0. El ejemplo más simple es L(d) = log d. Se dice entonces que la función X tiene J como exponente R/S y L(d) como prefactor R/S.
PRINCIPALES RESULTADOS (MANDELBROT 1975W). Cuando X(t) es un ruido gaussiano blanco, se obtiene J = 1/2 con prefactor constante. Precisando más, e−δJR(eδ)/S(eδ) es una función aleatoria estacionaria de Δ = log d.
En general, J = 1/2 siempre que S(d) → 〈X2〉 y que a−1/2X*(at) cambiado de escala converja débilmente a B(t) para a → ∞.
Cuando X(t) es el ruido gaussiano fraccionario discreto, esto es, la sucesión de incrementos de BH(t) (véase la pág. 353), se encuentra J = H, con H ∈ ]0,1[.
En general, para obtener J = H ≠ 1/2 con prefactor constante, basta con que S(d) → 〈X2〉 y que X*(t) sea atraído por BH(t) y satisfaga 〈X*(t)2〉 ~ t2H.
Más en general aún, J = H ≠ 1/2 con prefactor L(d) prevalece si S(d) → 〈X2〉, y X*(t) es atraído por Bn(t) y satisface 〈X*(t)2〉 ~ t2HL(t).
Finalmente, J ≠ 1/2 cuando S(d) → 〈X2〉, y X*(t) es atraído por una función aleatoria escalante no gaussiana de exponente H = J. En Taqqu (1975, 1979a, b) se dan algunos ejemplos.
Por otra parte, cuando X es un ruido blanco estable según Lévy, con lo que S〈X2〉 = ∞, se encuentra J = 1/2.
Cuando X se hace estacionaria por derivación (o por diferenciación), se encuentra que J = 1.
FUNCIONES DE WEIERSTRASS Y PARIENTES PRÓXIMOS. CATÁSTROFES INFRARROJA Y ULTRAVIOLETA
La función compleja de Weierstrass es la suma de la serie
W0(t) = (1 − w2)−1/2∑0∞wn exp(2πibnt)
donde b es un número real >1, y w se escribe unas veces como w = bH, con 0 < H < 1, y otras como w = bD−2, con 1 < D < 2. Las partes real e imaginaria de se conocen como funciones de Weierstrass en coseno y en seno, respectivamente.
La función W0(t) es continua, pero no es diferenciable en ningún punto. Ahora bien, su extensión formal a D < 1 es continua y diferenciable.
Además de la W0(t), en este apartado discutiremos otras variantes que me pareció necesario introducir, debido al nuevo papel que la teoría de fractales asigna a W0(t).
ESPECTRO DE FRECUENCIAS DE W0(t). El término «espectro» está sobrecargado de significados. Por espectro de frecuencias se entiende el conjunto de valores admisibles de la frecuencia f, independientemente de las correspondientes amplitudes de los términos.
El espectro de frecuencias de una función periódica es la sucesión de los números enteros positivos. El espectro de una función browniana es R+. Y el de la función de Weierstrass es la sucesión discreta bn desde n = 1 hasta n = ∞.
ESPECTRO DE ENERGÍAS DE W0(t). Por espectro de energía se entiende el conjunto de valores admisibles de f, junto con las energías correspondientes (amplitudes al cuadrado). Para cada frecuencia de la forma bn, W0(t) tiene una línea espectral de energía (1 − w2)−1w2n. Por lo que la energía total correspondiente a las frecuencias f ≥ bn es convergente y ∝ w2n = b−2nH = f−2H.
COMPARACIÓN CON EL MOVIMIENTO BROWNIANO FRACCIONARIO. La energía acumulada es también f−2H en varios casos encontrados anteriormente. (A) Las funciones aleatorias periódicas de Fourier-Brown-Wiener, cuyas frecuencias admisibles son de la forma f = n, y cuyos coeficientes de Fourier son nH−1/2. (B) Los procesos aleatorios con una densidad espectral continua de población ∝ 2Hf−2H−1. Se trata de las funciones brownianas fraccionarias BH(t) del capítulo 27. Por ejemplo, para el movimiento browniano ordinario, H = 1/2, la densidad espectral es f−2, y se obtiene un espectro acumulado de Weierstrass ∝ f−1. Una diferencia esencial es que, mientras el espectro browniano es absolutamente continuo, los espectros de Fourier-Brown-Wiener y de Weierstrass son discretos.
NO DIFERENCIABILIDAD. Para un físico acostumbrado a manejar espectros, las condiciones de Hardy son intuitivamente obvias. Aplicando la regla de que la derivada de una función se obtiene multiplicando su k-ésimo coeficiente de Fourier por k, el físico encuentra que para el coeficiente de Fourier con k = bn de la derivada formal de W0(t), el cuadrado de la amplitud vale (1 − w2)−1w2nb2n. Como la energía acumulada en las frecuencias ≥ bn es infinita, el físico reconoce que W0(t) no está definida.
Es interesante notar que, buscando un contraejemplo de la diferenciabilidad, Riemann encontró R(t) = ∑1∞n−2sin(2πn2t), cuya energía total para las frecuencias ≥ f = n2 es ∝ n−3 = f−2H, con H = 3/4. Así pues, el mismo argumento heurístico sugiere que R'(t) no está definida, con lo que R(t) no es diferenciable. Esta conclusión es «casi» correcta, aunque R'(t) existe para ciertos valores de t (Gerver 1970, Smith 1972).
DIVERGENCIA/CATÁSTROFE ULTRAVIOLETA. El término «catástrofe» apareció por primera vez en la física hacia 1900, después de que Rayleigh y Jeans propusieran una teoría de la radiación del cuerpo negro que predice que la banda de frecuencias de anchura df en la proximidad de f contiene una energía proporcional a f−4. El hecho de que ello implique que la energía total para las altas frecuencias es infinita es catastrófico para la teoría. Como los problemas vienen de las frecuencias más allá del ultravioleta, se hablaba de una catástrofe ultravioleta (UV).
Todo el mundo sabe que Planck construyó su teoría cuántica sobre las ruinas que dejó la catástrofe UV de la radiación.
APARTE HISTÓRICO. Nótese (alguien más debe haberlo señalado ya, aunque no tengo ninguna referencia de ello) que la misma divergencia mató la vieja física (†1900) y la vieja matemática (†1875) que pensaban que las funciones continuas deben ser diferenciables. La reacción de los físicos fue cambiar las reglas del juego, y la de los matemáticos fue aprender a vivir con las funciones no diferenciables y sus diferenciales formales. (Las últimas son los únicos ejemplos de distribuciones de Schwartz, de uso frecuente en la física).
BÚSQUEDA DE UN ESPECTRO DISCRETO ESCALANTE. DIVERGENCIA INFRARROJA. En tanto que el espectro de frecuencias de la función browniana es continuo, escalante y llega hasta f = 0, el de la función de Weierstrass para el mismo H es discreto y está acotado inferiormente por f = 1. La presencia de esta cota inferior se debe solamente al hecho de que la b original de Weierstrass era un entero y la función era periódica. Ahora nos gustaría prescindir de este hecho, y el procedimiento más fácil es dejar que n vaya de −∞ a +∞. Para que la propiedad escalante valga también para el espectro de energía, basta con asignar la amplitud wn a la componente de frecuencia bn.
Desgraciadamente, la serie que resulta es divergente, debido a las componentes de bajas frecuencias. Este defecto se conoce como divergencia (o «catástrofe») infrarroja (IR). Sin embargo, hay que afrontar esta divergencia, pues la cota inferior f = 1 está reñida con la autosemejanza que, por otra parte, encarna el espectro de energías f2H.
FUNCIÓN DE WEIERSTRASS, MODIFICADA PARA QUE SEA AUTOAFÍN CON RESPECTO AL TIEMPO FOCAL T = 0. Para extender el espectro de frecuencias de Weierstrass f−2H hasta f = 0 sin consecuencias fatales, lo más simple es formar primero la expresión W0(0) − W0(t), y luego dejar que n vaya de −∞ a +∞. Los términos añadidos correspondientes a n < 0 convergen si 0 < H < 1, y su suma es continua y diferenciable. La función así modificada,
W1(t) − W1(0) = (1 − w2)−1/2 ∑∞−∞[exp(2πibnt) − 1],
es todavía continua, pero no es diferenciable en ningún punto. Además es escalante, en el sentido de que
W1(tmb) − W1(0) = (1 − w2)−1/2
∑∞−∞w−mwn+m[exp(2πibn+mt) − 1] = w−m[W1(t) − W1(0)].
Así pues, la función wm[W1(bmt) − W1(0)] es independiente de m. O bien, si escribimos r = bm, r−H[W1(rt) − W1(0)] es independiente de h. Esto es, W1(r) − W1(0) y sus partes real e imaginaria son autoafines con respecto a los r de la forma b−m y al tiempo focal t = 0.
Un estudio completo de las funciones de Weierstrass (modificadas) W1(t), con gráficos muy ilustrativos se puede encontrar en Berry y Lewis (1980).
FUNCIONES ALEATORIAS GAUSSIANAS CON UN ESPECTRO DE WEIERSTRASS GENERALIZADO. El siguiente paso hacia el realismo y la aplicabilidad se da al aleatorizar la función de Weierstrass generalizada. El método más simple e intrínseco consiste en multiplicar sus coeficientes de Fourier por factores gaussianos complejos e independientes, de media nula y varianza unidad. Las partes real e imaginaria del resultado merecen llamarse funciones de Weierstrass-Gauss (modificadas). En cierto modo son funciones brownianas fraccionarias aproximadas. Cuando los valores de H coinciden, sus espectros son todo lo próximos que uno podría conseguir entre un espectro discreto y otro continuo. Además, el resultado de Orey (1970) y Marcus (1976) sigue siendo válido y demuestra que sus conjuntos de imagen constante tienen la misma dimensión fractal.
PROPIEDADES FRACTALES. Según un teorema de Love y Young (1937) y Besicovitch y Ursell (1937) (véase Lipschitz…), el grafo de una función que, para todo x, satisface la condición de Lipschitz con exponente H, tiene una dimensión fractal comprendida entre 1 y 2 − H. Para la función browniana fraccionaria con el mismo espectro acumulado f−2H, se sabe que la dimensión toma el máximo valor posible 2 − H = D. Mi conjetura es que lo mismo se puede decir de la curva de Weierstrass, y que la dimensión de su conjunto de ceros es 1 − H.
CONJUNTOS DE CEROS DE FUNCIONES AFINES. Las funciones de Rademacher son variantes cuadradas de las sinusoides sen(2πbnt) en las que b = 2. Si el seno es positivo (respectivamente, negativo o nulo), la función de Rademacher vale 1 (respectivamente, −1 o 0) (Zygmund, 1959 I, pág. 202). La generalización natural de la función de Weierstrass es una serie en la que el n-ésimo término es el producto de wn por la n-ésima función de Rademacher. Aunque esta función es discontinua, su exponente espectral sigue siendo 2H. Intuitivamente, el precedente del movimiento browniano fraccionario sugiere que los conjuntos de ceros de la función de Weierstrass-Rademacher tienen dimensión 1 − H. Beyer (1962) confirma este resultado, pero sólo si se da la condición de que 1/H es entero.
Singh (1935) hace referencia a numerosas variantes de la función de Weierstrass. En algunos casos la D de los conjuntos de ceros es fácilmente calculable. Vale la pena echar una nueva mirada a este tema.