La principal ventaja de las coordenadas no cartesianas es que se pueden elegir para que coincidan con la simetría del problema. Por ejemplo, la onda de presión debido a una explosión lejos del suelo (u otras barreras) depende del espacio 3D en coordenadas cartesianas, sin embargo, la presión se aleja predominantemente del centro, de modo que en coordenadas esféricas el problema se vuelve casi unidimensional (ya que la onda de presión depende predominantemente solo del tiempo y de la distancia desde el centro). Otro ejemplo es el flujo (no turbulento) de un líquido en una tubería circular recta: en coordenadas cartesianas se tiene que resolver un difícil problema de valor límite bidimensional que involucra una ecuación diferencial parcial, pero en coordenadas cilíndricas el problema se vuelve unidimensional y se puede resolver mediante una ecuación diferencial ordinaria en lugar de una ecuación en derivadas parciales.
La razón para preferir coordenadas ortogonales en lugar de coordenadas curvilíneas en general es su simplicidad: surgen muchas complicaciones cuando las coordenadas no son ortogonales. Por ejemplo, en coordenadas ortogonales muchos problemas pueden resolverse utilizando separación de variables. La separación de variables es una técnica matemática que convierte un problema complejo de d dimensiones en d problemas unidimensionales que pueden resolverse en términos de funciones conocidas. Muchas ecuaciones pueden reducirse a la ecuación de Laplace o a la ecuación de Helmholtz. La ecuación de Laplace es separable en 13 de los 14 sistemas de coordenadas ortogonales mencionados más adelante (con la única excepción de las coordenadas toroidales), y la ecuación de Helmholtz es separable en 11 de los mencionados sistemas de coordenadas ortogonales.[1][2]
Las coordenadas ortogonales nunca tienen términos fuera de la diagonal en sus tensores métricos. En otras palabras, la distancia infinitesimal al cuadrado ds2 siempre se puede escribir como una suma escalada de los desplazamientos infinitesimales al cuadrado de las coordenadas
donde d es la dimensión y las funciones de escala (o factores de escala)
son iguales a las raíces cuadradas de las componentes diagonales del tensor métrico, o las longitudes de los vectores base locales descritos a continuación. Estas funciones de escala hi se utilizan para calcular operadores diferenciales en las nuevas coordenadas, como por ejemplo el gradiente, el laplaciano, la divergencia y el rotacional.
Un método simple para generar sistemas de coordenadas ortogonales en dos dimensiones es mediante una transformación conforme de una cuadrícula bidimensional estándar de coordenadas cartesianas(x, y). Se puede formar un número complejoz = x + iy a partir de las coordenadas reales x e y, donde i representa la unidad imaginaria. Cualquier función holomorfaw = f(z) con derivada compleja distinta de cero producirá una transformación conforme. Si el número complejo resultante se escribe w= u + iv, entonces las curvas de u y v constantes se intersecan en ángulos rectos, tal como lo hacen las líneas originales de x e y constantes.
Se pueden generar coordenadas ortogonales en tres o más dimensiones a partir de un sistema de coordenadas ortogonal bidimensional, ya sea proyectándolo a una nueva dimensión (coordenadas cilíndricas) o rotando el sistema bidimensional sobre uno de sus ejes de simetría. Sin embargo, existen otros sistemas de coordenadas ortogonales en tres dimensiones que no se pueden obtener proyectando o rotando un sistema bidimensional, como las coordenadas elipsoidales. Se pueden obtener coordenadas ortogonales más generales comenzando con algunas superficies de coordenadas necesarias y considerando sus trayectorias ortogonales.
Dada una variedad de (pseudo)riemanniana , un conjunto abierto del mismo y un punto dentro de dicho conjunto abierto , una carta local o "sistema de coordenadas" local puede representarse por una función:
Donde d es la dimensión del espacio donde se define el sistema de coordenadas local. Las dcurvas coordenadas Ci(t) y sus vectores tangentes vienen definidas por las ecuaciones:
El sistema de coordenadas será ortogonal si los vectores tangentes a las curvas coordenadas xi son ortogonales, es decir, si:
Donde g(, ) es el tensor métrico del espacio donde se definen las coordenadas.
En coordenadas cartesianas, las bases son fijas (constantes). En el contexto más general de las coordenadas curvilíneas, un punto en el espacio se especifica mediante las coordenadas, y en cada uno de esos puntos hay un conjunto de vectores base, que generalmente no son constantes: esta es la esencia de las coordenadas curvilíneas en general y es un concepto muy importante. Lo que distingue a las coordenadas ortogonales es que, aunque los vectores base varían, siempre son ortogonales entre sí. En otras palabras,
Estos vectores base son, por definición, los vectores tangentes de las curvas obtenidas al variar una coordenada, manteniendo las otras fijas:
donde r es un punto y qi es la coordenada para la que se extrae el vector base. En otras palabras, se obtiene una curva al fijar todas las coordenadas menos una. La coordenada no fija se varía como en una ecuación paramétrica, y la derivada de la curva con respecto al parámetro (la coordenada variable) es el vector base para esa coordenada.
Debe tenerse en cuenta que los vectores no tienen necesariamente la misma longitud. Las funciones útiles conocidas como factores de escala de las coordenadas son simplemente las longitudes de los vectores base (consúltese la tabla siguiente). Los factores de escala a veces se denominan coeficientes de Lamé, que no deben confundirse con los parámetros de Lamé.
Los vectores de la base normalizados se anotan con un sombrero y se obtienen dividiendo por la longitud:
Un campo vectorial puede especificarse por sus componentes con respecto a los vectores base o los vectores base normalizados, y se debe estar seguro de qué caso se trata. Las componentes en la base normalizada son más comunes en aplicaciones para facilitar la claridad de las cantidades (por ejemplo, se puede querer tratar con la velocidad tangencial en lugar de con la velocidad tangencial multiplicada por un factor de escala); en las derivaciones, la base normalizada es menos común, ya que las expresiones son más complicadas.
Los vectores de la base que se muestran arriba son vectores de la base covariante (porque covarían con los vectores). En el caso de coordenadas ortogonales, los vectores de la base contravariantes son fáciles de encontrar, ya que estarán en la misma dirección que los vectores covariantes pero tendrán la longitud recíproca (por esta razón, se dice que los dos conjuntos de vectores base son recíprocos entre sí):
Esto se deduce del hecho de que, por definición, , utilizando la delta de Kronecker. Nótese que:
Por lo tanto, se cuenta con tres conjuntos de bases diferentes que se utilizan comúnmente para describir vectores en coordenadas ortogonales: la base covariante ei, la base contravariante ei y la base normalizada êi. Si bien un vector es una cantidad objetiva, es decir, su identidad es independiente de cualquier sistema de coordenadas, las componentes de un vector dependen de la base en la que se represente el vector.
Para evitar confusiones, las componentes del vector x con respecto a la base ei se representan como xi, mientras que las componentes con respecto a la base ei se representan como xi:
La posición de los índices representa cómo se calculan las componentes (los índices superiores no deben confundirse con los exponentes de una potencia). Téngase en cuenta que los símbolos del sumatorio Σ (sigma mayúscula) y el rango de la suma, que indica la suma de todos los vectores base (i = 1, 2, ..., d), a menudo son omitidos. Las componentes están relacionadas simplemente por:
No existe una notación general que distinga y se utilice para las componentes vectoriales con respecto a la base normalizada. En este artículo se utilizarán subíndices para las componentes vectoriales y se indicará que las componentes se calculan en la base normalizada.
La suma y el cambio de signo de vectores se realizan componente por componente, tal como en coordenadas cartesianas, sin complicaciones. Es posible que se requieran consideraciones adicionales para otras operaciones con vectores.
Sin embargo, debe tenerse en cuenta que todas estas operaciones suponen que dos vectores en un campo vectorial están ligados al mismo punto (en otras palabras, las colas de los vectores coinciden). Dado que los vectores base generalmente varían en coordenadas ortogonales, si se suman dos vectores cuyas componentes se calculan en diferentes puntos del espacio, es necesario considerar los diferentes vectores base.
El producto escalar en coordenadas cartesianas (en el espacio euclídeo con una base ortonormal) es simplemente la suma de los productos de las componentes. En coordenadas ortogonales, el producto escalar de dos vectores x e y adopta esta forma familiar cuando las componentes de los vectores se calculan en la base normalizada:
Esta es una consecuencia inmediata del hecho de que la base normalizada en algún punto puede formar un sistema de coordenadas cartesianas: el conjunto de vectores de la base es ortonormal.
Para las componentes en las bases covariantes o contravariantes,
Esta expresión se puede deducir fácilmente escribiendo los vectores en forma de componentes, normalizando los vectores base y tomando el producto escalar. Por ejemplo, en 2D:
donde se ha utilizado el hecho de que las bases covariantes y contravariantes normalizadas son iguales.
La fórmula anterior sigue siendo válida en coordenadas ortogonales si las componentes se calculan en la base normalizada.
Para construir el producto vectorial en coordenadas ortogonales con bases covariantes o contravariantes, simplemente se deben normalizar los vectores de la base, por ejemplo:
que, escrito expandido, toma la forma
La notación concisa para el producto vectorial, que simplifica la generalización a coordenadas no ortogonales y dimensiones superiores, es posible con el símbolo de Levi-Civita, que tendrá componentes distintas de ceros y unos si los factores de escala no son todos iguales a uno.
Si se observa un desplazamiento infinitesimal desde algún punto, es evidente que
Según su definición, el gradiente de una función debe satisfacer (esta definición sigue siendo cierta si ƒ es cualquier tensor)
De ello se deduce que el operador gradiente debe ser:
y esto sigue siendo cierto en coordenadas curvilíneas generales. Cantidades como el gradiente y el laplaciano se obtienen mediante la aplicación adecuada de este operador.
es el determinante jacobiano, que tiene la interpretación geométrica de la deformación en volumen desde el cubo infinitesimal dxdydz hasta el volumen curvo infinitesimal en las coordenadas ortogonales.
Usando el elemento de línea que se muestra arriba, la integral de arco en una trayectoria de un vector F es:
Un elemento infinitesimal de área para una superficie descrita manteniendo constante una coordenada qk es:
De manera similar, el elemento de volumen es:
donde el símbolo Π grande (pi mayúscula) indica un productorio, de la misma manera que una Σ grande indica un sumatorio. Nótese que el producto de todos los factores de escala es el determinante jacobiano.
A modo de ejemplo, la integral de superficie de una función vectorial F sobre una superficie q1 = constante en 3D es:
Debe tenerse en cuenta que F1/h1 es la componente de F normal a la superficie.
La elección de uno u otro sistema depende de las simetrías del problema geométrico o físico planteado. Al ser todos estos sistemas de coordenas ortogonales, el tensor métrico tiene en todos ellos la forma:
Donde las tres componentes no nulas son los llamados factores de escala son funciones de las tres coordenadas.
El rotacional viene dado por el desarrollo del siguiente determinante:
El laplaciano de una magnitud escalar viene dado por:
Las expresiones anteriores se pueden escribir de forma más compacta utilizando la simbología de Levi-Civita y el determinante jacobiano , suponiendo la suma sobre índices repetidos:
También debe observarse que el gradiente de un campo escalar se puede expresar en términos de la matriz jacobianaJ que contiene las derivadas parciales canónicas:
La coordenadas usadas en la teoría de la relatividad general son el ejemplo físico más conocido de sistemas de coordenadas sobre un espacio globalmente no euclídeo.
Además de las coordenadas cartesianas habituales, a continuación se tabulan varias otras.[5] Se utiliza la notación de intervalos para que la columna de coordenadas sea compacta: los paréntesis indican intervalos abiertos (es dedir, el valor al que acompañan es un límite del intervalo), y los corchetes indican intervalos cerrados (por el contrario, el valor al que acompañan forma parte del intervalo). Por ejemplo, en el caso de las coordenadas esféricas, los tres intervalos de los parámetros que las definen son CA-CC-CA (siendo C cerrado y A abierto).
Los tres factores de escala () son los valores de la diagonal del tensor métrico que definepermite el cálculo de distintas operaciones dentro del sistema de coordenadas (véase la sección Propiedades).