El significado latino original de la palabra «matriz» es útero. Por extensión ha pasado a significar también aquello en cuyo interior o a partir de lo cual se origina y desarrolla algo. En comparación con esto, el significado que se da en matemáticas a esa palabra es bastante estéril. Una matriz es una tabla de números ordenados en filas y columnas, y su dimensión viene dada por dos enteros que indican el número de las mismas.
Las matrices y
son matrices de 2 por 5 y de 3 por 2, respectivamente, mientras que una matriz de 1 fila y N columnas se llama generalmente vector N-dimensional. Estas definiciones no son muy apasionantes. Probablemente las disposiciones tabulares de números se conozcan desde los tiempos de los primeros contables fenicios. Lo relativamente moderno son las interpretaciones que se han dado a este sencillo instrumento de notación y a las propiedades del sistema algebraico resultante de definir operaciones entre matrices.
La aplicación matemática más corriente de las matrices está relacionada con la resolución de sistemas de ecuaciones lineales que aparecen en muchos contextos físicos y económicos. (Véase la entrada sobre Programación lineal). El método es parecido al que se usa en álgebra elemental. Para resolver simultáneamente 12W + 3X − 4Y + 6Z = 13, 2W − 3Y + 2Z = 5, 34W − 19Z = 15, y 5W + 2X + Y− 3Z = 11 hay que multiplicar varias de estas ecuaciones por números escogidos de modo que, al sumar o restar las ecuaciones dos a dos, las variables vayan desapareciendo sucesivamente. Después de resolver unos cuantos sistemas de esta clase, la automatización de un procedimiento tan tedioso se plantea como una idea muy interesante, y la práctica acaba por consistir en hacer los cálculos sólo en la matriz formada por los números que aparecen en las ecuaciones (o coeficientes) y prescindiendo de ellas. La matriz de coeficientes del sistema anterior es , y las distintas operaciones aritméticas que hay que realizar con las filas de esta matriz (que corresponden a las ecuaciones) la reducen a una matriz más simple en la que figura la solución de las ecuaciones.
Además de estas operaciones con las filas y columnas de una matriz, hay operaciones con la matriz como un todo que resultan esenciales para otras aplicaciones. Para no excederme en los cálculos, consideraré primero sólo las matrices A y B: y
, respectivamente. Las matrices (A + B), (A − B), 5A, (5A − 2B) y A*B son, respectivamente:
;
;
;
;
.
Cada elemento (o componente) de la suma (A + B) se obtiene sumando los correspondientes elementos de A y de B. Para obtener (A − B), se restan los elementos correspondientes (si tiene el álgebra un poco oxidada, recuerde que restar −6 equivale a sumar +6). Para multiplicar un número por una matriz basta con multiplicar cada elemento de ésta por dicho número. Esto explica cómo obtener 5A y −2B. Sumando estas dos se obtiene (5A − 2B).
¿Y el producto A*B? El elemento de la primera fila y la primera columna de A*B es [(3 × 1) + (−6 × 3)], esto es, −15; se calcula multiplicando componente a componente los elementos de la primera fila de A por los de la primera columna de B y sumando los resultados. El elemento de la primera fila y la segunda columna de A*B es 48 y se calcula multiplicando también componente a componente la primera fila de A por la segunda columna de B y sumando los resultados. Y, en general, el elemento de la i-ésima fila y la j-ésima columna de A*B se obtiene multiplicando componente a componente los elementos de la i-ésima fila de A por los de la j-ésima columna de B y sumando los productos. Aplicando este método obtenemos A*B = . Finalmente, la matriz I =
se llama matriz identidad (¿útero de gemelos?), pues C*I = I*C = C, para cualquier matriz C.
¿Y qué? Una consecuencia puramente matemática de estas definiciones es que el conjunto de matrices forma una estructura algebraica que se llama anillo no conmutativo. Renunciaré a dar la definición de anillo (a grandes rasgos, es un conjunto con un par de operaciones definidas entre sus elementos y que cumplen ciertas propiedades) pero señalaré que «no conmutativo» significa que, contrariamente a lo que ocurre con los números, A*B no tiene por qué ser igual a B*A. En nuestro ejemplo A*B es mientras que B*A es
.
Un poco de comprensión del funcionamiento de los vectores puede aclarar el por qué de esta no conmutatividad del producto de matrices. Así pues, siguiendo con el inexorablemente didáctico cursillo de esta entrada, digo que los vectores N-dimensionales (las matrices 1 por N) se emplean para representar magnitudes que se caracterizan, aparte de por su intensidad (como las temperaturas o los pesos), por su dirección y sentido (como las fuerzas y los campos electromagnéticos). De hecho, suele ser útil pensar en los vectores como si fueran flechas de una longitud conveniente apuntando en la dirección apropiada.
Estas transformaciones no conmutan, y tampoco lo harán las matrices que las representan
La velocidad es una magnitud vectorial típica. Una velocidad del viento de 10 kilómetros por hora se podría indicar por cualquiera de los vectores (0, 10), (10, 0), (0, −10) ó (−10, 0), dependiendo de que la dirección del viento fuera, respectivamente, hacia el norte, el este, el sur o el oeste. En cada caso, el primer número es la componente de la velocidad en la dirección este-oeste y el segundo la componente en la dirección norte-sur. El vector (−7,1, 7,1) tiene una longitud 10 [determinada por el teorema de Pitágoras: (−7,1)2 + 7,12 = 102] y por tanto se puede considerar también que indica una velocidad de 10 kilómetros por hora, pero en una dirección comprendida entre el oeste y el norte (conocida como noroeste). El vector (9,4, 3,4) indica también una velocidad de 10 (pues 9,42 + 3,42 = 102), pero esta vez en una dirección 20° al norte del este. Un viento cuyas componentes de la velocidad fueran (28,2, 10,2), tres veces mayores que las de (9,4, 3,4), soplaría en la misma dirección pero a 30 kilómetros por hora.
En general, se usan los vectores para representar magnitudes cuya especificación precisa de dos o más dimensiones y no hace falta que representen nada físico. Tratando de restaurantes podría ser útil introducir vectores pentadimensionales para indicar una clasificación numérica de los mismos que atendiera a cinco criterios distintos.
Comoquiera que interpretemos los vectores, las matrices se pueden considerar como transformaciones de los mismos; al multiplicarlo por una matriz (definido precisamente como el producto de dos matrices) un vector se transforma en otro vector. El vector (1, 1) se transforma en (8, −4) al multiplicarlo por porque (1, 1) *
= (8 ,−4). Estas «transformaciones lineales» alargan, giran y reflejan los vectores (aunque si los vectores no denotan cantidades físicas, estos alargamientos, giros y reflexiones no son más que un modo de hablar) y siempre se pueden representar por matrices.
Si se realizan una tras otra, estas transformaciones de vectores no tienen por qué conmutar. Por ejemplo, una rotación de un vector seguida de una reflexión del vector resultante no da siempre lo mismo que la reflexión seguida de la rotación. (Para verlo, piénsese en un vector que apunta hacia el nordeste y es girado 45° en sentido contrario a las agujas del reloj, de manera que quede apuntando hacia el norte. Si le hacemos sufrir una reflexión sobre el eje este-oeste, al final apuntará hacia el sur. Si en vez de ello hacemos primero la reflexión sobre el eje este-oeste y luego la rotación de 45° contra las agujas del reloj, el vector acaba apuntando hacia el este). Así pues, las matrices que representan estas rotaciones, reflexiones y otras transformaciones tampoco tienen por qué conmutar: A*B no siempre es igual a B*A.
Las matrices y los vectores juegan un papel principal en el álgebra lineal y también en muchas otras áreas de la matemática aplicada. La falta de conmutatividad explica en parte el porqué de la importancia de las matrices en mecánica cuántica, donde el orden en que se realizan dos medidas afecta el resultado final. Los tensores, que son una generalización natural de las matrices, constituyen uno de los principales ingredientes de la formulación matemática de la teoría de la relatividad general. Quizá, después de todo, la etimología de la palabra «matriz» no sea tan inapropiada.