Теорема Гурвица

Mar 04, 2006 17:18

Всем хорошо известна формула (x_1^2+x_2^2)(y_1^2+y_2^2)=(x_{1}y_{1}-x_{2}y_{2})^2+(x_{1}y_{2}+x_{2}y_{1})^2, которая показывает, что произведение сумм двух квадратов является суммой двух квадратов. Выписанное тождество выполняется в любом коммутативном кольце. В частности, этот простой факт применяется как в теории чисел, так и в теории упорядоченных полей. Доказательство не представляет труда, так как можно просто раскрыть скобки. С другой стороны, можно ввести комплексные числа z=x_{1}+ix_{2} и w=y_{1}+iy_{2}, воспользовавшись тем фактом, что модуль произведения комплексных чисел равен произведению модулей. В этих терминах выписанное тождество равносильно тому, что |zw|^2=|z|^{2}|w|^{2}.

Переходя от комплексных чисел к кватернионам, мы можем получить аналогичную формулу для произведения кватернионов. Если z=x_{1}+x_{2}i+x_{3}j+x_{4}k, w=y_{1}+y_{2}i+y_{3}j+y_{4}k, то, с учётом равенств i^2=j^2=k^2=-1, ij=-ji=k, jk=-kj=i, ki=-ik=j для базисных элементов и равенства N(zw)=N(z)N(w), где норма кватерниона есть сумма квадратов его коэффициентов, получаем тождество, превращающее произведение сумм четырёх квадратов в сумму четырёх квадратов: (x_1^2+x_2^2+x_3^2+x_4^2)(y_1^2+y_2^2+y_3^2+y_4^2)=(x_{1}y_{1}-x_{2}y_{2}-x_{3}y_{3}-x_{4}y_{4})^2+(x_{1}y_{2}+x_{2}y_{1}+x_{3}y_{4}-x_{4}y_{3})^2+(x_{1}y_{3}-x_{2}y_{4}+x_{3}y_{1}+x_{4}y_{2})^2+(x_{1}y_{4}+x_{2}y_{3}-x_{3}y_{2}+x_{4}y_{1})^2.

Возниикает естественный вопрос: при каких n существует аналогичная формула? Именно, мы хотим, чтобы произведение сумм n квадратов (x_1^2+...+x_n^2)(y_1^2+...+y_n^2) было тождественно равно сумме квадратов n билинейных форм от x_i,y_j. Каждая такая билинейная форма должна быть линейной комбинацией произведений вида x_{i}y_{j} с некоторыми коэффициентами. (Вопрос о коэффициентах здесь не принципиален, и мы будем считать их вещественными.)

Ответ на этот вопрос даёт теорема Гурвица: формула существует в точности при n принимающих значения 1,2,4,8.

Заметим, что задачу можно рассматривать и в более общей постановке, рассматривая произведение сумм r и s квадратов. Мы ограничимся здесь наиболее "классическим" случаем r=s=n.

Идея изложить доказательство этой замечательной теоремы возникла в ходе дискуссии с garvej. Я буду следовать изложению, предложенному в книге Херстейна "Некоммутативные кольца", которая даже четверть века назад была библиографической редкостью. Особенностью доказательства является то, что оно использует несколько наиболее фактов из теории представлений конечных групп. Переформулировка задачи в таких терминах возникает совершенно естественным образом. Для начала приведём формулировки тех утверждений, на которые мы будем ссылаться. Знакомство с теорией характеров при этом не предполагается.

(1) Всякое представление конечной группы G над полем С вполне приводимо, т.е. разлагается в сумму неприводимых представлений (теорема Машке).

(2) Количество одномерных представлений группы G над C равно |G/G'|, т.е. порядку факторгруппы G по её коммутанту.

(3) Количество неприводимых представлений группы G над C равно числу классов сопряжённых элементов группы G.

(4) Сумма квадратов размерностей неприводимых представлений G над С равно |G|, т.е. порядку группы G.

Теория представлений конечных групп изложена во многих учебниках (причём изложена по-разному); лично я предпочитаю в этом смысле книгу А. И. Кострикина "Введение в алгебру".

Итак, приступим к доказательству теоремы Гурвица. Пусть произведение (x_1^2+...+x_n^2)(y_1^2+...+y_n^2) тождественно равно сумме квадратов n билинейных форм. Слагаемое с номером i в правой части тождества есть квадрат линейной комбинации переменных y_1,...,y_n, коэффициенты которых суть линейные формы от x_1,...,x_n. Через a_{ij}(x) мы обозначим коэффициент в i-м слагаемом при y_j. Тождество примет вид (x_1^2+...+x_n^2)(y_1^2+...+y_n^2)=\sum_{i=1}^{n}(\sum_{j=1}{n} a_{ij}y_{j})^2. Раскрывая скобки, приходим к следующим равенствам:

(a) a_{1j}^2+...+a_{nj}^2=x_1^2+...+x_n^2 (j=1,...,n)

(b) a_{1j}a_{1k}+...+a_{nj}a_{nk}=0 (j \neq k)

Введём матрицу A=||a_{ij}(x)|| размером n на n, элементы которой суть линейные формы от x_1,...,x_n. Равенства (a), (b) говорят о том, что скалярный квадрат j-го столбца равен x_1^2+...+x_n^2, а скалярное произведение различных столбцов равно нулю. Обозначая через X^t матрицу, транспонированную для X, а через I -- единичную матрицу, мы приходим к следующему очень простому матричному равенству

(c) A^{t}A=(x_1^2+...+x_n^2)I,

которое полностью равносильно анализируемому тождеству.

Теперь можно разложить A по переменным x_1,...,x_n, а именно, положить A=x_{1}A_{1}+...+x_{n}A_{n}, где матрицы A_1,...,A_n имеют числовые элементы. Из равенства (c) мы извлекаем следующие равенства:

(d) A_{j}^{t}A_{j}=I
(e) A_{j}^{t}A_{k}+A_{k}^{t}A_{j}=0, где j меньше k.

Все матрицы оказались, в частности, ортогональными; A_{j}^t=A_{j}^{-1}. Поэтому имеют место равенства

(e') A_{j}^{-1}A_{k}+A_{k}^{-1}A_{j}=0, где j меньше k.

Легко заметить, что если от A перейти к A_{n}^{-1}A, то равенство вида (c) сохранится, и при этом коэффициент при A_n станет единичной матрицей. Это позволяет ввести новые матрицы B_{j}=A_{n}^{-1}A_{j} при всех j=1,...,n-1 и переписать равенство (e') при k=n в виде

(f) B_{j}^{-1}+B_{j}=0, j=1,...,n-1,

т.е. B_{j}^{-1}=-B_{j}. Отсюда из (e') при k меньшем n получаем, что

(g) B_{j}B_{k}+B_{k}B_{j}=0,

т.е. различные матрицы B_1,...,B_{n-1} попарно антикоммутируют. Кроме того, (f) равносильно равенству

(f') B_{j}^2=-I.

Рассмотрим теперь абстрактную группу G_{n} с образующими g_1,...,g_{n-1},c, где c играет роль "минус единицы", т.е. это инволюция, коммутирующая со всеми элементами:

c^2=1, cg_{i}=g_{i}c (i=1,...,n-1),

а также g_{i}^2=c при всех i=1,...,n-1 и g_{i}g_{j}=cg_{j}g_{i} при i \neq j.

Любой элемент группы G_{n} может быть переписан в виде g=c^{d}g_{i_1}...g_{i_p}, где d=0,1, p \ge 0, i_1,...,i_p -- строго возрастающая последовательность индексов. Представление элемента группы в таком виде единственно, в чём можно легко убедиться, рассматривая гомоморфизмы, отправляющие в единицу все элементы g_i, восстанавливая тем самым значение d, а также все гомоморфизмы, отправляющие в единицу все элементы кроме фиксированного g_i, определяя тем самым, входит ли g_i в произведение в записи элемента g. Отсюда следует, что порядок группы G_{n} равен 2^n, т.е.

(A) |G_{n}|=2^n.

Далее положим n \ge 3. Очевидно, что любые два элемента группы G_{n} либо коммутируют, либо антикоммутируют, т.е. их коммутатор равен 1 или c. Поскольку g_1 и g_2 не коммутируют, то коммутант группы G_n равен {1,c}. Таким образом, |G_{n}/G_{n}'|=2^{n-1}, и с учётом (2) имеем

(B) Количество одномерных представлений группы G_{n} над C равно 2^{n-1}.

Для нахождения числа классов сопряжённых элементов группы G_{n} нам потребуется вычислить её центр Z(G_n). В самом деле, всякий элемент, сопряжённый g, равен либо g, либо cg. Если g \in Z(G_n), то класс этого элемента равен {g}; в противном случае он равен {g,cg}. Ясно, что элементы 1 и c всегда принадлежат центру. Пусть g=g_{i_1}...g_{i_p}, где 1 \le p меньше n-1. Тогда gg_{j}=c^{p}g_{j}g, если g_j не входит в произведение и gg_{j}=c^{p-1}g_{j}g, если g_j -- один из элементов g_{i_1},...,g_{i_p}. Отсюда ясно, что g не принадлежит Z(G_n). Пусть g=g_{1}...g_{n-1}. Для любого j от 1 до n-1 получаем gg_{j}=c^{n}g_{j}g. Следовательно, при чётном n элемент g будет центральным, а при нечётном n -- не будет. В итоге

Z(G_n)={1,c) при нечётных n; Z(G_n)={1,c,g_{1}...g_{n-1},cg_{1}...g_{n-1}} при чётных n.

Теперь легко подсчитать число классов сопряжённых элементов. Если n нечётно, то имеется 2 одноэлементных класса, а все остальные 2^{n}-2 элемента разбиваются на двухэлементные классы. Общее количество классов равно 2^{n-1}+1. Если n чётно, то имеется 4 одноэлементных класса, а оставшиеся 2^{n}-4 элемента разбиваются на двухэлементные классы, и общее число классов равно 2^{n-1}+2. С учётом (B) и (3) получаем:

(C) Количество неодномерных неприводимых представлений группы G_n равно 1 при нечётном n и равно 2 при чётном n.

Найдём теперь размерности неодномерных неприводимых представлений группы G_n. Если n нечётно, а m означает размерность единственного такого представления, то с учётом (4) получаем равенство 1^2+1^2+...+1^2+m^2=2^n, где 1^2 берётся столько раз, сколько одномерных представлений имеет группа. Согласно (B), это число равно 2^{n-1}, т.е. m=2^{(n-1)/2}. При чётном n обозначим размерности неодномерных неприводимых представлений через m',m'', что приводит к уравнению 1^2+1^2+...+1^2+(m')^2+(m'')^2=2^n или (m')^2+(m'')^2=2^{n-1}. Ввиду того, что n \ge 3, число 2^{n-1} делится на 4, и потому m',m'' не могут быть нечётными. Следовательно, они чётны, и можно применить "метод бесконечного спуска", что приводит к равенствам m'=m''=2^{(n-2)/2}. Резюмируя, имеем:

(D) Размерность любого неодномерного неприводимого представления группы G_n равна 2^{(n-1)/2} при n нечётном и 2^{(n-2)/2} при n чётном.

Теперь вернёмся к нашим матрицам. Из условий (f'),(g) вытекает, что правила c \mapsto -I, g_{j} \mapsto B_{j} задают n-мерное представление группы G_n. Согласно (1), оно разлагается в сумму неприводимых представлений. Важное наблюдение состоит в том, что при этом не возникает одномерных слагаемых. В противном случае при подходящем выборе базиса все матрицы имели бы блочно-диагональную структуру, в которой присутствует блок размером 1 x 1. Однако это невозможно, так как матрицы B_1 и B_2 антикоммутируют. Следовательно, наше представление группы G_n матрицами n-го порядка разлагается в сумму неодномерных неприводимых представлений.

Если n нечётно, то в силу (D) получается, что n делится на 2^{(n-1)/2}, т.е. является чётным. Следовательно, остаётся рассмотреть случай только чётного n. Из тех же соображений имеем, что n делится на 2^{(n-2)/2}. При этом отсеивается случай n=6 и остаются только случаи n=4 и n=8, поскольку при n больших 8, как легко проверить, число n меньше 2^{(n-2)/2}.

Итак, мы получили, что интересующее нас тождество может иметь место только при n=1,2,4,8. Осталось показать, что при n=8 такое тождество возможно. Оно соответствует восьмимерной неассоциативной алгебре над R -- алгебре октав Кэли. Такую конструкцию можно получить как при помощи "высоких" соображений, так и кустарно. Прежде всего, мы хотим получить матрицу A(x), удовлетворяющую условию (c). Для этого можно составить таблицу умножения группы Z_{2} x Z_{2} x Z_{2}, состоящую из элементов x_1,...,x_8 и далее искусственно расставить знаки 1 и -1 так, чтобы скалярное произведение любых двух различных строк было равно нулю. Если x_1 -- единичный элемент группы, то в первой строке и в первом столбце знаки менять не будем (это не ограничивает общности). На главной диагонали в строках со 2-ой по 8-ю мы должны поставить знак "минус". При этом подматрица, образованная строками со 2-ой по 8-ю должна быть антисимметричной относительно главной диагонали. Далее совсем нетрудно подобрать оставшиеся знаки, руководствуясь этими правилами.

Ниже приводится таблица, где вместо x_1,...,x_8 фигурируют базисные элементы e_0,e_1,...,e_7 алгебры октав Кэли. При этом e_0 -- это единица алгебры, а умножение остальных элементов подчиняется правилам e_{i}e_{i+1}=e_{i+3}, e_{i}e_{i+2}=e_{i-1}, e_{i}e_{i+3}=-e_{i+1}, где индексы принимают значения от 1 до 7, а сложение происходит по модулю 7. При этом элементы e_1,...,e_7 попарно антикоммутируют и в квадрате равны -e_0, что полностью задаёт таблицу:

e0  e1   e2   e3   e4   e5   e6   e7  e1 -e0   e4  e7  -e2  e6  -e5  -e3 e2 -e4  -e0   e5  e1  -e3   e7  -e6  e3 -e7  -e5  -e0   e6   e2  -e4   e1  e4  e2  -e1  -e6  -e0   e7   e3  -e5  e5 -e6   e3  -e2  -e7  -e0   e1   e4  e6  e5  -e7   e4  -e3  -e1  -e0   e2  e7  e3   e6  -e1   e5  -e4  -e2  -e0 

author:falcao

Previous post Next post
Up