Главная > Математика > Курс высшей математике, Т.3. Ч.1
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

27. Характеристические числа матриц и приведение матриц к каноническому виду.

Подобные матрицы не равны, конечно, между собою в смысле (76), но в геометрическом смысле равносильны в том отношении, что они осуществляют одно и то же линейное преобразование пространства, но выраженное в различных координатных системах. Мы займемся сейчас разысканием инвариантов этих матриц, т. е. таких выражений, составленных из элементов, которые имели бы одинаковое значение для всех подобных матриц. Нетрудно составить один из таких инвариантов. Это будет определитель матрицы.

Действигельно, пусть А — некоторая матрица и ей подобная, причем U - любая матрица с определителем, отличным от нуля. Мы имеем в силу (80) и (92):

Чтобы построить еще другие инварианты, образуем полином степени от некоторого параметра X, равный определителю матрицы, которая получается из матрицы А, если вычтем из всех ее диагональных членов параметр X, т. е. положим

где - элементы матрицы А. Иначе мы можем записать это так:

ибо по условию или есть диагональная матрица, у которой все Элементы, стоящие на главной диагонали, равны . Подставляя вместо А и принимая во внимание, что любая матрица переместительна с числом X и, следовательно, будем иметь:

т. е.

Мы видим, таким образом, что полином (97), составленный для матрицы совпадает с таким же полиномом, составленным для матрицы . Иными словами, все коэффициенты полинома (97) суть инварианты по отношению к подобным матрицам. Старший коэффициент написанного полинома, как легко видеть, равен Отметим особо два его коэффициента, а именно свободный член и коэффициент при Первый из них равен, очевидно, определителю, и этот инвариант мы уже отметили и раньше. Что же касается коэффициента то, пользуясь результатами мы видим, что он совпадает с суммой диагональных элементов. Эта сумма называется обычно следом матрицы и обозначается следующим образом:

где есть начальные буквы немецкого слова «Spur», что значит по-русски «след» (французское «trace»). Итак, подобные матрицы имеют одинаковый определитель и одинаковый след.

Напишем теперь уравнение

которое называется характеристическим уравнением матрицы А, а его корни характеристическими числами, или собственными значениями матрицы А.

Согласно предыдущему, мы можем сказать, что подобные матрицы имеют одинаковые характеристические числа. Мы уже имели уравнение вида (100) раньше.

Поставим теперь следующий вопрос: нельзя ли найти матрицу совершающую преобразование подобия от заданной матрицы А к матрице так, чтобы последняя матрица была диагональной матрицей. Иными словами, с точки зрения линейных преобразований пространства, нельзя ли выбрать такие координатные оси, в которых линейное преобразование, характеризуемое в первоначальной системе координат матрицей сводилось бы просто в новых осях к преобразованию вида Заметим, что мы пишем подобную матрицу в виде вместо прежнего вида что не имеет, конечно, существенного значения.

Мы можем записать наше условие в виде:

где искомыми являются элементы матрицы V и числа Можно, очевидно, переписать это условие, умножая обе части слева на V, в виде:

Определим по формуле (65) элементы обеих частей написанного равенства со значками i и k. Таким образом мы получим уравнений:

где элементы матриц А и V.

Фиксируя второй значок k и полагая получим уравнений, содержащих только элементы столбца матрицы V с номером k и число

Если мы будем считать элементы как составляющие некоторого вектора то можем записать предыдущее равенство в виде одного векторного равенства:

Мы видим таким образом, что разыскание матрицы V, которая приводит матрицу А к диагональной форме, сводится к разысканию таких векторов которые воспроизводятся с точностью до численного множителя в результате линейного преобразования, определяемого матрицей А.

Этот факт является алгебраическим аналогом того факта современной квантовой механики, согласно которому матричная механика Гейзенберга по существу равносильна волновой механике Шрёдингера. Согласно первой точке зрения, существенным вопросом является задача приведения некоторой матрицы (бесконечной) к диагональной форме. Что же касается волновой механики, то здесь основным вопросом является задача отыскания таких векторов (в пространстве с бесчисленным множеством измерений), которые бы воспроизводились с точностью до численного множителя в результате некоторого линейного преобразования. Предыдущие соображения мы назвали алгебраическим аналогом потому, что ограничиваясь пространством с конечным числом измерений, мы приводим наши задачи к чисто алгебраическим задачам. В более же сложных случаях пространства с бесчисленным множеством измерений мы существенным образом выходим из рамок обычной алгебры и нуждаемся в аппарате анализа. Более подробно все эти вопросы будут выяснены впоследствии, причем заметим, что для приложений к физике в рассматриваемом случае конечного числа измерений достаточно ограничиться матрицами А частного типа (эрмитовские матрицы, у которых и, кроме того, матрица U также должна быть определенного типа (унитарная матрица, определение которой будет дано ниже). Здесь мы рассматриваем общий вопрос для любой конечной матрицы, причем ограничимся лишь приведением окончательных результатов, не приводя полностью доказательство. Для тех задач, которые будут интересны в приложениях, вопрос будет решен полностью.

Переходим к решению системы (103) или (104). В раскрытом виде мы можем записать ее так:

Для того чтобы получить для решение, отличное от нулевого, необходимо и достаточно, чтобы определитель написанной системы был равен нулю, т. е. необходимо и достаточно, чтобы число было корнем характеристического уравнения. Разберем подробно лишь тот случай, когда это уравнение имеет различные корни. Обозначим эти корни через . Подставляя в коэффициенты системы (105) вместо первый корень мы сможем определить из нее элементы первого столбца таблицы V, причем не рассматриваем вопроса о том, насколько широк будет выбор этих величин Выберем решение системы каким-нибудь одним определенным образом, лишь так, чтобы оно было отлично от нулевого.

Точно так же, заменяя в коэффициентах системы мы сможем определить элементы второго столбца матрицы V и т.д. до столбца. Равенства (105) равносильны (102), и чтобы перейти к основному равенству (101), нам надо только, чтобы V имела обратную матрицу т. е. чтобы определитель V был отличен от нуля. Будем доказывать это от противного. Положим, что он равен нулю. Как мы знаем [12], это равносильно тому, что между векторами определяемыми столбцами матрицы V, существует линейное соотношение:

где не все коэффициенты равны нулю. Применим к обеим частям этого равенства раз преобразование, определяемое матрицей А. Пользуясь (104), будем иметь равенств:

Принимая во внимание, что не все векторы равны нулю, можем утверждать, что определитель написанной системы должен равняться нулю:

где числа ХЛ по условию различны. Но последнее равенство противоречит тому, что определитель Вандермонда от неравных чисел отличен от нуля. Таким образом мы доказали возможность приведения матрицы преобразованием подобия к диагональной форме для того случая, когда все характеристические числа матрицы различны. В том случае, когда среди характеристических чисел имеются равные, может случиться, что матрица не может быть приведена преобразованием подобия к диагональной форме. Все же и в этом случае существует наиболее простое или, как говорят, каноническое представление матрицы. Это каноническое представление в том случае, когда матрица приводится к диагональной форме, имеет вид:

где — характеристические числа матрицы. Для общего случая сформулируем лишь результат.

Пусть является корнем уравнения (100) кратности k. Положлм далее, что для всех определителей порядка таблицы, стоящей в левой части уравнения (100), число является корнем кратности но не выше, т. е. все эти определители делятся на но хоть один из них не делится на Положим далее, что все определители упомянутой таблицы порядка имеют корнем кратности но не выше, и так дальше, и, наконец, все определители порядка имеют упомянутый корень кратности а хоть один из определителей порядка уже вовсе не обращается в нуль при То же самое будет, очевидно, иметь место и для определителей более низкого порядка. Можно доказать, что числа убывают: Введем следующие положительные целые числа:

причем, очевидно, .

Биномы

называются элементарными делителями матрицы соответствующими корню Мы можем таким образом определить элементарные делители для всех характеристических чисел матрицы А, в результате чего получим совокупность элементарных делителей:

где

и среди чисел могут быть и одинаковые.

Выше мы видели, что характеристические числа не меняются при преобразовании подобия. Оказывается, что таким же свойством обладает и совокупность элементарных делителей матрицы. Введем теперь некоторые новые, простейшие матрицы . Мы подразумеваем под этим матрицу порядка у которой на главной диагонали везде стоит число а, на следующей нижестоящей диагонали стоит везде единица, а остальные элементы равны нулю:

Основным фактом в вопросе о представлении матриц в канонической форме является следующий результат: если матрица А имеет элементарные делители (106), то существует такая матрица U с определителем, отличным от нуля, что

Заметим, что если известны все характеристические числа матрицы то нахождение матрицы U сводится к элементарным алгебраическим операциям. Если то под мы подразумеваем просто число а. Может случиться, что и при наличии одинаковых характеристических чисел все элементарные делители (106) будут простыми, т. е. будут иметь вид:

В этом случае квазидиагональная матрица

превращается просто в диагональную матрицу и матрица приводится к диагональной форме.

Нетрудно доказать, что для возможности приведения матрицы к диагональной форме необходимо и достаточно, чтобы ранг таблицы коэффициентов в системе (105) был равен , где — кратность корня векового уравнения. При выполнении этого условия система (105) определит линейно-независимых векторов

Отметим, что матрица U, входящая в формулу (109), определяется не единственным образом. В частности, если d — величина определителя матрицы U, то в формуле (109) можно заменить

т. е. можно считать, что в формуле (109) определитель матрицы U равен единице. Этими указаниями мы и ограничимся в общей задаче приведения матриц к каноническому виду. Мы вернемся к этой задаче в специальном добавлении ко второй части третьего тома. Как уже упоминалось выше, мы будем дальше рассматривать подробно эту задачу для матриц особого типа.

<< Предыдущий параграф Следующий параграф >>
Оглавление