Введение
В этом документе собраны основные сведения из алгебры матриц и векторов, которые используются в хемометрике. Приведенный текст не может служить учебником по матричной алгебре — он скорее является конспектом, справочником в этой области. Более глубокое и систематическое изложение может быть найдено в литературе.
Текст разбит на две части названные — "Базовые сведения" и "Дополнительная информация". В первой части изложены положения, минимально необходимые для понимания хемометрики, а во второй части — факты, которые необходимо знать для более глубокого постижения методов многомерного анализа. Изложение иллюстрируется примерами, выполненными в рабочей книге Excel, Matrix.xls, которая сопровождает этот документ.
Ссылки на примеры помещены в текст как объекты Excel. Эти примеры имеют абстрактный характер, они никак не привязаны к задачам аналитической химии. Реальные примеры использования матричной алгебры в хемометрике рассмотрены в других текстах, посвященных разнообразным хемометрическим приложениям.
Большинство измерений, проводимых в аналитической химии, являются не прямыми, а косвенными. Это означает, что в эксперименте вместо значения искомого аналита $C$ (концентрации) получается другая величина $x$ (сигнал), связанная, но не равная $C$, т.е. $x(C) ≠ С$. Как правило, вид зависимости $x(C)$ не известен, однако, к счастью, в аналитической химии большинство измерений пропорциональны. Это означает, что при увеличении концентрации $С$ в a раз, сигнал $X$ увеличится на столько же., т.е. $x(aC) = a x(C)$. Кроме того, сигналы еще и аддитивны, так что сигнал от пробы, в которой присутствуют два вещества с концентрациями $C_1$ и $C_2$, будет равен сумме сигналов от каждого компонента, т.е. $x(C_1 + C_2) = x(C_1)+ x(C_2)$.
Пропорциональность и аддитивность вместе дают линейность. Можно привести много примеров, иллюстрирующих принцип линейности, но достаточно упомянуть два самых ярких примера — хроматографию и спектроскопию. Вторая особенность, присущая эксперименту в аналитической химии — это многоканальность. Современное аналитическое оборудование одновременно измеряет сигналы для многих каналов. Например, измеряется интенсивность пропускания света сразу для нескольких длин волн, т.е. спектр. Поэтому в эксперименте мы имеем дело со множеством сигналов $x_1, x_2,...., x_n$, характеризующих набор концентраций $C_1,C_2, ..., C_m$ веществ, присутствующих в изучаемой системе.
Итак, аналитический эксперимент характеризуется линейностью и многомерностью. Поэтому удобно рассматривать экспериментальные данные как векторы и матрицы и манипулировать с ними, используя аппарат матричной алгебры. Плодотворность такого подхода иллюстрирует пример, показанный на Рис. 1, где представлены три спектра, снятые для 200 длин волн от 4000 до 4796 cm−1. Первый ($x_1$) и второй ($x_2$) спектры получены для стандартных образцов, в которых концентрация двух веществ $A$ и $B$, известны: в первом образце $[A] = 0.5, [B] = 0.1$, а во втором образце $[A] = 0.2, [B] = 0.6$. Что можно сказать о новом, неизвестном образце, спектр которого обозначен $x_3$?
Рассмотрим три экспериментальных спектра $x_1$, $x_2$ и $x_3$ как три вектора размерности 200. Средствами линейной алгебры можно легко показать, что $x_3 = 0.1x_1 + 0.3 x_2$, поэтому в третьем образце очевидно присутствуют только вещества $A$ и $B$ в концентрациях $[A] = 0.5×0.1 + 0.2×0.3 = 0.11$ и $[B] = 0.1×0.1 + 0.6×0.3 = 0.19$.