МОТП, Задачи на экзамене
Материал из eSyr's wiki.
(→Доказательство формул) |
(Вывод первых двух формул) |
||
Строка 1: | Строка 1: | ||
''За нерешение данных задач оценка снижается на балл.'' — Д. П. Ветров | ''За нерешение данных задач оценка снижается на балл.'' — Д. П. Ветров | ||
+ | |||
+ | ==Вывод формул для векторного дифференцирования== | ||
+ | Вывести (считаем все матрицы вещественными): | ||
+ | |||
+ | # <math>\frac{\partial c^Tu}{\partial u}=c</math> | ||
+ | # <math>\frac{\partial\|Au-f\|^2}{\partial u}=2A^TAu - 2A^Tf</math> | ||
+ | # <math>\frac{\partial^2\|Au-f\|^2}{\partial u^2}=2A^TA</math> | ||
+ | |||
+ | ===Решение=== | ||
+ | |||
+ | ====Формула 1==== | ||
+ | <math>c^Tu=\sum_{i=1}^nc_iu_i \Rightarrow \frac{\partial c^Tu}{\partial u_i}=c_i \Rightarrow \frac{\partial c^Tu}{\partial u} = c</math> | ||
+ | |||
+ | ====Формула 2==== | ||
+ | Далее через <math>a_i</math> всюду обозначен столбец матрицы <math>A</math> с номером <math>i</math>. | ||
+ | |||
+ | <math>\|Au-f\|^2 = (Au-f)^T(Au-f)=(Au)^TAu-2f^TAu+f^Tf</math> | ||
+ | |||
+ | <math>f^TAu=f^T(a_1u_1+\dots+a_nu_n) \Rightarrow \frac{\partial f^TAu}{\partial u_i} = f^Ta_i \Rightarrow \frac{\partial f^TAu}{\partial u} = f^TA</math> | ||
+ | |||
+ | <math>(Au)^TAu=(a_1u_1+\dots+a_nu_n)^T(a_1u_1+\dots+a_nu_n)=\sum_{i=1}^n\sum_{j=1}^nu_iu_ja_i^Ta_j \Rightarrow \frac{\partial (Au)^TAu}{\partial u_i} = 2\sum_{j=1}^nu_ja_i^Ta_j=2A^TAu</math> | ||
+ | |||
+ | <math>\frac{\partial\|Au-f\|^2}{\partial u} = \frac{\partial (Au)^TAu}{\partial u_i} - 2 \frac{\partial f^TAu}{\partial u_i} = 2A^TAu - 2A^Tf</math> | ||
==Метод главных компонент (PCA)== | ==Метод главных компонент (PCA)== |
Версия 17:22, 27 мая 2009
За нерешение данных задач оценка снижается на балл. — Д. П. Ветров
Содержание |
Вывод формул для векторного дифференцирования
Вывести (считаем все матрицы вещественными):
Решение
Формула 1
Формула 2
Далее через ai всюду обозначен столбец матрицы A с номером i.
Метод главных компонент (PCA)
Даны р точек в двухмерном пространстве (буду прямо их ручкой у вас на листочке задавать). Найти методом главных компонент первую главную компоненту. Так что вспоминайте как матрицу 2х2 к главным осям приводить и ковариации считать.
Решение
Рассмотрим следующую задачу: p = 5, x1 = (1,1), x2 = (1,2), x3 = (3,2), x4 = (4,1), x5 = (6,4).
Находим.
Находим
Решаем
Находим собственный вектор, соответствующий , решая . Получаем - собственный вектор, соответствующий максимальному собственному значению матрицы ковариации. Он и будет являться первой главной компонентой.
Подробные вычисления не приведены. Можете сами повторить и сверить результаты. Однако сильно не надейтесь найти ошибку, решение проверено в MATLAB.
Метод максимального правдоподобия (ММП)
Как метко заметил Оверрайдер, будут задачки на поиск оценки максимального правдоподобия. Не сложные, но чтобы было интереснее, не с нормальным распределением. Что-нибудь типа найти оценку МП на параметр распределения Лапласа.
Решение
Плотность распределения Лапласа: , μ - сдвиг, b - масштаб (подробнее в википедии).
Вариант 1: неизвестный сдвиг, единичный масштаб
Пусть есть распределение Лапласа с неизвестным матожиданием и единичным параметром масштаба. Дана выборка, взятая из этого распределения: . Оценим параметр μ.
Функция распределения запишется так:
Функция правдоподобия:
Покажем, что эта функция достигает максимума в точке -- когда параметр равен медиане выборки.
Упорядочим выборку по возрастанию. Пусть теперь она выглядит так: . Рассмотрим последнюю функцию на интервалах вида . На первом из них все функции под знаком суммы возрастают, итоговая производная равна n, на втором -- одна убывает, остальные возрастают, производная равна (n-2), и т.д. Переломный момент наступает в середине -- в одной точке перегиба (если n нечётно), или на центральном интервале производная равна 0 (если n чётно). После этого функция только убывает. Там и достигается максимум правдоподобия. Короче, нужно нарисовать график, и всё будет понятно: максимум правдоподобия достигается в точке, равной медиане выборки.
Вариант 2: нулевой сдвиг, неизвестный масштаб
Правило множителей Лангранжа
Обязательно кому-то дам задачку на условную максимизацию квадратичной функции с линейным ограничением в виде равенства. Писанины там немного, но вот без правила множителей Лагранжа обойтись вряд ли удастся.
Решение
Пусть нам необходимо максимизировать функцию f(x,y) = − 5x2 + 2xy − 3y2 при условии x − y + 1 = 0.
Запишем функцию Лагранжа .
Приравняем частные производные к нулю:
.
Линейная регрессия
Даны 3-4 точки в двухмерном пространстве - одна координата, это х, другая - t. Задача построить по ним линейную регрессию вида , т.е. найти коэффициенты k и b.
Решение
Подставляем значения для xi и ti, получаем k, затем b. Решение проверено на нескольких наборах данных в MATLAB.
Еще один вариант - посчитать напрямую (k,b) = (XTX) − 1XTY, где X - матрица, первый столбец которой составлен из xi, второй - из единиц, а Y - столбец из ti.