6.2. Критерии качества и правила приема дискретных сообщении
Рассмотрим сначала упоминавшийся и широко распространенный критерий Котельникова или идеального наблюдателя, согласно которому качество демодулятора оценивают безусловной вероятностью правильного приема символа.
Будем вначале полагать, что пространство передаваемых и принимаемых сигналов является конечномерным евклидовым. Это может быть, например, пространство финитных сигналов, представляемых конечной тригонометрической суммой. В дальнейшем это ограничение будет отброшено.
В n-мерном пространстве случайный сигнал z(t) характеризуется я-мерной плотностью вероятностей вектора z : w (z). Ее можно рассматривать как плотность вероятности коэффициентов разложения z(t) по любому ортонормированному базису. Если передается некоторый символ bi, т. е. посылается сигнал ui(t), то можно определить условную n-мерную плотность вероятности w{z|bi} - функцию правдоподобия i-й гипотезы (i = 0, 1, ..., m - 1) аналогично (5.12).
Пусть на вход демодулятора в течение тактового интервала 0-Т приходит некоторый элемент сигнала z(t). Предположим, что демодулятор принимает при этом решение, что передан символ bi. Вероятность того, что это решение правильно, очевидно, равна условной вероятности того, что действительно передавался символ bi, при условии прихода реализации элемента сигнала z(t), P(bi|z). Ее называют обычно апостериорной вероятностью символа bi (т. е. вероятностью, определенной после опыта, заключающегося в наблюдении и анализе сигнала z(t)).
Очевидно, что вероятность правильного приема будет максимальной в такой решающей схеме, которая относит всякую реализацию элемента приходящего сигнала z(t) к той области B̂i для которой апостериорная вероятность P(bi|z) максимальна. Другими словами, критерий идеального наблюдателя обеспечивается решающей схемой, построенной по правилу максимума апостериорной вероятности - решение bi принимается в том случае, если выполняется система из m-1 неравенств:
Для сокращения запишем это правило в такой форме:
Для двоичной системы сигналов упомянутое правило сводится к проверке неравенства
Р (1|z) > Р (0|z), (6.4)
При выполнении неравенства (6.4) регистрируется символ 1, в противном случае символ 0.
Согласно известной формуле Байеса
Р (bj|z) = [Р (bj) w (z|bj)/w (z)], (6.5)
где P(bj) - априорная вероятность передачи символа bj (т. е. та вероятность, которая имеет место до наблюдения и анализа, определяемая статистикой источника сообщения и правилом кодирования).
Подставив (6.5) в (6.3) и учитывая, что w(z)-безусловная плотность вероятности, не являющаяся функцией j, можно записать правило решения по критерию идеального наблюдателя в следующей форме:
Р (bi) w(z|bi) > P (bj) w (z|bj),
i = 0, 1, ... , m - 1 ; j≠i, (6.6)
или сокращенно max[P (bi)w (z|bi)].
Для двоичной системы правило (6.6) сводится к проверке неравенства
Р (1) w (z|1) > Р (0) w (z|0), (6.7)
при выполнении которого регистрируется символ 1, а при невыполнении - 0.
Для построения решающей схемы по правилу (6.6) необходимо знать априорные вероятности символов P(bj), а также свойства модулятора и канала, определяющие условные плотности w (z|bj) - функции правдоподобия.
Правило (6.6) можно записать иначе - решение о том, что передавался символ bi, и должно приниматься, если для всех j≠i выполняется m-1 неравенств:
Отношение в левой части этого неравенства называется отношением правдоподобия двух гипотез о том, что передавался символ bi и о том, что передавался символ bj. Его обозначают Λi,j.
В случае, когда все m символов передаются равновероятно, т. е. Р(bi) = Р(bj) = 1/m, правило (6.8) упрощается:
Λi,j>1, (6.9)
Иногда вводят в рассмотрение помимо m гипотез о передаче символов bi (i = 0, 1, m-1) еще дополнительную "шумовую" гипотезу о том, что никакой сигнал не передавался, т. е. z(t) = n(t) - чистая помеха*. Отношение правдоподобия
обычно обозначают просто Λi, тогда правило (6.9) можно записать так:
Λi>Λj при всех j≠i, (6.10)
или короче
Такое правило максимума правдоподобия реализует критерий идеального наблюдателя только при том условии, что все символы передаются равновероятно**.
* (Следует иметь в виду, что в системах с AM дополнительная гипотеза может соответствовать одной из позиций сигнала.)
** (Вместо неравенств (6.10) можно было бы просто записать w(z|bi)>w(z|bj). Сравнение отношений правдоподобия вместо сравнения условных плотностей вероятностей вызвано тем, что понятие отношения правдоподобия можно в известном смысле распространить и на сигналы из бесконечномерного гильбертовского пространства, для которых понятие плотностей вероятности w(z), w(z|bi) теряет смысл. Как это делается, будет показано в § 6.3.)
Для двоичной системы правило (6.10) сводится к проверке неравенства
Λ1>Λ0. (6.11)
Как отмечалось, критерий идеального наблюдателя не является единственным разумным критерием оптимальности решающей схемы. Дело в том, что во многих случаях различные ошибки приводят к различным последствиям. Например, в системе автоматической пожарной сигнализации опаснее не обнаружить сигнал о пожаре, нежели получить ложную тревогу, когда в действительности пожара нет.
Учет последствий ошибок различного рода (связанных с передачей различных символов) приводит к обобщению критерия идеального наблюдателя, известного под названием критерия минимального среднего риска (или байесовского критерия). Введем некоторые понятия. Если при передаче символа bi принят символ b̂j, то при i≠j имеет место ошибка. Чтобы учесть не равноценность различных ошибок, будем с каждой парой символов b̂j и bi связывать некоторую численную величину, называемую "потерей", обозначив ее Lij. Величина "потери" зависит, таким образом, от того, какой символ b̂j принят вместо переданного bi. Правильному приему при этом обычно приписывается нулевая "потеря". Значения Lij определяются в каждом конкретном случае важностью правильного приема данного элемента сигнала и величиной опасности различных ошибок.
Так как при передаче символа bi символы b̂j появляются с определенными вероятностями как реализации некоторой дискретной случайной величины, можно говорить об условном математическом ожидании величины "потери" при передаче конкретного символа bi. Назовем это условное математическое ожидание условным риском:
Интеграл в (6.12) берется по области B̂j решающей схемы и представляет вероятность того, что сигнал z(t) попал в эту область, если передавался символ bi. Усреднив условный риск Ri по всем символам bi, получим величину, называемую средним риском:
Критерий минимального среднего риска заключается в том, что оптимальной считается решающая схема, обеспечивающая наименьшее значение среднего риска Rcр. Приемник, работающий по такому критерию, называют байесовским.
Из (6.13) видно, что при использовании этого критерия нужно помимо априорных вероятностей P(bj) передачи отдельных символов знать и величины потерь Lij. Заметим, что если считать все ошибки равноценными (Lij=const при j≠i и Lii = 0), то критерий минимального среднего риска совпадает с критерием идеального наблюдателя, а байесовский приемник совпадает с идеальным приемником Котельникова. В общем же случае в оптимальном байесовском приемнике чаще будут возникать ошибки, связанные с малыми потерями, и реже - с большими потерями.
Ситуация, в которой практически невозможно определить априорную вероятность передачи отдельных элементарных сообщений, а последствия ошибок разного рода неодинаковы, особенно типична для радиолокации, когда приемник, анализируя принимаемое колебание z(t) (отраженный сигнал плюс помеха), должен определить, имеется в данном направлении и на данном расстоянии объект наблюдения (цель) или нет. Как правило, априорная вероятность р(1) наличия отраженного от цели сигнала (передачи символа "1") заранее неизвестна. Последствия двух родов ошибок - ложной тревоги (приемник фиксирует, что цель существует, в то время как в действительности ее нет) и пропуска цели (приемник отмечает отсутствие цели, в то время как фактически она имеется) - неравноценны.
В этой и других сходных ситуациях чаще всего пользуются критерием приема, известным под названием критерия Неймана - Пирсона. Суть его заключается в том, что решающая схема считается оптимальной, если при заданной вероятности ложной тревоги рл.т обеспечивается минимальная вероятность пропуска цели рпр. Введем в рассмотрение функции правдоподобия гипотезы об отсутствии цели w(z|0) и о наличии цели w(z|1).
Очевидно, что можно различными способами разбить пространство принимаемых колебаний z(t) на две области: B̂0 (область решения об отсутствии цели) и B̂1 (о наличии цели) -так, чтобы вероятность ложной тревоги
равнялась заданной величине. Поскольку в локации символ "0" (отсутствие цели) передается паузой, то w(z|0)-это плотность распределения помехи. Следовательно, вероятность ложной тревоги определяется вероятностными характеристиками помехи и выбором области B̂1. Но от выбора этой области зависит и вероятность пропуска цели:
Интегралы в (6.14), (6.15) и в аналогичных других формулах, взятые по векторной переменной, очевидно, n-кратные.
Минимизация (6.15) при заданной величине (6.14) достигается, если решение о наличии цели принимается при выполнении неравенства
Существуют и другие критерии качества приема, не требующие знания априорных вероятностей символов.
В технике связи преимущественно применяют правило максимального правдоподобия (6.10), (6.11). В том случае, когда все символы передаются равновероятно, правило максимального правдоподобия реализует критерий идеального наблюдателя. Однако очень часто это правило решения применяют и при неизвестных или известных, но не одинаковых, априорных вероятностях символов. Конечно, оно не обеспечивает в этих случаях максимума вероятности правильного приема. Изменив решающую схему на схему, построенную по правилу максимальной апостериорной вероятности (6.4), реализующему критерий идеального наблюдателя, можно было бы уменьшить вероятность ошибок. При этом, очевидно, пришлось бы сократить области приема маловероятных и расширить области высоковероятных символов. В результате редко передаваемые символы принимались бы менее надежно, нежели часто передаваемые. Но редкие символы несут больше информации, чем частые [см. ф-лу (4.1)]. Поэтому переход от правила максимального правдоподобия к правилу максимальной апостериорной вероятности, хотя и уменьшает безусловную вероятность ошибки, может привести к увеличению потери информации при демодуляции. Легко показать, что правило максимального правдоподобия реализует критерий минимума среднего риска (6.13), если положить Lij = 0 при i=j и Lij = 1/P(bi) при i≠j.
Вследствие сказанного будем в дальнейшем пользоваться, если не оговорено обратное, правилом максимального правдоподобия и решающую схему, реализующую травило (6.10), называть оптимальной.