Взвешенная погрешность — новая метрика для оценки качества валидации ответов в задаче вопросно-ответного поиска - page 5

На основе этой таблицы определяются традиционные метрики ка-

чества классификации:

Accuracy

;

Error

= 1

−

Accuracy

;

P recision

;

Recall

;

(1 +

)

P recision

∙

Recall

P recision

Recall

(1 +

)

(1 +

)

∙

где коэффициент

[0; +

∞

)

может рассматриваться как относитель-

ная степень важности показателей полноты и точности. При

= 1

точность вдвое важнее полноты, при

= 2

полнота вдвое важнее

точности.

В случае задачи валидации ответов показатель точности является

более важным, чем показатель полноты: задача вопросно-ответного

поиска разбивалась на две крупные фазы — генерацию гипотез-ответов

и проверку гипотез-ответов. Для первой фазы важным показателем

качества являлась полнота, для второй — точность [5].

Если рассмотреть модуль валидации как фильтр неверных ответов,

то задачей этого фильтра является уменьшение числа ошибок первого

рода

(

)

, может быть даже в ущерб сокращению ошибок второго рода

(

). Чтобы правильно сбалансировать эти два показателя, разложим

погрешность (

Error

) на сумму двух составляющих, соответствующих

ошибкам первого и второго рода:

Error

;

Error

Чтобы подчеркнуть важность ошибок первого рода для задачи

валидации, можно определить взвешенную погрешность, в которой

ошибки первого и второго рода будут иметь разные веса:

∙

+ 1

∙

+ 1

∙

(

+ 1)

∙

(

) +

∙

;

здесь коэффициент

[0; +

∞

)

имеет тот же смысл, что и

-мере — относительная степень важности ошибок первого и вто-

рого рода. При

= 1

ошибки второго рода вдвое важнее (менее

62 ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2013. № 1

SEO Version

Warning.

You are currently viewing the SEO version of !text.
It has a number of design and functionality limitations.

We recommend viewing the Flash version or the basic HTML version of this publication.

1,2,3,4 6,7