yakov_a_jerkov | Программирование/математика

На совсем другую тему. У меня есть вопрос об описании одного алгоритма. Я положу это все под кат.

Я читаю статью "Towards Open Set Deep Networks" с целью применить содержащуюся в этой статье идею для отбрасывание картинок, не принадлежащих ни к одному из классифицируемых классов.

Возможно, то, что это все для классификации, networks эти -- возможно, этого всего даже не нужно знать, чтобы ответить на мой вопрос.

Вроде бы, статья весьма просто написана, и идея, вроде, мне понятна -- по крайней мере, я думаю, что понятна. Но я не могу понять описанные в этой статье алгоритмы. Мне кажется, что дело в том, что я не понимаю notation, но может я и чего-то более фундаментального не понимаю. В общем, если кому-то написанное понятно, то я был бы благодарен за помощь.

Я вставлю сюда первый алгоритм, как картинку.

Я плохо понимаю значение i. x_i_j -- это что, все inputs, которые сеть классифицирует, как класс j? И, соответственно, S_i_j -- это что? Согласно определения, получается, что j-координата activation of x_i_j.

Дальше, mu_j -- это вектор или число? По идее, как я ее понимаю, должен быть вектор, но по определению вроде как число, или нет?

Что такое S_hat? Я нигде не вижу определения, вообще.

Идею я понимал так. Для каждого класса берем activation vectors всех inputs, которые сеть классифицирует как данный класс. По каждой координате отдельно вычисляем mean, и таким образом получаем mean activation vector для этого класса. А потом уже смотрим на distribution расстояний этих верно классифицированных inputs до mean activation vector.

Но сейчас я уже сомневаюсь, что правильно понял.

Flat | Top-Level Comments Only

Yeah, может быть, что и стандарт. Я потому и спросил, что может кто-то сразу узнает.

Мне, собственно, и до S_hat непонятно. Как я понимаю общую идею, я написал. Но, возможно, я ее не совсем правильно понимаю.

Упоминание extreme value fit наводит меня на мысль что речь может и вовсе идёт функциях. Т.е Может v_j(.) на выходе для каждого x_ij выдаёт функцию? Тогда и mu_j - это усреднённая функция. В общем, закругляюсь от бесполезности предположений не привязанных к контексту. Может кто-то непосредственно этим занимается или хотя бы почитывает

Нет, activation, v(x) -- это вектор с количеством координат равным количеству классов, которые сеть классифицирует. v(x) -- это то, что на выходе, на последнем шаге, грубо говоря, сеть смотрит какая координата имеет самое большое значение, и, если это координата j, то говорит, что картинка принадлежит к классу j.

Я изначально думал, что mu_j -- это среднее значение (покоординатно) всех activation vectors для класса j (правильно классифицированных inputs). Но сейчас уже не уверен.

Программирование/математика

no subject

no subject

no subject