Speaker
Description
В данной работе исследуются методы машинного обучения для решения задачи идентификации частиц в детекторе SuperFGD эксперимента T2K на основе реконструированных методом Монте-Карло треков. Представлен сравнительный анализ базовых моделей машинного обучения и нейросетевых подходов, а также предложена оригинальная гибридная нейросетевая архитектура.
Данная архитектура объединяет два взаимодополняющих компонента: блок на основе Transformer для обработки последовательности упорядоченных узлов трека и параллельный блок, анализирующий глобальные скалярные характеристики события, связанные с общей геометрией и энергетикой трека. Для инициализации Transformer-энкодера применялась методика предварительного обучения в самоконтролируемом режиме на задаче восстановления маскированных узлов трека без привлечения размеченных данных о типе частицы.
Второй ключевой аспект исследования посвящён проблеме интерпретируемости решений нейросетевой модели. В работе реализуется и применяется perturbation-based подход к интерпретации нейросетевых моделей, направленный на количественный анализ вклада физических признаков трека в отклик модели и процесс идентификации частиц.