В рамках проходящей в эти дни в Москве выставки Securika группа компаний ЦРТ впервые продемонстрировала новое решение, объединившее возможности компьютерного зрения и обработки естественного языка, — «Визирь.VLM» (Vision Language Model. Как сообщает пресс-служба разработчика, созданное на базе биометрической системы компьютерного зрения «Визирь» с поддержкой большой языковой модели решение обрабатывает визуальные данные (изображения, видео) и текстовую информацию в едином контуре.
По словам генерального директора группы компаний ЦРТ Дмитрия Дырмовского, визуально-языковая модель может анализировать причины инцидентов и предлагать решения, экономя более 90% времени операторов мониторинговых центров, тем самым существенно оптимизируя ресурсы для эффективного управления территорией.
По словам генерального директора группы компаний ЦРТ Дмитрия Дырмовского, визуально-языковая модель может анализировать причины инцидентов и предлагать решения, экономя более 90% времени операторов мониторинговых центров, тем самым существенно оптимизируя ресурсы для эффективного управления территорией.
«Решение может помочь не только обрабатывать кадры с помощью видеоаналитики, «видеть» и понимать увиденное, выстраивая смысловые связи, но и давать развернутые ответы о происходящем, подобно человеку. Все это позволяет строить универсальную аналитику — от безопасности до проактивного управления городом», — подчеркнул он.
Отмечается, что что текущее состояние систем видеомониторинга предполагает высокую степень участия человека: ручную обработку и анализ массива данных, поиск и реагирование на правонарушения. «Визирь.VLM» позволяет задавать любые вопросы на естественном языке, анализирует поведение и предоставляет готовые ответы там, где раньше требовалась ручная работа оператора.
Источник фото: pxhere.com.