Ниже описаны ключевые научные и/или научно-технические проекты.
1. Предиктивная аналитика технических систем.
Проект связан с исследованием и оптимизацией алгоритмов анализа данных для задач предиктивной аналитики. Основная цель проекта – создание платформы по предиктивной аналитике технических систем для предсказания возможных аварий и поломок и проведения предиктивного ремонта, что в целом приведет к увеличению срока службы оборудования. Основные трудности связаны с тем, что, во-первых, собираемые с устройств данные разнообразны и уникальны для каждого типа оборудования, во-вторых, каждый тип данных (в т.ч. их особенности) оптимальным образом обрабатываются различными алгоритмами, что не позволяет применить универсальный алгоритм. Для преодоления существующих трудностей планируется исследование выбора оптимальных алгоритмов для каждого типа данных и их особенностей. Данная технология является сквозной и может быть применена для всех рынков НТИ в целях реализации других НИР.
2. Система автоматического поиска уязвимостей в веб-приложениях.
Реализация проекта направлена на создание высокотехнологичного программно-аппаратного комплекса (в его основе лежит подход тестирования методом «черного ящика» (фаззинг) динамических приложений, с обратной связью по коду для оценки покрытия кода примерами, т. н. coverage guided fuzzing) для решения задачи автоматического непрерывного обнаружения уязвимостей в веб-приложениях. Технологии автоматического поиска уязвимостей веб-приложений, как правило, связаны с задачами анализа больших объемов кода современных приложений и поиска отклонений. Одним из главных технологических барьеров, на решение которого направлен разрабатываемый продукт, является возможность автоматического обнаружения уязвимостей в веб-приложениях с большими объемами программного кода.
3. Облачные технологии обработки и интерпретации медицинских диагностических изображений на основе применения средств анализа больших данных.
Целью проекта является разработка наукоемкого программного комплекса, обеспечивающего создание систем поддержки принятия врачебных решений в персонализированной медицине по наиболее критичным нозологиям на основе анализа больших данных, получаемых при использовании облачных и телемедицинских технологий в целях автоматизированной диагностики медицинских диагностических изображений.
4. Средства интеллектуального анализа больших массивов текстов.
Данный проект напрямую связан со всеми остальными, так как в последнее время анализ текста привлекает все больше внимания в различных областях, таких как безопасность, коммерция, наука и экология. Непрерывное накопление текстовых данных и активный рост рынка больших данных делают необходимым разработку методов интеллектуального анализа текстов для обеспечения эффективной работы с большими объемами текстов.
5. Математические основы интеллектуального анализа больших данных.
Проект направлен на совершенствование методов, алгоритмов и программных средств интеллектуального анализа данных (ИАД). Сложность и разнообразие методов ИАД требуют создания специализированных инструментов для конечного пользователя, с помощью которых будет решена поставленная задача. Основные цели в рамках данного направления: развитие и создание новых методов и алгоритмов анализа структурированных и неструктурированных данных; разработка программных средств обработки распределенных данных больших объемов; применение созданных средств при решении прикладных задач.
6. Новые подходы к проектированию систем считывания для технологии сверхстабильной трехмерной оптической памяти с многоуровневым кодированием на носителях из стекла.
Разработки по данному направлению будут использованы во многих проектах, связанных с большими данными, для сбора и анализа которых необходимо емкое и надежное хранилище, отвечающее современным стандартам скорости записи и обработки информации.
7. Мониторинг и стандартизация развития и использования технологий хранения и анализа больших данных в цифровой экономике Российской Федерации.
Проект направлен на разработку и реализацию комплексной системы мониторинга процессов развития и использования технологий хранения и анализа больших данных в Российской Федерации. Эта система может широко использоваться на практике государством, корпоративными клиентами и научно-образовательным сообществом.
8. Интеллектуальный анализ больших данных в задачах экологии и охраны окружающей среды.
Количество собираемых больших экологических данных и интерес к сфере со стороны ученых являются причинами динамичного развития рынка охраны окружающей среды. Данный проект направлен на разработку методов и алгоритмов интеллектуального анализа больших данных применительно к задачам экологии и охраны окружающей среды. Разработанные методы и алгоритмы анализа больших данных найдут применение в эколого-аналитических центрах для увеличения точности прогнозов и более эффективного сбора и анализа информации о состоянии экологии на планете.