Основные вызовы при построении современных платформ для
анализа данных
Растёт количество бизнес-задач, решаемых с помощью продвинутой аналитики и количество специалистов, вовлечённых в эти проекты. Поэтому управление этим процессом должно быть удобным и проходить без лишней бюрократии
С каждым днём появляется всё больше нишевых инструментов, заточенных на ту или иную подзадачу в процессе анализа данных. У специалистов Data Science должен быть доступ ко всем этим инструментам без трудностей для IT-служб
Для промышленного использования результатов анализа данных требуется непрерывный мониторинг метрик и сквозной контроль всего процесса принятия решений на базе модели: от инфраструктуры и качества данных до итоговых бизнес-показателей
Для воспроизводимости и объяснимости результатов проектов по анализу данных требуется каталогизация кода, датасетов и всех артефактов, включая переменные моделей, документацию и принятые решения