Реализация масштабного аналитического проекта силами исключительно штатных сотрудников компании среднего бизнеса — сложный путь, который часто приводит к затягиванию сроков. Чтобы внедрение витрины на базе DWH прошло успешно, необходимо следовать проверенной методологии, состоящей из трех последовательных шагов.
Шаг 1. Аудит текущих источников и проектирование архитектурыПрежде чем приступать к написанию программного кода и развертыванию инфраструктуры хранилища DWH, важно провести аудит всех существующих информационных систем компании. На этом этапе ИТ-специалисты проводят аудит всех существующих ИТ-источников и определяют:
- Из каких систем-источников будут поступать данные в хранилище;
- Какова структура этих источников и баз данных (CRM, «1С», файлы Excel);
- Какие требования предъявляются к качеству загружаемой информации.
На основе проведенного аудита проектируется будущая архитектура ИТ-хранилища, которая должна гибко масштабироваться по мере дальнейшего роста масштабов бизнеса компании. Также прорабатывается единый глоссарий бизнес-метрик, чтобы исключить разночтения показателей, которые используют разные отделы для аналитики.
Шаг 2. Выбор платформы и организация ETL-процессовНа втором этапе необходимо определиться, где именно будет развернуто корпоративное хранилище данных DWH — на собственном сервере компании (on-premise) или в облаке. Облачное Data Warehouse для среднего бизнеса часто оказывается более выгодным решением, поскольку снижает капитальные затраты на старте и позволяет быстро наращивать мощности.
После выбора платформы хранилища DWH настраиваются процессы ETL (Extract, Transform, Load) — извлечение информации из различных источников, ее преобразование, очистка и последующая загрузка в хранилище. Для этой задачи используют как готовые open-source инструменты (например, Apache Airflow, NiFi), так и специализированные коммерческие решения. Настройка качественного ETL-процесса гарантирует, что в центральном хранилище DWH будут находиться только проверенные и структурированные данные.
Шаг 3. Создание пилотной витрины для одного отделаПопытка объединить абсолютно все данные компании в единое хранилище за один раз — классическая ошибка внедрения, которая часто губит аналитические проекты. Правильный подход состоит в том, чтобы двигаться поэтапно. Начните с создания пилотной витрины данных для одного конкретного подразделения компании — например, для отдела продаж или маркетинга.
Локальная витрина данных решает вполне определенные бизнес-задачи анализа эффективности конкретной команды. Быстрый запуск пилотного проекта позволяет сотрудникам компании сразу оценить удобство работы с новыми инструментами аналитики, а руководству — увидеть первые результаты инвестиций. После успешной обкатки пилота архитектуру хранилища DWH можно масштабировать, подключая новые базы данных и создавая витрины данных для других департаментов.