19.10.22

После 24 февраля и фактически отказа Microsoft работать в России, в сфере бизнес-аналитики произошел качественный перелом.

Россия вынужденно отказывается от засилья иностранных вендоров:

  • Microsoft Power BI;
  • Tableue;
  • Qlik sense.

Но вот в чью пользу?

Я бы сказал так, что BI-рынок в России разделился на три сегмента:

  • тяжелые аналитические системы, работающие с госкорпорацими и компаниями, имеющими Х миллионов денег на внедрение:
    • Visiology;
    • Форсайт;
    • Almaz BI;
    • N3;
    • и многие другие.
  • OpenSource - проекты:
    • Apache Superset;
    • Grafana;
  • Yandex Datalens.

К сожалению, 99% всех российских решений не предполагает легкости внедрения и доступности для простого обывателя (как это было с тем же Power BI Pro за 10$ в месяц).

Остаются или Opensource - проекты или решение от Яндекса

image1.png

image2.png

image3.png

В чем же различия?

Мы рассмотрели у себя внутри компании и попробовали запустить несколько проектов на двух системах:

  • Apache Superset;
  • Yandex Datalens.

Рассмотрим Apache Superset и Yandex Datalens


Возможность

Apache Superset

Yandex Datalens

Стоимость Бесплатно. Есть платная облачная версия Бесплатно
Размещение Размещается на серверах Заказчика Доступен только в экосистеме Yandex Cloud (только облако)
Сложность развертывания Требует квалифицированного внедрения Продукт сразу же готов к использованию
Источники данных
  • PostgreSQL;
  • ClickHouse;
  • MySQL;
  • MS SQL;
  • Vertica;
  • Greenplum;
  • IBM DB2;
  • Oracle;
  • и многие другие.
  • PostgreSQL;
  • ClickHouse;
  • MySQL;
  • MS SQL;
  • Greenplum;
  • IBM DB2;
  • Oracle;
  • CSV;
  • Google Sheets
  • и несколько сервисов Яндекса, вроде Яндекс.метрики, YDB и т.д.
Общая схема работы Database -> Dataset -> Chart -> Dashboard Подключение -> Датасет -> Чарт -> Дашборд
Интерактивность в дашбордах
  • Cross Filtering (когда вы выделяете данные внутри одного чарта и выделение влияет на отображение других чартов);
  • Слайсеры (фильтры).
  • Слайсеры (фильтры).
Страницы Есть Есть
Материализация Условно да Есть (разовая и по расписанию)
Параметры Есть в формате jinja (сложно, но можно) Есть, как добавляемые параметры на уровне чарта или датасета
На чем сделан Python и иже с ним Разработка Яндекс
Наличие ETL Нет В экосистеме Yandex Cloud масса вариантов - от servless и Yandex Data Platform и до установки своей виртуальной машины с тем, что ваша душа пожелает (у себя или в облаке Yandex)

 Работа с данными 1С 8  Да, при использовании "Экстрактора 1С 8 в BI"  Да, при использовании "Экстрактора 1С 8 в BI"
Встроенная аналитическая СУБД Нет Предположительно нет, но для материализации и судя по набору функций - внутри все таки используется (как-то) ClickHouse
Где происходит весь расчет, агрегация данных На уровне подключаемой СУБД На уровне подключаемой СУБД
Функции агрегации данных
  • SUM;
  • AVG;
  • COUNT;
  • COUNT_DISTINCT;
  • MAX;
  • MIN.
  • SUM;
  • SUM_IF;
  • AVG;
  • AVG_IF;
  • MIN;
  • MAX;
  • COUNT;
  • COUNTD;
  • COUNT_IF;
  • COUNTD_IF;
  • MEDIAN;
  • QUANTILE;
  • VAR;
  • STDEV;
  • и т.д.
Вычисление скользящей средней Только средствами СУБД Средствами СУБД и с помощью M-функций
Накопительный итог (расчет остатка и т.д.) Только средствами СУБД Средствами СУБД и с помощью R-функций
Лаг (получение значения со смещением) Только средствами СУБД
  • LAG;
  • LAST;
  • FIRST.
LOD - функции Только средствами СУБД все функции (SUM, MAX, MIN, AVG, COUNT, COUNTD) поддерживают префильтацию, включение/исключение измерений для расчета функций
Ранжирование значений Только средствами СУБД

Средствами СУБД и RANK (аж в четырех вариациях)

Функции даты и времени Только средствами СУБД Набор из более чем десятка встроенных функций, вроде DATETRUNC, DATEPART, MONTH, YEAR и т.д.
Работа с массивами Не нашел Порядка 15 функций
Работа с картами Есть Есть и не только:

- Нативная поддержка Яндекс-карт;

- Большой набор функций по работе с преобразованием адресов, готочек, геополигонов.

Набор доступных визуализаций Очень много, можно дописывать и добавлять свои Ограниченный набор
Ввод и изменение данных (Write-Back) Нет Нет
Что понравилось
  • Крутая визуализация Сводной таблицы;
  • Кросс-фильтеринг - удобно;
  • То, что будет размещено у тебя на серверах.
  • Богатый набор функций;
  • Быстрота развертывания;
  • Работа с параметрами.
Что не понравилось

Это просто система визуализации, к BI - отношения не имеет. Очень сложно развертывается, нет оконных функций.

Очень простенькая Сводная таблица и отсутствие кросс-фильтеринга
Комьюнити Есть только Telegram-канал и зарубежные источники. На GitHub активность невысокая, хотя новые версии регулярно появляются.
  • Есть Telegram-канал;
  • Есть очень хорошая поддержка со стороны Яндекса;
  • Вебинары;
  • Продукт хорошо развивается;

Внедрение Yandex Datalens компанией ДЕНВИК

В результате сравнения двух систем мы выбрали для себя Yandex Datalens. Этот сервис прост в настройке, обладает широким функционалом, а также поддерживается разработчиками. Своим клиентам мы предлагаем использовать следующую связку:
  1. Хранилище данных на PostgreSQL или ClickHouse;
  2. ETL – скрипты и Python;
  3. BI-система – Yandex Datalens;
  4. Использование Экстрактора (более удобный вариант) для выгрузки данных из 1С.
Обращайтесь в наш отдел продаж для внедрения в своей компании системы бизнес-аналитики Yandex Datalens.

Получить консультацию
Наши менеджеры ответят на все вопросы, произведут расчет стоимости услуг и подготовят коммерческое предложение!
Заказать проект

Это интересно