ARENADATA
Arenadata Hadoop (ADH) — это интегрированный набор компонентов корпоративного уровня на базе решений с открытым исходным кодом. Платформа включает в себя все необходимые компоненты для работы с данными: управление, доступ, анализ, интеграция, безопасность и администрирование. Основная идея дистрибутива заключается в обеспечении возможности работы с любыми типами и форматами данных путем комбинированного использования различных технологических решений и архитектур обработки данных.
В 2016 году дистрибутив Arenadata Hadoop 1.3.2 прошел сертификацию и получил подтверждение о полном соответствии стандартам Open Data Platform Initiative (ODPi) — крупнейшего мирового сообщества разработчиков проектов хранения больших данных с открытым кодом под эгидой Linux Foundation.
В отличие от других корпоративных дистрибутивов, представленных на рынке, Arenadata Hadoop обладает рядом особенностей:
Arenadata Hadoop обеспечивает полный набор возможностей и инструментов для автоматического развертывания компонентов как на ≪голом железе≫, так и на виртуальных машинах (в облаке). Средства мониторинга и управления конфигурацией кластера позволяют оптимизировать производительность для всех компонентов системы. Оригинальная документация на русском языке позволяет облегчить процесс планирования и разворачивания кластера Hadoop. Инструкция может быть полезна администраторам, программистам, разработчикам и сотрудникам подразделений информационных технологий, осуществляющих внедрение и сопровождение кластеров Arenadata.
Базовая архитектура системы аналогична Apache Hadoop, и подробнее описана в соответствующем разделе. (Основа — Hadoop Common, HDFS, YARN; экосистема включает в себя более десятка подпродуктов. Фундаментом является распределенная файловая система HDFS, ключевой функционал СУБД обеспечивается HBase).
Экосистема Аренадаты:
Технические возможности соответствуют стандартному функционалу Apache Hadop (см. соответствующий раздел — JOIN HIVE, MERGE и UPDATE для ACID-таблиц; операторы над множествами; оконные функции; индексация отсутствует; конфигурация оптимизатора; промежуточные результаты агрегации; кастомные параметры на кластере; отказоустойчивость средствами СУБД; Zeppelin для DDL и запросов в графическом интерфейсе).
Дополнительно введена следующая возможность:
Для администратора СУБД:
Скриншот Arenadata Cluster Manager