Создание кластера ClickHouse

Чтобы создать кластер:

  1. Выберите проект, в котором нужно создать кластер.
  2. В главном меню портала перейдите в раздел Ресурсы → Базы данных → Managed Service for ClickHouse.
  3. Нажмите на кнопку Подключить или на кнопку Создать кластер, если в проекте уже есть созданный кластер.
  4. Заполните поля:

    Базовые параметры:
    • Название кластера * — уникальное имя кластера в рамках проекта. Введите название или нажмите Сгенерировать название, чтобы сформировать название кластера вида clickhouse-<номер>, например, clickhouse-0001. Последующим кластерам будут присваиваться названия с увеличивающимся порядковым номером;

      1. Длина имени — от 3 до 64 символов.
      2. Может содержать прописные и строчные буквы латинского алфавита, цифры, дефисы и символы нижнего подчёркивания.
    • Описание кластера — заполняется при необходимости;
    • Версия ClickHouse * — доступная версия ClickHouse.
  5. Нажмите на кнопку Вперед. Заполните поля:

    Параметры виртуальной машины:
    • Количество нод в кластере * — от 1 до 7;
    • Зона доступности * и Дата-центр *зона доступности и ЦОД, в котором будет находиться кластер;
    • Подсеть * — подсеть, к которой будет подключен кластер;
    • Включить Публичный IP-адрес активируйте переключатель, если к кластеру нужен доступ из сети Интернет. После создания кластера публичный IP-адрес отображается на вкладке Информация;
    • Ограничение скорости, Мбит/сек — ограничение скорости интернет-трафика на подключаемом IP-адресе. Значение должно быть кратно 100;
    • Выбрать группу безопасности из доступных — активируйте переключатель и выберите группу безопасности. Если нужной группы безопасности нет, создайте её. Если переключатель не активирован, новая группа безопасности создаётся автоматически;
    • Группа безопасности сетевого интерфейса * — правила для управления сетевым интерфейсом кластера.

      Важно

      Чтобы подключиться к кластеру, у группы безопасности должно быть правило, разрешающее входящий трафик по порту 9000 для протокола TCP. Подробнее см. раздел Доступ к кластеру ClickHouse.



    Вычислительные ресурсы:
    • Тип:
      • Публичные — для публичного облака;
      • Персональные — для частного облака;
    • Семейство — семейство процессоров:
      • General-purpose — процессоры с частотой 2.2 GHz с конфигурациями b2, с частотой 2.8 GHz с конфигурациями b5 и процессоры с частотой 3.0 GHz с конфигурациями b3. Подходит для решения большинства задач, например, выполнения кода для веб-сервисов и приложений, размещения интернет-магазинов, создания тестовых сред;
      • Advanced — процессоры с частотой 3.0 GHz с конфигурациями a1 и процессоры с частотой 2.8 GHz с конфигурациями a5. Подходит для работы высоконагруженных систем, например, CRM и баз данных;
    • Серия * — серия процессоров. Процессоры отличаются частотой, от которой зависят производительность сервера и скорость обработки данных:
      • Intel Cascade Lake 2.2 GHzдля небольшой нагрузки;
      • Intel Ice lake 2.8 GHz — подходят для большинства задач;
      • Intel Cascade Lake 3.0 GHz — для обеспечения высокой скорости обработки данных. Например, при работе с Microsoft SQL и 1С;
    • vCPU, шт. — количество процессоров;
    • RAM, ГБ — объём оперативной памяти;
    • Выбрана конфигурация конфигурация сервера определяется автоматически на основании выбранного количества процессоров (vCPU) и объёма оперативной памяти (RAM). Подробнее см. раздел Конфигурации сервера.


    Объём хранилища
    :
    • Размер диска, ГБ * — размер выделенной памяти на каждой ноде кластера, от 25 ГБ до 2048 ГБ;
    • Тип диска *:

      • Average cluster 2 - IOPS Read: 10000 IOPS Write: 3000;
      • Average cluster 4 - IOPS Read: 10000 IOPS Write: 3000;
      • High cluster 4 - IOPS Read: 15000 IOPS Write: 5000;
      • High cluster 5 - IOPS Read: 15000 IOPS Write: 5000;
      • High cluster 6 - IOPS Read: 15000 IOPS Write: 5000.


        IOPS — операции чтения и записи. Чем больше проводится операций чтения, тем меньше операций записи, и наоборот. При выполнении операций расходуется один и тот же дисковый ресурс.

        Примечания

        Типы дисков отличаются производительностью и количеством IOPS. Подробнее см. раздел Задержка и производительность дисков.

  6. Если в кластере 2 и более ноды, укажите параметры Координатора .

Координатор:

  • Количество нод в кластере * — 3;
  • Тип:
    • Публичные — для публичного облака;
    • Персональные — для частного облака;
  • Семейство — семейство процессоров:
    • General-purpose — процессоры с частотой 2.2 GHz с конфигурациями b2, с частотой 2.8 GHz с конфигурациями b5 и процессоры с частотой 3.0 GHz с конфигурациями b3. Подходит для решения большинства задач, например, выполнения кода для веб-сервисов и приложений, размещения интернет-магазинов, создания тестовых сред;
    • Advanced — процессоры с частотой 3.0 GHz с конфигурациями a1 и процессоры с частотой 2.8 GHz с конфигурациями a5. Подходит для работы высоконагруженных систем, например, CRM и баз данных;
  • Серия * — серия процессоров. Процессоры отличаются частотой, от которой зависят производительность сервера и скорость обработки данных:
    • Intel Cascade Lake 2.2 GHzдля небольшой нагрузки;
    • Intel Ice lake 2.8 GHz — подходят для большинства задач;
    • Intel Cascade Lake 3.0 GHz — для обеспечения высокой скорости обработки данных. Например, при работе с Microsoft SQL и 1С;
  • vCPU, шт. — количество процессоров;
  • RAM, ГБ — объём оперативной памяти;
  • Выбрана конфигурация конфигурация сервера определяется автоматически на основании выбранного количества процессоров (vCPU) и объёма оперативной памяти (RAM). Подробнее см. раздел Конфигурации сервера.

  • Размер диска, ГБ * — размер выделенной памяти на каждой ноде Координатора, от 25 ГБ до 2048 ГБ;
  • Тип диска *:
    • Average cluster 2 - IOPS Read: 10000 IOPS Write: 3000;
    • Average cluster 4 - IOPS Read: 10000 IOPS Write: 3000;
    • High cluster 4 - IOPS Read: 15000 IOPS Write: 5000;
    • High cluster 5 - IOPS Read: 15000 IOPS Write: 5000;

    • High cluster 6 - IOPS Read: 15000 IOPS Write: 5000.

      IOPS — операции чтения и записи. Чем больше проводится операций чтения, тем меньше операций записи, и наоборот. При выполнении операций расходуется один и тот же дисковый ресурс.

      Примечание

      Типы дисков отличаются производительностью и количеством IOPS. Подробнее см. раздел Задержка и производительность дисков.

7. Нажмите на кнопку Вперед.

8. Заполните поля:

Параметры базы данных:

  • Настроить СУБД — активируйте переключатель, если необходимо изменить параметры СУБД.

Примечание

Вы можете:

  • изменить значение параметра, заданного по умолчанию;
  • указать значение для незаданного параметра. Для этого удалите // перед параметром и присвойте ему значение. Например, чтобы установить максимальное время неактивности сессии — 1 час, удалите // перед параметром max_session_timeout и присвойте ему значение в секундах:

    3 max_session_timeout = 3600
  • указать дополнительные параметры, с которыми можно ознакомиться в официальной документации ClickHouse.
  • default_database база данных, к которой нужно подключаться по умолчанию, если имя базы данных явно не указано в команде;

    1. База данных должна быть создана в ClickHouse. Если указана несуществующая база данных, сервер может не запуститься или запросы будут завершаться с ошибкой.
    2. Значение чувствительно к регистру. Например, mydb и MyDB — это разные базы данных.
    3. Может быть задано значение системной базы данных (например, system), если это соответствует логике использования.
  • disableProtocols — отключение определённых сетевых протоколов (например, HTTP, TCP) для повышения безопасности:

    • http — отключение протокола HTTP;
    • tcp — отключение протокола TCP;
    • interserver — отключение межсерверного взаимодействия;

      Примечание

      По умолчанию все протоколы включены.

  • max_session_timeout — максимальное время неактивности сессии (в секундах). Примеры значений:

    • 0 — без ограничения;
    • 3600 — 1 час;
  • async_load_databases — асинхронная загрузка баз данных при старте сервера:

    • false — асинхронная загрузка выключена;
    • true — асинхронная загрузка включена;
  • max_thread_pool_size — максимальное количество потоков в пуле для выполнения запросов. Должно быть целым числом > 0. Примеры значений: 4, 16;

  • max_send_message_size — максимальный размер отправляемого сообщения в байтах. Примеры значений:

    • -1 — размер сообщений не ограничен;
    • 1048576 — 1 МБ;
    • 1073741824 — 1 ГБ;
  • max_concurrent_queries — максимальное количество одновременно выполняемых запросов. Должно быть целым числом > 0. Примеры значений: 50, 500;

  • default_session_timeout — время неактивности сессии по умолчанию (в секундах). Должно быть меньше либо равно значению параметра max_session_timeout. Должно быть целым числом ≥ 0. Примеры значений:

    • 0 — без ограничения;
    • 3600 — 1 час;
  • max_server_memory_usage — максимальное использование оперативной памяти сервером (в байтах). Должно быть целым числом ≥ 0. Примеры значений:

    • 0 — без ограничения;
    • 34359738368 — 32 ГБ;
  • uncompressed_cache_size — размер кеша для несжатых данных (в байтах). Должно быть целым числом ≥ 0. Примеры значений:

    • 0 — кеш отключен;
    • 1073741824 — 1 ГБ;
  • max_receive_message_size — максимальный размер принимаемого gRPC-сообщения в байтах. Примеры значений:

    • -1 — размер сообщения не ограничен;
    • 1048576 — 1 МБ;
    • 1073741824 — 1 ГБ;
  • total_memory_profiler_step — шаг для профилирования использования памяти (в байтах). Должно быть целым числом > 0. Примеры значений:

    • 4194304 — 4 МБ;
    • 67108864 — 64 МБ;
  • validate_tcp_client_information — проверка информации о TCP-клиенте:

    • false — проверка выключена;
    • true — проверка включена;
  • concurrent_threads_soft_limit_num — мягкое ограничение на количество одновременно работающих потоков. Должно быть целым числом ≥ 0. Примеры значений:

    • 0 — без ограничения;
    • 32;
  • builtin_dictionaries_reload_interval — интервал перезагрузки встроенных словарей (в секундах). Должно быть целым числом > 0. Примеры значений:

    • 3600 — 1 час;
    • 604800 — 1 неделя;
  • max_server_memory_usage_to_ram_ratio — отношение максимального использования памяти сервером к объёму оперативной памяти (RAM). Должно быть числом от 0 до 1. Примеры значений:

    • 0.5 — 50% от RAM;
    • 1.0 — 100% от RAM;

      Примечание

      Обычно значение устанавливается в диапазоне от 0.5 до 0.9, чтобы оставить часть памяти для других процессов операционной системы и избежать нехватки памяти.

      Например, если у вас 64 ГБ RAM, и вы установите значение 0.8, то ClickHouse будет использовать до 51,2 ГБ оперативной памяти.

  • total_memory_tracker_sample_probability — вероятность отслеживания использования памяти. Должно быть числом от 0 до 1. Примеры значений:

    • 0 — отслеживание использования памяти отключено;
    • 0.1 — вероятность составляет 10%;
    • 1 — использование памяти всегда отслеживается.
  • default_password_type — тип хеширования паролей по умолчанию. Примеры значений:
    • plaintext — пароль хранится в открытом виде (без хеширования);
    • sha256 — хеширование с использованием SHA-256;
    • double_sha1 — двойное хеширование SHA-1, используется для совместимости с MySQL;
  • custom_settings_prefixes — список префиксов для пользовательских настроек. Примеры значений:
    • custom_ — только настройки с префиксом custom_ считаются пользовательскими;
    • custom_ test_ только настройки с префиксами custom_ и test_ считаются пользовательскими

      Примечание

      Если параметру custom_settings_prefixes не присвоить значение, пользовательские настройки будут недоступны, кроме тех, что были явно зарегистрированы через конфигурацию сервера, роли или ограничения;

      Если администратор добавил настройки через конфигурацию сервера или роли, например:

      <t1cloud>
       <profiles>
       <default>
       <custom_timeout>30</custom_timeout>
       <custom_retries>5</custom_retries>
       </default>
       </profiles>
      </t1cloud>

      то при // custom_settings_prefixes будут доступны только эти настройки:

      • custom_timeout — ожидание операции в секундах, после чего произойдёт ошибка или повтор операции;
      • custom_retries — количество повторов операции при сбое.

      Любые другие пользовательские настройки будут недоступны.


  • table_engines_require_grant — требование привилегии CREATE для использования определённых движков таблиц:

    • false — привилегия CREATE не требуется;
    • true — привилегия CREATE требуется;
  • select_from_system_db_requires_grant — требование привилегии SELECT для выполнения запросов к системным базам данных:

    • false — привилегия SELECT не требуется;
    • true — привилегия SELECT требуется;
  • settings_constraints_replace_previous — замена ограничений настроек:

    • false — новые ограничения добавляются к существующим (не заменяют их);
    • true — новые ограничения заменяют существующие;
  • on_cluster_queries_require_cluster_grant — требование привилегии CLUSTER для запросов ON CLUSTER:

    • false — привилегия CLUSTER не требуется;
    • true — привилегия CLUSTER требуется;
  • users_without_row_policies_can_read_rows политики доступа к строкам:

    • false — требуются политики доступа
    • trueполный доступ (без политик);
  • select_from_information_schema_requires_grant — требование привилегии SELECT для выполнения запросов к information_schema:

    • false — привилегия SELECT не требуется;
    • true — привилегия SELECT требуется.

Важно

При указании некорректных значений кластер может не развернуться.

9. Нажмите на кнопку Вперед.

10. Заполните поля:

Дополнительные параметры:

  • День окна обслуживания * и Время обслуживания * — день недели и интервал времени (в вашем часовом поясе), когда специалисты Т1 Облако могут выполнять технические работы.

Настройки подключения:

11. Нажмите на кнопку Заказать. Кластер разворачивается около 10 минут.

Созданный кластер отображается на портале со статусом В порядке :

Чтобы посмотреть подробную информацию о кластере, нажмите на строку с нужным кластером. Откроется страница с информацией о кластере:

  • на вкладке Информация отображаются основные параметры кластера;
  • на вкладке Базы данных отображаются созданные базы данных;
  • на вкладке Пользователи отображается список пользователей;
  • на вкладке Ноды отображается список нод в кластере, их роли, внутренние и публичные IP-адреса. В кластере с 1 нодой вкладка Ноды не отображается;
  • на вкладке Настройки СУБД отображаются текущие параметры СУБД, которые можно изменить;
  • на вкладке История действий указаны действия пользователя с кластером.

Чтобы обновить информацию о кластере, нажмите на кнопку .

В созданном кластере можно создать базу данных, создать пользователей, изменить параметры СУБДизменить CPU/RAM, подключить/отключить публичный IP-адрес, увеличить размер диска и т.п. Подробнее см. раздел Действия с кластером ClickHouse.

Мы ответили на ваш вопрос?