ClickHouse в Авито: посиделки в прямом эфире с Алексеем Миловидовым

9 апреля инженеры Авито соберутся на уютные посиделки с главным разработчиком ClickHouse Алексеем Миловидым. Поговорим про то, как мы используем систему управления базами данных, с какими сложностями сталкиваемся в процессе и зададим Алексею вопросы о настоящем и будущем ClickHouse. Приглашаем всех принять участие в онлайн-трансляции встречи. Формат: три микродоклада и большая Q&A сессия, где зрители смогут задать свои вопросы.

ИТ и интернет 18+

Программа трансляции

[17:00 — 17:20] — Микродоклады инженеров Авито.

[17:20 — 18:45] — Q&A сессия с Алексеем Миловидовым.

[18:45 — 19:00] — Перерыв на чай.

[19:00 — 20:00] — Продолжаем Q&A сессию.

Доклады

Начнём с трёх докладов Авито, чтобы погрузить зрителей и Алексея в контекст беседы. Наши инженеры расскажут, как их команды используют ClickHouse. На всё про всё — 20 минут, и перейдём к сессии вопросов и ответов.

Владимир Колобаев, lead system administrator

У команды мониторинга два кластера ClickHouse. Первый — про метрики и мониторинг. Он состоит из 6 серверов общим объёмом данных 20 ТБ на SSD. Мы столкнулись с необходимостью перебалансировать все данные на 12 серверов. Боевая нагрузка никуда не делась, и стабильность кластера не должна пострадать. Это нестандартная для нас задача, потому что инструментов, позволяющий перебалансировать данные в пределах расширяемого кластера, нет.

Второй кластер — про логи, там 150 ТБ данных на 4 серверах. Был момент, когда мы эти серверы пытались разместить в трёх дата-центрах для того, чтобы повысить стабильность кластера. Хотелось бы обсудить нюансы обеих задач.

Максим Котяков, senior backend engineer

Коротко обрисую три момента, о которых хочется поговорить.

Первый — команда статистики для профессиональных пользователей Авито делает платформу реалтаймовой аналитики и статистики, которая пребывает в стадии бурного роста. Сейчас у нас на каждом шарде по 3 с лишним терабайта данных на SSD. Данных будет становиться всё больше, равно как и шардов, и реплик этих шардов. Поэтому нам особенно интересно всё, что связано с масштабированием кластеров.

Второй — покажу, как мы построили архитектуру нашего хранилища. Все события — как пользовательские, так и порождённые внутренними сервисами Авито — попадают в единственную большую и широкую таблицу, доступную снаружи только на запись. Оттуда они растекаются по множеству ad hoc оптимизируемых таблиц, скрывающихся под Materialized View.

Третий — расскажу, почему мы не вычитываем напрямую из Кафки, и как при таком раскладе гарантируем или не гарантируем в зависимости от бизнес-потребности доставку событий до ClickHouse.

Сос Саакян, middle engineer в направлении big data

В Авито я строю инфраструктуру хранилища для Realtime AB. Весь наш кликстрим льется в ClickHouse. Мы постоянно чистим данные по Cron-у — у нас версия 18.7. За день накапливается 3—4 ТБ.

Пайплайн устроен через множество Materialized View. Данные агрегируем в наблюдения и метрики, считаем статтесты и выводим в отчёты. К ClickHouse подключены внешние словари с активной lazy_load, и я расскажу про особенности их использования и какие сайд-эффекты возможны при перезагрузке ноды.

Отдельно поговорим про дыру с реквизитами в XML конфиге словарей и то, как мы её скрыли. Хочется понять, как справиться с проблемой не костыльными способами.

Q&A сессия с Алексеем Миловидовым

Гость встречи — Алексей Миловидов, главный разработчик ClickHouse в Яндексе. Он ответит на вопросы команды Авито и зрителей трансляции.

После вступительных докладов поразгоняем с Алексеем самые разные темы и накопившиеся боли. В дискуссии участвуют докладчики, Александр Козлов — бэкенд-инженер юнита Sale Success в Авито — и Кирилл Самохин — технический лид того же юнита. К ним присоединится Кирилл Шваков — Golang-разработчик из компании Integros. Надеемся, что беседа будет полезна всем инженерам, которые используют ClickHouse.

Кроме тем из докладов, планируем поговорить про:

Бэкапы. Лучшие практики, дружбу с Collapsing MT и партиционирование.
Решардинг при добавлении новых серверов.
Кэши. Параллельность выполнения N одинаковых select и частичное кэширование старых партиций.
Ноды в кластере. Как правильно альтерить distributed на всём кластере.
WAL. Rollback для alter и как реализовать контролируемое отставание реплики.
Асинхронный матвью. Как победить дублирование данных.
Логи. Три типа логов, по которым нет документации, и возможное существование дашборда.
Kafka engine. В каком состоянии движок.
Kill query. Почему не отрабатывает при высокой нагрузке на сервер.
Driver GoLang. Потребление памяти, проблемы с таймзонами и древние issues.
Внешние словари. Ошибки lazy_load и проблемы с безопасностью.

Чтобы задать свой вопрос, подключайтесь к прямой трансляции посиделок на ютубе. Модератор встречи Кирилл Самохин будет следить за чатом и вбрасывать интересные темы в обсуждение.

Пароли и явки

Трансляция стартует на нашем ютуб канале 9 апреля в 17:00. Зарегистрируйтесь ниже, и мы пришлём напоминание со ссылкой в день мероприятия.

Берегите здоровье, увидимся в онлайне!

Регистрация

ClickHouse в Авито: посиделки в прямом эфире с Алексеем Миловидовым

2082 дня назад
9 апреля 2020 17:00–20:00

Событие пройдет онлайн

Уже есть билет
Ссылка на онлайн-событие рассылается за час до его начала.
Получить ссылку

Программа трансляции

Доклады

Q&A сессия с Алексеем Миловидовым

Пароли и явки

Получить ссылку на трансляцию

Связь с организатором

Подпишитесь на рассылку организатора

Получение ссылок для участия

Возврат билета