Как объединять данные из разных СУБД и делать это эффективно / Виталий Исаев / Yandex Infrastructure
Представьте, что вам необходимо выполнить анализ данных, распределённых по нескольким системам хранения: например, таблицы, размещённые в реляционных СУБД, надо объединить с CSV-файлами из S3. Что вы предпримете? Если данных немного, можно написать простой скрипт на любом ЯП, который последовательно вычитает данные из каждого источника в оперативную память и объединит их в одну таблицу, после чего её можно будет проанализировать. При этом вам придётся написать свою реализацию JOIN либо использовать для этого стороннюю библиотеку неизвестной эффективности. Но что делать, если данных очень много, они имеют сложную структуру, а для описания аналитических операций над ними гораздо лучше подойдёт привычный и выразительный SQL? Здесь на помощь приходят СУБД и движки обработки запросов с федеративными возможностями. В этом докладе мы поговорим о принципах работы таких систем и о ключевых оптимизациях, позволяющих им быстро и эффективно извлекать и обрабатывать большие объёмы данных из внешних источников. highload.ru/moscow/2024/abstracts/13087

Моментальная навигация по коду для любого коммита / Ольга Лукьянова / Yandex Infrastructure

Динтаблицы YTsaurus — и ещё одна СУБД от Яндекса / Руслан Савченко / Yandex Infrastructure

Что такое CLICKHOUSE и колоночные СУБД

Как мы незаметно перемещаем десятки петабайт данных внутри S3 / Никита Иващенко / Ozon

Дмитрий Дин и Григорий Деревянных. Реактивное CRDT

Стоимостный оптимизатор в YDB — как, зачем и почему? / Павел Велихов / Yandex Infrastructure

«Катастрофа для экономики»: у России два выхода? | Олег Вьюгин про атаки на НПЗ и новый кризис

Turing Award Winner: Disagreeing with Google, Postgres, Future Problems | Mike Stonebraker

Революционная ситуация: признаки. Статус S09E42

Платформостроение. Опыт отдела DevTools в Яндексе / Анастасия Абрашитова / Yandex Infrastructure

Лучший Гайд по Kafka для Начинающих За 1 Час

Главный навык 21 века! Как читать людей без слов и получать то, что хочешь?

Как быстро собрать метаданные сотен миллиардов объектов в S3 / Артём Мурашко / Yandex Infrastructure

Записываем данные в YDB с помощью Yandex Cloud Functions

Creator of C++: Bell Labs, Negative Overhead Abstraction, Mistakes | Bjarne Stroustrup

Co-Creator of Haskell: Functional Programming, Thinking in Types, Useless Languages | Simon Jones

DWH‑инженер на стероидах: прокачиваем продуктивность с ИИ / Никита Бурковский / BI Consult

How to Trick the Military Registration and Enlistment Office? 10 Ways to Leave Russia in 2026

