Skip to main content
Data Coffee

Data Coffee

By Data Coffee

Подкаст о данных в современном мире. Мнения экспертов и опыт в получении, хранении, обработке, визуализации и принятии решений на основе данных. License: CC BY-NC-ND 3.0 (https://creativecommons.org/licenses/by-nc-nd/3.0/)
Available on
Amazon Music Logo
Apple Podcasts Logo
Castbox Logo
Google Podcasts Logo
Overcast Logo
Pocket Casts Logo
RadioPublic Logo
Spotify Logo
Currently playing episode

39. Маркировка рабочих, философия, и базы данных

Data CoffeeFeb 12, 2022

00:00
01:09:02
118 (S5E03). R1, py-пакеты, DMA, dbt, Apple
Mar 10, 202401:02:38
117 (S5E02). Vision Pro, Vanna и умные стиральные машины
Feb 20, 202401:04:53
116 (S5E01). Соревнования бариста и (анти)фрод
Feb 13, 202401:04:05
115 (S4E20). Happy New Data Year
Dec 30, 202350:24
114 (S4E19). Data Vault
Dec 23, 202301:06:33
113 (S4E18). В IT после 15 лет в других областях
Dec 18, 202301:04:06
112 (S4E17). Google, Gemini, GTA VI, Fallout TV series (стрим)
Dec 13, 202359:28
111 (S4E16). Консольный холивар, новости и Swift
Dec 02, 202301:02:00
110 (S4E15). Работа, OpenAI, медицина, OpenAI и игры
Nov 25, 202301:04:58
109 (S4E14). SAP BW/HANA и переход в open source
Nov 18, 202301:01:58
108 (S4E13). DuckDB
Nov 13, 202301:13:16
107 (S4E12). dbt, Ubuntu & Greenplum
Nov 04, 202301:05:37
106 (S4E11). CDO, дроны и кардан
Oct 28, 202301:10:47
105 (S4E10). Новостной стрим в Telegram
Oct 25, 202301:07:28
104 (S4E09). Инжиниринг, визуализация и DataLens

104 (S4E09). Инжиниринг, визуализация и DataLens

Тема выпуска Инжиниринг, визуализация и DataLens

В гостях у подкаста `Data Coffee` Роман Бунин — Эксперт по BI и визуализации данных, автор Reveal the Data


Shownotes:

0:51 Кофе

1:58 Оскар по визуализации

4:42 DataLens

9:54 Привязка к облаку и фичи

16:44 Roadmap

18:31 Чем Superset лучше

20:15 Семантический слой метрик

24:25 Конкуренция на рынке BI

27:13 Путь к открытию кода

30:17 Нужен ли BI дата инженеру

33:05 Работа инженером-конструктором

39:58 Где больше пьют (кофе)

41:19 Научный подход к визуализации

44:58 BI и опыт на производстве

46:38 Как перейти с Excel на BI

49:48 Диссертация

50:54 Приобретение BI скиллов

53:22 Системные мониторы

58:18 Чего не хватает в BI

1:00:46 Как стать BI-инженером


Сайт: https://datacoffee.link

Telegram: https://t.me/datacoffee

Mastodon: https://techhub.social/@datacoffee

Чат подкаста: https://t.me/datacoffee_chat

Oct 16, 202301:10:05
103 (S4E08). Microsoft, Apple, OpenAI и Python

103 (S4E08). Microsoft, Apple, OpenAI и Python

Ведущие подкаста 'Data Coffee' обсуждают новости и делятся своими мыслями!


Shownotes:

0:40 Swift и MacOS в облаке

9:18 Боль от MacOS

11:34 Microsoft скрепочка на стероидах

18:39 Microsoft web apps

23:14 Python 3.12

31:56 Миграция между версиями

35:03 chatgpt whiteboard coding

37:10 chatgpt-engineer

41:19 Cyberduck

44:13 DuckDB 0.9.0

49:31 DallE-3

57:05 Mistral 7B

1:05:34 Nova2 STT


Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Oct 07, 202301:08:30
102 (S4E07). LazyDocker, MacOS 14, Java 21
Sep 30, 202301:00:01
A7. Self-service и BI
Sep 30, 202357:14
A6. Доступ к данным и каталог
Sep 30, 202301:00:23
A5. Витрины данных
Sep 30, 202301:06:09
A4. Логирование событий и их доставка
Sep 30, 202301:09:31
A3. A/B эксперименты
Sep 30, 202301:07:12
A2. Интеграция с инфраструктурой компании

A2. Интеграция с инфраструктурой компании

A2. Интеграция с инфраструктурой компании


Shownotes:

1:04 Классический вопрос

2:07 Всем ли нужны новые решения

3:33 Необходимость именно для бизнеса

4:45 Как объяснить бизнесу необходимость в новых решениях

6:58 Как измерить удобство

8:54 Оцифровка хранилища данных в деньги

11:15 В чем сложность внедрения новой технологии

13:17 Контекстный пример

18:46 Ограничение ресурсов в Vertica

20:08 Альтернативные инструменты

26:42 Trino federated queries

29:16 High-level план внедрения новых инструментов

32:26 Dead end централизованных хранилищ

32:51 Как делится детальный слой

38:20 Гибридная модель

39:47 Переиспользование расчетов

42:10 Предел центрального хранилища

44:59 Бюджетирование по подразделениям

47:17 Аутсорс

49:44 Ограниченность ресурсов

52:51 Блокеры для аутсорса

53:34 Цикл технологий хранилищ данных

56:23 Немного про безопасность хранения

57:11 Метрики для потенциальных проблем

1:00:34 Tech radars

1:03:24 Альтернативные движки

1:05:51 Где искать новые инструменты


Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat


#партнерскийматериал

Sep 30, 202301:08:18
A1. Аналитическая платформа

A1. Аналитическая платформа

A1. Аналитическая платформа


Shownotes:

0:32 Представление гостя

0:53 Отношение к кофе

2:02 Помогает ли кофе взбодриться

2:10 Введение в аналитическую платформу

2:50 Составляющие части

4:52 Инфраструктура хранилища

7:09 Метрики

8:17 Usage

10:25 Изначально ли платформа была монолитом

11:55 Настройка логирования

15:42 Популярные инструменты внутри платформы

17:58 Что есть кластер

21:05 Как устроено хранилище

24:48 Когда пора заводить свою аналитическую платформу

27:18 Cost efficiency

30:31 Что привело к созданию

34:47 Расширение функционала

39:08 Open source частями

42:06 Open source нюансы

44:20 Data governance

48:21 Еще про open source

50:57 Что бы сделали иначе

52:50 Безопасность доступа к данным

54:57 Какой дата-каталог используется


Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat


#партнерскийматериал

Sep 30, 202357:03
101 (S4E06). Механический, керамический

101 (S4E06). Механический, керамический

Ведущие подкаста 'Data Coffee' обсуждают новости и делятся своими мыслями!


Shownotes:

0:00 Introduction

1:53 Первый керамический подкаст (внутряк)

5:28 Байкал (опровержение)

7:09 dbt 1.6

11:43 Terraform и OpenTofu

12:57 Whatsapp и группы

13:52 TON Wallet

15:13 Развод мошенников

18:17 Что делать если коллеги не отвечают

20:03 Темная тема в Confluence

22:19 Entity centric data modeling

30:31 Как досаждать владельцам Apple

33:23 Double commander

40:18 Apache Superset 3.0

42:07 Альтернатива docker desktop

47:39 snowkill

48:43 Дипломы писать с чатгпт

49:11 Spotify white noise

49:47 Метод определения по звуку клавиатуры

50:24 Молния про Spoitfy

50:50 Помощь в диагностике ДЦП по видео

51:33 Amazon планирует дата центр в Казахстане

51:47 Защита изображений от распознавания нейросетями

52:34 У Neuralink разрешение на работу с человеком

54:45 Лимит от gmail для amazon

57:15 (оффтоп) про браузеры

1:01:47 ts_zip


Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Sep 23, 202301:05:57
100 (S4E05). Организация data-команд

100 (S4E05). Организация data-команд

Тема выпуска Организация data-команд

В гостях у подкаста `Data Coffee` Георгий Виноградов — product owner в компании Novartis (LinkedIn)


Shownotes:

0:00 Introduction

1:32 Походный аэропресс

5:08 Data mesh — хайп?

10:44 Data Governance

14:13 Сколько людей работает с данными

15:33 Инфраструктура

17:17 Зачем что-то, если есть Snowflake

19:22 Snowflake & Databricks

22:15 Как выровнять аналитиков

24:22 Кабак в эпоху глобализации

26:25 Data catalog

30:14 Синхронизация распределенных команд

33:06 Упрощение взаимодействия

34:26 Airflow vs Matillion

36:30 Обучение боссов

39:19 ML pipelines

42:30 Разграничение прав на каталог

45:42 Как зародилась такая структура

50:10 Границы свободы команд

52:43 Эффект от внедрений в аналитике

56:29 Оценка внутренних инструментов

1:04:21 Специфика бизнеса

1:06:35 Карьерный трек


Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Sep 16, 202301:11:00
99 (S4E04). Data Mesh & dbt
Sep 09, 202301:07:00
98 (S4E03). Python в Excel, Terraform, Airflow
Sep 02, 202301:10:15
P1-4. Кофе с психологом
Aug 28, 202301:31:38
97 (S4E02). Мосты, ветряки и их фреквенции

97 (S4E02). Мосты, ветряки и их фреквенции

Тема выпуска Мосты, ветряки и их фреквенции

В гостях у подкаста `Data Coffee` Иван Долбоносов — специалист по системному мониторингу инженерных конструкций


Shownotes:

1:22 Классический вопрос

3:04 Ближе к делу

6:15 Какие данные собирать с моста

10:13 Высотные здания

11:50 Куда ставить датчики

14:47 Raw data

16:23 Умный город

18:47 Прочность в статике

19:34 Хрупкость

21:18 Стихийные бедствия

23:44 Законодательство и допуски

26:17 Предотвращение аварий

27:56 Умный город и хранение данных

31:21 Почем нынче датчик

35:50 Ветряные электростанции

38:17 airflow mic drop

39:11 Бесконечный ветер

44:09 Конечный ветер

49:04 No more airflow

51:23 xakepbI

53:25 На чем пишут код

55:45 Про экологию

1:01:17 Работа гостя

1:03:15 Классика от Жени

1:06:36 Кубы на ветряках

1:10:18 Эксперимент с окончанием


Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Aug 26, 202301:12:42
96 (S4E01). Игровой подкаст о данных
Aug 19, 202301:07:20
95 (S3E28). Как дата инженерам и аналитикам дружить?

95 (S3E28). Как дата инженерам и аналитикам дружить?

Тема выпуска Как дата инженерам и аналитикам дружить?

В гостях у подкаста `Data Coffee` Игорь Мосягин — Data Engineer в шведской финтех компании Klarna (Twitter, Youtube, LinkedIn)


Shownotes:

0:49 Классический вопрос

3:06 Inverse podcast

7:13 Уровни data security

10:38 Технический стек

14:28 Взаимодействие с аналитиками

16:50 On-boarding

20:50 Аналитики и контроль

25:09 Про Redshift

27:11 Документация и её метрики

30:05 Философия про документацию

31:19 Выстраивание процесса on-boarding

34:45 Самомотивация и quantified self

39:35 Про PhD

50:03 Data catalogue

58:04 Мотивация преподавать

1:06:37 Вдохновение


Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

May 30, 202301:10:00
94 (S3E27). Уязвимость в Telegram, терминал для MacOS и CozoDB
May 20, 202301:00:54
93 (S3E26). Elon Musk, -10x engineer, Airflow, dbt, OMD
May 13, 202301:06:11
92 (S3E25). Зачем писать свой Data Catalog

92 (S3E25). Зачем писать свой Data Catalog

Тема выпуска Зачем писать свой Data Catalog

В гостях у подкаста `Data Coffee` Иван Канашов — Data Engineer в компании Тинькофф (GitHubTelegram)


Shownotes:

0:47 Coffee

3:15 Зачем писать свой датакаталог

6:58 Модель данных каталога

9:08 Обновление данных в каталоге

17:40 Как говорить с бизнесом

21:03 Как решили идти в open source

23:37 Почему метаданные описывают не владельцы

25:20 Как понять, что каталог успешен

27:49 Lineage

29:59 Сколько времени ушло

31:49 Ролевая модель

35:13 Используется ли ML

37:23 Где посмотреть UI

40:18 Выйти и вернуться в IT

45:18 Каждый получает кайф там, где хочет

49:47 People & Data Governance

54:15 Будущее Data Governance систем

55:45 Что почитать и что поучить


Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

May 06, 202359:28
91 (S3E24). Немного про данные и нет кофе (обычный)
Apr 29, 202301:13:05
90 (S3E23). Terrific Microsoft Excel

90 (S3E23). Terrific Microsoft Excel

Тема выпуска Terrific Microsoft Excel

В гостях у подкаста `Data Coffee` Генрих Ананьев — руководитель направления автоматизации отчётности и моделирования в Beluga Group (HabrEmail)


Shownotes:

1:15 Голосование за кофе

3:53 Какое отношение гость имеет к теме

7:35 Alex попытался пройти обучение

9:30 Почему Excel настолько популярен

11:04 Погружаемся в историю

24:40 Почему пользовательская часть популярнее

30:52 Альтернативные табличные процессоры

34:13 Преимущества перед конкурентами

55:30 Анализ данных

1:05:50 Вот Excel, сделайте теперь нормально

1:09:00 PowerPivot и другие надстройки

1:14:52 Можно ли повлиять на roadmap

1:17:45 Lambda-функции в Excel

1:21:25 Популярные проблемы

1:27:58 Игры на Excel


Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Apr 22, 202301:30:25
89 (S3E22). Postman Flows, классический Twitter и галлюциногены на Майорке
Apr 15, 202350:55
88 (S3E21). AWS DataZone, YTsaurus, Postman Flows
Apr 08, 202356:48
P1-3. Кофе с психологом
Apr 04, 202301:11:18
87 (S3E20). ChatGPT на помощь учебе и работе

87 (S3E20). ChatGPT на помощь учебе и работе

Тема выпуска ChatGPT на помощь учебе и работе

В гостях у подкаста `Data Coffee` Александр Жадан — brand manager CM Games, интересующийся нейросетями (TwitterInstagram)


Shownotes:

1:41 Кофе

2:30 Выбор темы дипломной работы

5:26 Как двигался процесс подготовки текста

10:01 "ChatGPT написал диплом"?

11:53 Сколько времени ушло на запросы

15:13 Отличие результатов для разных языков

17:09 Кто знал об использовании ChatGPT

18:53 Стилизация текста

20:10 Догадался ли кто-то на защите

22:18 Выход за пределы Twitter

26:33 Злобные академики

41:39 Помогает ли ChatGPT бренд-менеджеру

45:20 Письмо остановить разработку

50:07 Решение в итоге принимать человеку

56:28 Инфляция в искусстве


Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Apr 01, 202301:01:11
86 (S3E19). Shopping data, рекомендации, облака

86 (S3E19). Shopping data, рекомендации, облака

Тема выпуска Shopping data, рекомендации, облака

В гостях у подкаста `Data Coffee` Саша Айваз — Chief Data & Analytics Officer, Lamoda Tech (email, Telegram, site)


Shownotes:

0:00 Традиционный вопрос

1:50 Lamoda

11:00 Как формируется предложение и какие данные используются

16:30 Data driven decision

18:15 Какие данные собираются

21:18 Только онлайн шоппинг?

21:53 Где хранятся собранные данные

27:04 Про PowerBI

29:42 Данные по люксовой одежде и ML

41:16 Рекомендации

43:39 Качество данных

48:48 Граница облаков и observability

1:00:47 Как стать CDO


Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Mar 25, 202301:12:47
85 (S3E18). ЭЭГ, коагулятор, осьминоги, Silicon Valley Bank
Mar 18, 202355:07
84 (S3E17). Беспилотники и картография
Mar 11, 202301:08:40
P1-2. Кофе с психологом
Mar 05, 202301:18:55
83 (S3E16). YouTube, Bing, EU data salaries и молитвы
Mar 04, 202358:00
82 (S3E15). DuckDB, Docker, AWS, Hashicorp, etc.
Feb 25, 202301:04:03
81 (S3E14). Данные на стройке
Feb 18, 202301:13:48
80 (S3E13). Наукометрия

80 (S3E13). Наукометрия

Тема выпуска Наукометрия

В гостях у подкаста `Data Coffee` Александр Мартиросян — Профессиональный наукометрист.


Shownotes:

0:45 Традиционный вопрос

1:38 Что такое наукометрия

3:23 Можно ли сравнивать по странам

4:22 Что мы измеряем

5:33 Значимость конференций и как померить

6:52 Какие объекты мы можем сравнивать

8:04 Как понять, чьи статьи стоит читать

9:44 Кто стоит за WoS и Scopus

12:29 Что такое impact factor

14:17 Зачем нужны цитирования

17:02 Призрак уробороса

18:18 Аналогия с социальной сетью

19:34 Хаки показателей

20:14 Молчаливо смотрим на огромный Хирш

23:29 Зависть к фабрике статей

24:32 Можно ли доверять индексу Хирша

25:20 Какой индекс Хирша у самого Хирша

25:48 Соревновательная хиршеметрия

26:18 Когда ученый становится таковым

28:14 Накрутка и борьба с ней

29:25 ОПГ Хирш

30:49 Манчкинство показателей

32:25 Денежная мотивация и соблазн

34:36 Ученые-диссиденты и альтернативные показатели

36:27 Создание новых метрик

36:55 Где взять наукометрические данные

40:51 Журналы и квартили

43:35 Data Coffee Conference

46:01 Где образуется научное знание

53:00 Как начать заниматься наукой


Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Feb 11, 202301:00:01
79 (S3E12). Новости про утечки Yandex, ChatGPT, и другое
Feb 04, 202301:10:26