Skip to main content
Data Coffee

Data Coffee

By Data Coffee

Подкаст о данных в современном мире. Мнения экспертов и опыт в получении, хранении, обработке, визуализации и принятии решений на основе данных. License: CC BY-NC-ND 3.0 (https://creativecommons.org/licenses/by-nc-nd/3.0/)
Available on
Amazon Music Logo
Apple Podcasts Logo
Castbox Logo
Google Podcasts Logo
Overcast Logo
Pocket Casts Logo
RadioPublic Logo
Spotify Logo
Currently playing episode

56 (S2E14). Edge ML

Data CoffeeJul 09, 2022

00:00
01:09:43
120 (S5E05). Data Contracts, SQL tools и игровые консоли
Apr 13, 202401:12:28
P1-5. Кофе с психологом

P1-5. Кофе с психологом

Р1-5, Кофе с психологом (Psy Coffee) Горе и потеря В эфире новый выпуск подкаста ПсиКофе. В этот раз Ирина пригласила в гости Александру Мхитарян, психотерапевта и по совместительству со-автора подкаста "Что-то на окейном". Мы обсудили тему горя и потери. К шоу-ноутам эпизода на подкаст-площадках и на ютубе приложены ссылки на ресурсы, упомянутые в выпуске. В этом эпизоде: 00:00 Горе и потеря 00:30 Поддержка близких в горевании 02:40 Гость Саша Мхитарян 06:21 Что делать с горем и потерей 09:56 Как помочь тому, у кого горе 17:03 Как прийти с помощью 20:09 Самое важное - быть рядом 23:44 Техника дебрифинга 25:22 Техники EMDR и Brainspotting 29:42 Прямое воздействие на мозг 34:55 Конкретные фразы 42:11 Как не пропускать через себя 45:53 Чужое и свое горе, как прожить 48:35 Как не сделать ещё хуже 51:43 Поддержка на расстоянии 56:08 Несколько книг 59:26 Когда это пройдет? 1:01:26 И ещё несколько книг Ссылки к эпизоду: - "Головоломка", отрывок (YouTube) - Вглядываясь в солнце, Ирвин Ялом (Amazon, Labirint) - Сказки обратимой смерти, Симона Мацлиах-Ханох (Labirint) - Утка, смерть и тюльпан, Вольф Эрльбрух (Amazon, Labirint) - Меня зовут смерть, Элисабет Ларсен (Polyandria) - "В поисках волка", Сандра Дикманн (Amazon, Mann-Ivanov-Ferber) #datacoffee #psycoffee Вопросы и предложения как и раньше можно присылать в комментарии! Поддержать нас чашечкой кофе ☕️

Apr 01, 202401:03:43
119 (S5E04). Pet Projects при найме
Mar 31, 202401:11:50
118 (S5E03). R1, py-пакеты, DMA, dbt, Apple
Mar 10, 202459:54
117 (S5E02). Vision Pro, Vanna и умные стиральные машины
Feb 20, 202401:04:53
116 (S5E01). Соревнования бариста и (анти)фрод
Feb 13, 202401:04:05
115 (S4E20). Happy New Data Year
Dec 30, 202350:24
114 (S4E19). Data Vault
Dec 23, 202301:06:33
113 (S4E18). В IT после 15 лет в других областях
Dec 18, 202301:04:06
112 (S4E17). Google, Gemini, GTA VI, Fallout TV series (стрим)
Dec 13, 202359:28
111 (S4E16). Консольный холивар, новости и Swift
Dec 02, 202301:02:00
110 (S4E15). Работа, OpenAI, медицина, OpenAI и игры
Nov 25, 202301:04:58
109 (S4E14). SAP BW/HANA и переход в open source
Nov 18, 202301:01:58
108 (S4E13). DuckDB
Nov 13, 202301:13:16
107 (S4E12). dbt, Ubuntu & Greenplum
Nov 04, 202301:05:37
106 (S4E11). CDO, дроны и кардан
Oct 28, 202301:10:47
105 (S4E10). Новостной стрим в Telegram
Oct 25, 202301:07:28
104 (S4E09). Инжиниринг, визуализация и DataLens

104 (S4E09). Инжиниринг, визуализация и DataLens

Тема выпуска Инжиниринг, визуализация и DataLens

В гостях у подкаста `Data Coffee` Роман Бунин — Эксперт по BI и визуализации данных, автор Reveal the Data


Shownotes:

0:51 Кофе

1:58 Оскар по визуализации

4:42 DataLens

9:54 Привязка к облаку и фичи

16:44 Roadmap

18:31 Чем Superset лучше

20:15 Семантический слой метрик

24:25 Конкуренция на рынке BI

27:13 Путь к открытию кода

30:17 Нужен ли BI дата инженеру

33:05 Работа инженером-конструктором

39:58 Где больше пьют (кофе)

41:19 Научный подход к визуализации

44:58 BI и опыт на производстве

46:38 Как перейти с Excel на BI

49:48 Диссертация

50:54 Приобретение BI скиллов

53:22 Системные мониторы

58:18 Чего не хватает в BI

1:00:46 Как стать BI-инженером


Сайт: https://datacoffee.link

Telegram: https://t.me/datacoffee

Mastodon: https://techhub.social/@datacoffee

Чат подкаста: https://t.me/datacoffee_chat

Oct 16, 202301:10:05
103 (S4E08). Microsoft, Apple, OpenAI и Python

103 (S4E08). Microsoft, Apple, OpenAI и Python

Ведущие подкаста 'Data Coffee' обсуждают новости и делятся своими мыслями!


Shownotes:

0:40 Swift и MacOS в облаке

9:18 Боль от MacOS

11:34 Microsoft скрепочка на стероидах

18:39 Microsoft web apps

23:14 Python 3.12

31:56 Миграция между версиями

35:03 chatgpt whiteboard coding

37:10 chatgpt-engineer

41:19 Cyberduck

44:13 DuckDB 0.9.0

49:31 DallE-3

57:05 Mistral 7B

1:05:34 Nova2 STT


Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Oct 07, 202301:08:30
102 (S4E07). LazyDocker, MacOS 14, Java 21
Sep 30, 202301:00:01
A7. Self-service и BI
Sep 30, 202357:14
A6. Доступ к данным и каталог
Sep 30, 202301:00:23
A5. Витрины данных
Sep 30, 202301:06:09
A4. Логирование событий и их доставка
Sep 30, 202301:09:31
A3. A/B эксперименты
Sep 30, 202301:07:12
A2. Интеграция с инфраструктурой компании

A2. Интеграция с инфраструктурой компании

A2. Интеграция с инфраструктурой компании


Shownotes:

1:04 Классический вопрос

2:07 Всем ли нужны новые решения

3:33 Необходимость именно для бизнеса

4:45 Как объяснить бизнесу необходимость в новых решениях

6:58 Как измерить удобство

8:54 Оцифровка хранилища данных в деньги

11:15 В чем сложность внедрения новой технологии

13:17 Контекстный пример

18:46 Ограничение ресурсов в Vertica

20:08 Альтернативные инструменты

26:42 Trino federated queries

29:16 High-level план внедрения новых инструментов

32:26 Dead end централизованных хранилищ

32:51 Как делится детальный слой

38:20 Гибридная модель

39:47 Переиспользование расчетов

42:10 Предел центрального хранилища

44:59 Бюджетирование по подразделениям

47:17 Аутсорс

49:44 Ограниченность ресурсов

52:51 Блокеры для аутсорса

53:34 Цикл технологий хранилищ данных

56:23 Немного про безопасность хранения

57:11 Метрики для потенциальных проблем

1:00:34 Tech radars

1:03:24 Альтернативные движки

1:05:51 Где искать новые инструменты


Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat


#партнерскийматериал

Sep 30, 202301:08:18
A1. Аналитическая платформа

A1. Аналитическая платформа

A1. Аналитическая платформа


Shownotes:

0:32 Представление гостя

0:53 Отношение к кофе

2:02 Помогает ли кофе взбодриться

2:10 Введение в аналитическую платформу

2:50 Составляющие части

4:52 Инфраструктура хранилища

7:09 Метрики

8:17 Usage

10:25 Изначально ли платформа была монолитом

11:55 Настройка логирования

15:42 Популярные инструменты внутри платформы

17:58 Что есть кластер

21:05 Как устроено хранилище

24:48 Когда пора заводить свою аналитическую платформу

27:18 Cost efficiency

30:31 Что привело к созданию

34:47 Расширение функционала

39:08 Open source частями

42:06 Open source нюансы

44:20 Data governance

48:21 Еще про open source

50:57 Что бы сделали иначе

52:50 Безопасность доступа к данным

54:57 Какой дата-каталог используется


Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat


#партнерскийматериал

Sep 30, 202357:03
101 (S4E06). Механический, керамический

101 (S4E06). Механический, керамический

Ведущие подкаста 'Data Coffee' обсуждают новости и делятся своими мыслями!


Shownotes:

0:00 Introduction

1:53 Первый керамический подкаст (внутряк)

5:28 Байкал (опровержение)

7:09 dbt 1.6

11:43 Terraform и OpenTofu

12:57 Whatsapp и группы

13:52 TON Wallet

15:13 Развод мошенников

18:17 Что делать если коллеги не отвечают

20:03 Темная тема в Confluence

22:19 Entity centric data modeling

30:31 Как досаждать владельцам Apple

33:23 Double commander

40:18 Apache Superset 3.0

42:07 Альтернатива docker desktop

47:39 snowkill

48:43 Дипломы писать с чатгпт

49:11 Spotify white noise

49:47 Метод определения по звуку клавиатуры

50:24 Молния про Spoitfy

50:50 Помощь в диагностике ДЦП по видео

51:33 Amazon планирует дата центр в Казахстане

51:47 Защита изображений от распознавания нейросетями

52:34 У Neuralink разрешение на работу с человеком

54:45 Лимит от gmail для amazon

57:15 (оффтоп) про браузеры

1:01:47 ts_zip


Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Sep 23, 202301:05:57
100 (S4E05). Организация data-команд

100 (S4E05). Организация data-команд

Тема выпуска Организация data-команд

В гостях у подкаста `Data Coffee` Георгий Виноградов — product owner в компании Novartis (LinkedIn)


Shownotes:

0:00 Introduction

1:32 Походный аэропресс

5:08 Data mesh — хайп?

10:44 Data Governance

14:13 Сколько людей работает с данными

15:33 Инфраструктура

17:17 Зачем что-то, если есть Snowflake

19:22 Snowflake & Databricks

22:15 Как выровнять аналитиков

24:22 Кабак в эпоху глобализации

26:25 Data catalog

30:14 Синхронизация распределенных команд

33:06 Упрощение взаимодействия

34:26 Airflow vs Matillion

36:30 Обучение боссов

39:19 ML pipelines

42:30 Разграничение прав на каталог

45:42 Как зародилась такая структура

50:10 Границы свободы команд

52:43 Эффект от внедрений в аналитике

56:29 Оценка внутренних инструментов

1:04:21 Специфика бизнеса

1:06:35 Карьерный трек


Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Sep 16, 202301:11:00
99 (S4E04). Data Mesh & dbt
Sep 09, 202301:07:00
98 (S4E03). Python в Excel, Terraform, Airflow
Sep 02, 202301:10:15
P1-4. Кофе с психологом
Aug 28, 202301:31:38
97 (S4E02). Мосты, ветряки и их фреквенции

97 (S4E02). Мосты, ветряки и их фреквенции

Тема выпуска Мосты, ветряки и их фреквенции

В гостях у подкаста `Data Coffee` Иван Долбоносов — специалист по системному мониторингу инженерных конструкций


Shownotes:

1:22 Классический вопрос

3:04 Ближе к делу

6:15 Какие данные собирать с моста

10:13 Высотные здания

11:50 Куда ставить датчики

14:47 Raw data

16:23 Умный город

18:47 Прочность в статике

19:34 Хрупкость

21:18 Стихийные бедствия

23:44 Законодательство и допуски

26:17 Предотвращение аварий

27:56 Умный город и хранение данных

31:21 Почем нынче датчик

35:50 Ветряные электростанции

38:17 airflow mic drop

39:11 Бесконечный ветер

44:09 Конечный ветер

49:04 No more airflow

51:23 xakepbI

53:25 На чем пишут код

55:45 Про экологию

1:01:17 Работа гостя

1:03:15 Классика от Жени

1:06:36 Кубы на ветряках

1:10:18 Эксперимент с окончанием


Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Aug 26, 202301:12:42
96 (S4E01). Игровой подкаст о данных
Aug 19, 202301:07:20
95 (S3E28). Как дата инженерам и аналитикам дружить?

95 (S3E28). Как дата инженерам и аналитикам дружить?

Тема выпуска Как дата инженерам и аналитикам дружить?

В гостях у подкаста `Data Coffee` Игорь Мосягин — Data Engineer в шведской финтех компании Klarna (Twitter, Youtube, LinkedIn)


Shownotes:

0:49 Классический вопрос

3:06 Inverse podcast

7:13 Уровни data security

10:38 Технический стек

14:28 Взаимодействие с аналитиками

16:50 On-boarding

20:50 Аналитики и контроль

25:09 Про Redshift

27:11 Документация и её метрики

30:05 Философия про документацию

31:19 Выстраивание процесса on-boarding

34:45 Самомотивация и quantified self

39:35 Про PhD

50:03 Data catalogue

58:04 Мотивация преподавать

1:06:37 Вдохновение


Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

May 30, 202301:10:00
94 (S3E27). Уязвимость в Telegram, терминал для MacOS и CozoDB
May 20, 202301:00:54
93 (S3E26). Elon Musk, -10x engineer, Airflow, dbt, OMD
May 13, 202301:06:11
92 (S3E25). Зачем писать свой Data Catalog

92 (S3E25). Зачем писать свой Data Catalog

Тема выпуска Зачем писать свой Data Catalog

В гостях у подкаста `Data Coffee` Иван Канашов — Data Engineer в компании Тинькофф (GitHubTelegram)


Shownotes:

0:47 Coffee

3:15 Зачем писать свой датакаталог

6:58 Модель данных каталога

9:08 Обновление данных в каталоге

17:40 Как говорить с бизнесом

21:03 Как решили идти в open source

23:37 Почему метаданные описывают не владельцы

25:20 Как понять, что каталог успешен

27:49 Lineage

29:59 Сколько времени ушло

31:49 Ролевая модель

35:13 Используется ли ML

37:23 Где посмотреть UI

40:18 Выйти и вернуться в IT

45:18 Каждый получает кайф там, где хочет

49:47 People & Data Governance

54:15 Будущее Data Governance систем

55:45 Что почитать и что поучить


Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

May 06, 202359:28
91 (S3E24). Немного про данные и нет кофе (обычный)
Apr 29, 202301:13:05
90 (S3E23). Terrific Microsoft Excel

90 (S3E23). Terrific Microsoft Excel

Тема выпуска Terrific Microsoft Excel

В гостях у подкаста `Data Coffee` Генрих Ананьев — руководитель направления автоматизации отчётности и моделирования в Beluga Group (HabrEmail)


Shownotes:

1:15 Голосование за кофе

3:53 Какое отношение гость имеет к теме

7:35 Alex попытался пройти обучение

9:30 Почему Excel настолько популярен

11:04 Погружаемся в историю

24:40 Почему пользовательская часть популярнее

30:52 Альтернативные табличные процессоры

34:13 Преимущества перед конкурентами

55:30 Анализ данных

1:05:50 Вот Excel, сделайте теперь нормально

1:09:00 PowerPivot и другие надстройки

1:14:52 Можно ли повлиять на roadmap

1:17:45 Lambda-функции в Excel

1:21:25 Популярные проблемы

1:27:58 Игры на Excel


Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Apr 22, 202301:30:25
89 (S3E22). Postman Flows, классический Twitter и галлюциногены на Майорке
Apr 15, 202350:55
88 (S3E21). AWS DataZone, YTsaurus, Postman Flows
Apr 08, 202356:48
P1-3. Кофе с психологом
Apr 04, 202301:11:18
87 (S3E20). ChatGPT на помощь учебе и работе

87 (S3E20). ChatGPT на помощь учебе и работе

Тема выпуска ChatGPT на помощь учебе и работе

В гостях у подкаста `Data Coffee` Александр Жадан — brand manager CM Games, интересующийся нейросетями (TwitterInstagram)


Shownotes:

1:41 Кофе

2:30 Выбор темы дипломной работы

5:26 Как двигался процесс подготовки текста

10:01 "ChatGPT написал диплом"?

11:53 Сколько времени ушло на запросы

15:13 Отличие результатов для разных языков

17:09 Кто знал об использовании ChatGPT

18:53 Стилизация текста

20:10 Догадался ли кто-то на защите

22:18 Выход за пределы Twitter

26:33 Злобные академики

41:39 Помогает ли ChatGPT бренд-менеджеру

45:20 Письмо остановить разработку

50:07 Решение в итоге принимать человеку

56:28 Инфляция в искусстве


Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Apr 01, 202301:01:11
86 (S3E19). Shopping data, рекомендации, облака

86 (S3E19). Shopping data, рекомендации, облака

Тема выпуска Shopping data, рекомендации, облака

В гостях у подкаста `Data Coffee` Саша Айваз — Chief Data & Analytics Officer, Lamoda Tech (email, Telegram, site)


Shownotes:

0:00 Традиционный вопрос

1:50 Lamoda

11:00 Как формируется предложение и какие данные используются

16:30 Data driven decision

18:15 Какие данные собираются

21:18 Только онлайн шоппинг?

21:53 Где хранятся собранные данные

27:04 Про PowerBI

29:42 Данные по люксовой одежде и ML

41:16 Рекомендации

43:39 Качество данных

48:48 Граница облаков и observability

1:00:47 Как стать CDO


Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Mar 25, 202301:12:47
85 (S3E18). ЭЭГ, коагулятор, осьминоги, Silicon Valley Bank
Mar 18, 202355:07
84 (S3E17). Беспилотники и картография
Mar 11, 202301:08:40
P1-2. Кофе с психологом
Mar 05, 202301:18:55
83 (S3E16). YouTube, Bing, EU data salaries и молитвы
Mar 04, 202358:00
82 (S3E15). DuckDB, Docker, AWS, Hashicorp, etc.
Feb 25, 202301:04:03