Skip to main content
Data Coffee

Data Coffee

By Data Coffee

Подкаст о данных в современном мире. Мнения экспертов и опыт в получении, хранении, обработке, визуализации и принятии решений на основе данных. License: CC BY-NC-ND 3.0 (https://creativecommons.org/licenses/by-nc-nd/3.0/)
Where to listen
Amazon Music Logo

Amazon Music

Apple Podcasts Logo

Apple Podcasts

Castbox Logo

Castbox

Google Podcasts Logo

Google Podcasts

Overcast Logo

Overcast

Pocket Casts Logo

Pocket Casts

RadioPublic Logo

RadioPublic

Spotify Logo

Spotify

Stitcher Logo

Stitcher

69 (S3E02). Метрики и аналитика сна
69 (S3E02). Метрики и аналитика сна
Тема выпуска Метрики и аналитика сна В гостях у подкаста `Data Coffee` Александр Толмачёв — руководитель аналитики Ozon.Fintech. Shownotes: 1:29 Традиционный вопрос 4:30 Знакомимся 7:40 Аналитика подкаста 8:24 Та самая бигдата 16:16 Туманное будущее 17:33 Начинаем про сон 23:06 Внезапный найм от Алекса и Дины 24:48 Best practices сна 27:08 На какие метрики смотреть 31:08 Сон, гениальность и здоровье 38:13 Топ-3 совета про сон 40:40 Что делать совам 42:59 Детальные метрики или best practices 50:05 Сон Роналдо и японцев 52:32 Estante suave 53:25 Когда осознал себя как аналитик 56:06 Какой твой путь аналитика 59:50 Как нащупать то самое Обложка - OpenAI Dall-E, promt="Dawn, painting my Matisse" Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:04:05
November 26, 2022
68 (S3E1). Любим Airflow, ругаем Apple, задаем вопрос слушателям
68 (S3E1). Любим Airflow, ругаем Apple, задаем вопрос слушателям
Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями! Shownotes: 4:28 Увольнения и природные катаклизмы 6:56 Твиттер 11:52 Твиттер и телеграм, подписки 17:19 Пресловутая связь роста и зарплаты 19:36 Estante suave 20:25 Радикальное изменение в подкасте 20:46 Massive layoffs 21:34 Последнее обновление macos 26:06 Классически про Airflow 30:27 Немного про ubuntu 22.10 34:42 Потеряли дата-инженеров в подкасте 35:30 Doom на Airflow 38:30 Про дельфинчика 40:59 Natural language to SQL query 45:11 AWS Code Whisperer 48:07 Shutterstock и DALL-E 51:28 Вопрос к слушателям по поводу S3 53:16 Asahi Linux на M1 Обложка - Generated by DALL-E 2, prompt "airflow, painting by Matisse" Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
56:13
November 19, 2022
67 (S2E25). Организация data-конференций
67 (S2E25). Организация data-конференций
Тема выпуска Организация data-конференций В гостях у подкаста `Data Coffee` Алексей Федоров — продюсер в JUG Ru Group, организатор крупнейших в России технологических конференций для разработчиков, Сергей Бойцов - менеджер дата продуктов и дата инженер, прошедший от маленького ассемблера до больших данных. Shownotes: 0:46 Кофе 3:51 Что такое smartdata и зачем 6:02 Конкуренты 7:49 Сколько людей задействовано 9:27 Как выполняется отбор спикеров 15:22 Как выполняется продвижение 17:58 Источники данных и сбор данных из них 31:42 Как придти с докладом 35:34 Отказ от докладов 49:05 Любимые доклады 52:41 Какие идеи хочется осуществить Обложка - SmartData Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:04:48
September 24, 2022
66 (S2E24). iOS, Airflow, Doom, and biomedicine
66 (S2E24). iOS, Airflow, Doom, and biomedicine
Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями! Shownotes: 00:00 На презентации apple показали iphone 14 со спут... 20:24 Doom running on dynamic island iphone 14 21:32 Airflow 2.4.0 is coming in mid-septemer 26:23 Airflow extension for visual studio code 28:15 2022 state of workflow orchestration 43:17 Tjournal закрылся после 11 лет работы 44:22 Multi-gpu support for jupyter notebooks 48:24 Настенных роботов превратили в интерактивные по... 49:04 Runway — ai-based video editor 51:58 Искусственный палец научили определять материал... 55:41 Умные очки для незрячих с поддержкой искусствен... 58:20 Для восстановления после ожогов используют рыбь... 1:00:41 Have an old ipad lying around? you might be abl... Обложка - Raymangold22, CC0, via Wikimedia Commons Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:04:38
September 17, 2022
65 (S2E23). Data catalogs
65 (S2E23). Data catalogs
Тема выпуска Data Catalogs В гостях у подкаста `Data Coffee` Data Engineer из компании Picsart — Алмаз Мурзабеков (Telegram, Email) Shownotes: 0:56 Чашку-другую, но не сбивая биоритмы 1:45 Кто такой DI engineer 6:52 Что такое data catalog 11:20 Meta-информация 17:21 Как заполняется data catalog 20:32 Amundsen, OpenMetaData 26:15 Atlan 31:39 Структура бизнес-глоссария 33:06 Как продать data catalog руководству 36:21 Чем заниматься DE после внедрения 39:58 Витрины как сервис 41:03 Algorithm-based decision making 42:48 Критерии выбора data-каталога 46:15 DQ и интеграция с мессенжерами 48:58 Data catalog on top of file system 51:44 Data exploration 54:11 Сколько проект займет в людях 57:02 Как сделать MVP Обложка - Michael Holley Swtpc6800, Public domain, via Wikimedia Commons Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:02:15
September 10, 2022
64 (S2E22). Прослушка, file system SQL, psycopg и другое
64 (S2E22). Прослушка, file system SQL, psycopg и другое
Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями! Shownotes: 1:40 ДР в подкасте 3:12 Stream deck 7:13 Дум на тракторе 8:22 Подслушивание через оптоволоконный кабель 13:21 SQL для файловой системы 16:29 Новость от слушателя 18:55 Тема от слушателя, галера или in-house 33:09 Дальний космос в колбасе 35:10 TikTok, дипфейки и брюзжание 37:57 20 лет Shazam 40:25 Про яндекс, поиск и обмен сервисами 44:59 Diablo 1 в браузере 46:02 Немного про GeForce Now 48:45 MacPass 50:15 DbGate 51:59 Heroku убирает бесплатные тарифы 52:55 Когда забанили в гугле Обложка - Joaquim de Mello (book author), Public domain, via Wikimedia Commons Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
56:03
September 03, 2022
63 (S2E21). Data Management Platform
63 (S2E21). Data Management Platform
Тема выпуска Data Management Platform В гостях у подкаста `Data Coffee` руководитель команды продукта Data Management Platform в Яндекс GO — Максим Пчелин (LinkedIn, Telegram) Shownotes: 00:42 Кофе: важно не какой, а где 02:15 На пути к данным 06:07 Любимая роль на проектах 07:30 Кто такой data platform product owner 09:45 Плохо пахнущие субстанции в консалтинге 14:28 Какая из работ была лучше 16:24 Легко ли даются трансформации из роли в роль 20:52 Синдром самозванца - хороший признак 25:13 Планнинг дел в Telegram 29:20 Как не страдать от невыполненных дел 33:04 Разница между DWH и data platform 39:55 Как общаться с админами 43:25 Как разбираться в людях 47:30 Что действительно нужно аналитикам 52:22 Как делать DWH гибким 55:06 Где искать людей на работу 59:28 Сколько будет 2 в 10й степени Обложка - Adam37, CC0, via Wikimedia Commons Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:02:10
August 27, 2022
62 (S2E20). VR, змеиный экзоскелет и новинки медицины
62 (S2E20). VR, змеиный экзоскелет и новинки медицины
Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями! Shownotes: 4:57 Экзоскелет для змеи 12:04 Apple VR 17:06 Наушники с распознаванием эмоций 25:48 Распознавание эмоций детей 28:42 .NET для Ubuntu 34:01 Искусственная роговица 39:23 Игроки собрали 500 тысяч долларов... 41:38 Векторная вакцина от бешенства 51:17 Пошаговый DOOM 52:48 DIY open source gaming mouse 54:54 Кампус в Нижнем Новгороде Обложка - Metropolitan Museum of Art, CC0, via Wikimedia Commons Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
56:36
August 20, 2022
61 (S2E19). Reverse ETL, проблемы в cloud и расточительство пакетных менеджеров
61 (S2E19). Reverse ETL, проблемы в cloud и расточительство пакетных менеджеров
Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями! Shownotes: 4:06 Пожар на складе озона 9:50 Python-клиент для airflow api 11:16 Dagster 1.0 11:58 Reverse etl 16:42 'лучший' браузер для винды 23:40 Стриминг экселя 32:47 Мнения разработчиков: проблемы cloud providers 37:16 Gitlab собирается удалять проекты на бесплатных... 38:50 Superset 2.0.0 44:50 Аналитика загрузок одного пакета с npmjs.com 47:57 Китайцы силой мысли управляют домом 51:49 Робот или человек по ту сторону экрана 55:34 Японские учёные обнаружили червей-паразитов, сп... 59:31 Flipper zero — ксерокс радиосигналов или «тамаг... Обложка - Unknown authorUnknown author, CC0, via Wikimedia Commons Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:03:21
August 13, 2022
60 (S2E18). dbt — data transformation workflow
60 (S2E18). dbt — data transformation workflow
Тема выпуска dbt В гостях у подкаста `Data Coffee` Lead Data Engineer в компании NabuMinds — Никита Баканчев (LinkedIn, Telegram) Shownotes: 0:48 Кофе  1:32 Что такое dbt 2:56 Истинная сущность dbt 4:56 Что нужно сделать, чтобы он взлетел 10:06 Как это всё запустить 13:27 Где подводные камни 14:48 Миграция 17:00 Отличие core от cloud 19:53 Как понять, что пора 22:53 Степень зрелости проекта 25:24 Изменения в моделях 28:05 Отладка макросов 29:31 dbt test 31:25 lineage и dbt docs 35:19 Работа с разными DB 36:28 data quality и dbt 42:23 dbt community 44:42 Полезные dbt-пакеты 53:29 Легко ли слезть с dbt Обложка - dbt Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
58:32
August 06, 2022
59 (S2E17). Пауки, нейроинтерфейсы, восстание машин и немного IT
59 (S2E17). Пауки, нейроинтерфейсы, восстание машин и немного IT
Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями! Shownotes: 0:00 Проблемы с Docker 1:24 MS Teams — плох, но какие альтернативы? 7:38 Веселье с Oracle Cloud 11:47 Donation от Ильи из Германии 12:07 Обновлённая подписка PS+ 18:31 Пневмозахват из паука 22:48 Очередное восстание машин 26:00 Альтернатива для Looker на dbt 29:08 Телеметрия и метрики бэкенда 32:12 Snowflake accountadmin 33:47 Безопасные электроды в мозгу 40:03 И снова генерация изображений в нейросетях 46:33 Технический долг мешает работать 59:51 ETL porn на VBA: стрим на OnlyFans Обложка - Cassiopeia sweet, Public domain, via Wikimedia Commons Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:02:04
July 30, 2022
58 (S2E16). Приоритеты, финансы, роботы, нейросети и данные
58 (S2E16). Приоритеты, финансы, роботы, нейросети и данные
Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями! Shownotes: 0:50 Про расставление приоритетов и сон 6:00 Голосовым сообщениям нет 9:23 Global hiring freeze 11:04 Финансово независимы 11:53 Petuum mobile от Apple 12:47 Немного роботов 14:54 А судьи кто 17:31 Несправедливый страйктому самому стриму 18:52 AI и Minecraft 21:01 Киберпанк и коты, продано 22:12 Нейросети поняли физику 26:18 Дом с водорослями 28:54 Мексика и кактусы 29:41 Та самая компания 30:44 Данные подгорели 34:51 Новость в бэклог Обложка - none credited, Public domain, via Wikimedia Commons Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
38:05
July 23, 2022
57 (S2E15). Музыка, прогнозы, саранча, и немного про дирижабли
57 (S2E15). Музыка, прогнозы, саранча, и немного про дирижабли
Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями! Shownotes: 2:25  разлад мажора. что не так с музыкальными унив... 14:10 Less data, more art 17:29 nokia встроила беспроводные наушники в кнопочн... 20:01 Илон маск узнал, что twitter можно скачать в ap... 22:38 Kafka arm-native docker images 26:51 Ipad as second display for ububtu 31:56 Организация software freedom conservancy призва... 34:54 Дешёвый pr? жест доброй воли? 36:27 Deprecated linux commands you should not use an... 40:48   42:44 Беспилотный камаз 47:41 Саранча определяет рак по запаху чтооо 56:200 Прогноз преступлений 1:05:56 Немного про современные дирижабли 1:06:22 Ar контактные линзы Обложка - George Grove, Public domain, via Wikimedia Commons Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:10:07
July 16, 2022
56 (S2E14). Edge ML
56 (S2E14). Edge ML
Тема выпуска Edge ML В гостях у подкаста `Data Coffee` Data Scientist в компании Dannie — Елена Шевченко Shownotes: 00:52 Классический вопрос 02:13 Начало карьеры 04:03 Чем плох R 05:40 Дебаты R vs Python 07:01 Непростой путь в DS 07:45 Что такое Edge ML 10:05 Потенциальная потеря полезной информации 10:17 Соотношение точность-полнота 12:58 Когда разумно использовать edge устройства 16:31 Майнинг на edge устройствах 17:12 Дообучение моделей после кражи устройства 18:13 Почему эта сфера и не крупная компания 21:03 Небольшие проекты и беспилотники 22:10 Стоимость edge устройств 23:59 Процесс разработки под edge устройства 28:35 Как обычному DS пощупать edge ml 29:44 Про квантование 34:59 Ассоциация с обучением с подкреплением 36:23 Языки имплементации 38:16 Android и edge ml 40:01 Работа с большими моделями 42:50 Есть ли работа для data engineer 43:57 Внезапный podcast inversion of control 44:11 IoC: Бигада в датакофе 44:52 IoC: Глубокие нейронные сети 45:54 Как попасть в эту сферу 47:12 NLP на устройствах 48:38 Немного про voice recognition 49:25 edge ml своими руками 49:55 IoC: искуственный интеллект 51:05 Как модель положить в железку и дообучение 52:49 Контроль качества 55:40 Создание обучающей выборки 56:17 Embedded разработчики 57:17 Дорогие дата-сатанисты 58:00 Как проверить DS 59:38 Менеджер-дата-сатанист 1:01:10 DL как black box 1:01:45 Вопрос от друга 1:03:47 Первый шаг в DS 1:05:31 Проходим собеседование вместе 1:08:08 Накидываем на лингвистику Обложка - Jing.fm, CC BY-SA 4.0, via Wikimedia Commons Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:09:43
July 09, 2022
55 (S2E13). IE retirement, Telegram Premium, Excel, datadiff
55 (S2E13). IE retirement, Telegram Premium, Excel, datadiff
Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями! Shownotes: 0:30 Инсайды от Жени 3:38 Инструмент для оценки скиллов от Я 5:33 Та самая подписка 15:47 Ещё подписка на Github Copilot 19:49 datadiff 25:13 Excel и sqlite 28:51 Беспросветная печаль джуна 38:48 IE must die 44:21 Бигдата в SpaceX 47:55 Некая компания выложила некую большую языковую модель 54:42 Amazon и ваши голоса 57:47 Голоса и имитация 59:39 Doom запустили на... Обложка - Microsoft, Public domain, via Wikimedia Commons Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:02:25
July 02, 2022
54 (S2E12). Беседа про собеседования
54 (S2E12). Беседа про собеседования
Тема выпуска "Беседа про собеседования"! Обложка - Freepik, CC BY-SA 3.0, via Wikimedia Commons Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:12:33
June 25, 2022
53 (S2E11). WWDC22, Natasha, Bergamot & AI has come to life
53 (S2E11). WWDC22, Natasha, Bergamot & AI has come to life
Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями! Shownotes: 7:45 Новости эпол 32:58 Xsolla закрывает российский филиал: 35:27 Doom запустили прямо в bios 39:34 Спустя годы это всё-таки произошло. теперь нако... 42:11 Minor news for streamlit fans, introducing mult... 46:09 Mozilla запустили “проект бергамот” в бета-тест... 51:12 Google отстранила от работы инженера, который н... 1:02:21 Проект natasha — набор python-библиотек для обр... 1:04:35 Msi анонсировала ножную педаль liberator для иг... Обложка - Dan Gerhards, CC0, via Wikimedia Commons Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:07:47
June 18, 2022
52 (S2E10). Игры на работе
52 (S2E10). Игры на работе
Тема выпуска Игры на работе В гостях у подкаста `Data Coffee` game designer из Kama Games — Коля Юн Shownotes: 1:55 Кофе 3:20 Как гость шёл в геймдизайн 11:39 Как попасть в геймдизайн 14:15 Первый месяц на новой работе нужно играть 15:52 Feature review 19:00 Неудачная фича 21:35 Что нужно знать геймдизайнеру 23:20 Нужно ли художественное образование 25:00 Какие дизайнеры есть на игровом проекте 29:10 Можно ли из аналитика попасть в геймдиз 32:01 product_manager == game_designer 34:20 Куда может вырасти геймдизайнер 36:30 Тайное желание гостя 38:50 Требуемые skills геймдизайнера 43:50 На кого все геймдизайнеры пытаются равняться 46:25 Три любимые компании 48:10 Кодзима — гений? 50:00 За какой платформой будущее Обложка - National Gallery of Art, CC0, via Wikimedia Commons Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
56:44
June 11, 2022
51 (S2E9). KDE Connect, хранение секретов и нанороботы
51 (S2E9). KDE Connect, хранение секретов и нанороботы
Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями! Shownotes: 00:51 Logitech выпустила механическую клавиатуру mx m... 13:08 Штрафы от нейросеточки 17:18 Ai ambassador 19:34 Kde connect is now available for iphone & ipad... 28:36 Ищем новые экзопланеты 33:09 Нанороботы для лечения зубов. над специальным у... 35:28 Немецкие учёные разработали робота с шипастыми... 37:37 В открытом доступе нашли базу с данными о клиен... 43:16 Детгксификатор языка 47:33 Назад в будущее! 51:26 Open-source self-hosted password manager for teams 1:00:28 Гугл продолжает воевать со своими расплодившимс... 1:04:56 Пациент с пересаженным гм-сердцем свиньи умер и... Обложка - GeMet, CC0, via Wikimedia Commons Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:05:36
June 04, 2022
50 (S2E8). Кофейный-юбилейный
50 (S2E8). Кофейный-юбилейный
Тема выпуска Кофейный-юбилейный В гостях у подкаста `Data Coffee` PM в DWH в Yandex.Go, автор канала Coffeeinmsk — Анастасия Королёва (Telegram, LinkedIn) Shownotes: 01:47 Обязательный гостевой вопрос 03:35 Как научиться заваривать кофе в турке 06:04 Турка из серебра — стоит того? 08:19 Откуда все эти знания о кофе 10:57 Какую кофеварку покупать домой 14:36 Как погрузиться в мир кофе 17:40 Как искать кофе в новом месте? 24:17 Что такое кофе specialty? 27:38 Кофейный снобизм 29:45 Существует ли достойный растворимый кофе 31:47 Правильное начало кофейного пути 39:00 Когда лучше молоть зёрна 43:20 Альтернативное молоко 48:35 Кофе без кофеина 50:52 Как выбрать кофе для джезвы 54:14 Биодинамика 55:09 Coldbrew Обложка - gnokii at openclipart.org, CC0, via Wikimedia Commons Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:02:10
May 28, 2022
49 (S2E7). VR-шлем с отдачей, регуляция ML-сервисов и наноботы
49 (S2E7). VR-шлем с отдачей, регуляция ML-сервисов и наноботы
Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями! Shownotes: 10:49 Нью йорк собирается начать регулировать найм, к... 20:48 Проблемы белого мира 23:11 Дипфейк, который тебя причёсывает и одевает 28:57 Low code добралось и до инженерии данных. старт... 32:43 Испанские химики создали наноботов, которые «пл... 38:05 Amazon откажется от поддержки собственного форм... 45:11 Vr-шлем научили имитировать контакт с лицом бе... 55:37 Европа обяжет веб-сервисы объяснять работу алг... Обложка - Martí 8, Public domain, via Wikimedia Commons Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:12:43
May 21, 2022
48 (S2E6). Cooking stages, pizza scientists и индейка в мандаринах
48 (S2E6). Cooking stages, pizza scientists и индейка в мандаринах
Тема выпуска Cooking stages, pizza scientists и индейка в мандаринах В гостях у подкаста `Data Coffee` Data Engineering TechLead в Dodo Engineering, член программного комитета SmartData, DE or DIE data engineering digest редактор и организатор митапов DE or DIE — Ксения Томак (LinkedIn, Twitter, DE or DIE) Shownotes: 1:06 Кофейный вопрос 1:51 Чем занимается TechLead 5:10 Какие данные собираются про пиццу 10:32 Поиск маршрутов 12:10 Эксперименты с рецептами и RnD 18:26 Прогноз закупки ингредиентов 19:36 Что нужно уметь, чтобы попасть в Pizza RnD 20:49 Рекомендационная модель 24:50 Контроль качества продуктов по фото 28:40 DoDo BI 32:30 "Умная" пиццерия 33:29 Переход PowerBI-Superset 36:24 Франчайзинговый "каннибализм" 37:46 Никакой пиццы после полуночи 39:37 Переход на data-driven подход 43:52 Доставка пиццы дронами 48:35 DEorDIE community 56:58 Поиск участников и докладов 1:00:44 Работа для борьбы с синдромом самозванца Обложка - public domain, via Wikimedia Commons Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:03:29
May 14, 2022
47 (S2E5). Курсы для новичков, менторы и community
47 (S2E5). Курсы для новичков, менторы и community
Тема выпуска Курсы для новичков, менторы и community В гостях у подкаста `Data Coffee` junior data engineer, автор канала Girl DataEng и создатель чата для начинающих дата инженеров DataYoungers — Анна Строевская (Telegram) Shownotes: 01:04 Кофе — это вид снотворного 01:42 Вопрос, который беспокоит всех 04:07 Вопрос, который беспокоит Дину 07:43 Скиллы, которые помогли 08:53 Что мешает новичку в профессии 12:39 Как гостья готовилась к DE 15:14 Противоречивые курсы 16:56 DE и аналитик: разные взгляды на задачи 19:07 Переход в DE: составляющие успеха 23:07 Почему не аналитика или ML 26:27 Что зажигает в работе DE 28:50 Никто не умеет писать код 32:49 Куда хотелось бы расти 34:48 Как подступиться к проблеме с задачей 39:03 Community для новичков 43:59 Приглашают ли джуна на обсуждения 45:42 Синдром самозванца у новичков 48:26 Кому задать вопросы первого дня Обложка - Ryan Riggins ryan_riggins, CC0, via Wikimedia Commons Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
55:23
May 07, 2022
46 (S2E4). Дирижабли, кнопка Mute, Twitter Илона Маска, etc.
46 (S2E4). Дирижабли, кнопка Mute, Twitter Илона Маска, etc.
Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями! Shownotes: 00:31 Mute работает или все же нет 09:10 Легализация web scraping 13:16 Илон Маск всея Твиттера 18:55 Перчатки для обучения хирургов 23:15 Top 100 big data companies 25:45 Разбираем стиралки на полупроводники 31:00 Штраф за утечку данных клиентов Яндекс Еды 42:38 Японский робот для работ на железной дороге 51:15 Внезапно про дирижабли 57:22 И вновь шутеры и олдскулы Обложка - German photographer, Public domain, via Wikimedia Commons Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:00:01
April 30, 2022
45 (S2E3). xLookUp, Dataminer, RegExp for Email, Doom w/raytracing
45 (S2E3). xLookUp, Dataminer, RegExp for Email, Doom w/raytracing
Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями! 09:18 XLookUp — убийца vLookUp и hLookUp 15:07 «Яндекс» выложил в открытый доступ исходный код... 25:27 Dataminer — браузерное расширение для Chrome и... 26:39 Telegram представил несколько новых функций: мо... 32:27 Перестаньте валидировать Email-адреса через RegExp 38:41 Залетевший в Швецию соловей-красношейка научил... 40:49 AWS Lambda function URLs 47:15 Тут «венома» сделали ( — движущаяся магнитная с... 47:53 Генерим сложные эмоции. Интересная штука от Goo... 57:58 Spotify считает, когда е... 01:06:36 Дум с raytracing Обложка - Pyfisch, CC0, via Wikimedia Commons Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:06:15
April 23, 2022
44 (S2E2). Метеорология, ледники и голодные медведи
44 (S2E2). Метеорология, ледники и голодные медведи
Тема выпуска Метеорология, ледники и голодные медведи В гостях у подкаста `Data Coffee` метеоролог, младший научный сотрудник Арктического и Антарктического научно-исследовательского института — Ульяна Прохорова (Instagram) Shownotes: 2:05 30 лет и переосмысление кофе 3:05 Метеорология, океанология и экспедиции 6:42 Голодные белые медведи 8:58 Первая экспедиция 11:29 Граница между метеорологией и океанологией 12:03 Данные в метеорологии 18:19 Тепловой баланс ледника 21:32 Верификация данных 23:33 Что мы будем с этого иметь? 27:22 Мировые центры данных 28:17 Реанализ 32:40 Хаос в форматах данных 34:10 Квадрат или шестиугольник? 35:12 "Через две минуты дождь кончится" 36:52 Метео-краудсорсинг 40:50 Доступ к собранным данным 42:35 Как ещё можно помочь науке 44:00 Климатические параметры 49:07 Статьи про ледники 50:00 Как происходит процесс сбора данных 54:44 Как располагается сеть наблюдений 56:04 Допустим, я инженер данных 1:05:07 Заруб с p-value 1:06:49 Куда идти учиться Обложка - Author, CC0, via Wikimedia Commons Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:10:14
April 16, 2022
43 (S2E1). Twitter, DALL-E, Ubuntu 22.04, PyTorch, а также психоделики
43 (S2E1). Twitter, DALL-E, Ubuntu 22.04, PyTorch, а также психоделики
Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями! 1:08 Последний кофе Алекса 2:16 Диаграммы в github markdown 8:49 Про личную базу знаний и Obsidian 13:05 Новости про твиттер 16:31 Наивные размышления про рынки ценных бумаг 22:18 Быстрая имплементация pytorch для M1 25:11 Инстанцы на M1 в AWS и немного любимого Airflow 29:00 DALL-E 2 33:53 Don't look up great again 39:00 Ubuntu 22 46:28 dockerized 50:41 Психоделики и нейроинтерфейсы Обложка - cogdogblog, CC BY 2.0, via Wikimedia Commons Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
59:23
April 09, 2022
42. Как жить?
42. Как жить?
Тема выпуска Как жить? В гостях у подкаста `Data Coffee` психолог — Ирина Андрейченко (Instagram, Telegram) 03:17 Вернуть себя в состояние "взрослого" 07:06 Попробовать привести себя в норму 12:35 Безысходность, страх, стыд и вина 17:33 Как разговаривать с близкими 20:10 Образы других людей в наших головах 27:50 Бей, замри, беги 33:10 О(т)ставить развлечения 40:12 Что можно сделать сейчас? 41:16 Разделять истинные и рэкетные чувства 50:50 Переоценка ценностей 56:30 Что делает нас людьми 1:01:25 Разделять ответственность Обложка - Wilfredor, CC0, via Wikimedia Commons  Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:10:33
March 05, 2022
40. Игровая аналитика как она есть
40. Игровая аналитика как она есть
Тема выпуска Игровая аналитика как она есть В гостях у подкаста `Data Coffee` руководитель направления аналитики в My.Games — Олег Потапов (Facebook) 00:58 Традиционно про кофе 01:56 Зачем в играх нужна аналитика 04:32 Нужен ли аналитик до того, как игра стала хорошей 08:12 Как выбрать хорошего аналитика 11:36 Конкретные скиллы в аналитике 16:55 Аналитические метрики 24:12 Как можно донести свое видение до проекта 27:44 Верят ли разработчики решениям от аналитики 29:10 Метрики, направленные на отдельных пользователей 31:12 Успешность проекта и Factorio 36:31 Как проводятся АБ тесты 43:04 Исследования на разных типах игроков 45:32 Процент играющих людей по отношению к проекту 47:44 Метрики, чтобы понять, что дело не стоит свеч 50:38 Стоит ли пилить фермы ради денег 53:01 Любимый проект гостя 55:57 Когда стоит принять то самое грустное решение Обложка - Metropolitan Museum of Art, CC0, via Wikimedia Commons Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:02:37
February 19, 2022
39. Маркировка рабочих, философия, и базы данных
39. Маркировка рабочих, философия, и базы данных
Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями! Shownotes: 02:37 Auchenberg/volkswagen определяет, что тесты зап... 05:37 История с распределенной базой на sqlite развив... 10:27 10 лет AWS DynamoDB - NoSQL база данных single-... 13:52 Отличия в парсерах PNG у Apple и остальных 20:31 Майнинг в Иркутске 23:23 EdgeDB 1.0 release - first open source graph-re... 27:41 Стартап Engineer.ai, позиционирующий себя как р... 33:34 Описываем свой SQL на естественном языке и выпо... 37:01 Закрывают IBM Watson Health по кускам и продают... 37:18 Интересная штука, может попробую: естественный... 40:40 После анализа бигдаты было принято решение увол... 42:18 Рабочих мясокомбината в Набережных Челнах «пром... 53:57 Живая нейросеть общего назначения 56:10 Дрон гоняет голубей в Швейцарии смотреть до кон... 01:01:21 Атаки на NLP-системы: невидимые пробелы, подмен... 01:09:33 Айтишник не может зарабатывать меньше 4000$, он... Обложка - Smallbones, CC0, via Wikimedia Commons Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:09:02
February 12, 2022
38. Snowflake Data Cloud
38. Snowflake Data Cloud
Тема выпуска Snowflake Data Cloud В гостях у подкаста `Data Coffee` автор канала Сингулярности не будет, фаундер holistic.dev, dwh.dev и parsers.dev, заводила в snowflake чатах (ru, en) и канале со snowflake новостями — Антон Ревяко Shownotes: 02:04 Две нижегородские кофейни 06:18 Что за мифический зверь Snowflake 10:48 Обновления в облачных базах 15:20 Статические анализаторы кода 19:16 Что под капотом у Snowflake 20:45 Можно ли запустить в private-облаке 26:19 Data Marketplace 30:20 Выгодные преимущества Snowflake 34:26 Специфические (не)удобства 52:51 Поддержка ML 57:32 Кому Snowflake точно не подойдёт 58:54 Проекты гостя Обложка - Gagea, Public domain, via Wikimedia Commons Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:15:22
February 05, 2022
37. Open source, котики, мемы и новости
37. Open source, котики, мемы и новости
Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями! Shownotes: 00:40 Мак и мак (долгий блок) 18:33 Коротко про faker 19:53 Проблемы онлайн-курсов 21:44 Дыры в open source (получение рута) 22:50 Нововведения в superset 28:49 Пилить ли свой ETL 31:28 Обилие курсов для новичков 35:13 Про крипту и центробанк 37:51 Искусственный зрительный аппарат 41:01 Мечты о second brain 43:41 Раздача интернета с дирижаблей 46:30 Starlink и котики 48:21 Мемы по мотивам log4j 49:01 Распознавание голосов птиц 50:01 Стандарт многоквартирного умного дома 55:06 AirTag и слежка 57:31 Удерживающие собеседования 01:02:12 Заканчиваем историей про именование серверов Обложка - Auckland Museum, CC BY 4.0, via Wikimedia Commons Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:10:07
January 29, 2022
36. Тестирование программного обеспечения (гостевой)
36. Тестирование программного обеспечения (гостевой)
Тема выпуска Тестирование программного обеспечения В гостях у подкаста `Data Coffee` QA Lead в JetBrains, ведущая подкаста "Вроде в проде", ментор и консультант на тему автоматизации и тестирования - Саша Пшеборовская (Twitter, Instagram, LinkedIn, Подкаст, GetMentor) Shownotes: 02:42 Традиционный вопрос про кофе 04:44 Что такое тестирование 11:14 Можно ли обойтись без тестирования 14:43 Автоматизированное или ручное 20:52 Противостояние тестировщиков и разработчиков 26:40 Почему разработчики сами не тестируют 27:32 Методологии тестирования 31:28 Обилие курсов для новичков 33:37 Войти в ИТ через тестирование 38:09 Популярные фреймворки для тестирования 40:47 Методы тестирования в data-продуктах 46:12 Data quality и тестирование 53:00 Как устроена работа в команде 56:34 Формальная верификация и связь Обложка - Blobbie244, CC BY-SA 3.0, via Wikimedia Commons Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:02:36
January 22, 2022
35. Первый iPhone, немного бигдаты и много электричества
35. Первый iPhone, немного бигдаты и много электричества
Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями! Shownotes: 01:02 15 лет назад был анонсирован первый iPhone 12:18 Смартфон запитал бумажный синтезатор по NFC 18:56 🔗 Ford представил технологию зарядки электромоб... 33:39 Устройство определяющее наличие вредоносного П... 40:01 В Японии заработают автобусы-поезда 44:25 Hyundai показала тележку-робота MobED. Она осна... 48:26 Customizable ноут я этой штуки не видел может... 54:39 Маленький кабинет для себя на 9м^2 во дворе сб... 57:45 Отличное завершение года считаю. В сеть выложи... 1:01:48 В августе в соцсетях разошлось письмо основател... 1:12:56 Polars – быстрая библиотека подготовки данных к... Пара дополнительных ссылок, упомянутых в шоу: https://flipperzero.one/ https://www.kiteboard.io/ Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:14:43
January 15, 2022
34. Первым делом самолёты (гостевой)
34. Первым делом самолёты (гостевой)
Тема выпуска Первым делом самолёты (и их данные) В гостях у подкаста `Data Coffee` технический директор S7 ТехЛаб, инновационного подразделения S7 - Андрей Жуков (Telegram, Facebook) Shownotes: 01:35 Coffee 03:17 Что за инновации творятся в S7 13:46 Как шла цифровизация 21:24 Данные, получаемые с самолетов 31:33 Платформа данных 39:06 Управление хаосом 43:07 DS и ML по данным с самолетов 46:19 Команда 53:25 Инструменты обработки данных 01:02:10 Вклад в open source Обложка - PolyLingua, CC0, via Wikimedia Commons Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:03:59
January 08, 2022
33. Подводим итоги года
33. Подводим итоги года
Ведущие подкаста "Data Coffee" подводят итоги года! Shownotes: 00:33 Data Coffee: Начало 03:14 Знаменательные даты 05:03 Какие у нас были страхи 07:25 Статистика подкаста за год 13:25 Рекорды ведущих 21:27 Ущемление года 33:29 Нейронная сеть года 39:58 Технология года 46:47 Провалы года 1:01:38 Гостевые темы 2021 года 1:05:28 Взломы года 1:10:26 Ребрендинги года 1:13:40 Споры года 1:21:03 Идея года 1:26:13 Личные итоги года от ведущих 1:38:33 Поздравления!  Обложка - Myotus, CC BY-SA 4.0, via Wikimedia Commons Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:42:57
December 31, 2021
32. Personal Knowledge Management (гостевой)
32. Personal Knowledge Management (гостевой)
Тема выпуска Personal Knowledge Management В гостях у подкаста `Data Coffee` Machine Learning Engineer at ExB Labs - Сергей Гамоцкий (Сайт, Telegram, LinkedIn) Shownotes: 00:23 Coffee 03:23 Personal Knowledge Management System: что такое... 07:42 Какая информация критична для потери 08:41 Что гость хранит в PKMS 10:44 Как искать то, что давно сохранено и забыто 17:31 Категории, tags и другие атрибуты 21:19 Какой системой пользуется гость 27:21 Насколько просто переносить базу в другие инстр... 30:49 Как заставлять себя вносить информацию в базу 35:53 Так ли много типов информации, чтобы заводить PKMS 40:34 Как правильно записывать информацию 43:20 Поиск по базе знаний 48:01 Философия персональной базы данных 50:06 Zettelkasten 53:17 Johnnydecimal 55:57 Digital garden 01:02:06 Насколько важно, чтобы инструмент был быстрым,... Обложка - Duke Innovation Co-Lab, CC0, via Wikimedia Commons Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:06:45
December 25, 2021
31. Выйти из IT и зайти нормально, AWS, Pandas, супер-кабель
31. Выйти из IT и зайти нормально, AWS, Pandas, супер-кабель
Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями! Shownotes: 02:56 Не уйти ли из айти 19:10 Маркетолог-IT-священник. Как вам такой путь? 23:34 Техника определения скрытых камер при помощи To... 31:09 Катастрофическая уязвимость в Apache log4j 32:12 AWS лежал больше 4х часов 35:07 Злоумышленники и AirTag 39:09 Путь Мака от кровати до хоумофиса теперь застра... 42:17 Зарядный кабель, который в свернутом состоянии... 47:26 3dfx никогда не выпускала Voodoo 5 6000 с четыр... 49:10 Удобный инструмент для изучения Pandas 49:12 3dfx никогда не выпускала Voodoo 5 6000 с четыр... 51:04 23 декабря 2021 года завершение разработки Pyth... 52:27 Как прогуливать встречи в Zoom с помощью Python 59:19 Rqlite - распределенная реляционная БД на основ... 1:01:31 В Оксфорде испытали нейросеть с 530 млрд параме... 1:09:13 Кофе подорожает 1:10:37 Второй апдейт для ремастера quake 1 Обложка - Public Domain Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:13:11
December 18, 2021
30. Аспирантура в области QnA-систем (гостевой)
30. Аспирантура в области QnA-систем (гостевой)
Тема выпуска Аспирантура в области QnA-систем В гостях у подкаста `Data Coffee` Аспирант Университета ИТМО - Павел Ефимов (Google Scholar) 14 декабря 2021 года пройдет бесплатная онлайн-конференция DataStart по Data Science, машинному обучению и нейросетям. Узнайте о самых последних решениях в мире Data Science! Трансляция будет абсолютно бесплатной, но если вы хотите купить видеозаписи, то специально для наших слушателей есть промокод: сoffee500 Shownotes: 01:59 Отношение к кофе 02:49 Работа в университете 03:29 Какие языки считаются слаборесурсными 07:03 Что такое вопросно-ответный поиск 10:43 Фактологические вопросы 12:04 Поиск ответа в тексте 15:06 Архитектура QnA системы 16:19 Что такое ридер и как оценивать качество QnA 18:35 Можно ли обойтись без ML 22:36 Языковые модели 23:57 Word embeddings 27:55 Король - мужчина + женщина = ? 32:26 Какие модели используются сейчас для NLP 32:50 Трансформеры 36:22 Берт и другие жители Улицы Сезам 39:06 Лимиты в QnA-системах 41:04 Особенности национальной аспирантуры 43:31 Можно ли использовать в своих целях результаты исследований 45:17 Что есть интересного и перспективного в NLP 51:00 Векторный поиск "по-старинке" и современный 54:32 Самостоятельное обучение новичка в QnA 56:18 Какие языки программирования используются Обложка - Therain, Public domain, via Wikimedia Commons Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:00:18
December 11, 2021
29. Oxxxymiron, нейросети, единые стандарты и монополисты
29. Oxxxymiron, нейросети, единые стандарты и монополисты
Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями! 14 декабря 2021 года пройдет бесплатная онлайн-конференция DataStart по Data Science, машинному обучению и нейросетям. Узнайте о самых последних решениях в мире Data Science! Трансляция будет абсолютно бесплатной, но если вы хотите купить видеозаписи, то специально для наших слушателей есть промокод: сoffee500 Shownotes: 02:08 Изучение эволюции человеческих концепций с помощью зондирования 08:06 NVIDIA GauGAN2 создаёт фотореалистичные изображения 12:08 "Визуальная" база данных в PNG 14:33 Избыток медиаконтента сегодня и Oxxxymiron 21:42 WinAMP собираются оживить 23:35 Единый стандарт для "умного" дома 26:11 USB-C как единый стандарт для зарядки 32:38 Опровержение про MuzeNet 34:37 Платное беспилотное такси 35:53 Дуров давит на сторонние Telegram-клиенты 38:44 VR-перчатка от Meta 40:07 Новости от AWS 42:04 Завершение поддержки Firefox Lockwise 50:10 JetBrains DataSpell и Gateway 53:05 Оптимизация NumPy в десятки раз Обложка - Metropolitan Museum of Art, CC0, via Wikimedia Commons Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
59:53
December 04, 2021
28. Анонимность при поиске работы, IT-курсы и другое (гостевой)
28. Анонимность при поиске работы, IT-курсы и другое (гостевой)
Тема выпуска Анонимность при поиске работы, IT-курсы и другое В гостях у подкаста `Data Coffee` Founder & CEO Get me IT - Дима Доброхотов (Facebook, Хабр) 14 декабря 2021 года пройдет бесплатная онлайн-конференция DataStart по Data Science, машинному обучению и нейросетям. Узнайте о самых последних решениях в мире Data Science! Трансляция будет абсолютно бесплатной, но если вы хотите купить видеозаписи, то специально для наших слушателей есть промокод: сoffee500 Shownotes: 01:47 Усыпляющий кофе 03:34 Переводы, туризм, продажи, HR и IT 05:34 Зачем нужна анонимность при поиске работы 11:25 Реально ли быть анонимным в сети 16:43 Что плохого, если вас постоянно одолевают рекрутеры 19:22 Как сложно рекрутерам в Европе 23:30 Зачем компаниям анонимные соискатели 27:49 Инструменты для сбора данных о кандидатах 32:24 Анализ качества кода соискателей в GitHub 39:50 IT-курсы и трудоустройство после них 45:43 Нужен ли технический background для IT 48:56 Считает ли гость свой переход в IT успешным 57:27 Лопата и яблоки, или самостоятельное обучение Обложка - Jorjum, CC0, via Wikimedia Commons Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:07:23
November 27, 2021
27. Кнопка Turbo, таблицы, "отжим" и метавселенные
27. Кнопка Turbo, таблицы, "отжим" и метавселенные
Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями! Shownotes: 00:41 Особый кофе от Дины 03:34 Перчатка для передачи тактильных ощущений 06:50 Make turbo button great again 09:01 Очередная метавселенная от Microsoft 13:38 Система моделирования климата Земли 18:21 Nocodb 21:48 Консольный spreadsheet Visidata 30:40 Отжим Яндекса 35:28 Musenet 36:50 Что бесит русского в Германии 37:47 Рейтинг вузов от Times 42:28 Поддержка Python в Snowpark 44:04 Запрет на отправку сообщений работникам 49:28 Нейросети помогают при нарушениях речи 54:20 Пост-кибербанк и голосовые помощники 57:48 Опрос разработчиков на Python 58:21 Выпуск новой версии Snoop Обложка - Jack Weir, Public domain, via Wikimedia Commons Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:03:10
November 20, 2021
26. Орнитология и birdwatching (гостевой)
26. Орнитология и birdwatching (гостевой)
Тема выпуска Орнитология и birdwatching В гостях у подкаста `Data Coffee` профессиональный орнитолог и бёрдвотчинг гид, преподаватель Биологического факультета МГУ, лектор в проектах Московского зоопарка и Политеха, автор проекта о птицах и природе Lyric Forester - Григорий Евтух (Telegram, Instagram, Facebook, VK) Shownotes: 00:38 Bird-friendly coffee 04:33 Традиционный вопрос 05:31 Что изучают орнитологи 09:14 Теория или полевые исследования 11:01 Почему именно орнитология? 12:23 Зачем метить птиц и как собирать данные 16:03 Можно ли самому понять, какую информацию несет метка на птице 19:36 Помогает ли исследованиям информация о найденных меченых птицах? 21:48 Существует ли база знаний о миграции птиц? 23:46 Более современные способы сбора информации о птицах 28:32 История с большими счетами за роуминг 31:03 Crowd funding исследовательских проектов 34:08 Что происходит с собранными данными 36:09 Выводы и решения на основе данных 39:53 Распознавание птиц по звуку и фото 44:12 И снова про crowd sourcing 47:38 Открытые научные вопросы в орнитологии 55:22 Что нужно делать, чтобы стать орнитологом 57:56 Самая любимая птица Обложка - U.S. Fish and Wildlife Service, Public domain, via Wikimedia Commons Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:02:22
November 13, 2021
25. Нейросети, майнинг, TouchBar и выбор компьютера
25. Нейросети, майнинг, TouchBar и выбор компьютера
Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями! Shownotes: 02:27 Сбой в магазине Ozon 06:34 Redis 3 не поддерживает Arm64 07:34 Удобства TouchBar 08:50 При этом TouchBar нужен не всем 10:49 Проблемы у Facebook и размышления про Meta 17:55 MacOS Monterey и Apple Fitness+ 27:00 Какой компьютер покупать Mak’у 31:02 Генерация картинок по русскому тексту в нейросети от Сбера 36:12 Нейросеть от Сбера, но в области медицины 42:50 И ещё одна нейросеть, но уже от Facebook, работающая на звуковых волнах 49:33 Сбор данных с камер, установленных в торговых центрах Москвы 51:06 Трекинг активности работников в Китае 52:10 Продолжение истории с XSolla 54:39 Ограничение работы систем распознавания лиц и сбора данных в Европе и Австралии 1:01:06 Майнинг криптовалют на попутном газе при добыче нефти 1:04:00 Эмбеддинги логотипов метал-групп Обложка - сгенерирована нейросетью ruDALL-E Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:05:50
November 06, 2021
24. Что скрывает в себе Маруся? (гостевой)
24. Что скрывает в себе Маруся? (гостевой)
Тема выпуска Что скрывает в себе Маруся? В гостях у подкаста `Data Coffee` руководитель разработки backend голосового помощника "Маруся" - Вадим Пуштаев (Facebook) Shownotes: 02:43 Кофе можно пить любой 04:07 Как нас подслушивает Маруся 08:20 Маруся и Беларусь 10:09 Определение владельца локально 11:15 Можно ли поменять Марусе имя 13:22 Анализ детских голосов 16:40 Кто размечает данные 17:50 Что если у взрослого детский голос 19:39 Как устроена цепочка обработки запроса 24:30 Выбор подходящего навыка для ответа 26:54 Оценка качества работы 28:28 Использование пользовательских запросов в улучшении сервиса 29:47 Самые интересные навыки 32:32 Разработка сторонних навыков для Маруси 37:24 Какая статистика собирается 39:54 Кодекс этики ИИ 45:19 Влияние исходных данных на результаты 47:58 “Занавески” и “штора”: умный дом 52:29 Могут ли поспорить две Маруси 54:44 Журнал запросов и доступ к внешним сервисам 1:02:06 Регистрация внешних skills 1:05:08 Голосовые помощники вне дома-офиса Обложка - Orion 8, Public domain, via Wikimedia Commons Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:09:31
October 30, 2021
23 (bonus). Куда развиваться?
23 (bonus). Куда развиваться?
Бонусный эпизод подкаста Data Coffee - "Куда развиваться?" Получили очень серьёзный вопрос от нашего постоянного слушателя, и не могли просто взять и упомянуть о нём вскользь в одном из новостных выпусков. Приложили максимум доступных ресурсов и попросили нескольких data-экспертов дать ответы нашему слушателю. Shownotes: 00:34 Вопрос от слушателя 02:38 Ответ Александра Волынского (Facebook, Github, VK) 04:50 Ответ Christian Beutenmueller (LinkedIn) 06:35 Ответ Евгения Ермакова (Сайт) 14:04 Ответ Дмитрия Аношина (Telegram, LinkedIn, Хабр) 21:57 Ответ Паши Финкельштейна (Twitter, LinkedIn, Telegram) Обложка - собственное творение🙂 Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
27:48
October 24, 2021
22. Airflow, Snowflake, пиво и зарплаты DE
22. Airflow, Snowflake, пиво и зарплаты DE
Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями! Shownotes: 01:32 Внезапный блок про AirFlow 06:06 Mail.ru -> VK 12:45 facebook 14:06 Tesla и пиво 16:06 apple, google 26:27 Презентация Google Pixel 29:10 Анонсы Microsoft 33:50 VSCode в браузере 35:08 Неожиданно про Snowflake 37:52 Неожиданно про интерфейсы 43:39 Обзор зарплат в DE 53:45 State of Data Science 1:07:20 Open Metadata Обложка - O'Reilly Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:10:12
October 23, 2021
21. Найм в ИТ и семь "смертных грехов" вашего резюме (гостевой)
21. Найм в ИТ и семь "смертных грехов" вашего резюме (гостевой)
Тема выпуска Найм в ИТ и семь "смертных грехов" вашего резюме В гостях у подкаста `Data Coffee` T&D Project manager at Intella - Анастасия Пилькевич (LinkedIn, Facebook) Shownotes: 02:38 Что такое t&d? 03:17 Отношение к кофе 04:12 Что происходит с наймом в it сегодня 06:30 Влияние пандемии на рынок найми 10:07 Найм в условиях дефицита кадров 18:03 Cтранные места для хантинга 19:15 Самые странные требования к кандидатам 21:12 Как создается профиль будущего кандидата 23:11 Как тестируются soft-skills и пост-оплата 25:17 7 смертных грехов в резюме 28:13 Переход из it в it-рекрутеры 29:26 Определение зарплаты для новой вакансии на основе данных о рынке 31:21 На сколько поднялись зарплатные ожидания в последние 1-2 года 34:20 Торги на собеседовании 36:52 Чаще ли стали торговаться? 37:43 Удалённая работа (плюсы и минусы) 41:23 Что делать, когда на рынке 20% выгоревших людей 44:59 Как добиваться повышения зарплаты 52:36 Необычные переходы между профессиями 53:42 Насколько этично предлагать вакансию по diversity квоте 55:28 Cultural fit (с обеих сторон) 1:03:58 Как заранее понять, что кандидат с опытом собеседований, но без технического опыта 1:10:49 Влияет ли уровень образования на зарплату кандидата 1:12:24 Вакансия в my games, data engineer 1:12:54 Как слабой команде нанять сильного инженера 1:18:17 Послешоу, про вторжение в личную жизнь Обложка - The Seven Deadly Sins and the Four Last Things, Public domain Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:19:49
October 16, 2021
20. Python, PgSQL и Vulkan (но не ставки на спорт)
20. Python, PgSQL и Vulkan (но не ставки на спорт)
Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями! Подкаст `Data Coffee` — информационный партнёр конференции SmartData 2021. SmartData — это большая техническая конференция по Data Engineering. Десятки докладов, воркшопов, Q&A-сессий — первые доклады и имена спикеров уже появляются на сайте! Промокод на 2000 рублей: datacoffe2021JRGpc Shownotes: 01:33 Python 3.10 08:02 JupyterLab standalone application 12:22 PostgreSQL 14 13:30 Apache Kafka 3.0.0 14:31 SemVer 17:23 askgit 24:05 Windows 11 про которую никто не может ничего сказать 27:37 Игры и Vulkan (но не ставки на спорт) 29:40 Как нас коснулось падение сервисов Facebook 35:25 Идентификация лицом и жертва киберпреступления среди ведущих 41:08 Apple купил сервис классической музыки Primephonic 48:35 Программист 2 года назад начал работать в виртуальной реальности 1:00:46 Есть ли у собак СДВГ 1:04:56 Новая рубрика подкаста: Off Topic Обложка - Freshmaniac, Public domain, via Wikimedia Commons Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:17:51
October 09, 2021
19. Кофейный бизнес, SQL, dbt и BI (гостевой)
19. Кофейный бизнес, SQL, dbt и BI (гостевой)
Тема выпуска "Кофейный бизнес, SQL, dbt и BI" В гостях у подкаста `Data Coffee` кандидат экономических наук, специалист и руководитель в области BI, руководитель компании Valiotti Analytics — Николай Валиотти (Сайт, Telegram) Подкаст `Data Coffee` — информационный партнёр конференции SmartData 2021. SmartData — это большая техническая конференция по Data Engineering. Десятки докладов, воркшопов, Q&A-сессий — первые доклады и имена спикеров уже появляются на сайте! Промокод на 2000 рублей: datacoffe2021JRGpc Shownotes: 00:35 Знаменательный день для подкаста 03:03 Всё будет кофе, даже пиво 06:52 Есть ли особеннности в аналитике кофейного бизнеса 11:35 SQL в задачах анализа данных 22:34 Хорошая ли практика - строить ML в SQL 25:00 dbt, Looker и версионирование SQL-кода 41:15 Нужно ли аналитику изучать Python 44:53 Зачем используют MatLab в диссертациях 48:30 Самый любимый BI-инструмент гостя 53:10 Дашборд новоиспечённых родителей 54:24 Динамические дашборды в opensource инструментах 1:08:54 Metabase в качестве BI-инструмента 1:14:42 Как обидеть аналитика данных, или внедрение self-service BI 1:21:20 Бонус для тех кто дослушал Обложка - собственное творение🙂 Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:23:05
October 02, 2021
18. Apache Superset
18. Apache Superset
Тема выпуска "Apache Superset"! Подкаст `Data Coffee` — информационный партнёр конференции SmartData 2021. SmartData — это большая техническая конференция по Data Engineering. Десятки докладов, воркшопов, Q&A-сессий — первые доклады и имена спикеров уже появляются на сайте! Промокод на 2000 рублей: datacoffe2021JRGpc Shownotes: 00:35 Кофе с заменителем молока, который приходится любить 02:09 Что такое Apache Superset и зачем его использовать 07:27 Основные функции и типы источников данных 12:12 Насколько сложен инструмент для менеджеров и аналитиков 13:42 Кастомизация 18:47 Внутреннее представление данных и загрузка своих csv/xlsx 20:41 Что можно сделать с данными после их получения 26:16 Доступ и полномочия 29:28 Способы запустить локально и развитие продукта 31:50 Динамические дашборды и Jinja-шаблонизация 34:47 Как обновляются дашборды, realtime и GIS-данные 39:35 Насколько стабилен Superset и чего в нём не хватает 45:27 Зачем забирать данные из Elasticsearch в Superset 46:49 Superset as a Service 49:41 Куда движется Superset 56:18 Три причины использовать Superset Обложка - https://superset.apache.org Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
59:17
September 25, 2021
17. "Умный" дом и его особенности (гостевой)
17. "Умный" дом и его особенности (гостевой)
Тема выпуска "Умный" дом и его особенности В гостях у подкаста `Data Coffee` организатор DIY-митапов, энтузиаст DIY, умных домов и 3D-принтеров, iOS-разработчик - Вадим Балашов  (Хабр) Подкаст `Data Coffee` — информационный партнёр конференции SmartData 2021. SmartData — это большая техническая конференция по Data Engineering. Десятки докладов, воркшопов, Q&A-сессий — первые доклады и имена спикеров уже появляются на сайте! Промокод на 2000 рублей: datacoffe2021JRGpc Shownotes: 02:03 DIY-энтузиазм 03:57 Профессионалы в “умных” домах 06:35 Что такое “умный” дом 08:30 Уведомления от домашних систем в коммунальные службы 10:50 Думали мы забыли про кофе? Ни за что! 13:08 “Зоопарк” экосистем — можно ли объединить всё под одной крышей? 19:08 Проблемы с политиками производителей 22:53 Недостаточно одних лишь денег для того, чтобы настроить себе “умный” дом 31:29 Виртуальные устройства для расширения систем 34:32 Что можно сегодня автоматизировать в доме 42:20 Продажа “умного” жилья. Делаем дом глупее или зарабатываем на новом хозяине? 47:07 Привязка к электропитанию и подключение своих устройств 55:42 Когда перейдём от автоматики к действительно “умным” домам? Обложка - LindaInpijn, CC BY-SA 4.0, via Wikimedia Commons Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:04:59
September 18, 2021
16. Кринжовый биокриоподкаст
16. Кринжовый биокриоподкаст
Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями! Подкаст `Data Coffee` — информационный партнёр конференции SmartData 2021. SmartData — это большая техническая конференция по Data Engineering. Десятки докладов, воркшопов, Q&A-сессий — первые доклады и имена спикеров уже появляются на сайте! Промокод на 2000 рублей: datacoffe2021JRGpc Shownotes: 01:05 Топ-100 компаний, работающих в облаке 10:51 Каждый сантиметр роста прибавляет мужчине почти $1000 годового дохода 19:30 Пассажиры московского метро смогут оплатить за проезд лицом 26:29 ФБР сделал "безопасный" мессенджер для преступников 32:40 Яндекс запускает беспилотное такси 40:55 Комната, которая заряжает смартфоны и ноутбуки без проводов 45:09 «Открытая Крионика» обвинила «КриоРус» в краже тел и оборудования из хранилища 53:02 Вырастили искусственный мозг с глазами Обложка - Julie St. Louis, U.S. Fish and Wildlife Service, Public domain, via Wikimedia Commons Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
59:26
September 11, 2021
15. Spark, Pandas, Scala и Zeppelin (гостевой)
15. Spark, Pandas, Scala и Zeppelin (гостевой)
Тема выпуска “Spark, Pandas, Scala и Zeppelin” В гостях у подкаста `Data Coffee` developer advocate из JetBrains - Паша Финкельштейн (Twitter, LinkedIn, Telegram) Подкаст `Data Coffee` — информационный партнёр конференции SmartData 2021. SmartData — это большая техническая конференция по Data Engineering. Десятки докладов, воркшопов, Q&A-сессий — первые доклады и имена спикеров уже появляются на сайте! Промокод на 2000 рублей: datacoffe2021JRGpc Shownotes: 00:42 Чем занимается Developer Advocate 02:47 Итальянская обжарка убивает кофе 04:49 Что такое Spark 14:58 Много языков — это хорошо 19:06 Чем хорош Spark 21:01 Чем хороша Scala 24:10 Учить PySpark или сразу Scala? 27:23 Знакомство со Spark через Zeppelin 35:30 Что хуже — Jupyter или Zeppelin 43:08 Истории из проектов гостя 50:08 Big Data Tools от JetBrains Обложка - https://scala-lang.org Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
57:40
September 04, 2021
14. NLP и его место в машинном обучении
14. NLP и его место в машинном обучении
Тема выпуска "NLP и его место в машинном обучении"! Подкаст `Data Coffee` — информационный партнёр конференции SmartData 2021. SmartData — это большая техническая конференция по Data Engineering. Десятки докладов, воркшопов, Q&A-сессий — первые доклады и имена спикеров уже появляются на сайте! Промокод на 2000 рублей: datacoffe2021JRGpc Shownotes: 03:40 Что такое NLP 06:45 Учёные делятся знаниями 10:30 Изучение редких языков 12:56 Где находится NLP в мире ML 16:37 Что лежит в основе Elasicsearch 23:18 DS и ML — одно и то же? 27:26 Кто такой ML-инженер 35:21 Популярные инструменты в NLP 39:28 Предобработка текста 41:35 Популярные задачи, решаемые с помощью NLP 45:21 Вспомнили сериал Доктор Кто 46:51 Проблемы классификации текстов и пути решения 58:42 NLP для emoji и картинок Обложка - "language variety on cadbury's choc" by nofrills is licensed underCC BY-NC 2.0 Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:04:50
August 28, 2021
13. Игры глазами продакт-менеджера (гостевой)
13. Игры глазами продакт-менеджера (гостевой)
Тема выпуска “Игры глазами продакт-менеджера” В гостях у подкаста `Data Coffee` продакт-менеджер из Москвы - Валера Попов (Twitter) Подкаст `Data Coffee` — информационный партнёр конференции SmartData 2021. SmartData — это большая техническая конференция по Data Engineering. Десятки докладов, воркшопов, Q&A-сессий — первые доклады и имена спикеров уже появляются на сайте! Промокод на 2000 рублей: datacoffe2021JRGpc Shownotes: 01:50 Не все любят кофе 03:30 Чем занимается гость 05:44 Нужны ли hard skills менеджеру 08:54 Пайплайн всех IT проектов одинаков 13:58 Кому показывать новые фичи 15:58 Как хранят данные в команде у гостя 21:42 Аналитика на разных платформах разная? 26:57 Retention и play-time 32:20 Угадывание ожиданий пользователей 33:47 На какие группы делить игроков 34:33 Что такое Roblox 37:12 Что можно проанализировать на примере SkyRim 40:10 Как вернуть игрока в игру 41:38 Всё крутится вокруг денег 48:13 Взрывающийся вертолёт 48:49 Чёрные механики и лутбоксы 54:00 Психологи в штате игровых студий 55:44 Metroidvania Обложка - XOXO, CC0, via Wikimedia Commons Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:01:11
August 21, 2021
12. Тайна частной жизни сегодня
12. Тайна частной жизни сегодня
Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями! Shownotes: 01:24 Управление морганием глаз и похожие технологии 08:37 Алгоритмы Twitter предвзяты к темнокожим 14:41 Девять мастер-лиц могут обойти системы распознавания 20:36 46% Python-пакетов в PyPI содержат потенциально небезопасный код 30:42 Apple будет проверять контент на наших устройствах 43:11 “Умный” дом — отстой и разваливается как концепция 57:16 За нами следят и через принтеры тоже 1:11:11 Опрос от Stackoverflow: популярные языки программирования и другое Обложка - Yuri Ribeiro Sucupira, CC0, via Wikimedia Commons Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:33:10
August 14, 2021
11. Хранилище данных Яндекс.Go (гостевой)
11. Хранилище данных Яндекс.Go (гостевой)
Тема выпуска “Хранилище данных Яндекс.Go” В гостях у подкаста `Data Coffee` руководитель DWH Яндекс.Go - Евгений Ермаков (Сайт) Shownotes: 01:35 Традиционно про кофе 03:29 Отличия Яндекс от других компаний 06:49 Что "своё” Евгений сделал в Яндексе 12:18 Экономия места или скорости 14:25 Факторы влияющие на оптимизацию 16:54 На чём построена кодогенерация 17:44 Анализ существующих решений 26:13 Бизнес-глоссарий для данных 29:02 “Под капотом” — кластеры YT и Greenplum 31:41 Эксклюзив для Data Coffee: тизер будущего доклада про трудности в оптимизации Greenplum 38:02 Батчинг, стриминг, вот это всё 39:43 Переходим от технического к более общему 40:02 Как выдвигаются идеи и как потом внедряются 43:02 Ревью, встречи 1:1 и хуралы 45:28 Как оценить затраты на новый проект и искать потом на него людей 51:22 Масштабирование хранилища при переходе от Такси к Go 56:22 Можно ли подкрутить рейтинг в Такси и Драйве Обложка - smallcurio, CC BY 2.0, via Wikimedia Commons Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:00:34
August 07, 2021
10. Gentoo, доработки человека и многое другое
10. Gentoo, доработки человека и многое другое
Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями! Shownotes: 01:04 “Не сможешь поставить Gentoo за 10 дней — нечего тебе делать в IT” и другие тезисы 25:23 Синхронный перевод видео в Яндекс.Браузере 36:49 Необычные плейлисты Spotify 41:38 Яндекс.Драйв будет повышать тарифы за неаккуратное вождение 48:33 Открытые датасеты для беспилотников, прогноза погоды и переводчика 52:43 Мозг подстраивается под новые органы и обстоятельства 1:07:25 Имплантация в тело чипов и не только 1:15:06 Восстановление телескопа Hubble 1:18:45 Схожесть между emoji Обложка - WCusr2019, CC0, via Wikimedia Commons Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:24:33
July 31, 2021
9. IT-системы на автомагистралях (гостевой)
9. IT-системы на автомагистралях (гостевой)
Тема выпуска “IT-системы на автомагистралях” В гостях у подкаста `Data Coffee` product owner компании Глосав - Алексей Мелёхин (Хабр) Shownotes: 01:03 Как обычно, про кофе 04:15 Чем занимается гость? 06:37 Что включает в себя проект "автоматизации" дороги? 08:28 Как работает взимание платы 12:36 Что делать с любителями скрыть номер? 13:46 Системы на дорогах: управление движением и взимания платы 15:30 Система фиксации нарушений и доказательства в суде 18:52 Инородные предметы и непредвиденные ситуации 22:43 Какая информация выводится на панели и знаки 26:12 Другая автоматизация: метеостанции, вода и лёд на покрытии, коэффициент сцепления 28:18 Как работают автоматические сценарии 28:47 Знаки на табло не являются знаками дорожного движения 30:18 Как происходит обмен данными с датчиками на дороге 33:51 Как обеспечить качество распознавания (классификация)? 36:02 Протоколы передачи "обстановки" от дорожных систем в автомобиль? 38:47 Ограничения Carplay / Android Auto 40:43 Далеко ли от дороги ЦОД? 41:33 GPU в серверах ЦОД 42:21 Как устроена система автоматического распознавания инцидентов 44:25 Alex чуть не уехал на встречку из Кипрского аэропорта 45:53 Подбивается ли статистика постфактум? 47:58 Про мост Golden Gate и оптимизацию трафика 50:16 Количество данных, которое генерируется в системах 52:01 Как организован доступ аналитиков к данным 54:26 Пользуются ли Data Scientists этими данными? 58:22 Контроль выезда на встречную полосу с помощью квадрокоптеров 1:00:47 Пролемы беспилотных автомобилей на дорогах 1:04:34 Системы моделирования трафика 1:07:29 Сложность системы и конкуренция на рынке в РФ Обложка - Rob Croes / Anefo, CC0, via Wikimedia Commons Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:14:10
July 24, 2021
8. Цифровые следы, посёлок программистов, Excel и другое
8. Цифровые следы, посёлок программистов, Excel и другое
Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями! Shownotes: 01:05 Новая версия Snoop - за каждым нашим шагом следят 16:12 Нужно ли сегодня уметь аккуратно писать рукой 19:40 Норвежский закон об обозначении обработанных фото 28:10 Посёлок программистов - почему всё рушится? 44:37 В Excel можно сделать всё, но зачем 56:41 Twitter через полгода закрывает Fleets 1:03:00 Новые подкаст-платформы Обложка - Sherlock Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:06:28
July 17, 2021
7. Визуализация данных: бизнес или искусство (гостевой)
7. Визуализация данных: бизнес или искусство (гостевой)
Тема выпуска “Визуализация данных: бизнес или искусство” В гостях у подкаста `Data Coffee` основатель сообщества DataYoga, некоммерческой организации ВИЗСТАНДАРТ, а также нескольких компаний в области изучения языков, лечения от технологических зависимостей и соцмедиа мониторинга - Андрей Демидов (Facebook, LinkedIn, Instagram) Shownotes: 01:52 Кипрский кофе тонкого помола 06:14 Обучение визуализации 07:30 Зачем учиться визуализации, Marketing Technology Landscape 14:39 Стандартные метрики и создание новых 19:10 Научиться расчёту метрик самостоятельно 21:27 Язык визуализации как искусство 27:26 Отвлекает ли искусство в BI от сути 31:38 Самые интересные работы 35:39 Марафоны по работе с данными 44:23 Запрос на финансистов со знанием SQL и художественным образованием 46:11 Разнообразие BI-инструментов 54:00 Open source и бесплатные инструменты 57:00 Community специалистов Обложка - Gregory Burdin, Public domain, via Wikimedia Commons Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:10:51
July 10, 2021
6. Microsoft, Google, DataEng и хакеры
6. Microsoft, Google, DataEng и хакеры
Новостной эпизод подкаста "Data Coffee" с вашими любимыми ведущими! Shownotes: 00:30 Поддержка 3rd party cookies от Google и методика подсчёта ТВ-рейтинга 11:21 Data Engineering Manifesto 24:49 Контролируемая утечка из LinkedIn 30:40 Microsoft показывает Windows 11 пока ведущие поют оды Linux 40:57 GitHub Issues и фантазии насчёт виртуальных помощников 47:24 “Добрые” люди опустошают ваши старые NAS от WD 52:28 Социализм Евросоюза лезет в ваш контракт 58:56 Экомониторинг Байкала — имиджевый проект или польза? Обложка - Hacker behind PC, Public Domain Канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:05:16
July 03, 2021
5. Обсудим новости
5. Обсудим новости
Темы нет или наоборот тем много? Сегодня мы обсудим новости! Shownotes: 04:20 Яндекс запустил нейросеть Балабоба 09:28 Голосовые помощники и их возможности 18:22 Модель проникновения мух в жилище 24:04 Low Code не заменит программистов 32:20 Детская книжка про Apache Kafka 42:14 SQLite в мире приложений 49:02 Влияние манипуляций над данными на стоимость акций 56:40 Факап (или нет?) от стажёра HBO и истории из жизни 1:04:37 На что положительно повлиял карантин Обложка - Tokyoship Talk icon, WTF license Канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
01:23:32
July 01, 2021
4. ETL-инструменты (гостевой)
4. ETL-инструменты (гостевой)
Тема выпуска “ETL-инструменты” В гостях у подкаста `Data Coffee` ведущий разработчик игрового хранилища mail.ru и сооснователь русскоязычного сообщества airflow - Дина Сафина (Facebook, Telegram) Shownotes: 02:05 Два пути IT — либо кофе, либо алкоголь 04:09 Что такое ETL 08:20 Зачем мне ETL, если я — программист 09:25 Как выбрать ETL-инструмент 11:40 Airflow и другие инструментыы 18:57 Внутреннее устройство Airflow 27:49 Airflow-as-a-Service 33:57 Другие open-source решения 36:06 Dagster — убийца Airflow Обложка - https://airflow.apache.org Канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
42:02
June 26, 2021
3. Данные в журналистике (гостевой)
3. Данные в журналистике (гостевой)
Тема выпуска "Данные в журналистике" В гостях у подкаста ‘Data Coffee’ журналист "Медиазоны" - Максим Литаврин (Twitter, Telegram) Shownotes: 01:00 Журналист и кофе 04:00 Зачем журналисту данные 05:41 Где он их берёт 07:08 Инструменты журналиста 11:20 Как проверять информацию 20:00 Доверие читателя к журналисту 27:17 Кто владеет информацией - владеет миром? 29:38 Манипуляции vs. Open Government 41:06 Какие данные должны быть открытыми 44:24 Россия держится хорошо! 48:26 Начало пути в журналистику Обложка - Open Government Partnership, CC BY-SA 3.0, via Wikimedia Commons Канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
53:59
June 19, 2021
2. Облака и Data-Driven Culture (гостевой)
2. Облака и Data-Driven Culture (гостевой)
Тема выпуска "Облака и Data-Driven Culture" В гостях у подкаста ‘Data Coffee’ специалист по созданию аналитических решений из Канады - Дмитрий Аношин (Telegram, Linkedin, Хабр) Shownotes: 01:22 Сколько кофе пьют канадцы 04:18 Что такое “облако” (описание от NIST) 08:20 Преимущества облачных решений 16:35 Последствия концентрации сервисов в одних руках 25:28 Делают ли облачные провайдеры инновации 31:55 Data-driven culture 38:27 Обучение работе с данными на платформе DataLearn Обложка - Marc de Jong, CC BY-SA 4.0, via Wikimedia Commons Канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
49:45
June 12, 2021
1. Где данные?
1. Где данные?
Тема выпуска "Где данные?" Shownotes: 00:30 Что такое данные 01:11 Как было раньше 03:42 Положение дел в 2010-2011 03:56 Зеттабайты, эксабайты, петабайты, терабайты… 04:30 Ну а что сейчас? 05:31 Данные — новые деньги 06:11 Реклама сегодня Обложка — João Batista Neto, CC BY 3.0, via Wikimedia Commons Канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
09:02
June 05, 2021