Láncreakció
By Láncreakció Clementine
LáncreakcióOct 21, 2023
#159 - Nagy megmondások a dataSTREAM 2024 farvizén
2024. május 14-én tartotta a Clementine éves adattudományi konferenciáját, ahol a szokások szerint az utolsó programpont egy Láncreakció adás felvétele volt. Ezúttal is vendégekkel (Kovács-Ördög Zita és Fegyó Tibor) beszéltük át, mi jutott eszünkbe az egyes előadásokban tárgyalt témákról. Gartner Hype Cycle, EU AI Act, vállalati jóllét adatalapon, hálózatvizualizáció, GPT-4o és meteorológia volt terítéken.
Kapcsolódó epizódok:
#134 ChatGPT-cunami a conTEXT2023-on
#109 - Beszélgetés a skynetezésről a dataSTREAM-en
#90 - Egy igazán magyar hangasszisztens
#158 - Bál volt az Operában, BASIC-ben
Hatvan éves a BASIC programozási nyelv, amit a magyar marslakókkal is dolgozó, élete utolsó évtizedében a Dartmouth College rektoraként tevékenykedő Kemény János tervezett, aki a BASIC mellett az első működő időosztásos rendszer kifejlesztője és az email ősének megalkotója is volt. Az eredeti BASIC-ben nem voltak sorszámok és compiler változata is létezett, de ahhoz, hogy a BASIC-re építve elterjedjenek az otthoni és iskolaszámítógépek, mindennél egyszerűbbé kellett változtatni a nyelvet. Már csak az a kérdés, mi köze mindennek a KFT zenekar 1984-es nagylemezéhez?
#157 - Robotkapitányok a rumoshordón ülve
Vendégünk volt Gergely Norbert, a Clementine elemzője, nem mellesleg vitorlás oktató, akivel arról beszélgettünk, hogyan jelent meg az informatika (sőt, a mérnöktudományok úgy általában) a vitorlássportban és mit keres a mesterséges intelligencia a tengerhajózásban. Szóba került a Balaton 25 hajóosztály, az IBM Atlanti óceánt átszelő önvezető hajó projektje, a Mayflower, a hordszárnyas (hydrofoil) hajók, az America's Cup, a Pyxis Ocean merev vitorlával (WindWing) támogatott LNG tanker és a sudoku-rajongó kapitányok lecserélése robotpilótára.
#74 - Lesz-e vihar a meteorológiában?
#154 - Fogunk-e mindnyájan venni atyáskodó elektromos autókat?
#156 - Nem csak Budapestről indulhatnak világcégek
Vendégeink voltak Karasszon Dezső és Vasvári Zoltán, az adatgyűjtéssel és -elemzéssel világot hódító debreceni vállalat, a Dataexpert tulajdonosai. Beszéltek a vidék előnyeiről, a segítőkész hollandokról és a világjárvány okozta megtorpanásról, ami végül mégis felfelé lökte a céget.
Kapcsolódó epizódok:
https://lancreakcio.clementine.hu/tragya-vagy-olaj
https://lancreakcio.clementine.hu/hany-adatprojekt-szakitja-at-a-celszalagot
https://lancreakcio.clementine.hu/tikk-domonkos-a-gravity-sztori
https://lancreakcio.clementine.hu/tiszta-adat-marpedig-nincs
#155 - A konzumidiotizmus találkozása az MI-vel
Megpróbáltuk magunkat az egyszeri fogyasztó helyébe képzelve értelmezni a szolgáltatások és a mesterséges intelligencia legújabb szerelemgyerekeit - a körkép pedig sötétebbre sikeredett, mint amire számítottunk: megbukott az Amazon Fresh "Just Walk Out", azaz pénztáros nélküli bolt koncepciója, mert évek alatt sem sikerült feltanítani a kiszolgáló MI-t; a generatív modelleket filléres regények írására és publikálására használó csaló ikrek nem szédíthetik tovább tanítványaikat; új világvégét vízionál a dinamikus árképző rendszerek mögött a The Atlantic; az MI által működtetett étteremben robotkarok emelgetik a krumplisütő kosarakat.
#154 - Fogunk-e mindnyájan venni atyáskodó elektromos autókat?
Gyuri vett egyet, ezért jó mélyre beleásta magát a közlekedés elektrifikációjának témakörébe, és ma megosztja, amit megtudott: tényleg csak elektromos autókat fognak-e gyártani Európában 2035-től, van-e értelme a hidrogénhajtásnak, vesznek-e az emberek elég EV-t, lesz-e valódi önvezetés és ha igen, eljön-e a pillanat, amikor az autónk MI-je a sarokba állít minket? Villanyautós megmondás érthetően, az adattudós szemüvegén keresztül.
Kapcsolódó korábbi epizódok:
#151 - Bukott Tesla és halott Lou Reed #91 - Önvezető babakocsi és intelligens sütő Las Vegasban #123 - Döntéshozó drónok és legyőzött vadászpilóták
#153 - A háromtest probléma a Netflixen
Megnéztük, elolvastuk, aztán nekiálltunk szétcincálni a benne foglalt fizikát, miközben a sorozatot mindnyájan eléggé szerettük. A cincálás során előkerült a Riemann-sejtés, két magyar tudós (Szebehely Győző és Izsák Imre) és a húrelmélet is.
Kapcsolódó epizódjaink:
#039 - Az adatbányászok moziba mennek
#152 - Hogyan tanítjuk meg egy chatbotnak, hogy befogja a száját?
Vendégünk volt Hámornik Balázs, a SEON termékmenedzsere, akivel a nemrég bemutatott chatbotjukról beszélgettünk, amely RAG technológiával készült, support feladatokat lát el és nagyon akar válaszolni, pedig nem mindig szabad neki. Hogyan lehet betanítani egy ügyfélszolgálati chatbotot, hogy mivel kapcsolatban hallgasson, mire mit válaszolhat, hogyan ne kezdjen el hallucinálni, és hol húzza meg a saját határait?
#151 - Bukott Tesla és halott Lou Reed
Pezseg az MI-színtér! Miközben a nagykutyák veszekszenek és az újságok lódítanak, a magyar PULI egyre okosabb lesz - és kipróbálható! Elon Musk perre megy az OpenAI-jal és nyílt forráskódúvá teszi a Grokot. Az önvezető autókat ekézik az amerikai biztosítók (joggal?), a Midjourney új verziója konzisztens karakterkezelést nyújt, Laurie Anderson pedig gyakran beszélget halott férjével, Lou Reeddel.
A becslős játék forrásai: a világ aranyfelhasználása, az Internet áramfogyasztása, Magyarország pillanatnyi áramexportja.
Kapcsolódó epizódok:
#150 - Megszabadulunk-e a SORA-val a hollywoodi színészektől?
Az OpenAI bemutatta a SORA-t, a pár perces videókat szöveges promptból generálni képes MI modelljét, ennek nyomán gondolkoztunk el azon, hogyan fogja ez ténylegesen megváltoztatni a világot, és valóban akkora forradalmat hoz-e, mint arról most szeretnek sokan beszélni. Ehhez sorra vettük a SORA demo videóit, ami kapcsán a rend kedvéért jegyezzük meg, hogy az újfundlandi kölykök valójában golden retrieverek, de Gyuri nem is rájuk, hanem tényleg a farkaskölykökre gondolt.
Kapcsolódó epizódok:
#131 - A képzőművész, az MI és a giccsfestők
#149 - A világnak kellenek a bullshit melók!
Mi az a bullshit job, miért jött létre és vajon az MI megszünteti-e ezeket? David Graeber elhíresült könyvében, a Bullshit Jobs-ban amellett érvel, hogy a modern társadalmak állásainak fele felesleges és káros. Ezzel ugyan nem értünk egyet, de azt látjuk, hogy sok munkakört tényleg nem a hatékony működés termelt ki. A Robert M. Solow Nobel-díjas közgazdászról elnevezett Solow-paradoxon szerint a gazdaság lassabb ütemben növekszik, mint az az informatikai fejlődésből következne, illetve Stafford Beer könyvében, a Designing Freedomban arra jut, hogy egyre több erőforrást fordítunk a társadalom repedéseinek befoltozására. Ezekre alapozva úgy sejtjük, hogy az MI sem fogja a bullshit munkákat megszüntetni, csak lecseréli azokat másik hasonlókra.
Kapcsolódó podcastjaink:
#103 - A legújabb data science címkék kiakasztják a bullshit-métert
#76 - Állást keresel? Vigyázz mit hirdetsz a Jófogáson!
#148 - Mitől hagyja abba a ChatGPT a hallucinálást?
A nagy nyelvi modellek hajlamosak elkezdeni össze-vissza beszélni, ezt azonban el lehet kerülni, ha a válasz alapjául szolgáló információ megtippelését nem az LLM-re, hanem egy hagyományos keresésre bízzuk: a Retrieval-Augmented Generation, azaz RAG megközelítés ebben jeleskedik. Azt csak gyanítjuk, hogy új kedvenc Mac-es böngészőnk (Ferié mindenképpen), az Arc Browser, és iPhone-os tesója, az Arc Search ezen alapszik, s biztos ezen fognak az újfajta tudásbázisok, ügyfélszolgálati chatbotok, sőt akár keresők is.
#147 - A véleménykutatás jól van, pedig zombik tépik
Kassai Endrével, a Piackutatók Magyarországi Szövetsége elnökével, társadalomkutatóval arról beszélgettünk, tényleg leáldozott-e a kérdezésen alapuló véleménykutatásnak, vagy csak a politikai célú, vagy ebben a kontextusban kommunikált eredmények keltenek téves képzeteket? Miért tabu a poltikai vélemény vagy a jövedelmi viszonyok ebben a régióban, hogyan lehet ezt megkerülni, miben különbözik egy politikai kutatás egy marketingestől, illetve hogyan segítheti az MI ezt a tudományterületet? A beszélgetés a két héttel ezelőtti, 145. Láncreakció adás folytatása.
#146 - Mi köze Taylor Swiftnek a Nagy Nyelvi Modellekhez?
Semmi. Ugyanakkor őt is utolérte a generatív MI, többek között az X-en terjedő deepfake pornója képében. Nemcsak erről volt szó, hanem:
- Elon Musk chipet ültet az emberek agyába
- Sam Altmann: a GPT 5 jobb lesz, mint a 4
- Sam Altmann arab pénzből épülő csipgyárral akarja felvenni a versenyt az Nvidiával
- Az Apple M chipeket Tajvanon gyártja a TSMC
- Mi van a Google-féle Geminivel?
- Volkswagen és ChatGPT a CES-en
- Mistral / Mixtral 8x7b
- SLM (Small Language Model)
- Phi2 (Micosoft)
- Johnny Harris meg-deepfake-ekte magát (video)
#145 - Van-e még jövője a közvéleménykutatásnak?
Az utóbbi években rendszeresen tapasztaljuk, hogy a politikai tárgyú, kérdezéses alapú előrejelzések rendre megbuknak, mintha ez a módszer már nem lenne alkalmas a közösségi vélemény szondázására. Vajon valóban elmúlt az idő az önbevalláson alapuló véleménypanelek felett? Jön helyette valami más? Esetleg az MI? Ezekre a kérdésekre kerestünk felforgató válaszokat ebben az epizódban.
#144 - Dataracing Gáspár Csabával
Gáspár Csaba, a DMLab vezetője és a Műegyetem TMIT tanszék tanársegédje segítségével megvontuk az idei Dataracing mérlegét, ahol idén előretörtek az egyetemisták, de ahol az első tízben végzett a mi Gyulánk is! Mi volt a feladat, milyen megoldásokat alkalmaztak a győztesek, jutott-e érdemi szerephez a mesterséges intelligencia a versenyen?
#143 - Az MI megérkezett a porszívókba is!
Új, rendszeres játékkal indítunk, amiben a Google-höz kell felvételiznie a műsorvezetőknek. A számolgatás után pedig rácsodálkoztunk, hogy év eleji jóslatunkat a Las Vegas-i CES kiállítói igazolták: a beágyazott MI minden kütyüben megjelent, legalábbis a marketing szintjén. A horkolásgátló párnák, mosógépek és porszívók mellett viszont bemutatták a Rabbit R1-et is, vele pedig megismertünk egy új kifejezést: a LAM-ot, illetve a Samsung idei csúcstelefonjában megérkezett a telefonba épített bábelhal és a generatív képmanipuláció is. Gyuri emellett rácsodálkozott a villanyautók útvonaltervezőjére (A Better Routplanner) és a startupok új hozzáállására is.
#142 - Mivel tölti a napját egy matematikus?
Vendégünk volt Keszthelyi Gabriella, a BME adjunktusa és a Rényi Alfréd Matematikai Kutatóintézet kutatója, akit arról faggattunk, milyenek is valójában a matematikusok? A beszélgetés során előkerült az Arxiv.org, a Négyszín-tétel, Gabi Erdős-száma, John Bohannon átverős diéta-kutatása, Nicholas Cage és a medence-halálok kapcsolata, illetve a Cochrane review, valamint a Rényi keretei között szervezett matematikus-támogató workshopok sorozata.
#141 - 2024 az áram éve lesz?
Idén is megpróbáljuk megjósolni, mik lesznek a legjelentősebb fejleményei az adattudomány és a mesterséges intelligencia iparágaknak, de hogy legyen súlya is a szavainknak, számba vesszük a tavalyi tippjeink sikerarányát is. Spoiler: egész jól tippeltünk!
#140 - 2023 a valóságérzékelésünk fekete lukában
Az elmúlt év utolsó adásában megpróbáltuk fellelni 2023 szórakoztató híreit, de legfeljebb keserédes lett a lista. Felemlegettük az OpenAI szappanoperát (Sam Altmann, majd a board kirúgása), a Google LLM modelljének (Gemini) sokat kritizált bemutató videóját, Andrej Karpathy LLM-magyarázatát (és származását), a Future of Life Institute év eleji aláírásgyűjtését az MI kutatások szüneteltetésére, az NRC-Bosch-Richter véleménykutatását az MI hazai megítéléséről, az automata pénzcsináló videocsatornákról, sőt végül a Schwarzschild-sugár is szóba került, de azt már mi sem értjük, hogyan.
#139 - Egy magyar adattudós Sandokan nyomában
Vendégünk volt a Clementine egyik alapítója, Cseh Zoltán, aki több mint tíz éve él és dolgozik Délkelet-Ázsiában. Fő székhelye Malajzia, de sokat dolgozik Indonéziában vagy a Fülöp-szigeteken is és kedvenc home office helyszíne Bali, ahol a pandémia alatt ragadt. Miben más ez a térség kulturális és adattudományi szempontból, hol tartanak hozzánk képest, milyen előnyt hordoz a hatalmas népesség, hogyan kezelik a privacy jogokat és a felhőt, végül mit tudnak a maláj tigrisről?
#138 - Az új Mad Maxtől a milicista haláláig
Év végi hírcsokrunkban előbukkant az új Mad Max film (Fuiosa - a Mad Max Saga), az Amazon Q névre keresztelt LLM-alapú asszisztense és a nemsokára hasonló képességekkel bíró Apple Siri, a GAFAM betűszó, a gitározó indiai miniszterelnök, a Spotifynál reptében fordított podcastok, a speech-to-speech technológia és a generált fotók által megváltozó riportfotó műfaja, aminek elődje lehet Robert Capa híres képe, a Milicista halála.
#137 - Hol voltak a leglazább sales-es állások 2023-ban?
Az MI-üzlet idei trendjei alapján a legkényelmesebb értékesítői pozíciók az nVidiánál, a Teslánál vagy az OpenAI-nál voltak, de jó lehetett dolgozni a pharma-szektor startupjainál és a progresszív IT cégek generatív MI főosztályain is. Mi történt 2023-ban az MI-iparban a State of AI jelentés szerint?
#136 - Matekos mémek magyar módra
Miben osztozik a hat lépés távolság, az Élő-pontok rendszere, Kempelen Farkas sakkozógépe és az erről elnevezett Amazon-szolgáltatás, a Neumann-elvek, a bűvös kocka, a Gömböc és az Excel születése? Egyfelől abban, hogy matematikáról beszélgető asztaltársaságok kedvelt mémjei, de van bennük más közös is! Előkerült még egy Kempelen-monográfia, az Időfutár, az Erdős-szám és a Bacon-szám, Ottlik bridzs-könyve és kisregénye, a Valencia-rejtély
#135 - Lesz-e jövőre MI generálta sláger? - A State-of-AI jelentés
Az Air Street Capital hatodik éve készíti el az elmúlt év MI-trendjeinek kimerítő áttekintését, a State of AI Reportot: mi történt az akadémiai szférában, az iparban, a politikában és az MI-biztonság terén idén és mi várható jövőre? Arról is beszámolnak, beváltak-e a tavalyi jóslataik és mit várnak 2024-től - mi pedig elmondjuk, amit szerintünk tudni érdemes belőle.
#134 - ChatGPT-cunami a conTEXT 2023-on
A podcast ezúttal a Clementine évi rendes szöveganalítikai konferenciájának színpadáról jelentkezik, ahol Schäffer Krisztián, az aijunior.dev önmagát programozó coder-segéd megalkotója társaságában megbeszéltük, mi jutott eszünkbe az előadásokról. Idén a nagy nyelvi modellek, a transzformerek és a generatív MI volt fókuszban, így került szóba a titkolózó OpenAI, a nem is olyan kicsi Puli, a versíró watsonx, a miniszterelnök 1056 beszéde, a prompt-alapú programozás és a vonatokról beszélő telefon.
#133 - A ChatGPT csak beszél, de akarni nem tud
Vendégünk volt dr. Prószéky Gábor, a MorphoLogic alapítója és a Nyelvtudományi Kutatóközpont főigazgatója, akivel arról beszélgettünk, mi volt a ChatGPT előtt, hová lett a BERT, miért kell magyar GPT-t (a Pulit) csinálni, van-e tudásreprezentáció a generatív MI modellekben, hihetünk-e a kozmológiai állandónak és kell-e félnünk attól, hogy a Wikipedia a fejünkre nő?
#132 - A podcasterek szoftverterméket tesztelnek
Az epizód során lesből figyelhető meg a Láncreakció személyzete, amint kipróbálja az IBM vadonatúj watsonx platformjának PromptLab modulját, amivel a vállalatok saját tudásfelhőjükkel szabhatják testre a különböző nagy nyelvi modelleket. Az AI workflow no-code-alapú kialakítására szolgáló rendszer bemutatásra egyébként sor kerül a conTEXT 2023 konferencián is november 14-én.
#131 - A képzőművész, az MI és a giccsfestők
Ezúttal Weiler Péter képzőművész, nem mellesleg a Habostorta és Randivonal társkeresők alapító tulajdonosa volt a vendégünk és egyebek mellett azt kerestük, kiből lesz elismert képzőművész, volt-e értelme az NFT láznak, hogyan hat a képzőművészetre a generatív MI megjelenése, egyáltalán mi művészet és mi nem az, szabad-e MI-t használnia egy festőnek, és van-e még sminkese és fodrásza a nagy fotósoknak?
#130 - Mihez kezdjünk a Nobel-díjasainkkal?
Vajon megfelelően dolgozta-e fel a hazai sajtó a magyar tudományos élet dupla szenzációját? Mekkora a jelentősége Karikó Katalin és Krausz Ferenc sikerének a hétköznapi élet szempontjából? Mennyiben számít magyar eredménynek a két külföldön dolgozó kutató elismerése és kell-e ezzel foglalkoznunk egyáltalán? Ki lett Nobel-díjas a Fasori gimiből és hogy mitizálta ezt Marx György könyve? Van-e jó tudománynépszerűsítő tartalom magyarul? (Lásd pl. Atomcsill.) Körüljártuk a magyar Nobel-díjasok kérdéskörét.
#129 - Szélhámos szakértők az MI körül
A podcast történetének legnagyobb vitája akörül forgott, hogy ki nevezheti magát MI szakértőnek és ehhez képest ki szokta annak titulálni saját magát? Károsak-e a megmondóemberek, szabad-e a tudósoknak társadalmi hasznosságról dönteni és milyen diploma kell ahhoz, hogy érvényeseket mondhassunk a mesterséges intelligenciáról a médiában vagy egy konferencia színpadán?
#128 - Hol áll hazánk az MI-világlistán?
Megnéztük a Global AI Index nevű kutatást, amiben 111 szempont szerint rangsorolják a világ országait a mesterséges intelligenciához való viszonyuk alapján, hogy kiderítsük, tényleg csak USA és Kína versenyez-e és hogy utóbbi lenyomja-e Amerikát? Ha már arra jártunk, idéztük egy chicagoi think tank (MarcoPolo.org) kutatását a téma kutatóinak tanulmányi mobilitásáról, és egy Nature cikket, ami azt fejti meg, a vonatkozó kínai publikációk dömpingje minőséget vagy csak mennyiséget képvisel-e. A beszélgetés során az is kiderült, megelőzi-e hazánk a régió többi országát az MI témájában, valamint hogy van-e Angliának ipara.
#127 - Ügyfélszolgálat vagy profitorientált időhúzás?
A Láncreakció személyzete nagy levegőt vett és hosszan ventillált ügyfélszolgálati élményeiről, hogy aztán ezzel alapozza meg ezen szolgáltatások mozgatórugóit felfedő, érdekeit és különféle felfogásban előadott megvalósításait leleplező szakmai kirohanásait. Miért nincsenek jó ügyfélszolgálatok, miért akarják lepattintani az ügyfelet, és amelyik mégsem, annak miért éri ez meg? Mit tudna tenni az MI ezért a szegmensért és vajon szeretné-e ez a szegmens, hogy az MI tényleg kisegítse?
#126 - Béla beindul az OSINT-ra!
A Clementine szakértője, Csatlós Béla volt a vendégünk, aki számos sztorival körítve világította meg, hogyan tud használni az államigazgatás egy olyan összetett kockázatkezelő és adatkinyerő rendszert, mint a ClemRisk. Miért reklámozzák a legnagyobb OSINT-adatbázist azzal, hogy a bűnözők is rendelnek pizzát? Kell-e aggódni a kisembernek? Mi van ma a krimik egész falakat beborító, piros cérnával összekötögetett táblái helyett a rendőrségi falakon?
#125 - MI is csak emberek vagyunk!
A műsorkészítők elárulják, mi foglalkoztatja őket úgy igazán, ha felteszik az MI szemüvegüket. Egyáltalán: le szokták venni? Közben kiderül az is, hogyan design-olta meg a Bosch a budapesti irodáit, hány kilométert vezetnek a fővárosi taxisok és hogy lesz ebből állás a Google-nél, közveszélyesek-e a Waymo taxik San Franciscóban, probléma-e a hadseregben a 8 inches floppy és a Windows XP-t futtató anyahajó, lehet-e használni üzleti célokra a spaCy-t és mire való az Excel Python-implementációja.
#124 - Munkahelyi románcot fogott a csalásdetektor
A Clementine fraud detection szakértőjével, Gergely Norberttel beszélgettünk arról, hogy miért az ügyfelek fizetik meg, ha valaki átveri a biztosítót, szükség lesz-e még kárszakértőkre az MI korában, milyen elemekből áll egy ilyen rendszer (pl. a ClemRisk), és mire jó még, ha anomáliákat keresünk egy adatbázisban.
#123 - Döntéshozó drónok és legyőzött vadászpilóták
Adásunk vendége kettős életet él: Kárpáti Endre egyszerre az Erste adattudósa és az Aranysas katonai repüléssel foglalkozó magazin főmunkatársa több évtizede. Hogy néz ki a jelen és a jövő légiharca egy adattudós szemüvegén keresztül? Miben más az orosz-ukrán háború az elmúlt évtizedek konfliktusaihoz képest? Milyen fegyverek vesznek részt napjaink csatáiban, lesznek-e önálló döntéseket hozó bombázók, vajon mi jelenti az igazi veszélyt az MI és repülés találkozásakor? Miközben ezekről beszélgettünk, előkerült néhány eszköz és fogalom, amiről érdekes még tájékozódni: különböző drónok, mint az orosz ZALA Lancet, a török Bayraktar és az amerikai RQ-4, a legmodernebb orosz tank (T-90M), vagy az ukrán MiG-29-esekre felbarkácsolt AGM-88 HARM levegő-föld rakéta, továbbá olyan fogalmak is szóba kerültek, mint a Collaborative Combat Aircraft, a beszélgető drónrajok, végül a DARPA AlphaDogfight.
#122 - Kézműves hamburgert minden zenerajongónak?
A hollywoodi színészek sztrájkolnak a digitális avatarjuk miatt (is), a Spotify generált zeneszámok tömegét írtja a platformjáról a nagy kiadók legnagyobb örömére, a Google nem bocsátja ki a MusicLM-et, mert az 1%-ban másolatokat generál, a New York Times pedig a földbe készül beleperelni az OpenAI-t - egyszóval gyülekeznek az iparági felhők a generatív MI által létrehozott kreatív alkotások felett. Vajon mi jelenti a nagyobb veszélyt erre a területre, a fogyasztók ragaszkodása a humán művészethez, vagy a nagy gazdasági rendszerek ellenérdekeltsége?
#121 - Történetek Adatországból
Miért érdemes történetekbe ágyazni az elemzések végeredményét, amikor prezentáljuk azokat? Mi értelme van az adatalapú történetmesélésnek és kik ennek a legnagyobb mesterei? Mit mond erről Jean-Luc Godard és Ludwig Wittgenstein? Na és Gyula kedvenc prezentőrje, Brent Dykes és az ő Effective Data Storytelling blogja? Ide kapcsolódik Gyuri kedvence is, a tudományos kommunikáció tanítómestere, Patrick H. Winston és híres videója, a How to Speak. Gyula említett még néhány storytellert (Nancy Duarte, Ben Jones, Alberto Cairro), végül Gyuri két jutifalatot is feldobott, egy adatvizualizácós demó oldalt (r2d3.us), és egy nagymúltú tankönyv új, pythonos, letölthető változatát (An Introduction to Statistical Learning).
#120 - Most akkor a Facebook tényleg nem is veszélyes a társadalomra?
Július végén jelent meg egy nagyszabású kutatás független tudósok és a Meta együttműködésével, ami azt elemezte, a Facebook hírfolyamát alakító algoritmusa hatással van-e a felhasználók politikai attitűdjére, szélsőségek iránti fogékonyságára vagy éppen választási kedvére. Elvileg az derült ki, nincs. De tényleg nincs? Lehet, hogy a visszhangkamra és a szűrőbuborék nem is létezik? Tudományosan megalapozott fogalmak ezek egyáltalán? Hogyan köthető mindez a dohányzás huszadik századi kutatásához és Gyuri társadalomtudományokkal ápolt kapcsolatához?
#119 - Virtuális valótlanság?
Mi a különbség a virtuális és a kiterjesztett valóság között, melyiket mire használják, milyen lett az Apple évek óta várt kevertvalóság szemüvege (az Apple Vision Pro), ellopja-e Cupertino a képünket és a hangunkat, mit firkáljunk a falra a virtuális Colosseumban és miért nincs otthon a pápa? VR, AR, deepfake és nyelvi MI-k az Apple-nél.
#118 - Krézi hírek, avagy rácsodálkozunk a világra
Nyár van, a könnyű mínuszos hírek ideje, erre tessék, tele a padlás olyan újdonságokkal, hogy csak lesünk. Sam Altmann bevezette a Worldcoin nevű kriptovalutáját, amit csak humánok használhatnak (tőzsdei botok és vállalatok elvileg kizárva), mert egy Orb nevű vasgömbbe kell belenézni a regisztráció során, hogy az írisz azonosítsa a felhasználót. Az íriszekkel kereskedés napokon belül megkezdődött. A Meta ezzel szemben a VoiceBox hangutánzó szoftvert vezette be, de aztán megijedt és nem tette nyilvánosan elérhetővé, mert túl jól sikerült. Francesca Gino harvardi professzor, a viselkedéstudomány elismert tudósa és gyakran idézett szerző pitiáner adathamisítással bukott le, így most kényszerszabadságon tartózkodik. Az esetről remek videós összefoglaló is nézhető. Az MI pedig vagy elveszi a munkánkat, vagy nem, ez csak azon múlik, hogy éppen melyik cikkét olvassuk ugyanannak az újságnak. De semmi vész, mert néhány számítástechnikus szerint a ChatGPT butul, és ezt ki is mérték, szóval megmenekültünk. Vagy nem.
#117 - Kell-e a gyorstalpalt szakértőnek a lineáris regresszió?
A Clementine SPSS Nyári Iskolájában járt a Láncreakció, így egy veszprémi teázó kertjében beszélgettünk dr. Abonyi Jánossal, a Pannon Egyetem rektorhelyettesével arról, hogy hogyan lehet adattudósokat képezni, melyik az ideális rezgésmérő eszköz, lehet-e az ipari szereplőkkel publikálni, hány szabadalmat köteles évente előállítani egy egyetem és hogy jön össze a folyamatbányászat a hallgatók bukási mintázataival?
#116. Elveszi-e az AutoML a munkánkat?
Lemerültünk az AutoML csomagok mélyére, hogy felhozzuk onnan a nemtudás gyöngyeit. A Gyula által megversenyeztetett csomagok (PyCaret, H2O, TPOT) focis adatbázisokon (pl. FiveThirtyEight) dolgoztak és versenybe szálltak a korábban emberi csapatoknak kiírt adattudós-verseny babérjaiért, de nem áruljuk el, hanyadikok lettek. Bezzeg az adásban!
#115. Kit nevezhetünk MI szakértőnek?
Manapság a médiának MI témában nyilatkozó szakértőkre van szüksége. Vajon a megfelelő személyeket találják meg? Egyáltalán, kit nevezhetünk szakértőknek és mire van inkább szükség, jó kiállásra vagy akadémiai háttérre? Az OurWorldInData.org készített egy nagy predikciós körképet, amiben 352 szakértőt kérdezett meg arról, mikorra teszi az emberi szintű mesterséges intelligencia eljövetelét - de vajon van bármi értelme egy ilyen körkérdésnek? És annak a generalizált előrejelző közösségnek (Metaculus.com), amelybe bárki beszállhat, és akár pénzdíjas predikciós versenyeken is részt vehet? Megpróbáltunk válaszolni.
#114 - Nagy Nyári Salátaörvény
A felvétel pillanatában még reménytelenül esős, de azóta magára talált nyarat ünnepelve a társaság össze-vissza beszélt, emlegetett kifejezéssel hochmeczolt. Szóba kerültek Gyula kalandjai az AutoML technológiákkal, dos Santos Salamon kulcsa című regényének kapcsolódása az adattudományhoz, a kvantummechanika remek angol Wikipedia-oldala, Soros György reflexivitás-elmélete és Taleb Fekete hattyú című kötete, illetve Feri örömmel újságolta, hogy többé már nem kell az év elején jósolnia, hogy idén fogja bemutatni az Apple a kevertvalóság-szemüvegét (Apple Vision Pro), mert most megtette.
#113 - Podcastfesztivál az adattudós szemüvegén át
Május 31-én egész nap Podcastfesztivál volt, és úgy gondoltuk, érdemes róla beszélni. Annál is inkább, mert pár nappal korábban mutatták be az IAB Hungary által megrendelt, NRC által elkészített Podcast Insight Hungary kutatást, annak főbb számaival egyetemben. Hányan hallgatnak ma Magyarországon podcastot, kik ők, miért, de főképpen jogos-e a hurráoptimizmus? Ha az adatszakértő szemével nézzük a kutatás számait, alternatív magyarázataink is születhetnek, erre jutottunk. Ha már beszélgettünk, elővettük a Pillangót is, meg a podcastot szerkeszthető szöveggé alakító, majd azt vissza-hangosító Descriptet.
#112 - Boldog szülinapot, Clementine!
Pár nappal a Clementine 18. születésnapja után elábrándoztunk azon, honnan indult Gyuri cége, mivel lepte őt meg egy régi ügyfele az ügetőn, milyen párhuzamok vannak a természettudományos végzettségű, ám szociológiára áthallgató fiatalemberek szerelmi életében, és hogyan vált egy holland konferencián nyilvánvalóvá, hogy a Clementine beszáll az NLP-be? Kis magyar adattudomány-történelem nosztalgia-köntösben.
#111 - Mennyit keres egy ChatGPT-idomár?
És úgy általában milyen szakmákkal versenyez az ML Engineer? Ugyanazt kell-e tudnia, mint egy data scientistnek, egy data analystnek, vagy egy data engineernek? Ki mennyit keres, melyik szakma mekkora hiány? Rendet teszünk a Data szakmában és bónusznak megtárgyaljuk azt is, leküzdi-e az MI az inflációt?
#110 - Ki kicsoda a Nagy ChatGPT-aggódásban?
Ha már mindenki a generatív MI előnyeiről és veszélyeiről osztja az észt, bemutatjuk az észosztás résztvevőit! Kicsoda Steve Wozniak, Max Tegmark, Eliezer Yudkowsky, Tristan Harris, Jaron Lanier, Mérő Lászó, Andrew Ng és Yann LeCun vitája, Timnit Gebru és elhíresült tanulmánya, Emily M. Bender, Sam Altman, Henry Kissinger és Eric Schmidt a WSJ-ben, Yuval Noah Harari vs Yann LeCun, Naomi Klein cikke, Tilesch György, Margrethe Vestager és Thierry Breton? Ki mit gondol és ehhez milyen tudományos háttere, múltja van?