Skip to main content
regonn&curry.fm

regonn&curry.fm

By regonn&curry
regonnとcurrypurinがデータサイエンス・機械学習(主にKaggle)について話します。新しい働き方や量子コンピュータ、xR等寄り道もしていきます。
Listen on
Where to listen
Apple Podcasts Logo

Apple Podcasts

Breaker Logo

Breaker

Google Podcasts Logo

Google Podcasts

Overcast Logo

Overcast

PodBean Logo

PodBean

RadioPublic Logo

RadioPublic

Spotify Logo

Spotify

126 dinoとか
話した内容Blog このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、dino、Spotifyの有料ポッドキャスト開始、simulationコンペのスコア変動を通知する、5月の目標、Hungry GeeseTOPチームのTwitterアカウント開設、今週のKaggleについて話しました。
36:15
May 8, 2021
125 不動産テックDiscordとか
話した内容Blog このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、Papers with Datasets、不動産テックDiscord、CoeFont Studio、アップル春の新製品、4月目標結果、今週のKaggleについて話しています。
37:27
May 3, 2021
124 Obsidianとか Google Cloud Secret Managerとか
話した内容Blog このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、Obsidian、Google Cloud Secret Manager、統計検定データサイエンス試験、Kaggle notebook のブログ埋め込み、今週のKaggleについて話しています。
25:34
April 26, 2021
123 Numerai日本コミュニティとか日本語話し言葉BERTとか
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、J-Quantsニュース分析チャレンジのオンラインイベント、Numerai 日本人非公式Slackコミュニティ、Optuna connpassグループ、日本語話し言葉BERT、遺伝的アルゴリズムで作られた画像のNFT、今週のKaggleについて話しています。
33:07
April 18, 2021
122 Axrossで記事公開
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、Axross記事公開、codeコンペかcsvを提出するコンペか、discordのステージチャンネル、4月の目標、今週のKaggleについて話しています。
29:21
April 12, 2021
121 pysenとか
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、pysen、Colaboratory V100、3月の目標結果、SORACOM UG Online#4、今週のKaggleについて話しています。
28:23
April 4, 2021
120 ColabProとか
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、Tellusのeラーニング教材追加、ColabPro、日本取引所グループ ニュース分析チャレンジ、バスケコンペ終了、今週のKaggleについて話しています。
34:39
March 29, 2021
119 PtitPrince とか pytoch1.8
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、PtitPrinceのチュートリアルやりました、pytoch1.8リリース、J-Quants ファンダメンタルズ分析チャレンジ! 〜モデルの投稿方法特集〜、CF + Fin ML勉強会、Tellus User Group もくもく会#1、今週のKaggleについて話しています。
32:33
March 21, 2021
118 宙畑Kagglerアンケート
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、TensorFlow3D、宙畑Kagglerアンケート、分析コンペ勉強会、J-Quantsファンダメンタルズ分析チャンレンジ、今週のKaggleについて話しています。
35:26
March 15, 2021
117 Colaboratoryのtipsとか
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、Colaboratoryのtips、Axross、3月の目標、今週のKaggleについて話しています。 ※ 最後の俳句のコーナーで花粉症は季語ではないと話していますが、合本俳句歳時記 第四版(角川書店)では、春の季語である「杉の花」の子季語で「花粉症」「杉花粉」が掲載されていたので季語でした。
35:42
March 8, 2021
116 Cassavaコンペ終了
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、Cassavaコンペ終了、2月の目標結果、独学大全 audible版公開、今週のKaggleについて話しています。
28:51
March 1, 2021
115 PLATEAUとか
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、PLATEAU、分析コンペ勉強会での登壇、2月の目標途中経過、今週のKaggleについて話しています。
34:56
February 22, 2021
114 Signate Tellus コンペの上位解法記事
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、Colab Pro、Abhishek Thakur さんのデータサイエンス本がgithubで無料公開、宙畑の記事を寄稿、骨伝導ヘッドフォンを購入、今週のKaggleについて話しています。
31:24
February 15, 2021
113 Clubhouse とか
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、SIGNATE JPXコンペのチュートリアル、Clubhouse、PyTorch実践入門、QHACK、2月の目標、今週のKaggleについて話しています。
42:06
February 8, 2021
112 データ分析コンペで獲得した賞金の税金
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、データ分析コンペの賞金の税金、Scikit Learn 0.24、SIGNATE金融コンペ、Notion について話しています。
36:37
February 1, 2021
111 KaggleOpsとかGPU
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、KaggleOps、GPUベンチマーク、今週のKaggle について話しています。
28:49
January 24, 2021
110 JupyterLab3.0とかDALL·Eとか
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、JupyterLab 3.0、BlueqatのJulia、SIGNATEリーダーボードの仕様変更、DALL·E、今週のKaggle について話しています。
34:44
January 18, 2021
109 2021年の目標とKaggleのアクシデント
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、2021年の目標、今週のKaggle(年末に起きたアクシデント、新コンペ)について話しています。
41:17
January 9, 2021
108 2020年の目標結果報告
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、12月の目標結果、年間の目標結果、アドベントカレンダーで書いた記事、reduce_mem_usageの高速化、今週のKaggle(Signate)について話しています。
38:38
December 30, 2020
107 ゲスト バイリンガリレオ ナオトさん
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、バイリンガリレオ の ナオトさん にゲストで来て頂き、毎週の定例 Kaggle ネタ、DRIVENDATA の MagNet コンペ、インプットアウトプットツールについて話しています。 後編はバイリンガリレオさんの第026話「regonn&curry.fmさんをゲストに迎えてデータサイエンスについて語ろう!(後編)」で公開していますので、ぜひこちらも聴いてください。
43:18
December 26, 2020
106 Kindleでの出版方法
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、Amazonでの出版について調べてみた、アドベントカレンダーで書いた記事、Tellus Satellite Cafe登壇、今週のKaggleについて話しています。
27:19
December 21, 2020
105 MoAコンペを終えて
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、MoAコンペ終了、アドベントカレンダーで書いた記事紹介、11月の目標結果・12月の目標、今週のKaggleについて話しています。
43:50
December 13, 2020
104 ゲスト 白金鉱業.FM 吉田さん
このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、白金鉱業.FM の 吉田さん にゲストで来て頂き、島根トーク、ポッドキャストで気をつけていること、企業としてのポッドキャストや勉強会の開催等について話しています。
01:27:35
December 7, 2020
103 Kaggleの新コンペティション4つ
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、Zenn.dev のスクラップ機能、リスナーからのメッセージ、深層強化学習フレームワークcoax、今週のKaggle、ゲスト告知について話しています。
27:56
November 28, 2020
102 ギャンブルとデータサイエンス
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、ギャンブルとデータサイエンス、独学大全技法1:学びの動機付けマップ、今週のKaggle、ゲスト告知について話しています。
40:51
November 23, 2020
101 noteマガジンはじめました
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、noteマガジンをはじめました、kedroイベント、アドベントカレンダー、11月の目標、SignateTellusコンペ終了、競馬高裁判決、今週のKaggleについて話しています。
43:02
November 14, 2020
100 100回記念振り返り
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、100回記念振り返り、東京大学国際オープンイノベーションフォーラム、AWS DEVDAY登壇しました、スプラトゥーンを5000時間やってわかったこと、10月の目標結果、今週のKaggleについて話しています。
55:13
November 2, 2020
099 Pythonで動かして学ぶ!Kaggleデータ分析入門 レビュー
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、Solafune、Pythonで動かして学ぶ!Kaggleデータ分析入門 レビュー、リスナーからのメッセージ、今週のKaggleについて話しています。
27:05
October 26, 2020
098 OSIC と OpenVaccine: COVID-19コンペ 終了
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、「最新研究からわかる 学習効率の高め方」購入、OSIC終了、OpenVaccine: COVID-19終了、今週のKaggleについて話しています。
35:36
October 19, 2020
097 宙畑への記事寄稿
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、Tellusのオウンドメディアの宙畑に記事を寄稿、Amazon ミュージックのPodcastが開始した、10月の目標、今週のKaggleについて話しています。
31:26
October 11, 2020
096 独学大全 とか AWS DevDay Online Japan 登壇告知
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、データサイエンティストの「真の実力」を測るための効果的な面接方法、「独学大全」発売!、AWS DevDay Online Japanで登壇します、今週のKaggleについて話しています。
31:11
October 4, 2020
095 zenn.dev とか
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、強化学習の基礎と深層強化学習、zenn.dev、今週のKaggleについて話しています。
33:30
September 28, 2020
094 ガートナーハイプ・サイクル2020と技術書典9
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、Spacenet7コンペ、ガートナージャパン ハイプ・サイクル 日本 2020、技術書典9で買ったもの、今週のKaggleについて話しています。
33:55
September 21, 2020
093 AR生け花🌼
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、Magic Leap Challenge#1、"機械学習エンジニアが職を失いつつある。しかし、とにかく機械学習を学ぼう"、orchest、マリオカート ライブ ホームサーキット、9月の目標、今週のKaggleについて話しています。
57:23
September 14, 2020
092 Kaggle入門記事更新
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、Kaggle初心者向けの記事書きました、8月の目標結果、今週のKaggleについて話しています。
42:06
September 6, 2020
091 Splatoonとライブ配信
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、auカブコム証券の株取引API、Splatoon、ライブ配信の教科書、今週のKaggleについて話しています。
30:40
August 28, 2020
090 キャリアについて考える
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、キャリアについて、マシュマロの質問、質問力、Jupyter Book、Playgram Typing、Pythonで動かして学ぶ!Kaggleデータ分析入門、今週のKaggleについて話しています。
59:03
August 21, 2020
089 mmhmmとかディープラーニングのモデリングの経験則とか
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、M5_Uncertainty上位解法、mmhmm、HHKB、ディープラーニングのモデリングの経験則を語る会についての有識者からの反応まとめ、今週のKaggleについて話しています。
31:33
August 13, 2020
088 optunaとかpfrlとか
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、TensorFlow User Group Meetup、optuna v2.0、PFRL、lightgbm.cv、8月の目標、今週のKaggleについて話しています。
37:16
August 10, 2020
087 マイプロジェクト
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、7月の目標結果、データサイエンスギルドでの発表、Magic Leap 1ハッカソン、設定ファイルのファイル形式、今週のKaggleについて話しています。
36:52
August 3, 2020
086 Tellusモブプロ会
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、AIcrowd Biltz#2、藤井棋聖誕生、独学大全、Tellusモブプロ会開催、今週のKaggleについて話しています。
31:26
July 27, 2020
085 自動EDA
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、Bigqueryの新機能、技術書典9、Sweetviz、Tellusイベント、Approaching (Almost) Any Machine Learning Problem、今週のKaggleについて話しています。
34:20
July 20, 2020
084 m5コンペ振り返り
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、m5コンペ振り返り、リスナーからの質問、Pylance、Python関係の「〇〇100本ノック」のまとめ、Quevicoの宿泊予約キャンセル予測コンペ、Blueqat Summit Tokyo 2020、7月の目標、今週のKaggleについて話しています。
52:60
July 13, 2020
083 Kagglerは何をやっているのか
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、6月の目標結果、streamlit、高等学校情報科「情報Ⅱ」教員研修用教材 にkaggleが登場、結局Kagglerは何を必死にやっているのか、ProbSpace Re:不動産取引価格予測 コンペ、今週のKaggleについて話しています。
31:46
July 6, 2020
082 dataframe命名規則
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、データサイエンス100本ノック、Kaggleのnotebookの新機能、xfeat、dataframeの変数名、今週のKaggleについて話しています。
40:59
June 30, 2020
081 人工知能学会と綺麗なコード
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、Atma杯、人工知能学会、papa kaggler's meeting、Open AI API、データ分析でコードをクリーンに保つ技術、今週のKaggleについて話しています。
48:48
June 22, 2020
080 YouTubeLiveはじめました
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、YouTubeLive放送はじめました、今月の目標、Optuna 1.5、Atma杯、今週のKaggleについて話しています。
37:08
June 16, 2020
079 専業Kaggler締めくくり
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、5月の目標結果、専業Kagglerも今週で終わり、Kagglerを訪ねて三千里(リモート)&白金鉱業.FM、住所の正規化 npm モジュール、Kaggle Days shop、今週のKaggleについて話しています。
46:21
June 3, 2020
078 就職活動報告
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、Windows周りの新機能、就職活動報告、今週のKaggleについて話しています。
39:30
May 25, 2020
077 RandomSeed値何使ってる?
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、情報収集方法、pytorch pfn extras、RandomSeed値、今週のKaggleについて話しています。
31:09
May 18, 2020
076 ワンストップ オンライン生活と一人esa
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、ワンストップ オンライン生活、Kaggleでコピーしたnotebookについて、Codespaces、一人esa、今週のKaggleについて話しています。
41:34
May 11, 2020
075 PyCaret, ML Study Jams Vol.4
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は5月の目標、リスナーからの質問(子育て関係・統計的学習の基礎)、ML Study Jams Vol.4、PyCaretを動かしてみた、今週のKaggleについて話しています。
48:25
May 4, 2020
074 求められるデータサイエンティスト人材像
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は4月の目標結果、企業の求めるデータサイエンティスト人材像、質問箱の答えをまとめる、コードを早く書けるようにするために、Kaggleスタートブックの次に求められるコンテンツ、今週のKaggleについて話しています。
48:41
April 25, 2020
073 最近使ってるオンライサービス
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回はGitHubの値下げ、noteサークル、FI2.0、Freedom、Zoomでのかぐるーど飲み、Remo Virtual Office、PyCaretについて話しています。
35:28
April 18, 2020
072 デジタルミニマリストとKaggleスタートブックの次の学び方
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回はデジタルミニマリスト、SIGNATEQuest、Modeloy、スポンサー紹介: データラーニングスクール、Kaggleスタートブックの次の学び方、今週のKaggle について話しています。
47:58
April 11, 2020
071 自宅のリモートワーク環境と就職活動
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は2020年4月の目標、SignateのLateサブができるSOTA Challenge、Optunaでハイパーパラメータの重要度、自宅のリモートワーク環境、就職活動の準備周りの話、今週のKaggle について話しています。
47:49
April 4, 2020
070 月間目標の結果とニュース
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、2020年3月の月間目標結果、TechFeed Pro、オンライン(Zoom)飲み会、今週のKaggle について話しています。
30:09
March 29, 2020
069 【Kaggleスタートブック発売記念】 ゲスト u++ さん
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、初のゲストとして u++(@upura0) さんに参加していただき、「PythonではじめるKaggleスタートブック」の出版についてと、今週のKaggle について話しています。
01:00:25
March 17, 2020
068 Kaggleへのモチベーションの保ち方
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、次回のゲスト回について、JuliaのAutoML、N予備校、Tellus、noteサークル、3月の目標、Kaggleへのモチベーション、今週のKaggle について話しています。
53:36
March 12, 2020
067 余命3ヶ月でKaggleをやるか?
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、2月の目標結果、どんな流れでKaggleを解いていくか、余命3ヶ月だったとしてKaggleやりますか、今週のKaggle について話しています。
32:52
March 6, 2020
066 脱Heroku
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、新型コロナウイルス、脱税調査にAI導入、DiscordBotの脱Heroku、Kaggleの新UI、ランニング始めました、今週のKaggle について話しています。
37:53
February 28, 2020
065 MLflow
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、MLflow、Kaggleの新UI、今週のKaggle について話しています。
30:58
February 21, 2020
064 更新されたNotebookとDiscussionの通知システムを構築
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、2月の目標、投稿されたkernelをslackやdiscordに通知する、noteサークル機能、読んだ本、Neo4j、今週のKaggle について話しています。
49:41
February 14, 2020
063 DSB2019とatma杯結果報告
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、1月の目標結果報告、DataScienceBowl2019結果、atma杯、Weather Challenge表彰式、今週のKaggle について話しています。
58:24
February 1, 2020
062 就職活動中
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、1月の目標、1回目の校正、就職活動はじめました、今週のKaggle について話しています。
34:29
January 24, 2020
061 2020年の目標
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、2020年の目標、BigQueryMLとAutoMLをKaggleNotebook上で実行、Kaggleの「入門」を高速で終えるためのおすすめ資料、Connext X、Atma杯、今週のKaggleについて話しています。
34:01
January 11, 2020
060 Kaggle Days Tokyo
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、Kaggle Days Tokyo、エネルギーコンペ、SIGNATEの新称号、SIGNATE新コンペ、Nishika新コンペ、Kaggle新コンペについて話しています。
59:49
January 5, 2020
059 Kaggle入門書
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、カレーちゃんとu++さんのKaggleの本、Glide、aws量子コンピュータ、Nishika、Chainer、今週書いたQiita記事、分析コンペLT会、今週のKaggleについて話しています。
38:53
December 20, 2019
058 パイプラインとAtma杯#2
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、パイプライン、Google Cloud Run、Atma杯#2、Kedro、Kaggle Daysについて話しています。
50:49
December 6, 2019
057 コンペにチームで挑戦中
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、SlackとTeams、lineとyahooの統合、Python実践データ分析100本ノック、polynote、Paperspace、給与コンペ、DSBについて話しています。
38:52
November 24, 2019
056 Kaggle写経
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、分析コンペLT、Kaggleでの写経、アドベントカレンダー、データサイエンティスト スキルチェックリスト、Kedro、voicy、最近書いたブログ記事について話しています。
41:30
November 22, 2019
055 Kaggle本の輪読会と分析コンペLT会はじめました
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、ニュージーランドの旅、Kaggle本の輪読会、分析コンペLT会、Kaggle Days Tokyo、技術書典、鉄コンペ 銅メダル、アドベントカレンダー、Julia Tokyo 10、チームで挑むデータ分析コンペ、新コンペについて話しています。
01:07:24
November 15, 2019
054 二人の日常
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、二人の一日、Kaggle本の輪読、Kaggleコンペにチームで参加、Kaggleカーネルでのデバッグ方法、新コンペについて話しています。
56:21
November 8, 2019
053 GCPの扱い方
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、Podcastの配信、目の疲れ、Kaggle初心者限定コンペ、飯田産業コンペ表彰式、GCPインスタンス、YouTubeコンペで銀メダル、VS Code上での Jupyter Notebooks の操作について話しています。
43:30
October 13, 2019
052 IEEEコンペを終えて
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、IEEEコンペを終えて、メモ・ノートツール、Kaggleでのタスク管理、新コンペについて話しています。
51:32
October 9, 2019
051 特徴量・ソースコードの管理
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、特徴量・ソースコードの管理、技術書典を終えて、DartとFlutterのアップデート、HacktoberFes、ディープラーニングでリアルタイム声質変換、今週のKaggleについて話しています。
45:21
September 29, 2019
050 KPTで振り返る
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は50回目ということで、20回目と同じく、今までの、このポッドキャストでの活動をKPTで振り返ってみました。
53:41
September 28, 2019
049 APTOSコンペ終わり
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回はAPTOSコンペ、KaggleのGPU制限、Kaggleの賞金の受け取り方、Signateコンペ情報をDiscordに通知するBOTについて話しています。
40:20
September 16, 2019
048 ChainerMeetup#10
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回はPCでのPodcast、ChainerMeetup10、Slack分析コンペ、IEEE、APTOS、KaggleAPIでのサブミット、松江でのML Study Jamsについて話しています。
47:07
September 13, 2019
047 Discordサーバー作りました
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、データ分析ハッカソン、Julia 1.2、Discordでサーバー作った話、RAdam、今週のKaggle、新コンペ、データラーニングギルドについて話しています。
56:06
September 6, 2019
46. Signate飯田産業コンペ
 話した内容ScrapBox  このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、Signate飯田産業コンペ、簿記の話、Kaggleの初心者限定コンペ?、ML Study Jams、PlantUML、特徴名を日本語について話しています。
47:03
August 18, 2019
45. atma杯
  話した内容ScrapBox     このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、BIツール、ML Study Jams Vol.3、統計検定データサイエンス、atma杯、白金鉱業 Meetup Vol.10、Kaggle新コンペ、Kaggle api からkaggleデータセットを作る方法について話しています。
58:27
August 12, 2019
44. 動画で機械学習を学ぶ
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、TabNine、コーセラの機械学習講座、機械学習案件、Automated ML Tools、Kaggle新コンペ、今週のKaggleについて話しています。
36:54
August 9, 2019
43. 実績を作る
 話した内容ScrapBox  このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、自然言語処理とVTuber、Kaggle Tokyo Meetup #6、Signateの総合ランキング、機械学習案件、ポーカーAI、Kaggle Kernelでコミットせずにファイルをダウンロードする方法、Kaggle新コンペについて話しています。
47:30
July 26, 2019
42.強化学習で競う
 話した内容ScrapBox  このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、Chainer Meetup、 MineRL、ayameの分類、【大阪開催】atma杯 オンサイトデータコンペ、リスナーからの質問、Kaggleのくずし字コンペ、絵で見てわかる量子コンピュータの仕組み、技術書典について話しています。
45:20
July 19, 2019
41. 老後Kaggler
話した内容ScrapBox このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、欠損値補完、Flutter for web、Signate with Runtime、老後にKaggleをすること、Julia Gen、atma杯 オンサイトデータコンペについて話しています。
47:30
July 9, 2019
40. Validation大事
話した内容 ScrapBox https://scrapbox.io/regonn-curry/040_Validation%E5%A4%A7%E4%BA%8B  今回は WEB+DB PRESS の Julia 特集、LINEの独自コンペ、マシュマロでの質問回答、Signate・Kaggleの新コンペについて話しています。
44:16
July 5, 2019
39. カレーちゃんのコードレビュー
このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、 Kaggle Tokyo Meetup #6 WSL2 SIGNATEアヤメコンペを二人がやってみたコードの公開とコードレビュー データサイエンスに関するリスナーからの質問に回答しています 扱っている内容は Scrapbox で公開しています。
01:08:02
June 28, 2019
38. リスナーの質問に答えていきます
このポッドキャストでは、Kaggleを中心としたデータサイエンスに関連する情報を配信していきます。 今回は、リスナーからの質問を中心に論文や書籍をどれくらい読むか、Signateコンペ、アンサンブル学習、前処理入門、Kaggleのショートカット一覧について話しています。 詳しい話した内容はコチラ-Scrapbox
45:34
June 22, 2019
37 地震コンペ金メダル
ScrapBox 今回は 地震コンペ金メダル 自動売買に適した仮想通貨取引所 BitMex PodcastをAnchorへ移行 英語学習 共感SNS 丸くとがる発信で仕事を創る について話しています。
01:01:29
June 10, 2019
36. SIGNATEのデータサイエンティスト実態調査
今回から、配信方式を Anchor に変更しました。 強化学習、SIGNATE、作ってわかる!アンサンブル学習アルゴリズム入門、コンペの選び方、今週のKaggleについて話しています。 お題Scrapbox
36:58
June 5, 2019
35. 機械学習プラットフォーム
Scrapbox お題 強化学習ロジックをDQNからRainbowに変更した 価値ベースのアルゴリズム 学習をしているけど、アルゴリズムが複雑になった分、レイヤーが増えたりしてGPUのメモリが足りなくなってトレーニング途中で失敗する状態で困っている。 機械学習におけるGPU memory error の呪いを解く方法 with Chainer - Qiita 上手いことGPUのメモリを調整したい カレーちゃんもGPU関連でこういう時どうしてる? (currypurin)Kerasでしか学習したことがなくて、batch sizeを調整しています 過学習しているだけっぽい?(とりあえず取引の勝率) とりあえず愚直にデータ数増やす予定 リスナーからのコメント AlpacaDB | TechCrunch Japan Alpacaの人がChainer meetupで運営側にいたと思うけど、前回参加の時には自動売買ハマってなかったので特に話したりはしなかったのが悔やまれる 現在の日本ではサービスが利用できないはず、米株とかだけ? 以前読んだ内容だと自分で買いのタイミングをチャートから複数トリミングして、学習させるUIだった気がする 画像認識で買いか売りかのシグナルだったので、自分としては、シグナルだけでなく、どれだけホールディングするかの学習も含めてやりたかったので、強化学習にしてみた。 今週のtips KaggleをするのにGCP(Google Cloud Platform)を使う方法 わかりやすいqiitaの記事があり、使ってみたらとても簡単だった。 現状特徴の作成にのみ、GCPを使っているの。 Anacondaを入れて、ストレージをマウントして、kaggle apiでデータをダウンロードするくらいで、特徴を作り始められる。 大きなデータのコンペや画像コンペの場合は、今後も使っていきたい。 いつも使うdockerも整備しておくと更に捗りそう 今週と来週でプラットフォーム調査のイベントを開催 新しくなったMicrosoftのブロックベースのサービスを実際にやってみる ludwig デモンストレーションでコードを書かずにKaggleへ挑戦 パワポのデザインアイデアという機能でスライド作ってる 複数のデザイン候補を提供してくれる JuliaをWSL上で動かしてGPUを使えるようにした 前回PythonでGPU使えるようになったので、Juliaでも同じやり方でできるかなと試したらできた Windows側にJuliaをインストールして、WSLで julia.exe を実行するようにする GANはこれというフレームワークのようなものはなく自分でレイヤーを作っていくので、JuliaのFlux.jlでいいかも 量子コンピューターの本が出た いちばんやさしい量子コンピューターの教本 人気講師が教える世界が注目する最新テクノロジー 「いちばんやさしい教本」シリーズ 毎度おなじみBlueqat 「Blueqat」(量子ゲート型)と「Wildqat」(量子アニーリング型)を使い、簡単な問題を解く手順も解説されている どうディープラーニングに活用されていくかなどの説明もあって、ばりばりのエンジニアというよりは、少しビジネス書の傾向が強い Pythonで機械学習入門: 深層学習から敵対的生成ネットワークまで | 大関真之 今週のkaggle 地震コンペ 50位近辺で停滞している 新しいKernelコンペが始まった Instant Gratification -A synchronous Kernels-only competition- これまでのKernelコンペ・2ndstageがあるコンペの課題だった、コンペ終了後に結果が出るのが遅い、2nd stageでエラーがでてしまうとスコアなしになってしまうという課題に対応したという実験コンペ
01:00:56
June 1, 2019
34. 強化学習
Scrapbox お題 仮想通貨自動売買 OpenAI Gym 強化学習をやりやすくするためのライブラリ サンプルも豊富 効率良く学習を行えるように、白黒にしてもチャートが識別できるように色を調節したり解像度を調整している ChainerRL の強化学習過程がわかる良さそうなライブラリ chainer-visualizer Windows はまだ未対応だった https://github.com/chainer/chainerrl-visualizer/issues/12 普段 Windows を使っているので、放置して学習させるために、余っている Mac で学習を行う AWS DeepRacer – 機械学習を自由自在に操る最速の手段 強化学習でのレース大会 Tokyo でも 6 月の Aws のイベントでレースがあるみたい ただ、技適通って無いから実機で遊べない? Deep Learning エンジニア育成講座「DL4US」 ポモドーロでの作業をまた始めた 去年の夏はずっとポモドーロで作業をしていて、調子が良かったが、いつからかやめてしまった その時に、iOS のポモドーロのアプリは一通り購入した 今回、新たに Focus というアプリを使ってみた。 iphone とも連携するし、使い勝手も良いし素晴らしいアプリだった。 今週の tips ディープラーニングの用途であれば、Ubuntu でも Windows でもどちらでも良いと思う メモリは 16GB だとつらくなるかもしれないので、増やせる予算があるなら増やしたい HDD も SSD もパソコン工房さんのディープラーニング用パソコンとかゲーミング PC とからな、特に意識しなくても問題なさそう。 今まで WSL は GPU 対応していなかったので、諦めていたけど実は出来るみたいなので試してみた えるしってるか WSL では windows のバイナリを実行できる | せかいらぼ Cupy, Chainer での GPU は使えるようになった VSCode Remote の Python は WSL 上のしか見つけてくれないので、また、WSL 側にも WIndows 側にも Python がインストールされている状態になってしまった WSL2 は Linux カーネルものるので GPU 対応するのではという噂 リリースされるときには対応していないとの回答があった 個人的には Windows で良いと思う派になりかけている 今週の kaggle カレー 地震コンペをコツコツやっています。 Fashion コンペは今日データのダウンロードしました。
44:14
May 20, 2019
33. 性格診断
Scrapbox お題 16タイプ診断やりました 論理学者型という判定だった 次のくだりは、本当に当てはまる しかし皮肉にも、論理学者型の人達の言うことは常に鵜呑みにはできません。これは、論理学者型の人達が嘘つきだというわけではなく、完全には確立されていない考えを共有する傾向があるためです。 このことから、論理学者型の人達は信用できないように見えるかもしれませんが、実際は、論理学者型の人達ほど熱意をもって問題点を指摘して、その問題を取り巻く果てしない要素と詳細にメスを入れながら、ユニークで実行可能な解決策を見い出せる人はいないのです ただ、進捗報告が期限通りに届くことは期待できません。日常的な実践活動や維持管理には興味ありませんが、自分が持つ非凡な創造力と潜在能力を発揮できる環境を見つけると、時間やエネルギーを際限なく費やし、実態を見透した先入観にとらわれない解決策を見い出します。 regonnは仲介者型 仲介者型気質の人は、真の理想主義者で、極悪人や最悪の出来事の中にさえも、常にわずかな善を見い出し、物事をより良くするための方法を模索しています。 キャラクター性格診断スレまとめ Wiki 自分の性格が最も正確にわかる10の質問 - YouTubeもやった 8点満点で、外向性5 協調性8、神経症的傾向0、誠実性3、開放性5という結果になった。 誠実性については、運動、睡眠、瞑想をとると修正可能らしい。Daigoさんの本を読んでみたいと思った。 Kaggleのカーネルで過去のソリューションのまとめが公開されていた Winning solutions of kaggle competitions twitterでリンクを貼ったところ、過去最大のいいね数となり、Kaggleのソリューションってこんなに興味がある人が多いんだと思った。 フォロワーからの質問 2019 Google I/OとMicrosoft Build 2019あたりの話し Microsoftの開発環境がより良くなりそう WSL 2 Linux KernelがWindows上に乗る 今まで難しかった、デーモンとかファイルシステムが動くようになる Windows Terminal いままでのが使いづらかったし、使う環境を切り替えられるみたいで良さそう マイクロソフトがドラッグ&ドロップの機械学習ツールをローンチ、ユーザーはデータを用意するだけ | TechCrunch Japan Google I/Oだと機械学習は関係ないけど Flutter for web が気になってる Dart 言語 引き続き仮想通貨取引やってる Python周りのライブラリが揃っていて楽しい 強化学習に挑戦中 DQN with ChainerRL 今週のtips Optunaでのパラメータチューニング OptunaはPFNが開発している、ハイパーパラメータチューニングツール 簡単に指定した範囲のパラメータをチューニングしてるとても優秀なツール タイタニックコンペのデータでハイパーパラメータチューニングする簡単な Kernel を公開した パラメータの範囲を途中で変えたり、データベースと使って複数のマシンからパラメータチューニングをすることができる 今週のkaggle 地震コンペ 銅メダル圏内にはいりました
57:16
May 12, 2019
32. 令和最初の収録
Scrapbox お題 Kaggleのノートブックカーネルにscriptをimportできるようになった すごい便利だと思う scriptからscriptはまだimportできないので、これもそのうち可能になるかも? kaggleもくもく会やりました。 kaggler もくもく会 #2 - connpass 13時から19時までもくもくして 19時からLTと懇親会 PetFinderコンペについてLTもした わかめさんは、KernelについてLTされていた メルペイの50%キャッシュバックすごい ApplePayでIDとして使えるようになって使いやすい セブンイレブンでは、70%還元 メルカリアプリからクーポンを取得可能 PythonやAIが無料で学べるAI Academyに新コース「量子コンピューター入門編」を完全無料でリリース おなじみ、blueqat 入門ということで回路の組み立てのところまで コンテンツとしては続きが出てきそう コーチングを受けてみた 性格特性診断に基づいたコーチング|目標を明確化して行動につなげる Big5や16タイプ診断等 経済的成功(お金)志向が強いらしい 人に関わろうとしない傾向、チーム志向も低いため、フリーランスが向いているのかも それを踏まえて振り返りをした 最近は仮想通貨自動売買に向けて色々やってる 自動売買は色々挑戦した時期がある Freqtrade が良さげ Pure Python pandas等を利用している Telegramとの連携 最適化の損失関数を自分で定義できたりする 全てのコードがPythonなので、既存の機械学習での処理とかも入れやすそう 他のだと、別にサーバーを立ててAPIで呼ぶ等していたが、それが無くなる Juliaでも実装していきたいな VSCodeのつよつよ拡張が出た Visual Studio Code Remote Development WSL, Docker, SSH でリモートの環境を利用できる 早速乗り換えてみたら、快適 今まで、ターミナル連携等の実行はWSLだけど、リント系がWindows側だったりして面倒だった 全てをWSL上の環境に移すことができている 今週のtips Kaggleのノートブックカーネルにscriptをimportする - kaggle全力でやります 久し振りにブログを書いた Kernelの実行終了時にlineで通知する仕組みの例を書いた line notify初めて使ってみたけど便利。他にも応用できそう 今週のkaggle カレー 地震コンペやっています とてもやり甲斐のある内容だと思ってきた 16性格診断
59:32
May 10, 2019
31. 平成最後の収録
Scrapbox お題 Twitterでの質問 前々回紹介した、Chainer Tutorial のPython部分とかが理解できていればいいのかも。あと、ライブラリの扱い方。 2. Python 入門 — ディープラーニング入門:Chainer チュートリアル Pythonの基本文法がわかれば、Kaggleに参加してしまうのもあり。 Kaggleのチュートリアルのyoutubeでの説明を公開しているので、それを見てとりあえず参加してみましょう。 私は、「Python機械学習プログラミング 達人データサイエンティストによる理論と実践」と「機械学習のエッセンス」をオススメしています。どちらも良書です。 数学の知識は、使うだけだとなくても大丈夫な場合もありますが、知っておいた方がちゃんと考えられるし、やりたいことによっては必須な場合もある。 必要性を感じてから学ぶのがオススメ。 ML Study Jams : Machine Learning 中級者向けトレーニングプログラム 10連休なにするか? kaggler もくもく会 #2 - connpass 行うセミナーのイベントページ作成された 【5/24開催@松江】機械学習セミナー「機械学習プラットフォーム・サービスの選び方」 - connpass 【5/31開催@出雲】機械学習セミナー「機械学習プラットフォーム・サービスの選び方」 - connpass 現在ある機械学習プラットフォームの話しをする 今週のtips csvファイルをpickleやfeatherに固めると読み込みが早くなる 地震コンペのデータはtrainingデータの読み込みが、pickleに固めたことで、1分強から4秒になった。 4GBを越える時は、protocol=4を指定しておくと、pickle化できることを知った(MACは別の書き方が必要) 今週のkaggle カレー 地震コンペを始めた
47:48
May 1, 2019
30. 技術書典6を終えて
Scrapbox お題 ProbSpace データ分析好きが集まる交流プラットフォーム Online Quantum Computing Course 4週間コースの受講が終わった 次はこの前の技術書典のを読んでから、Quantum Machine Learning を勉強しようと思ってる 技術書典終わりました Kaggleのチュートリアル4時間強で300冊完売となった 前回は、300冊完売できなかった。機械学習需要の高まりを感じた 今週のtips コンペの一覧を取得する方法 kaggle apiを使える状況にし、以下コードを実行。 メダルあり、メダルなし、サブミッション不可の3つのデータフレームを返す関数 from kaggle.api.kaggle_api_extended import KaggleApi import pandas as pd def get_compe_list(): api = KaggleApi() api.authenticate() # 認証を通す competitions_list = api.competitions_list() df = pd.DataFrame(columns=['id', 'title', 'awards_Points', 'deadline', 'isKernelsSubmissionsOnly', 'tags', 'submissionsDisabled']) for i in range(len(competitions_list)): tmp ={} tmp'id' = competitions_listi.id tmp'title' = competitions_listi.title tmp'awards_Points' = competitions_listi.awardsPoints tmp'deadline' = competitions_listi.deadline tmp'isKernelsSubmissionsOnly' = competitions_listi.isKernelsSubmissionsOnly tmp'tags' = competitions_listi.tags tmp'submissionsDisabled' = competitions_listi.submissionsDisabled tmp = pd.DataFrame(list(tmp.items())).set_index(0).T df = pd.concat(df, tmp, axis=0, sort=False) df.set_index('id', inplace=True) submissionsDisabled = df[df'submissionsDisabled' == True] submissionsDisabled.drop('submissionsDisabled', axis=1, inplace=True) df = df[df'submissionsDisabled' == False] df.drop('submissionsDisabled', axis=1, inplace=True) awards_True = df[df'awards_Points' == True] awards_False = df[df'awards_Points' == False] return awards_True, awards_False, submissionsDisabled メダルあり メダルなし サブミット不可 kaggle apiでは次の情報を取得できる 'ref', 'tags', 'description', 'id', 'title', 'url', 'deadline', 'category', 'reward', 'organizationName', 'organizationRef', 'kernelCount', 'teamCount', 'userHasEntered', 'userRank', 'mergerDeadline', 'newEntrantDeadline', 'enabledDate', 'maxDailySubmissions', 'maxTeamSize', 'evaluationMetric', 'awardsPoints', 'isKernelsSubmissionsOnly', 'submissionsDisabled' 毎日この情報をつぶやくbotがあると良いかも? 今週のkaggle シナモンが金メダルを3つ取ってKaggle Masterになるまでにやったこと - mamastan’s blog カレー Petfinderコンペの反省会を行なった 15人ほど参加し、良い反省会となった
37:46
April 26, 2019
29. Kaggle Master!!
Scrapbox お題 ペットコンペで銀メダルと獲得しKaggleマスターになりました 目標にしていたので、素直に嬉しい 本当は金メダルととってKaggleマスターになりたかった 取り組み始めて9ヶ月と時間がかかったけれど、最初の金メダルを取れていなかったらもっと時間がかかったと思う。反対にテーブルデータのコンペのみ取り組んでいたらもう少し早くkaggleマスターになれていたと思う。 先週AITuberの話ししたけど、NTTとドワンゴも取り組んでた。 なりきりAI 田中ヒメ データの集め方が上手い Chainer Tutorial Web界隈でRails学ぶなら Rails Tutorial だけど、機械学習だったらこの Chainer Tutorial やっとけという感じになりそう 次の技術書典でも量子コンピュータの本が出るみたい 技術書典でkaggleのチュートリアルと合同会社の本を頒布します 4/12金と4/13土の夜に、解説生放送を行います 最近も色々AIプラットフォームが増えてきた ブロック組み合わせ系が増えてる Dataiku Basics — Dataiku Academy 5.0 documentation Throughout the tutorials, we will work with a fictional online t-shirt retailer called Haiku T-Shirt, and use their enterprise data to illustrate the basic steps to working with Dataiku. MatrixFlow 5月後半でAIプラットフォームの話をするセミナー開催する予定 今週のtips kaggleのコンペ一覧を取得する方法 pythonでkaggleapiを使うとpandasでうまく整形しやすい 今週のkaggle カレー Petコンペ27位で銀メダルでした PublicLBは6位だったので、悔しい れごん 別の方が Chainer のカーネル公開してくれたので、それを読んでる iMet2019 Chainer Starter (SEResNet152 + FocalLoss) | Kaggle
43:37
April 15, 2019
28. Chainer Meetup
Scrapbox お題 リスナーからの質問 第一回から欠かさず聞いています。最近、自分も友人とポッドキャストをしたいなという気持ちが湧いています。お二人はオンラインで通話しながら録音しているように聞こえるのですが、もしよければ収録環境など教えていただくことはできますか?音声がとてもクリアなので参考にしたいです 最初はAdobe Auditionでノイズ削除してたりしてた 最近はZoom Github PagesでYattecastをベースに配信していて1ファイル50MB位を目処にしている Podcast繋がりでAnchorというサービスが気になってる 今年の2月位に Spotify が買収して、Spotify自体もPodcast配信できるようになっているので、このポッドキャストも対応させた Anchorも無料で無制限にホスティングできる 日本では対応していないが、海外だと広告を挿入できたりして、お金を稼ぐことが可能 Spotifyも日本に進出しているし、そのうち日本でも広告は扱えそうなので、そのときには動くかもしれない 動画撮った 独立したVTuberを作る企画 YouTubeLiveコメントで自然言語処理を行い、ネガポジ判定して色が変化する まだ、英語のみ なかなか日本語の良い学習データがない そのうち、返答もできたりするようにしたい Chainer Meetup #09 参加レポート 雰囲気的には、プログラミングイベントと学会の中間のイメージ ChainerXの話 ndarrayでnumpy風に計算グラフ処理等で扱う部分等をC++実装に置き換えている そこら辺の処理をC++側に渡すことで、高速化や、Python側もリファクタしやすくなるらしい Ruby で Chainer 作ってます Julia実装も作ってみたいなと思った 自分のLTでは PyCall.jl でJuliaでChainerを動かした事を発表した Chainerでのプロファイリングをちょっと楽にする話 nvidiaの人の話で、GPUのチューニング方法(GPU処理のボトルネックを見つける方法等)を見せてもらった ChainerRLで株売買を結構頑張ってみた(前編) 株売買をやってみようとしている けど、LTで発表していた、VAEを用いたチャートを画像学習で予測するほうが精度が高そう? やっぱりランダムウォークの投資で利益を出すのは大変 AWS, GCP, Azure の人達が話してた ココらへんはあまり差が生まれにくい、どこも自社のサービスでJupyter notebook動かせる AWSはONNX(オニキス)を使いやすいよ GCPはKubeflowでコンテナを使った開発エコシステム作れる AzureはXBoxでIoT系のノウハウ持ってるから強い オフ会やりました ペットコンペ終了の日に、リスナーの方と3人で。 今週のtips ディスカッションに書き込まれたときにメールで受け取る方法 削除してされてもメールを見るとなにが書き込まれたかわかるのでとりあえずやっておくと安心する メールアドレスをgmailにしておけば、検索性能も高くて探しやすい 今週のkaggle カレー Petコンペ、Publicリーダーボード6位で終えた 結果発表待ち 結果が発表されるまで長い れごん 壺コンペ Chainerで書いてる マルチラベルの対応が難しい Kaggleの新コンペ Kernelコンペが3つ始まった。 ルールが全部同じというわけではなくて難しい 壺とToxicity Classification (毒)はkernelで推論できればOK Freesond Audio Tagging 2019は、External dataとpre-traineは禁止されている
01:05:32
April 7, 2019
27. Julia 100%
Scrapbox お題 リスナーからの質問 昨年、juliaがver1.0になり、興味を持っているのですが、具体的にjuliaのどの辺が良いのかや、オススメのパッケージなどについて、取り上げて頂きたいです! 素直にコードを書いても遅くならない Pythonとかだとfor文で遅くなってしまう等もあるけど、Juliaであれば、そういう制約を気にせずに書ける ライブラリもpureなJuliaで書かれている場合が多い。(Python だとC拡張で書かれることも多い) ライブラリの中身が読みやすいので、勉強にも丁度良い まだ、Juliaが使える範囲は限られていそう Kaggleでは使えない状態 関連ディスカッション ライブラリ等もちゃんとメンテナンスされているものを見つける必要がる段階 そのかわり、あまりライブラリを使わないようなアカデミックなところで科学計算分野で利用されている ライブラリ Flux.jl ディープラーニングライブラリ Julia 100% PyCall.jl これで、Pythonの恩恵も受けられる PyCall2.0 版がもうすぐ出そう Julia 100% オフ会やります 今週のtips KaggleのKernelで知らなかった使い方 スクリプト 選択した箇所を実行できる print文を書いておくと、commit後の黒い部分に表示される スクリプト、ノートブック共通 commitした後に、そのノートブックに戻ると、変数などがリセットされずに使い続けられる 今週のkaggle Signateの新コンペ 日本たばこ産業 たばこ商品の画像検出 カレー ペットコンペ 銀メダル圏内に入った 電線コンペ 1月にやっていたコンペ ResNETにLSTMのKernelの特徴を入れて、サブミットしたものが銅メダルだった。 れごん 色々断捨離してる 次回放送 次週はオフ会があるため、おやすみ
41:08
April 2, 2019
26. Kaggleもくもく会
Scrapbox お題 今週のtips Kaggleのカーネルコンペと言えども、カーネルだけでやる必要はない データがダウンロードできるコンペであれば、サブミットファイルを他で作って、サブミットファイルをKaggleデータセットにあげて、カーネルからimportすることもできる Petコンペでは、そのやり方でやっている このやり方のデメリットは、最後にKernelで書き直さないといけないこと Kaggleもくもく会をやりました やっと確定申告終わった 自分を振り返る環境? 最近取り組んでる機械学習案件 色々な機械学習プラットフォームの調査 意外と機械学習とビジュアルプログラミングって相性いいのでは? 周りのデータを取得してみる IoT ラズパイ SIGNATEから、アンケート調査がきていた 最近tweetdeckを使い始めた twitterのリストとか通知を流せて便利 今週のkaggle マルウェアコンペが終了になった カレー ペットコンペ 全然スコアの進捗がないのがつらい Kernelを越えられない経験は初めてだった
58:27
March 22, 2019
25. Kaggleでのモチベーション
Scrapbox お題 リスナーからの質問 podキャスト収録前に、2人で打ち合わせはしているのですか? 今週のtips kaggleでのモチベーションの保ち方 ワンアイデアで勝てることがあるので、最後まで諦めない(仮説検証を続ける)ことが大事だと実感した リーダーボードの上位の人と技術的な差は大きいかもしれないけれど、そのコンペに関して知っていることは必ずしも大きくない ディスカッションで分かったようなことを言っていても、後からシェイクダウンすることが数多くある パブリックリーダーボードは目安でしかない Kaggleの講師を毎週やっています 来週は、3/12に初級編の講座( AI・機械学習ハンズオン 〜実践Kaggle 初級編〜 - connpass )を、3/13にもくもく会( もくもくKaggle #1 - connpass )をやるので是非参加ください 勉強会で聞かれることが多いのは 初めてコンペする時にどう始めるか 銅メダルをどのように取るか kaggleのKernelのGPUが、k80からp100になったらしい Kernel GPU device changed! | Kaggle DeNAテックコンのパネルディスカッションの動画がアップロードされていた パネルディスカッション:データサイエンスの競技者、Kagglerたちが活躍する職場とは - YouTube 最近 scraiv(スクライブ) を始めた バーチャルマーケット2が開催された 量子コンピュータSDKの Blueqat をベンチャーから分離してOSS化した経緯 今週のkaggle カレー PetFinder 0.442まできた。Kernelのbestスコアが0.453なのでもう少し Eloが終わってからの10日間でようやく、bestカーネルまでキャッチアップできた感じ ディスカッションやKernelはそれほど見ていないので、見ながら実験を重ねる予定 今回から、A4サイズの紙のノートを1冊用意して、それにメモを書いていってる。ノートと、先週話したようにgithubuのissueでの管理でとても良い れごん polar_bear の ludwig 対応
44:18
March 14, 2019
24. 1人Discord
Scrapbox お題 リスナーからの質問 MacBookAirから、デスクトップにsshして、kaggleの作業をやっています。 Macを使う1番のメリットは、トラックパッドが使えるので、マウスを使わなくて良いことです 外出時など、全て同じ環境でできるというメリットもある れごんは Google file stream をファイル置き場で使ってる 特徴量の本届いた polar_bear のバグレポートも届いてる TypeError: data type “float128” not understood · Issue #4 · regonn/polar_bear Kaggle メンテナンスあったけど、何か変更点あった? Chainer Meetup #09 で LT する予定 Chainer Meetup #09 - connpass LT5分なので Chainer + Julia でもやってみる? 今週のtips 1人Discord メモとかを1人Slackでやっている人が多いと思いますが、カレー(currypurin)はDiscordでやっています Discordのメリットは以下 チャンネルのカテゴリを作れる、チャンネルを動かせる メッセージ数の制限がない 画像を貼るとURLが与えられて、githubやscrapboxにurlを貼ると画像になる 今週のkaggle カレー Eloコンペ銅メダル サブミット選択に失敗してしまい、銅メダルとなってしまった PetFinder始めました 初サブミット 0から自分でコードを書いて(過去コンペのコードを使って)やることにした れごん polar_bear の windows 環境構築 と debug
44:35
March 5, 2019
23. 台風コンペの入賞式
Scrapbox お題 台風コンペの入賞式に行ってきました 台風コンペの概要 台風あり、台風なし画像の二値分類 不均衡データ 台風あり:71,779枚 台風なし:2,172,444枚 総参加者(規約への同意者)653名、総投稿者209名 1位の方の手法 2値化した画像と生画像を標準化した画像との2channelの入力 110層のPyramidNet ミニバッチ作成時、正例のうまく分類できていない画像が多くサンプリングされるようにし、その割合を変えてアンサンブル 懇親会 kaggleもくもく会@麹町に行ってきました 第1回 kaggleもくもく会@麹町 - connpass 30人もの人が参加していた 初心者、過去コンペをやる人、開催中のコンペをやる人に別れて作業をした 作業は2時間程度、その後懇親会 今週のtips 機械学習のための特徴量エンジニアリング ひと通り読みました 知らないことが多くあり、網羅的に学べるのでとても良い本です ただ、例えば勾配ブースティングを使う場合にどの特徴量エンジニアリングが必要かということは書いていないので、実務やKaggleなどで実践をつんだことがない人だと、どのエンジニアリングを使えば良いのかということになりそうです 既にデータ分析をされている人が網羅的な知識を得るためとか、この本を読みながらデータ分析に取り組むなどの用途にとてもオススメです。 polar_bearが成長している wakameさんがプルリク送ってくれて圧倒的な成長を実感する Functionalization of extracting target column and data from training data by wakamezake · Pull Request #2 · regonn/polar_bear github上でコミットしてくれた人に投げ銭できる仕組みが欲しくなったので、NEMとかで作りたい v0.0.5 から optuna と sklearn を導入して、one_hot の閾値も勝手に良い値にして欲しかった ちょっと、2月中は忙しいので、3月からちゃんとCIの設定とかやっていきたい あと、julia版も作りたいけど、juliaだとpandas関係なくなるので、ライブラリ名考え中 先週紹介した Ludwig を触ってみた ただ、データの情報を渡すだけで、titanic のスコアが 0.76 ludwig.ipynb 新たな時代を感じた Steam:Aim Lab AI等がFPSのエイム力を鍛えてくれるらしい お昼にテスト配信してたらカレーちゃんに練習風景を見られた 機械学習つかったサービスで能力がつくようになると面白い 語学学習とか絵の練習とか 今週のkaggle カレー Eloコンペ 60位くらいになりました 外れ値の影響をもろに受けるコンペなので、Shakeup、Shakedownがありそうですが、最後まで頑張りたい 2/27(水)までのコンペでありもう少し Malware Eloが終わったらやっていきたい れごん polar_bearメンテしつつ、性能評価でタイタニックコンペとかにサブミットしたりしてた。
56:52
February 25, 2019
22. Pythonライブラリを作ってみる
Scrapbox お題 fastai/fastprogress fastaiのプログレスバー 特徴量エンジニアリングの書籍がでるっぽい uber/ludwig 米Uber、コードを書かずに深層学習モデルのトレーニングができるツール「Ludwig」を発表 | OSDN Magazine uberが出してきた、コードを書かずに機械学習ができるツール まだ、あまり情報や記事は出てきてない 今後こういうのが増えてきたら、Kaggleのスコアがベースアップしてきて、より厳しい戦いになっていくのか。それとも、onedayコンペみたいな、いかに早く精度良く作りあげるのができるかみたいな戦いになりそう。 Pythonパッケージ作成中 とりあえず公開できた regonn/polar_bear Kaggleとかで、csvから読み取ったpandasのデータをそのまま渡すだけで、ワンホットとかnan値をいい感じで処理してくれるライブラリが欲しかった 使用感 polar_bear.ipynb とりあえずタイタニックで、そのまま csv_read した dataframe を渡せば、light_gbm とかで処理できる形にできる 現状タイタニックで正答率6割ぐらいで低めだけど敷居は下がった感じ 他のテーブルデータのコンテストでも試してみたい 名前はpandasをクレンジングしてくれるので白熊(polar_bear)と名付けた テストとかあんまりなくて、コードも汚いので特徴量エンジニアリング勉強しながらメンテしていきたい Googleポッドキャストを使ってregonn&curry.fmを購読してみる - わかめの備忘録 Googleポッドキャストは3倍速で聴ける iphoneのポッドキャストは最大2倍速なので、より早く聴けると思った 自分もGoogleポッドキャスト使ってる。 そのまま記事部分も表示してくれるのでリンクも飛びやすい “Trim silence” を使うと無音を飛ばしてくれるからより早く聞けるけど、小さい”っ”とかも無音とみなされるので、ツイッターがツイターって聞こえてしまう。 Signateのランキング 総合ランキング説明 | SIGNATE - Data Science Competition 今週のkaggle 新コンペ Santander Customer Transaction Prediction | Kaggle 特徴も少なく、匿名化されており誰でも参加しやすいコンペ ディスカッション では、8000人を超える参加者になるのではという予想もされていた カレー Eloコンペ Kernelをようやくこえることができた れごん Kaggle の勉強会開催とライブラリ作って終わってた。
52:32
February 18, 2019
21. Podcast生配信はじめました
Scrapbox お題 今週から始めたこと twitterでのライブ配信開始 scrapboxを公開 事前に話す内容を公開した DeNA Tech Conに行ってきました Kagglerが入って、既存事業でも新規事業でもできることの幅が広がった。 関西電力とDeNAが、石炭火力発電所の燃料運用最適化を行うAIソリューションの共同開発等に関して基本合意|2019|プレスリリース|企業情報|関西電力 Show RoomのVTuberブースとかVTuberLTもあったみたいですね リスナーからのコメント コメントありがとうございます。#1から聴いてきてもらえるなんて嬉しいです! 今週のtipsとかいいですね! kaggler-jaで流れてくるtipsも 過去のソリューション EliotAndres/kaggle-past-solutions 過去コンペの上位チームの解法を解説は、私(カレー)のyoutube放送でやりたいですが、勉強の時間がかかりそうなので実力がついたらやりたいです となりのkagglerもいいですね。是非コメントとかもらいたいので、生放送中の時とかに募集してみましょうかね signateで招待制コンペが開始 コンペティション詳細/経済産業省 | SIGNATE - Data Science Competition LinuxやWindows(wsl)でBrewが使えるようになった 現状 Kite + PyCharm(Windows) + wsl(brew で入れた python) で動くようにしてある Windows の PyCharm が wsl に対応してくれているので、brewで入れたpythonも動いてくれる Kite - AI-Powered Python Copilot 開発にもAIの力を使っていきたい PyCharmのバグでマークダウン表示されなかったり、pandasのデータが表示されないみたいなので、普通にpyファイルで編集している。 Jupyter Notebook not rendering pandas dataframes properly : PY-25931 pycharm cell mode plugin を入れればほとんど jupyter みたいに使える Julia Academy Juliaを使ったコースが用意されている(今の所無料) Julia Computing が提供しているので、そのまま Julia Box が使えて Jupyter Notebook が利用できる 量子コンピュータのコンテスト BlueQatも第二回目開催決定 Codeforces で Q# の二回目コンテストも開催 Announcement: Microsoft Q# Coding Contest – Winter 2019 - Codeforces 【LightGBM】ドキュメントを読む生放送【完全理解】 #VRアカデミア - YouTube LightGBMのドキュメントを読むという硬派な生放送が行われていた コミッターの方がコメントされていたり、とても有益な放送であった 放送者が完全に理解していなくても、放送中に学ぶというコンテンツもあるということがわかった 今週のkaggle 新コンペ Gendered Pronoun Resolution Don’t Overfit! II カレー 電線コンペ Eloコンペ kaggle関連の動
01:00:38
February 11, 2019
20. KPTで振り返る
振り返り 20回目なのでKPTフレームワークで振り返る 【徹底解説】正しい「KPT」が仕事の成果を生み出す!進め方のコツ、現場の事例を紹介 | SELECK [セレック] なぜKPT 頻度高いならPDCAとかで数値目標も持っていいかもしれないけど、何回かに1回の頻度とかだったらKPTで問題点とか、何を対応していくかを考えた方が良さそう K(keep) Kaggleに触れる機会は増えている podcastは続けていきたい 勉強会などで、podcast聴いていますという感想はかなりもらえている podcastで話すことが自分の情報取得という観点から有益 ニュースとかをメモするようになった P(problem) 今日の一句の俳句欲が最近17Liveで発散されているので必要無くなってきた 毎週だとコンテンツを準備するのが結構しんどい 今週やったことの報告だけになりがち ゲストを呼んでみる Kaggleの公開できない制限が発生する 発信の場所はPodcastだけで十分か? dropbox paper 同時書き込みができない kagglerのリスナーに聴いてもらえるコンテンツをどのように作っていくか 収益化がなっていない スポンサー? タイムラグが発生している気がする ポッドキャストの音声だけだと解説ができない 動画みたいな見せるものがあってもいいのかも ポッドキャスト再生数がどれくらいが普通なのかわから T(try) 動画コンテンツ 音声での生配信 Discord YouTube生配信 Scrapboxで公開してみる 気になったニュース 量子コンピュータの日本版プログラミングコンテストも開催されそう Blueqat | 量子コンピュータソフトウェア開発キット 大学発、量子コンピュータ用ソフト開発のJijがANRIから資金調達 | TechCrunch Japan 今週のkaggle カレー オレシカナイトのコンペ(abematvのデータを分析するコンペ)に出るも入賞できなかった 電線の実験を主に進めた youtube始めました 自己紹介動画とKaggleのKernelの説明動画を作った 生配信をやってみた れごん Kaggle勉強会開催 県事業の機械学習導入担当の人とか高専の機械学習を研究している人もいて、Kaggle以外の話とかも色々できた KaggleのJuliaカーネルDockerプルリク Ver1.1 対応 反応はない Kernelも少し更新 Unity、AIをテストするゲーム「障害物タワー」を発表。ゲームAIの新たなベンチマークへ MacBookAirを購入した 練習のために、Kaggleは全てこれでやっているけれどとても快適
01:06:11
February 4, 2019
19. 使ってるツール
KaggleでSilver取るためにどういう段階を踏んでいけばよいですか? もう少し詳しくという要望があったので、前回に続きもう一度 kaggleで銀メダルを取るのは難しいと思う 「銀メダル安定までに4年かかった」というツイートがあった 一方で、「全期間(約3ヵ月)公開カーネルをしっかり読んで真面目に参加すれば取れる」とのツイートも 全期間、公開カーネルをしっかり読んで理解するのは、はじめのうちは時間がかかって難しいけれど、慣れてくるとやっていることがわかるようになるので時間がかからなくなる テーブルデータのコンペと画像データのコンペは別物(一部共通点もある) テーブルデータの場合は、kaggleのソリューションからほぼ全てを学ぶことができる LightGBMなど、ツールのドキュメントは読む必要がある 画像コンペの場合は論文を読むとか、強い人に教えてもらうとかする必要がある 画像データのコンペはディープラーニングが必須だと思う テーブルデータのコンペはLightGBMだけでも戦える。 戦えるが、NN系とアンサンブルすると更に強くなる チームマージは本当にお勧め チームマージするデメリットはほとんどない お互いのモデルのアンサンブルでスコアが改善する テクニックを交換できる チーム戦は楽しい カレーちゃんは本を書く時にどんなツール使ってる? Re:VIEW とか? reviewは使わずにPages(appleのワープロソフト)で書いています Pagesの良い所 図や写真のレイアウトが簡単。好きな場所に挿入できる。 簡単に他の人にレビューしてもらえる(共有できて、コメントもしてもらえる) 共同作成も可能 reviewの使い勝手 gitで差分を管理できるので、複数人でインタラクティブに書くならreviewなどのツールは必須だと思う 1人で書くとか、章ごとに分担して書くとかなら、PagesやWordの方が図や写真を自由にレイアウトできるなど使いやすい点もある plotライブラリは何使ってる? Kaggle Python Dockerにあるもの(れごんがわかる範囲で) Bokeh Python Graphing Library, Plotly Matplotlib seaborn yhat/ggpy: ggplot port for python ストレングス・ファインダーの結果をJuliaで主成分分析して似た人を探す Strengths Finderで上位の強みが似ている人を見つけるためにJuliaでPCA(主成分分析)をしてみた 初めて機械学習関連の仕事がもらえそう(れごん) 詳しくは話せないけど、3月納品で納品物は公開されるのでそこで話せそう kaggleの講師をすることになりました(カレー) 【初心者OK】AI・機械学習ハンズオン 〜実践Kaggle〜 - connpass noteでお仕事依頼を書いていたら、声をかけてもらえた 東京でkaggleもくもく会の開催が告知されていた 第1回 kaggleもくもく会@麹町 - connpass 今週のkaggle れごん 引き続き解析ノート更新 やっとグラフ表示ぐらい コメントと up vote もらえてる 読んでるカーネルの表記が間違ってるところをコメントで指摘したり kernel と discussion で銅メダル1枚ずつもらえた カレー Eloコンペに主に取り組んでいる あまり印象が良くないコンペだったが、取り組んでみて良いコンペかもしれないと思った オレシカナイト用のコードの準備もした 今日の一句 寒の内点滅続く赤信号 恋言
47:58
January 29, 2019
18. KaggleでSilver取るために
KaggleでSilver取るためにどういう段階を踏んでいけばよいですか?|カレーちゃん|note Kaggleに取り組みながら、少しづつ実力をつけるのが良いと思う 最近kaggle参加人数が増えているので、難易度が上がっているのか。それともコンペ数が増えているので易化しているのか興味がある リスナーからのコメント 今回から毎回続けていきたい 今週のkaggle カレー 帰省していたのであまりkaggleができていない Eloコンペやマルウェアコンペにも手をつけつつ、電線コンペに取り組んでいる れごん 恋言の解析のーと(Analysis note by regonn) 随時更新 | Kaggle 日本語でカーネル書いてる kaggler-jaの質問が止まっているので答えてあげたい Kaggle画像コンペだと、どれくらいのGPU使っているか? カレー 1080ti 1枚 以前の台風コンペでのチームの人達もだいたい1枚 新ロゴ作成で機械学習系の処理してみた amp対応で1200px以上のロゴ画像が欲しかった。 What Font Is - the best font finder tool 画像からフォントを探してくれるサービス GitHub - movehand/raisr: A Python implementation of RAISR googleが発表した解像度を上げるraisrのpython実装 高解像度の画像をトレーニングデータで学習させる必要がある できたもの オレシカナイトデータコンペティションvol.2に参加します 1月26日(土)の1日で開催 AbemaTVのデータをもとに、配信される広告が実際にどれくらい閲覧されるか予測 勉強会開催 Kaggle Knight Matsue Kaggleのもくもく会 松江のオープンソースラボで1/27(日)開催 今日の一句 足早に雪の降る街通りすぐ 恋言
31:43
January 19, 2019
17. 受験の思い出
リスナーからの質問 れごん あんまり真剣に取り組めてなかったかも 数学は好きで数学の先生から数学の面白い問題とか個別に出してもらって解いてたりした カレー 勉強は、高校3年生の時に代ゼミのパーフェクTVで見ることができるやつで頑張った。 北海道の大学と東京の大学のどちらに行くか、とても悩みました。 技術者はどこでアウトプットすると幸せになれるか? はてブロかnoteか、技術者はどこで技術ブログを書くと幸せになれる? Qiita、はてなブログ、note、個人ブログを使い分け はてなブログとnoteの違い markdownで書けるか、コードが綺麗にかけるか、課金等 技術ブログと私的なことを書く場所を分けるという動きが観測される noteは課金してプライベートなこともかきやすい kagglerはどうしてもブログでのアウトプットよりも、kaggleへのアウトプットを優先しがち ALIS 全カテゴリの記事を投稿できるようになった 今年は暗号通貨関連の技術サービスが増えそう。暗号通貨下落でDappsのトランザクション手数料が下がったりして、サービスが参入しやすくなっている 2018年量子コンピュータ総集編 IBMの発表もあったので2018年のまとめと2019年の動き確認しとく 1回目の時に話していたslackも現在は Blueqat という名前になった。 このMDR社が作ってる Blueqat というライブラリが最初の汎用量子プログラミングシミュレータとして丁度良い。 mdrft/Blueqat が量子ゲートモデル mdrft/Wildqat が量子アニーリングモデル 現状だと数独が解けるレベル 以前作った4x4の数独を新しいWildqatに移植してみた - Qiita Numerai 機械学習エンジニアが儲けるにはの話 早い話がスタッキングで色んなデータサイエンティストが作ったモデルで投資すれば儲かりそうじゃない?というプロジェクト 最初の方は良いモデルを作ればお金がもらえていたが、現在のルールだと実際にNMRをベットして、実際のライブLoglossが自分の設定した基準を超えたらお金が貰える。だめだったら、そのNMRは溶けてしまう。https://numer.ai/learn 以前、Kaggleユーザ相手にNMRをエアードロップして問題にもなってた Optuna v0.6 リリース Optuna v0.6 リリース Lightgbm.py のクロスバリデーション対応 Keras対応の向上 KaggleのDockerにも取り込まれるPRはある 現在 Optuna 開発メンバーが引き継ごうとしているみたい install optuna by suk1yak1 · Pull Request #411 · Kaggle/docker-python 今年は python 側は chainer と optuna 触っていきたい 17Live れごんさんの配信を視聴した れごんさんの配信は、下半分がキャラで、上半分が俳句を書くエリアになっていて独特 技術書典6 4月14日(日)11:00~17:00 池袋サンシャインシティ2階 勉強会開催 Kaggle Knight Matsue Kaggleのもくもく会 松江のオープンソースラボという無料で使えるスペースが改修工事でできてなかったけど再開 AtCoder CADDi 2018 for Beginners C問題を Julia 言語で解いてみた 今日の一句 冬の朝声援聞こえ散歩道 恋言
01:01:29
January 14, 2019
16. 新年の抱負
今年の目標 れごん Julia ライブラリ開発 Kaggle メダル圏内に一度でも入る(最終的な順位は別) カーネルでメダルを取る 実は日本語でも日本人 Kaggler もそれなりに多いので、メダルは取れるのでは? eda script 67 analyst in Japanese | Kaggle VR Web エンジニアの収入の 3 割を VR からの収入にしたい 俳句 一日一句 カレー Kaggle Kaggle マスターになるべく早くなる Kaggle グランドマスターになる 新しいことに挑戦したい お金を稼ぐ 今週読んだブログ Google トレンド(Kaggle)を見て1年を振り返ってみる - わかめの備忘録 Kaggle 関連の出来事があった時に、Google トレンドでピークになっていて面白い Google トレンド(Kaggle)を見て1年を振り返ってみる - わかめの備忘録 Kaggle のチュートリアルを note で公開したときに THEGUILD 代表の深津さんが twitter でつぶやいてくれて、ばずった。インフルエンサーに紹介してもらったのは初で、こんなに影響力があるんだと感じる体験だった。 カレーのフォロワー数の推移もトレンドと重なって面白い そういえば、qrunch.io と qrunch.net に分裂した https://qrunch.net/ 習慣化アプリ Quitzilla: 悪い癖や依存症を解消 - Google Play のアプリ 悪い習慣を見えるようにして、どれだけ達成しているかを見えるようにしてくれる 布団にスマホ持って寝る時間が遅くなるのでこれで意識するようにしている 今週よんだ本 深層学習 (アスキードワンゴ) clippings.io っていうサービスを使い出した Kindle のハイライトやメモをテキストや EverNote に書き出してくれる 2018 年に Amazon で買った 271 件を公開する 現場で使える!PyTorch 開発入門 深層学習モデルの作成とアプリケーションへの実装 Jupyter Notebook のサンプルコードがあり、ディープラーニングを学んだことがあれば、あっという間に読める DaiGo のニコニコ動画に契約しているけど、動画溜まってたので見てた 生産性を上げる作業部屋 リラックスと作業するものを変える等 input の適した時間帯 10 時~ 14 時 カレーも DaiGo さん動画を見始めました 今週の kaggle ほとんどできなかった Julia v1.1 の rc 版リリース Release v1.1.0-rc1 · JuliaLang/julia そこまで破壊的な変更はない感じ 【競技プログラミング】AtCoder Beginner Contest 115 D 問題を Julia で解く VTuber 17Live も無事始まった 今日の一句 お正月水鳥達の声高く 恋言
01:07:04
January 7, 2019
15. 2018年を振り返る
今年1年を振り返る れごん 3月島根移住 4月 Kaggle Knight Matsue 開催 5月初の海外技術カンファレンス Ruby X Elixir Conf Taiwan 2018 7月フリーランスになる 8月VRに目覚める 9月ポッドキャスト開始 11月Vnos加入 12月VTuberハッカソン全国大会 + コルクラボ &TAG加入 カレー 2018年の自分を振り返ってみる|カレーちゃん|note 今週のKaggle 電線コンペ 金メダル圏に入った 良いコンペだと思うが参加者がすくない メモの魔力(前田裕二) 前田裕二氏「GAFAには、弱点があると思う」 | 東洋経済オンライン コミュニティについての話がある また、あまりにコミュニティー規模が大きくなってきてリーダーとファンの間の双方向性が成立しなくなってきた場合においては、今度は「ファン同士の双方向性」によって、コミュニティーのエンゲージメントを保つこともできます。 あとは、GAFAの先に来るものの話 SHOWROOMはTech Labという研究部署があって、ここにすごい人達が揃ってる バーチャル蠱毒みたいなえげつない事もしてたり 前田さん最近バ美肉してVTuberになってた VTuber 17Live というところで VLiver として活動できるようになりました。 チョコ入りマシュマロ 今日の一句 見つめれど何も言わぬや冬林檎 恋言
50:21
December 29, 2018
14. PLAsTiCCコンペを終えて
コルクラボの話 コルクラボの5期生になれたので、初回説明会の内容と今後やっていきたいこと The Agile Guild カイゼン・ジャーニー も書いてる 市川さんが立ち上げているギルド 今年できたらしい アドベントカレンダーもやってる The Agile Guild(TAG) Advent Calendar 2018 - Qiita アドベントカレンダー kaggleAdventCalenderのその1が全て埋まり、その2ができた kaggleの人が、AdventCalenderについて、twitterでつぶやいていた。 plasticcコンペ 銀メダルを獲得 チームマージ後の1週間でスコアが0.902から0.826まで上がり、学びが大きかった。 コンペの反省会 kaggleの新コンペ VSB Power Line Fault Detection | Kaggle 1日2サブミットの制限が特殊 将棋の竜王戦第7局が終了 私が将棋を真剣にやっていた、20年くらいまえと何もかも違いすぎた。 ネット配信、ソフトの評価値、色々な人がリアルタイムで解説している 今週の活動 一応1日1カーネルやってる 少しアウトプットを意識してTODOとかコメントも書いてる 自然言語処理を学ぼう #7 サービスデプロイ編 - YouTube Optuna使いたいけど、Juliaなので Hyperopt.jl でハイパーパラメータの最適な値を探す(Julia 1.0) Julia メジャーどころのライブラリは 1.0 対応してるんだけど、未対応のも多くて結構大変だった VR界隈 VR向け3Dアバターフォーマット「VRM」、国内13社が推進コンソーシアムを発足 任天堂もオブザーバーに - ITmedia NEWS 今日の一句 冬の月灯台点かずとも白し 恋言
45:05
December 23, 2018
13. インプット&アウトプット
rebuild.fm で higepon さんが kaggle の話と kaggler-ja についても触れてた 知的生活の設計 インプットのまとめ方を色々考えてる Linuxでもネイティブアプリを動かしたい(Evernoteが動かない) Turtl VSNotes scrapbox Inkdrop Boostnote Amazonで2018年に買った商品(271件)を棚卸し中 積読も多い ブログがamp対応(完全amp化)しました regonn&curry.fm Yattecastを改造して amp 対応 Yattecastをamp対応させてPodcastを配信していく 以前話してていた機械学習をAPIとして公開する方法 結局サーバーにそのままデプロイしてみることに Digital Ocean VPS 結構昔から使ってて使い心地がいい 定額なのでアクセスが集中しても大丈夫 ドメイン設定とかも楽 Amazon Lightsail みたいなもの あと、環境構築記事が公開されていて、メンテもされているので助かる Initial Server Setup with Ubuntu 18.04 | DigitalOcean Flask, Nginx, uWSGI 作業ログはqrunch.ioでまとめた Digital Ocean (Ubuntu) Flask, Nginx, uWSGI また、動画にする予定 勝手に自分の振り返り) 自分の性格とKaggleの相性実は悪いのかも? 毎日アウトプットが出しにくく手を付けるのが億劫になっている可能性もある カーネルを毎日出していく? 今週のkaggle Plasticcコンペチームを組みました Plasticcコンペ反省会12/19(水)に決定 新コンペ→Microsoft Malware Prediction paypayのキャンペーン終了 今日の一句 イヤホンの結び目ほどけ冬日差す 恋言
36:41
December 14, 2018
12. オフ会後
2人でオフ会しました Kaggle Tokyo Meetup #5 Kaggle Tokyo Meetup #5 参加レポート&資料のリンク - kaggle 全力でやります kaggle Advent Calendar 2018 25 日間全部埋まった どの記事も楽しみ VTuber ハッカソン全国大会 ツクモ/ASK 賞を受賞 コルクラボの 5 期メンバーになれた これからもコミュニティ運営についてブログとか書いていきたい アドベントカレンダーのブログとか書いてる 島根県松江市に 2018 年 3 月に I ターンしてフリーランスになりました ハイパーパラメータ自動最適化ツール「Optuna」公開 これまでやってきた勉強会、運営が変わって新しくはじまります 第一回 Rによる実証分析・読書会@渋谷 - connpass 隔週での開催見込み 競技プログラミングも少しコンテンツ作り始めた 今日の一句 怠け癖けふも顔出す小六月 恋言
45:01
December 12, 2018
11. Vlogはじめました
三江線アイデアソン 今年廃線になった三江線 なかなか普段立ち入ることのできない線路とかトンネル内に入ることができる ドローンは自分のは民家とかも近くて飛ばせなかったけど、事業でドローンを飛ばしている人が本格的なドローンを飛ばしている所を見ることができた 安定してサービスを提供できてお金にも結びつけるアイデアって難しい OSS Gate 東京ミートアップ for Red Data Tools in Speee 朝:VR 夜:データサイエンス という風に自分の中で区切ってみたけど良さげ Vlog 始めてみた 海外だと Video + Log で Vlog といって、日記感覚で YouTube に投稿している それを VTuber で Virtual + Log で Vlog VTuber で作業しているところも今後上げていきたい kaggle のスコアが上がらなくてつらい pandas の小技 Pandas.DataFrame のメモリサイズを削減する(最大で 8 分の 1) [Python] - Qiita 特徴を作るときに、pandas をやめて、numpy で処理するようにしたら早くなった 今日の一句 ポケットに手を入れ横に寒雀 恋言
30:08
November 22, 2018
10. カレーちゃんの財務省時代の話
リスナーからの質問 Ryze トイドローン Tello やすいのと Amazon の評価が良かった コントローラーも一緒に購入 Scrach, Python, Swift でプログラミングもできるらしい 他のドローン触ってないので、比較はできないが安定して飛ばせる 今週末は島根の廃線になった三江線のアイデアソンに参加予定 11/17-18  三江線でのVRやドローン等の機器を活用したアイディアソンの開催 - connpass ネタは割とあるのですが、何を話して良いか難しい。自分のことなら話しやすいので、遅くに返ってゲームしていた話を。 財務省ではタクシー代金の節約のために、深夜に宿舎へ向かうバスがある( 私が働いていた頃はあった、今はあるか不明。) バスの発車時刻は、24:30、25:45、27:00 の 3 回 財務省には仮眠スペースがあるので、バスで家に帰って寝るか、仮眠スペースで眠って財務省に泊まるか、大きな決断 私はある意味でとっても勤勉なので、24:30 発のバスで帰って家に着いて 25:30 くらい、そこから桃鉄 2010 やスプラトゥーンをするという生活を送っていた時期があった。 最後の1年は忙しすぎて仮眠室で泊まることも多かった。 kaggle の特徴量の管理の仕方 特徴のファイルは feather 形式で管理する csv ファイルは、読み込みがとても遅いので csv は使わないようにする feather 又は npy 又は pickle 特徴量をグループごとに feather のファイルを作って管理する class をつくって、特徴量の作成と特徴量の読み込みは全てそこでやる 最近リリースされたトリクルを使ってみました。 トリクルでは、トピックごとにアクティビティ(ログ)を書けるサービス トピックは自分で設定する 私は、kaggle、サブミット、日記、掃除というアクテビティを作ってみた トピックごとに、github でいう「草を生やす」ことができるので、毎日やろうという気になる 習慣化のためには、毎日継続することが大事(続ける習慣より) 基本的には個人でアクティビティを記録するだけで、他社との関わりは知り合いのアクティビティのうち気になるものをサブスクライブする程度だと思われる。 収益化の仕組みが現状なさそうなので、心配。 Twitter から流入があるといいけど、mastodon と同じ様に追いかけたい人が Twitter のままだとなかなか移行に踏み込めない。 みんチャレ - 三日坊主防止アプリ ちょっと話はずれるけど、複数のプラットフォームへ投稿するのが面倒問題 特に Valu みたいな外部 API 公開してない場合なども面倒 ifttt みたいに自動化もできるけど、元の投稿をどこにするかも迷う voicy のチャンネル開設申し込みしてみました(2回目) たまに voicy のようなメディアで、思いっきり話したくなる 過去の遺産が残っている れごん / Voicy(ボイシー) れごんはコルクラボの 5 期生に応募 新世界読みました 西野さんが良く書いている、貯信時代という信用の話やクラウドファウンディングの話は1度は読むと良い。 日本最大のオンラインサロンの話も読める Python 環境どうしてる? 最近 pyenv + anaconda から Pipenv に乗り換えた Ruby の Gemfile みたいにパッケージ管理ができるようになったので良さげ 私は anaconda のみで、適当にインストールしちゃっています 今日の一句 冬帽子朝の苦手な君を待つ 恋言
01:02:28
November 17, 2018
9. カレーちゃんのイベント報告
台風コンペ反省会やりました 9人が参加し、情報交換 主催者の方にも参加してもらえて、どうしてこのコンペを参加することになったのかや、データの概要などを教えてもらった 参加者の多くの方がこの podcast のリスナーだった データサイエンティスト養成読本ビジネス活用編刊行記念イベントに参加 kaggler の業務への活用 Kaggle マスターの方は引き出しがものすごく多い Kaggle マスターは、PoC(概念実証)のフェーズにいてもらえると、示唆が得られる。 ピープルアナリティクス 超精密な性格診断 | 自分を構成する 8 性格をエムグラムで診断 無料性格診断テスト、性格タイプ詳細説明、人間関係およびキャリアのアドバイス | 16Personalities 農家の手伝い 確率プログラミング probability/README.md at master · tensorflow/probability TensorFlow にとりことりこまれ取り込まれた ベイジアンニューラルネットワーク構築中 kaggle の新コンペ julia 1.0.2 リリース 2018 Kaggle ML & DS Survey Challenge 回答者は、アメリカ、インド、中国の順に多い 日本は10番目 Is it better than 2017? 今日の一句 振り込みはいつものところ冬の入 恋言
34:53
November 8, 2018
8. 二人の名前の由来
台風コンペ終了 スコアなしの最下位 やったこと → 台風コンペ@currypurin のやったこと - typhoon@currypurin 台風コンペの反省会やります。 将棋でいう感想戦のように、反省会でみんなで振り返りることによって kaggle の実力があがるはず kaggle Advent Calendar 2018 - Qiita 2017 年版は regonn が作ったけど宣伝とかしてなかったので全然埋まらなかった。。。しかも、Qiita 退会したので作成者が Ghost になってる。 今年は埋まって、ノウハウが共有されることを期待 Kaggle Tokyo Meetup #5 - connpass が 12 月1日に開催されることが決定 Santander コンペについて、15 分間ほど発表することに 何を話すか非常に難しい PLAsTiCC コンペ 宇宙 テーブルデータ Class 分類 14 個 + その他の 15 個 Two Sigma 「kaggle のチュートリアル」&「Kaggle 挑戦記」の10月の結果 2018 年 10 月の note 売上の結果|カレーちゃん| note 読んでいる本 データサイエンティスト養成読本 ビジネス活用編 11/6 の刊行記念イベントに参加するので、それまでに読み終えて参加したい リスナーからの質問 regonn は中学生の時に ハンゲーム に登録するときに、レゴブロックにハマっていて、レゴで登録しようとしたら既に ID が取られていたので、怪獣っぽくていいかなと思い レゴン になった。なので、ローマ字打ちで regonn(n が重なる) カレーパンマンが小さい頃から好きなこともあり、勉強会に参加するときにハンドルネームをカレーちゃんにした。twitter の@currypurin は、カレーパンマンと同じくらい好きなポムポムプリンから purin をもらって、@currypurin にした。 データサイエンティストはフリーランスでも活躍できるか? できるし、やっている人もいる。実際に人は足りていない。けど、データサイエンティストも色々と分野があるので、強みを持てると複数案件とかもできるのかも。データサイエンティストはどこも足りてないので、複数案件持つ人も求められていそう。 今後はフリーランスが集合するようなギルド的な存在が出てくるのかなと考えている 「ライターになりたい!」というニーズが急増する今。労働集約型モデルを、どう変えていく? - 少し前の記事だけど、WEB ライターの話でどう活躍していくかの話。 - ウェブエンジニアでもデータサイエンティストでもある程度同じ話ができそう。 - inquire という団体がでてくるが、ここがフリーランスの団体で、企業としてまとまらず、それぞれが独立していて、個人で活躍できるレベルの人たちの集まり。 技術の共有がある程度できる 仕事もその団体として受けて評価もその団体として評価される これのデータサイエンティスト版を作りたいけど、色々問題も多そう。 最近 vnos という団体に入った。ここは VTuber を扱う人たちのギルド。 思想が自分の理想のギルドの形に近くメンバー募集もしていたので参加した。 VTuber 界隈の話も今後していきたい。 Workshop in VR #3 LT とか 今日の一句 秋寒し電気ブランのほろ苦さ 恋言
01:01:48
November 2, 2018
7. 台風コンペ追い込み
PyData.tokyo One-day Conference 2018 - connpass に参加しました。 どのセッションもとても勉強になった 「kaggle のススメ」という LT を実施 NVIDIA この日は、「PyData.tokyo」、「TokyoR」、「JuliaTokyo」が同日開催という珍しい日だった。 今週の1週間 台風コンペ10位まで上がりました。 最近読んでる本 マルチ・ポテンシャライト 好きなことを次々と仕事にして、一生食っていく方法 https://amzn.to/2SdVr5C 一つのことに専念していくためにはどうすればいいかという本が多い中、この本は専門家で一つのことをやりとげるのではなく、色々と興味が移る人(マルチポテンシャライト)向けの話し どのような人生設計をすればいいのか 4 つの働き方(ワークモデル)を提示してくれている どの働き方も「お金」「意義」「多様性」を大事にしている グループハグアプローチ スラッシュアプローチ 自分はこれに一番近い ニッチなテーマに魅力を感じるが、それをフルタイムでやろうとはせず、名詞の肩書が多くなるタイプ(フリーランスの掛け持ち) アインシュタインアプローチ フェニックスアプローチ 最近気になってる新しいサービス みずはのめ 競艇予想人工知能 SNS 要素を入れていくみたい Qrunch 技術ブログを書くハードルを下げるサービス ログという形で気軽に残せる クロス投稿で自分のブログ記事を投稿することもできる Qiita よりも良い デザインもしっかりしている タスクが Trello で公開している 早速自分の Julia の記事をクロス投稿しておいた 最近、個人がクオリティの高いサービスを出してくるようになったイメージ Julia の動き Gadfly.jl が v1.0 で動くようになった XGboost.jl も master ブランチが v1.0 対応したっぽい Take Kaggle’s 2018 Machine Learning and Data Science Survey! やってる データサイエンスの最前線がわかる調査 収集データは CSV で公開される Kaggle Machine Learning & Data Science Survey 2017 Two Sigma せっかく Python で書くのでなにか学びながらやりたい ベイズ統計で解いてみる(Stan.jl 等もあるので、Julia でも知見を活かせそう) Two Sigma のカーネルで Bayesian とかで検索しても出てこない。 人気が無いのか このコンペには適さないのか 【Python と Stan で学ぶ】仕組みが分かるベイズ統計学入門 で学んでる 今日の一句 アイスからホットに変はり松手入れ 恋言
45:06
October 23, 2018
6. Juliaの多重ディスパッチ
リスナーからの質問 言語屋さんではないので詳しくは話せないけど、Julia が Class を使わない理由は多重ディスパッチと呼ばれる仕組みを採用しているから。おそらく、Go とか Rust は別の理由(未調査) 多重ディスパッチは関数の全ての引数の型マッチングで対応するメソッドを呼ぶ方法 同じ関数名で複数のメソッドが定義される 科学計算等で、型によって処理を変えられるため重宝する(引数が Int Int の場合と Float Float の場合とで別の処理を定義することができる) オブジェクト一つ一つがメソッドを持っているわけではなく、関数オブジェクトがまとめてメソッドを持っている 似たように多重ディスパッチを採用しているのは Common Lisp なので、Julia は Ruby や Python のような 純粋オブジェクト指向言語ではないが、疑似的なオブジェクト指向の書き方ができる 多重ディスパッチ - Wikipedia 多重ディスパッチがあると、クラスがあって、そこにメソッドが属しているという考え方はあまり意味を持たない。collide-with という名前のメソッドは、引数ごとにそれぞれ 2 つのクラスと関連付けられている「普通の関数呼び出し」に過ぎなくなる。結果として、メソッドを呼び出す際の特殊な構文を必要としない。 class - julia: OOP or not - Stack Overflow 疑似 OOP note の継続課金マガジンの読者が 5 人になりました CtoC と言われる、個人向けの販売やっていきたい データ分析の鬼、けいすけさんから私の twitter の分析を 100 円で買いました。 1年半にわたり毎週開催していた勉強会の最終回と打ち上げをやりました 次は Kaggle の勉強会を開催していきたい。 今週の1週間 currypurin 画像のディープのモデルをいろいろ作りました。 畳み込みニューラルネットワークの最新研究動向 (〜2017) 塩コンペのディスカッションを見ていました。 消費税が増税されることが発表された 成長ジャーニー読みました。 regonn Two Sigma: Using News to Predict Stock Movements | Kaggle 引き続き調べてる 完全 Kernel-Only ConfidenceValue iPad 買ったけど Goodnote の使い方が分からない 今日の一句 川沿いをただ彷徨ふや草の花 恋言
46:05
October 15, 2018
5. 技術書典を終えて
技術書典終わりました 何人か「podcast 聴いています」と声をかけてくれた方がいました 来場者1万人超え。 データリファインメントの技術書典5開催レポート|カレーちゃん| note Kaggle 本は、紙と pdf で合計 280 冊くらい売れて、合同会社本は pdf のみで 90 冊ほど売ることができました。 技術書でご飯は食べられるのか? #技術書典 - その後のその後 とにかく、「技術の発信」でも収入が得られる時代が到来しつつあることが嬉しいです。お客さんの課題に対して技術力をふるう「案件」も好きですが、その仕込みフェーズ自体でも稼げるとなると、より自由に生きるための選択肢が増えたような、そんなワクワク感があります。 技術の発信でも収入が得られる時代 参加者も増えて全体的なクオリティが上がっているので売る方のハードルも上がりそう 慶応大学の量子コンピュータ講義が無料で受けられる MOOC Online Quantum Computing Course - FutureLearn 動画は英語だけど日本語スクリプトも見えるので良い 4 週間のコンテンツ AI 系の日本語ポッドキャスト見つけた 「人工知能ラジオ Team AI Channel」 Team AI 自体は何度か Qiita 記事とかで見かけてたけど、Podcast やってるのは知らなかった daisuke-team-ai - Qiita 話の内容的にはアカデミックでのキャリアパスやビジネスについて regonn&curry.fm の1回目の時にリプもらっていました。 落合陽一の塾に入った きっかけ Weekly Ochiai コミュニティをアップデートせよ 最近は kaggler-ja とか VR アカデミア みたいに専門のコミュニティが出来上がってきている気がして、そこらへんに興味があった 今後は大学という枠ではなくコミュニティという枠で学ぶ機会が増えるのではないか? 落合陽一塾 - DMM オンラインサロン 中で研究室という概念があり、そこで自分の興味がある分野を他の人とディスカッションできる VR 研究室を立ち上げ中 AI 研究室も立ち上げてみたいけど、何を研究するのかが明確にならないので、諦めた Doc2Vec の YouTube 動画上げました Two Sigma: Using News to Predict Stock Movements 取り組もうと思ってる ニュース情報から株価の動きを予測するコンペ(チーム最大 3 人) Kernels only Two Sigma News Official Getting Started Kernel | Kaggle You can only submit from Kaggle Kernels. Submission Instructions を見れば Kernels only について書いてあった PUBG Finish Placement Prediction (Kernels Only) | Kaggle kaggle の新コンペ Human Protein Atlas Image Classification | Kaggle リスナーからの質問 画像系のコンペティションでは DNN1 強という印象ですが、それ以外の手法をどの程度調べるべきと考えていますか? 今
39:53
October 10, 2018
4. 技術書典5来てね
10/8 の技術書典サークル参加します 「Kaggle のチュートリアル」と「代表1人の小さな合同会社の作り方」を販売予定 グッズとして扇子も作成中 twitter でどういう文字・画像が良いか聞いたが反応なし note.mu の継続課金マガジンを購読している方には、扇子をプレゼント 10/8 の天気が気になる podcast 聞いていますで ○○ プレゼントをやりたい 今週の一週間を簡単に振り返る 台風コンペ チームメンバーの家に行って打ち合わせをしたり、チームメンバーが使う、train.py と test.py を書いていました。 海外旅行中に読んだ本(3 冊) 機械学習入門 ボルツマン機械学習から深層学習まで 以前ベイズ推定入門の本は読んでいたので、こちらも読みたかった 作者は量子コンピュータの書籍もだしているので、ちょくちょくそこら辺の話題が出てくる シリーズは続いているみたい(公式ではないけど、本人 Twitter では呟いていた)で量子コンピュータの話とかも今後出てくるかも 10 年後の仕事図鑑 古代ローマ市民 好きなことに没頭 発信が大事 カレーちゃんが影響受けている人はいる? ホリエモン、西野亮廣、ゆうこす、ハヤカワ五味など 若い方とか、違う分野の方に学べるようになりたいと思っている 自分は落合陽一、森博嗣、土屋賢二の影響が大きい 一生リバウンドしないパレオダイエットの教科書 鈴木祐 メンタリスト DaiGo 最近この二人の本を読んでて、色々と論文の内容を紹介してくれる 量子コンピュータの手軽に触れるイジングエディタが出てきた イジングエディタ - Annealing Cloud Web ここやってるフィックスターズ株式会社は積極的に量子コンピュータを使った研究開発をやっていて勉強会とかも定期的に開催している 次世代計算機講座 - connpass あとは、企業だと MDR が有名 量子コンピュータアプリ(ゲートモデル&アニーリングモデル) - connpass こちらは kaggler-ja みたいに Slack コミュニティがある MDR | 量子コンピュータ 最近 Kaggle の新規コンペが増えてきた Julia v1.0.1 リリース Bugfix がメイン リスナーからの質問 最近 Kaggle を始めた者です。素晴らしいポッドキャストありがとうございます。(各エピソード 3 回ずつは聞きました。)GA コンペで R を使っているせいもあるのか、モデリングのトライ&エラーを高速で行うことができずに困っています。(XGBoost 回すだけで 1 時間はかかってしまいます。)何かいい方法は無いでしょうか? Python の場合は、LightGBM の方が XGBoost よりも数倍はやい R の場合はどうなんだろう 私の場合は早く回すために特に利いたのは次の3つ Learning Late を小さくし過ぎない 多く分割しすぎない(3 分割ぐらい) GPU を使う クロスバリデーションや主成分分析でトライアンドエラーの時間を減らせるかも LightGBM 公式の Parameters Tuning にも、For Faster Speed という項目があるので参考にすると良い イベント情報 Workshop in VR #2 LT 会 - connpass 技術書典5 | 技術書典 今日の一句 流星やラジオの会話途切れたり 恋言
01:15:10
October 1, 2018
3. Twitterの質問に答えていきます
質問 ポッドキャスト聞いてから Signate の存在を知りました。Kaggle 関連の話が面白かったのでもっと聞きたいです。例えば、最近コンピティションで話題の技術や、自分が参加したコンピティションではどういうことを考えてモデル作成の戦略を立てているか、などなど @ハシビロコウさんより 最近話題の技術(どちらも最新ではないが、必須?) LightGBM マイクロソフト作成 早い!!精度が高い、大量の特徴量も入れられる、 kaggle-ja で共有されていた xgboost LightGBM CatBoost の比較記事 CatBoost vs. Light GBM vs. XGBoost アンサンブル 相関が低い予想をアンサンブルし、スコアを上げる Santander コンペで金メダルをとった戦略 失点を減らす フォーラムをつねにチェック リークを見つける 加点を狙う 他の人が見つけていないことをみつける ポイントを絞る 時間は有限なので、キーとなりそうなところに集中 画像のコンペは好きじゃない、と思われるのはなぜですか?優秀なモデルを持ってきて力技勝負になっちゃうとかでしょうか(マシュマロ) 画像のコンペを真剣にやろうとすると、GPU が必須になる GPU が必要なためか参加人数は増えない傾向にある 個人的には画像のコンペは楽しい 技術の進歩すごいって感じられる 人間の認識能力もすごいと感じる 前処理とかも難しいブログ記事なども少ない 少ないという意味は、殆どがサンプルコードを動かして Mnist 解析するだけみたいな気もしてる 論文を読んでいく必要がある jupyter の tips Jupyter Tips 募集中への回答です。PyCharm + Jupyter NoteBook を使うことによって PyCharm の強力なコードの自動補完が利用出来て便利です。 jupyter notebook と PyCharm Jetbrains 系は Professional 版(お値段高め)と Community 版(無料)がある 違いは web 開発機能とかなので機械学習で利用するのであればいけそう 気になるニュース AI/機械学習の利用がストレージ支出に大きな影響を与えると 70%の企業が判断、IDC Japan 調査 - クラウド Watch 機械学習のストレージ問題 なんか対処してる? Box Japan BigQuery - アナリティクス データ ウェアハウス  |  BigQuery  |  Google Cloud 田中 TOM 自然言語処理を学ぼう #5 doc2vec 理論編 - 田中 TOM と愉快な仲間たち 量子コンピュータ関連 メルカリのインターンシップに出ている学生達のブログ記事が出ている D-wave を触っている 現状の量子コンピューターでの限界(妥協点)や問題がなんとなくわかる メルカリがこういう分野にもすでにお金を出している D-Wave マシンで Graph Golf に挑戦した話 - Mercari Engineering Blog D-wave マシンで最大カット問題を解く - Mercari Engineering Blog オレオレ機械学習ライブラリ構想(機械学習名古屋第1 7 回勉強会) 機械学習のアルゴリズムに関係ない部分多すぎ問題 試したものがちゃんと記録される・再現できる 煩わしいデータ管理をどうにかしたい モデル管理をちゃんとしたい オレオレライブラリって結構大事でみんな Kaggle に夢中すぎてやってない分野も多い気がする 自分も Julia から Neural Network Console フォーマット向けのオレオレライブラリとか書いてる 今日の一句 抜け道を先ゆく風や彼岸花 恋言
45:44
September 16, 2018
2. 未来のプログラミング
ハッシュタグの紹介 #regonn_curry_fm @regonn_curry 初回収録・公開の感想 今 Kaggle で開催中の賞金もあるコンペって画像系しかない playground コンペが充実している あと 2 週間程度でおわるのが 7 つある 今週の専業 Kaggler 技術書典5の原稿を執筆。 レビュアーに依頼できるところまでほぼ書き上げた。 質問箱 カレーちゃんは現在どのように生計を立てているのですか。扶養親族はいますか。私も現在公務員で家庭持ちなのですが機械学習界隈にキャリアチェンジを狙っているのでその辺り気になります。 勉強方法も気になる connpass での勉強会を 1 年半、週1で開催 TechFeed 合同会社とフリーランス 技術書典5 わかばちゃんと学ぶ Git 使い方入門 松江の VTuber ハッカソン参戦して最優秀チームに選ばれたので東京大会への参加券をゲットしました VTuber ハッカソン 全国ツアー 2018【島根会場】 CUI-GUI-SUI(SPATIAL-USER-INTERFACE) AtCoder 参戦 jupyter 使ってて Tips あったら教えて欲しい tqdm: A fast, extensible progress bar for Python and CLI for 文を回す時に、 tqdm を挟んでくるプログレスバーを出す マシュマロで質問や Jupyter Tips 募集中 今日の一句 秋の蚊や雨音響く独り部屋 恋言
57:37
September 10, 2018
1. データサイエンス界隈Podcastはじめました
この Podcast ではデータサイエンティスト界隈で話題の Kaggle について話していこうと思います 自己紹介・近況 れごん フリーランス、2018 年 3 月から松江に移住。Julia 言語が好き。 カレーちゃん 2018 年7月から専業で Kaggle をやっている。それまでは公務員。2018 年 4 月に「Kaggle のチュートリアル」という同人誌を作成 機械学習や Kaggle を知人に伝えるのが難しい問題 kaggle 流行っている? HomeCredit コンペ:参加者 8572 ユーザー、7198 チーム、で過去最大 rebuild.fm でゲストで出ている Higepon さんが Kaggle 始めたらしい。そのうち、rebuild.fm でも Kaggle の話が聞けそう Kaggle じゃないけど、Signate のメテオサーチ 1 位の解法がマンガになっている https://speakerdeck.com/pigeon/meteorsearch メテオサーチの1位から 3 位のかたの発表動画も公開されている Pairs の婚活マッチングアプリに Kaggle が好きな人コミュニティがある 現在 男性 11 人(れごん含む) 女性 0 人 機械学習系 VTuber 増えてきた スベトラーナ・小百合・ベレフスカヤ 静谷 鳩(しずたに はと) アイシア=ソリッド VRoid 世界初の Vtuber 支援サービス 「V カツ」 今週の専業 Kaggler Competition Detail/国立研究開発法人 海洋研究開発機構 | SIGNATE - Data Science Competition 量子コンピュータ Q# QISKit Pyquil twitter 周知・質問募集の周知 @regonn_curry 質問箱つくるので、質問あるかたはお願いします。 イベント告知 Workshop in VR #1 LT 祭り VR 上で行う勉強会 VR の都合上発表者全然集まらない 自分は Kaggle の Julia1.0 化(取り込まれてないけど)について話す予定 Julia 0.6 から 1.0 への変化した部分等 今日の一句(れごん) 青空に定規いらずの秋津かな 恋言
53:58
September 5, 2018