Leading NLP Ninja

By jojonki

Leading NLP Ninjaでは最近のNLP (Natural Language Processing）に関連する論文をjojonkiが短く紹介します．気になったこと・質問・間違い等，フィードバック頂けると嬉しいです．
紹介する論文は，基本的に下記の論文まとめから取り上げる予定です．
github.com/jojonki/arXivNotes/issues

Listen on SpotifySend voice message

Available on

Report content on Spotify

ep50 (ICLR): ELECTRA: Pre-training Text Encoders as Discriminators Rather Than Generators

Leading NLP NinjaMar 14, 2020

00:00

28:02

ep52(ACL): A Two-Stage Masked LM Method for Term Set Expansion

Masked Language Modelingを活用して語彙拡張を行うTerm Set Expansionの手法を解説しました．

今回紹介した記事はこちらのissueで解説しています．
https://github.com/jojonki/arXivNotes/issues/409

サポーターの方も募集中です．
https://www.patreon.com/jojonki

May 16, 202031:11

ep51 (arXiv): XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization

CMUとGoogle Researchによる40言語9タスクによるベンチマークXTREMEを解説しました．Cross-lingualな評価にとても良さそうです．

今回紹介した記事はこちらのissueで解説しています．
https://github.com/jojonki/arXivNotes/issues/400

サポーターも募集中です．
https://www.patreon.com/jojonki

Apr 18, 202027:28

ep50 (ICLR): ELECTRA: Pre-training Text Encoders as Discriminators Rather Than Generators

ICLR 2020より，Replaced Token Detectionタスクによる事前学習によってGLUEとSQuADでSOTAを獲得したStanford x Googleのモデルを解説しました．

今回紹介した記事はこちらのissueで解説しています．
https://github.com/jojonki/arXivNotes/issues/391

サポーターも募集中です．
https://www.patreon.com/jojonki

Mar 14, 202028:02

ep49 (ICASSP): Looking Enhances Listening: Recovering Missing Speech Using Images

ICASSP 2020より，ビジュアル情報を利用し，マスクされた音声信号を復元できるマルチモーダルASRを解説しました．

今回紹介した記事はこちらのissueで解説しています． https://github.com/jojonki/arXivNotes/issues/384

サポーターも募集中です． https://www.patreon.com/jojonki

Feb 21, 202022:11

ep48 (AAAI): Emu: Enhancing Multilingual Sentence Embeddings with Semantic Specialization

AAAI 2020より，多言語文埋め込みフレームワークEMUを解説しました．

今回紹介した記事はこちらのissueで解説しています． https://github.com/jojonki/arXivNotes/issues/371

サポーターも募集中です． https://www.patreon.com/jojonki

Feb 09, 202038:34

ep47 (ICLR): ALBERT: A Lite BERT for Self-supervised Learning of Language Representations

ICLR 2020より，factorized embeddingとパラメタ共有によるパラメタ削減及び文順序予測タスクを採用したALBERTを解説しました．

今回紹介した記事はこちらのissueで解説しています． https://github.com/jojonki/arXivNotes/issues/348

サポーターも募集中です． https://www.patreon.com/jojonki

Jan 12, 202025:35

ep46: FreeLB: Enhanced Adversarial Training for Language Understanding

ICLR 2020より，BERT/RoBERTaの埋め込み空間に，敵対摂動を入れるVirtual Adversarial Trainingによって，モデル性能を改善するFreeLBという手法を解説しました．

今回紹介した記事はこちらのissueで解説しています． https://github.com/jojonki/arXivNotes/issues/347

サポーターも募集中です． https://www.patreon.com/jojonki

Jan 01, 202024:21

ep45: Episodic Memory in Lifelong Language Learning

NeurIPS 2019よりDeepMindが発表した，様々な異なるタスク（テキスト分類とQA）のデータセットをepisodic memoryを利用して１モデルで学習できる手法を解説しました．

今回紹介した記事はこちらのissueで解説しています． https://github.com/jojonki/arXivNotes/issues/326

サポーターも募集中です． https://www.patreon.com/jojonki

Dec 01, 201936:03

ep44: 75 Languages, 1 Model: Parsing Universal Dependencies Universally

第４４回では，多言語で事前学習されたBERTを用いて，多言語でUniversal Dependenciesのタスクを解くモデルを解説しました．

今回紹介した記事はこちらのissueで解説しています． https://github.com/jojonki/arXivNotes/issues/322

サポーターも募集中です． https://www.patreon.com/jojonki

Nov 24, 201936:04

ep43: BPE-Dropout: Simple and Effective Subword Regularization

第４３回では，Byte Pair Encodingを用いたサブワード正則化手法，BPE-dropoutを解説しました．

今回紹介した記事はこちらのissueで解説しています． https://github.com/jojonki/arXivNotes/issues/302

サポーターも募集中です． https://www.patreon.com/jojonki

Nov 04, 201936:45

ep42: HuggingFace's Transformers: State-of-the-art Natural Language Processing

第４２回では，HuggingFace社のBERT, GPT-2, RoBERTaなどが気軽に利用できるTransformersフレームワークを紹介しました．

今回紹介した記事はこちらのissueで解説しています． https://github.com/jojonki/arXivNotes/issues/295

サポーターも募集中です． https://www.patreon.com/jojonki

Oct 20, 201919:45

ep41: A Simple Theoretical Model of Importance for Summarization

第４１回では，ACL 2019より要約タスクにおける"重要性"をモデル化して，Outstanding Paperを獲得した論文を説明しました．

今回紹介した記事はこちらのissueで解説しています．
https://github.com/jojonki/arXivNotes/issues/290

サポーターも募集中です． https://www.patreon.com/jojonki

Sep 15, 201945:26

ep40: OpenDialKG: Explainable Conversational Reasoning with Attention-based Walks over Knowledge Graphs

第４０回では，ACL 2019よりFacebookのOpenDialKGという知識グラフを探索できる対話推論モデルを解説しました

今回紹介した記事はこちらのissueで解説しています．
https://github.com/jojonki/arXivNotes/issues/287

サポーターも募集中です． https://www.patreon.com/jojonki

Sep 07, 201934:17

ep39: Conversational Response Re-ranking Based on Event Causality and Role Factored Tensor Event Embedding

第３９回では，ACL 2019 NLP for Conversational AIのBest Paperから，対話応答生成タスクにおいて，対話履歴と応答候補の因果関係に着目したリランキング手法を提案したモデルを紹介しました．

今回紹介した論文はこちらのissueで解説しています． github.com/jojonki/arXivNotes/issues/283

Aug 20, 201926:05

ep38: Trends in Natural Language Processing: ACL 2019 In Review

第３８回では，Amazonの方のACL 2019の参加レポートを解説しました

今回紹介した記事はこちらのissueで解説しています．
github.com/jojonki/AI-Post-Notes/issues/2

Podcastのなかで紹介したarxivのメタ情報を簡単にコピペするChrome拡張
https://chrome.google.com/webstore/detail/arxiv-clip/enkadffnndphdjnpjamejdjlcbkkbpmp

サポーターも募集中です．
https://www.patreon.com/jojonki

Aug 09, 201923:59

ep37: Multimodal Transformer Networks for End-to-End Video-Grounded Dialogue Systems

第３７回では，ACL 2019から，ACL2019からDSTC7のマルチモーダル対話でSOTAを獲得したMulti-Modal Transformer Networksを紹介しました．

今回紹介した論文はこちらのissueで解説しています． github.com/jojonki/arXivNotes/issues/272

サポーターも募集中です． www.patreon.com/jojonki

Jul 15, 201926:15

ep36: A Survey of Reinforcement Learning Informed by Natural Language

第３６回では，IJCAI 2019から，自然言語処理を用いた最近のRLに関するサーベイ論文を紹介しました．

今回紹介した論文はこちらのissueで解説しています． github.com/jojonki/arXivNotes/issues/267

Jul 07, 201926:47

ep35: Modeling Semantic Relationship in Multi-turn Conversations with Hierarchical Latent Variables

第３５回では，ACL 2019から，階層的にVAEを用いてマルチターン対話における言語生成を行う論文を紹介しました．

今回紹介した論文はこちらのissueで解説しています． github.com/jojonki/arXivNotes/issues/261

Jun 30, 201926:37

ep34: Do Neural Dialog Systems Use the Conversation History Effectively?

第３４回では，ACL 2019から，ニューラル対話生成モデルが，対話履歴を効果的に活用しているか調査した論文を紹介しました．

今回紹介した論文はこちらのissueで解説しています． github.com/jojonki/arXivNotes/issues/254

番組への支援は，こちらからお待ちしております．

Jun 07, 201916:31

ep33: Target-Guided Open-Domain Conversation

第３３回では，ACL 2019から，目的のトピックにスムーズに対話遷移できるopen-domainの対話システムに関する論文を紹介しました．

今回紹介した論文はこちらのissueで解説しています． github.com/jojonki/arXivNotes/issues/242

番組への支援は，こちらからお待ちしております．

Jun 01, 201938:41

ep32: We need to talk about standard splits

github上でご指摘いただきましたが，実験２のReproductionのシステムの優劣を完全に逆にして説明していることが判明しました．issueのコメント欄を御覧ください．他にも怪しくなってきた気がするのでお気付きの方はどんどんコメント頂けると嬉しいです。

第３２回では，ACL 2019から，標準的なデータセットのsplitに起因するシステム比較手法の危険性を示す論文を解説しました．今回紹介した論文はこちらのissueで解説しています． github.com/jojonki/arXivNotes/issues/241 番組への支援は，こちらからお待ちしております．

May 26, 201922:17

ep31: CommonsenseQA: A Question Answering Challenge Targeting Commonsense Knowledge

第３０回では，NAACLのBest Short Paperに選ばれた，マルチモーダル機械翻訳におけるビジョンモダリティの貢献具合を調査した論文を紹介しました．

今回紹介した論文はこちらのissueで解説しています．
github.com/jojonki/arXivNotes/issues/229

番組への支援は，こちらからお待ちしております．

May 11, 201933:02

ep30: Probing the Need for Visual Context in Multimodal Machine Translation

第３０回では，NAACLのBest Short Paperに選ばれた，マルチモーダル機械翻訳におけるビジョンモダリティの貢献具合を調査した論文を紹介しました．

今回紹介した論文はこちらのissueで解説しています．
github.com/jojonki/arXivNotes/issues/228

番組への支援は，こちらからお待ちしております．

Apr 30, 201925:32

ep29: What's in a Name? Reducing Bias in Bios without Access to Protected Attributes

第２９回では，NAACLのBest Thematic Paperに選ばれた，学習データに含まれるバイアスを軽減させる手法を紹介しました．名前の単語埋め込みと予測確率の相関関係にペナルティを与えるロス関数を提案しています．

今回紹介した論文はこちらのissueで解説しています．
github.com/jojonki/arXivNotes/issues/226

Apr 22, 201931:19

ep28: Attention is not Explanation

第２８回では，NAACLより学習した重みに対する透明性・説明性について一石を投じる論文を解説しました．
今回紹介した論文はこちらのissueで解説しています．

github.com/jojonki/arXivNotes/issues/221

Apr 13, 201924:54

ep27: 今年度の振り返りとこれからについて

第２７回では，２０１８年度の振り返りの特別回として，アンケート結果の共有，NLPのおすすめ勉強方法と教材，論文の読み方，期末の振り返りと今後について話しました．

アンケートの振り返り
NLPの勉強の仕方，論文の読み方
今期，来期のはなし

紹介した書籍やサイト

自然言語処理の基本と技術
- Graham Neubig先生のNLPプログラミングチュートリアル
- 言語処理のための機械学習入門

番組への支援は，こちらからお待ちしております．

Mar 31, 201917:15

ep26: 大規模な自動解析データが形態素解析器をどこまで小さくできるか

第２６回では，NLP2019のニューラルネットワークベースのシンプルな形態素解析器について解説しました．
今回紹介した論文は予稿集が公開され次第，issueを公開にします

現在 視聴者の方へのアンケートを実施しているので，数分で終わりますのでぜひご協力ください．

番組への支援は，こちらからお待ちしております．www.patreon.com/jojonki

Mar 23, 201916:19

ep25: サブワードに基づく単語分散表現の縮約モデリング

第２５回では，NLP2019のサブワードを利用した単語分散表現のモデルについて解説しました．
今回紹介した論文は予稿集が公開され次第，issueを公開にします

現在視聴者の方へのアンケートを実施しているので，数分で終わりますのでぜひご協力ください．

番組への支援は，こちらからお待ちしております．www.patreon.com/jojonki

Mar 17, 201918:23

ep24: BERT for Joint Intent Classification and Slot Filling

第２４回では，BERTを利用してインテント分類とスロット抽出をjoint learningした手法を解説しました．
今回紹介した論文はこちらのissueで解説しています．

github.com/jojonki/arXivNotes/issues/210

番組への支援は，こちらからお待ちしております．www.patreon.com/jojonki

Mar 02, 201921:08

ep23: End-to-End Knowledge-Routed Relational Dialogue System for Automatic Diagnosis

第２３回では，患者との対話を通して医療診断を行う対話システムKR-DSの解説をしました．
今回紹介した論文はこちらのissueで解説しています．

github.com/jojonki/arXivNotes/issues/206

番組への支援は，こちらからお待ちしております．www.patreon.com/jojonki

Feb 24, 201929:19

ep22: What are the biases in my data?

第２２回では，Microsoft Research Blogで解説された差別的バイアスの発見と分析に記事を解説しました．github.com/jojonki/AI-Post-Notes/issues/1

番組への支援は，こちらからお待ちしております．www.patreon.com/jojonki

Feb 17, 201913:22

ep21: BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

第２１回では，Googleによる双方向コンテキストを獲得した言語モデルBERTの解説をしました．
今回紹介した論文はこちらのissueで解説しています．

github.com/jojonki/arXivNotes/issues/199

番組への支援は，こちらからお待ちしております．www.patreon.com/jojonki

Feb 03, 201932:19

ep20: Comprehensive evaluation of statistical speech waveform synthesis

第２０回では，Amazonが行った音声合成の知覚評価に関する論文を解説しました．
今回紹介した論文はこちらのissueで解説しています．

github.com/jojonki/arXivNotes/issues/194

番組への支援は，こちらからお待ちしております．www.patreon.com/jojonki

Jan 27, 201919:08

ep19: SentencePiece: A simple and language independent subword tokenizer and detokenizer for NLP

第１９回では，Googleが開発したサブワードによるTokenizer/DetokenizerであるSentencePieceを解説しました．
今回紹介した論文はこちらのissueで解説しています．

github.com/jojonki/arXivNotes/issues/186

番組への支援は，こちらからお待ちしております．www.patreon.com/jojonki

Jan 20, 201937:24

ep18: PyText: A Seamless Path from NLP research to production

ep18: PyText: A Seamless Path from NLP research to production
第１８回では，FacebookによるNLPのモデル化のためのフレームワーク，PyTextを解説しました．
今回紹介した論文はこちらのissueで解説しています．

github.com/jojonki/arXivNotes/issues/179

番組への支援は，こちらからお待ちしております．www.patreon.com/jojonki

今年もよろしくおねがいします！

Jan 14, 201928:03

ep17: User Modeling for Task Oriented Dialogues

第１７回では，Googleによるタスク指向対話におけるユーザーシミュレーターの論文について解説しました．

今回紹介した論文はこちらのissueで解説しています．

github.com/jojonki/arXivNotes/issues/180

番組への支援は，こちらからお待ちしております．www.patreon.com/jojonki

Dec 31, 201852:40

ep16: Contextual Topic Modeling For Dialog Systems

第１６回では，Amazonによるコンテキストを利用したトピック分類のモデルについて解説しました．

今回紹介した論文はこちらのissueで解説しています．
github.com/jojonki/arXivNotes/issues/162

番組への支援は，こちらからお待ちしております． www.patreon.com/jojonki

Dec 09, 201829:08

ep15: Another Diversity-Promoting Objective Function for Neural Dialogue Generation

第１５回では，AAAI 2019 Deep Dialに採択された，ニューラル対話生成モデルの論文を解説しました．あのりょぼっとさんの論文でして恐縮しながら解説しました．

今回紹介した論文はこちらのissueで解説しています．理解が及ばず説明が曖昧な個所がありましたが，りょぼっとさん本人にissueで細くコメントもらっていますので是非見てみてください．
github.com/jojonki/arXivNotes/issues/159

番組への支援は，こちらからお待ちしております． www.patreon.com/jojonki

Dec 02, 201831:48

ep14: XNLI: Evaluating Cross-lingual Sentence Representations

第８回では，Microsoftのスロットタギングの論文を解説しました．
今回紹介した論文の解説はこちらにあります．https://github.com/jojonki/arXivNotes/issues/128

前々回のエピソードを予め聞いておくと，今回の内容は分かりやすいかもしれません．
anchor.fm/lnlp-ninja/episodes/ep6-Bag-of-Experts-Architectures-for-Model-Reuse-in-Conversational-Language-Understanding-e24tuf

Sep 24, 201824:28

ep7: Training Millions of Personalized Dialogue Agents

第７回では，EMNLP 2018でFacebookが開発したペルソナデータセット及びそのペルソナに沿ったEnd-to-end雑談対話システムを解説しました．
今回紹介した論文の解説はこちらにあります．https://github.com/jojonki/arXivNotes/issues/130

Sep 11, 201827:06

ep6: Bag of Experts Architectures for Model Reuse in Conversational Language Understanding

Leading NLP Ninja

By jojonki

Available on

ep50 (ICLR): ELECTRA: Pre-training Text Encoders as Discriminators Rather Than Generators

Leading NLP NinjaMar 14, 2020

ep52(ACL): A Two-Stage Masked LM Method for Term Set Expansion

ep51 (arXiv): XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization

ep50 (ICLR): ELECTRA: Pre-training Text Encoders as Discriminators Rather Than Generators

ep49 (ICASSP): Looking Enhances Listening: Recovering Missing Speech Using Images

ep48 (AAAI): Emu: Enhancing Multilingual Sentence Embeddings with Semantic Specialization

ep47 (ICLR): ALBERT: A Lite BERT for Self-supervised Learning of Language Representations

ep46: FreeLB: Enhanced Adversarial Training for Language Understanding

ep45: Episodic Memory in Lifelong Language Learning

ep44: 75 Languages, 1 Model: Parsing Universal Dependencies Universally

ep43: BPE-Dropout: Simple and Effective Subword Regularization

ep42: HuggingFace's Transformers: State-of-the-art Natural Language Processing

ep41: A Simple Theoretical Model of Importance for Summarization

ep40: OpenDialKG: Explainable Conversational Reasoning with Attention-based Walks over Knowledge Graphs

ep39: Conversational Response Re-ranking Based on Event Causality and Role Factored Tensor Event Embedding

ep38: Trends in Natural Language Processing: ACL 2019 In Review

ep37: Multimodal Transformer Networks for End-to-End Video-Grounded Dialogue Systems

ep36: A Survey of Reinforcement Learning Informed by Natural Language

ep35: Modeling Semantic Relationship in Multi-turn Conversations with Hierarchical Latent Variables

ep34: Do Neural Dialog Systems Use the Conversation History Effectively?

ep33: Target-Guided Open-Domain Conversation

ep32: We need to talk about standard splits

ep31: CommonsenseQA: A Question Answering Challenge Targeting Commonsense Knowledge

ep30: Probing the Need for Visual Context in Multimodal Machine Translation

ep29: What's in a Name? Reducing Bias in Bios without Access to Protected Attributes

ep28: Attention is not Explanation

ep27: 今年度の振り返りとこれからについて

ep26: 大規模な自動解析データが形態素解析器をどこまで小さくできるか

ep25: サブワードに基づく単語分散表現の縮約モデリング

ep24: BERT for Joint Intent Classification and Slot Filling

ep23: End-to-End Knowledge-Routed Relational Dialogue System for Automatic Diagnosis

ep22: What are the biases in my data?

ep21: BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

ep20: Comprehensive evaluation of statistical speech waveform synthesis

ep19: SentencePiece: A simple and language independent subword tokenizer and detokenizer for NLP

ep18: PyText: A Seamless Path from NLP research to production

ep17: User Modeling for Task Oriented Dialogues

ep16: Contextual Topic Modeling For Dialog Systems

ep15: Another Diversity-Promoting Objective Function for Neural Dialogue Generation

ep14: XNLI: Evaluating Cross-lingual Sentence Representations

ep13: You May Not Need Attention

ep12: Word Embedding based Edit Distance

ep11: Query Tracking for E-commerce Conversational Search: A Machine Comprehension Perspective

ep10: Automatic Evaluation of Neural Personality-based Chatbots

ep9: Learning and Evaluating Sparse Interpretable Sentence Embeddings

ep8: Zero-Shot Adaptive Transfer for Conversational Language Understanding

ep7: Training Millions of Personalized Dialogue Agents

ep6: Bag of Experts Architectures for Model Reuse in Conversational Language Understanding

ep5: Analysing the potential of seq-to-seq models for incremental interpretation in task-oriented dialogue

ep4: CoQA: A Conversational Question Answering Challeng

ep3: Large-Scale Multi-Domain Belief Tracking with Knowledge Sharing