Bi-LSTM学習におけるバッチごとの系列長調整について

まただいぶ更新期間が空いてしまいました。 今回は、表題の通り、深層学習でのBi-LSTMなどの系列学習において、バッチごとに系列長を調整できるようにしてみます。 例えば、Kaggleのカーネルコンペなどで、自然言語の分類…続きを読む続きを読む

WordCloudとpyLDAvisによるLDAの可視化について

表題の通り、潜在ディリクレ配分法(LDA; Latent Dirichlet Allocation)によるトピックモデルを学習させて、WordCloud・pyLDAvisで可視化までやってみます。 データセットの用意 今…続きを読む続きを読む

文書分散表現SCDVと他の分散表現を比較してみた

今回は、以下の論文の文章分散表現、Sparse Composite Document Vectors; SCDVについて書きます。 https://arxiv.org/abs/1612.06778 実は去年に試しに実装し…続きを読む続きを読む

CNN、RNNで文章分類を実装してみた

深層学習において文脈情報を学習させる方法としては、再帰的ニューラルネットワーク(RNN)を用いる方法と畳み込みニューラルネットワーク(CNN)を用いる方法があります。 今回はそれぞれの方法で、文章を学習させてラベル分類を…続きを読む続きを読む

Attention Seq2Seqで対話モデルを実装してみた

MLPシリーズの「深層学習による自然言語処理」を読みました。 深層学習による自然言語処理 (機械学習プロフェッショナルシリーズ) posted with ヨメレバ 坪井 祐太,海野 裕也,鈴木 潤 講談社 2017-05…続きを読む続きを読む

MeCabの新語辞書「MeCab-ipadic-NEologd」について

形態素解析器のMeCabに、「MeCab-ipadic-NEologd」という素晴らしい新語辞書がありますので、その使い方について記します。 MeCab-ipadic-NEologd : https://github.c…続きを読む続きを読む

青空文庫のデータを形態素解析・感情分析してみた

青空文庫の文書データを形態素解析し、分割された単語ごとにネガティブかポジティブかの判定を行なって、スコアを計算させてみました。 形態素解析にはMecabを、ネガポジの判定には下記の単語感情極性対応表を使わせていただきまし…続きを読む続きを読む