PuLPで数理最適化問題(TSP、VRP)

表題の通り、数理最適化問題の中でもNP困難の基本的な問題の1つ、巡回セールスマン問題と、その一般化、運搬経路問題を、PuLPで解いてみます。 PuLPは、最適化問題を解くためのPythonライブラリです。 今回は、このラ…続きを読む続きを読む

SIRモデルで新型コロナウイルスの感染者数の収束を予測してみた

勉強がてら、やってみました。 SIRモデルのパラメータの推定は、オーソドックスには最尤推定などが用いられるようですが、今回はベイズで定式化して、ベイズ推定もやってみました。 国別のデータを使った分析は最近よく見ますので、…続きを読む続きを読む

Grad-CAM、Grad-CAM++、Score-CAMを実装・比較してみた

あけましておめでとうございます。← 2020も頑張りましょう。 今回は表題の通り、画像系深層学習の判断根拠手法について、 近年人気のある手法「Grad-CAM」と、 その改良版「Grad-CAM++」、さらに去年論文発表…続きを読む続きを読む

Bi-LSTM学習におけるバッチごとの系列長調整について

まただいぶ更新期間が空いてしまいました。 今回は、表題の通り、深層学習でのBi-LSTMなどの系列学習において、バッチごとに系列長を調整できるようにしてみます。 例えば、Kaggleのカーネルコンペなどで、自然言語の分類…続きを読む続きを読む

機械学習モデルを解釈する指標SHAPについて

明けましておめでとうございます← 最近身の回りが忙しかったため、更新をサボっておりました。 今回は、機械学習モデルの解釈性に関する指標「SHAP」について書きます。 SHAPについて 機械学習モデルを学習させた時に、実際…続きを読む続きを読む

WordCloudとpyLDAvisによるLDAの可視化について

表題の通り、潜在ディリクレ配分法(LDA; Latent Dirichlet Allocation)によるトピックモデルを学習させて、WordCloud・pyLDAvisで可視化までやってみます。 データセットの用意 今…続きを読む続きを読む

因子分析でテニスのサーブ力・リターン力を定量化してみた

先日はKaggleデータセットにあるプロテニスのツアーの勝敗データで、強さのモデリングをしてみました。 その後、同じくKaggleデータセットの中で、別に公開されている男子プロテニスのツアーの勝敗データを見つけました。 …続きを読む続きを読む

文書分散表現SCDVと他の分散表現を比較してみた

今回は、以下の論文の文章分散表現、Sparse Composite Document Vectors; SCDVについて書きます。 https://arxiv.org/abs/1612.06778 実は去年に試しに実装し…続きを読む続きを読む

クレジットカード不正利用予測モデルを作成・評価してみた

表題の通り、Kaggleデータセットに、クレジットカードの利用履歴データを主成分化したカラムが複数と、それが不正利用であったかどうかラベル付けされているデータがあります。 https://www.kaggle.com/m…続きを読む続きを読む

分析環境をDockerでコンテナ管理するようにしてみた

これまでプライベートの分析環境については、 アドホックな分析は、ローカル端末上のpyenvで仮想環境として管理 深層学習などは、クラウド上で環境構築手順を管理しておいて実行 といったやり方で管理・運用していました。 これ…続きを読む続きを読む

数学ガールシリーズ読書感想

数学ガールは、結城浩氏による数学を題材にしたシリーズ小説であり、今年の4月に発売された「ポアンカレ予想」を含め、現在以下の6作が出ています。 数学ガール 数学ガール -フェルマーの最終定理- 数学ガール -ゲーデルの不完…続きを読む続きを読む

テクニカル分析で買いシグナルからの株価推移を調べてみた

株やります← 株価取引において、最近では「スイングトレード」などというワードを見るようになり、下記のような書籍も書店に並ぶようになりました。 株でゆったり月20万円。「スイングトレード」楽すぎ手順 posted with…続きを読む続きを読む

Dropoutによる近似ベイズ推論について2

以前に、Dropoutによる近似ベイズ推論に関する記事をあげました。 上記では、ソフトマックス関数の出力値の平均を、カテゴリカル分布のパラメータと見て、その不確実性をエントロピーとして算出していました。 これについて、少…続きを読む続きを読む

TensorFlow Eager Executionを試してみた

今年2月頃、TensorFlow 1.5が公開され、TensorFlowをDefine by Runで実行できる「Eager Execution for TensorFlow」が追加されました。 TensorFlowとい…続きを読む続きを読む

ベイズモデリングで男子プロテニスの強さを分析してみた

久しぶりにベイズモデルをやります。 今回は、Kaggleのデータセットで公開されている、男子プロテニスの試合結果データがありましたので、これを使って各プレイヤーの強さをモデル化してみます。 Association of …続きを読む続きを読む

Dropoutによる近似ベイズ推論について

割と今更ですが、深層学習において、汎化性能を保つための工夫の一つであるDropoutを使って推論を行うことが、近似的にベイズ推論になっているという論文がありますので、それについて記します。 また、実際に試験的にMNIST…続きを読む続きを読む

統計検定2級の試験対策について

統計検定2級の受験対策に関して記そうと思います。 準1級の試験対策については、以下を参照してください。 参考書籍 (初級者向け)マンガでわかる統計学 マンガでわかる統計学 posted with ヨメレバ 高橋信/トレン…続きを読む続きを読む

Edward、PyStan、PyMC3で状態空間モデルを実装してみた

状態空間モデルの勉強をしていましたので、実装について書きます。 PyStanやPyMC3の実装は、ある程度参考になる例が多いのですが、Edwardの実装例は見当たりませんでしたので、どんな感じになるか試しに実装してみまし…続きを読む続きを読む

インタラクティブなグラフ生成ライブラリPlotlyについて

Plotlyというマウスでぐりぐりと動かせるようなインタラクティブなグラフを生成するライブラリがあります。 最近これをよくJupyter notebook上で可視化して遊んだりしていますので、これについてまとめます。 P…続きを読む続きを読む

Chainerによる転移学習とファインチューニングについて(VGG16、ResNet、GoogLeNet)

画像系の深層学習では、学習済みモデルの重みを利用する「転移学習」や「ファインチューニング」と呼ばれる手法がよく利用されます。 転移学習: 学習済みのモデルから特徴量を抽出すること ファインチューニング: 学習済みモデルの…続きを読む続きを読む