IT パケット解析 1: 10分でわかる基礎(プロトコルとOSI参照モデル) インターネットでは、いろいろなソフトが配布されているが、中には怪しいソフトも存在する。 例えば、無料のソフトをインストールしたパソコンでユーザーの個人情報や行動を収集し、別のマシンに送ってしまうスパイウェアなどだ。 そこで、ネットワーク通信... 2020.07.29 IT
IT エックスサーバー(Xserver)でのデータベース(MySQL)のバックアップとリストア エックスサーバーでは、データベースにMySQLが使われていて、毎日自動的にバックアップされている。このサービスは、容量に2GBの制限があるものの、X10/X20/X30プランでも共通だ。 ただし、自動バックアップには、現時点では過去7日分の... 2020.07.27 IT
IT Machine Learning 11: 10分でできるKNeighborsClassifier(K最近傍法) 前回は、ROC曲線の下のエリアのAUSについて求めてみた。今までは、数字の画像が5かそれ以外だけを判断していた。 今回は、 機械学習の中で単純なKNeighborsClassifierを使って複数のクラスについて判断してみよう。 KNeig... 2020.07.16 IT
IT Machine Learning 10: 10分でできるAUC(Area Under the Curve)値の求め方 前回は、ROC曲線を描き、性能評価の可視化をしてみた。すでにroc_curveというライブラリが用意されているので、プロット自体は簡単だ。 今回は、ROC曲線の下の部分のエリアであるAUC(Area Under the Curve)について... 2020.07.08 IT
IT 混同行列 (Confusion Matrix) のまとめ 混同行列は、言葉だけではピンとこないこともあるので、指標についてまとめてみた。 予測されたクラス + - 実際のクラス + True Positive False Negative - False Positive True Negativ... 2020.07.01 IT
IT Machine Learning 9: 10分でできるROC(Receiver Operating Characteristic)曲線 前回は、適合率/再現率曲線を実際に描いてみた。 理由は、正解率をチェックするだけでは不十分だからだ。 例えば、癌や新型コロナの陽性を発見するタスクでは、陽性患者を陰性と判定してはマズいので、陰性の患者を陽性と診断して、再検査したほうがマシと... 2020.06.23 IT
IT Machine Learning 8: 10分でできるprecision/recall curve (適合率/再現率曲線) 前回は、予測と実際の結果がどれほど一致するか検証してみた。 具体的には、k-folds cross validationやconfusion matrix(混合行列)について、実際の手書きの数字画像データを利用して検証してみた。 理由は、検... 2020.06.22 IT