機械学習

G検定取得したい方必見:2021#2の試験を振り返る

G検定を受験された方、現在受験勉強をしている皆さん、お疲れ様です。GRIの分析官・講師のヤンです。 今回は、G検定試験の最近の出題傾向や問題の特徴を解説するとともに、これから受験する方のために学習法を何点かお勧めしたいと思います。 この中で語る分…

Grad-CAMで画像認識を可視化(Part2)

前回のPart1の記事では、機械学習モデルの解釈性の重要性、そしてGrad-CAMを中心とする、いくつかの予測根拠の可視化ツールを紹介しました。 gri-blog.hatenablog.com 今回は、早速Grad-CAMを実装してみましょう。 環境・設定: Google Colaboratory 上でJup…

Grad-CAMで画像認識を可視化(Part1)

ディープラーニングは数多くある機械学習の手法の中でも、特に画像・音声・文章などの非構造化データに対する識別能力を発揮します。 参考記事: 【超優しいデータサイエンス・シリーズ】機械学習とディープラーニングの関係は? - GRI Blog 【超優しいデー…

【5分講義・自然言語処理#2】機械翻訳システムの内部に迫る

機械翻訳システムを使うこと(というよりもその結果を観察すること)はかなり楽しいと思いませんか。機械翻訳は自然言語処理の代表的な用途の1つであり、また自然言語処理の技術の進化にモチベーションを与えた存在でもあります。この記事ではこれまでに開…

Isolation Forest と異常検知(ネットアクセスログを用いて)

【はじめに】 日頃データサイエンスの研修においては、教師あり機械学習から入門し、それをビジネスの花形として紹介することが多いです。ただし世の中の問題に向き合うと実に教師なし機械学習の存在が大きいのも知っていただきたいです。その1つが異常検知…

AutoML(自動機械学習)サービスの比較‗ForecastFlowとPredictionOne

本記事は2つの会社が提供している予測分析のできるサービスを使ってみた記録です。 ・ForecastFlow(GRI社提供) ・Prediction One(SONY社提供) を使用しました。どちらも初めて使いました。というかAutoMLサービスを初めて使いました。こんな人でも使える! F…

あなたは何と呼んでますか?機械学習で頻出の関数・指標の枠組みについて

機械学習には用語がいっぱい 機械学習モデルの役割は、未知のデータに対する予測精度を最大化するように、既知のデータを利用してモデル内部のパラメータを最適化することです。 最適化するためには、理想と現実の距離を図るための指標や関数が必要です。 機…

人工知能の社会への波及効果に関する徒然なる考え

今回は、ディープラーニングを中心とした人工知能の現在と未来に関して書いてみました。技術中心の仕事に携わっているとどうしても分析手法やアルゴリズムばっかり考えています。ところで近頃、機械学習の研修を提供していく中で、営業担当・ビジネス企画担…

自己情報量の発見法的導出

はじめに 情報理論の基本的な概念として、自己情報量があります。 自己情報量は、機械学習の分類モデルのアルゴリズムで登場する平均情報量の定義の基礎となっていたり、ここそこで現れてきます。ただ、抽象度が高いため初心者泣かせの概念です。 そこで、こ…

「なんでXGBoostでは分類問題の学習に対数損失を使うんですか?」

先日M氏がO御大に質問していたのを聞いて、自分も気になったのでまとめてみました。 そもそも勾配ブースティングで目的関数はどのように使われる? 勾配ブースティングの仕組み 学習プロセス 損失関数を用いた解釈(勾配降下法) 分類問題の場合 問題設定 対…