Tableauのファイルが最新バージョンで開かれるようにする

Tableau Desktop / Prep Builderは異なるメジャーバージョンを1台のPCで共存して使うことができますが、ファイル(twb/twbx/tfl/tflxファイル)をダブルクリックしたときに、意図しないバージョンで開いてしまうことがあります。 直近にインストールしたバージ…

Tableau DesktopからTreasure Dataに接続する

Tableau Desktopで、データソースにTreasure Dataを使うときに必要な設定をまとめました。(Windows 10 / Tableau Desktop 2021.2.0での情報) ドライバのダウンロード Tableau Desktopは、JDBCドライバを介してTreasure Dataに接続するため、JDBCドライバを入…

Treasure Data接続のTableauワークブックを安全に共有する

Tableau Desktopで、データソースにTreasure Dataを使った場合、ワークブック(twbファイル)にTreasure Dataのアカウント情報が埋め込まれてしまいます。 アカウント情報を毎回入力する必要がないため、自分だけが使う場合は便利ですが、他の人に共有する場合…

サブスクリプションがブームとなった訳

「サブスクリプション」という言葉が浸透した現在ですが、改めてなぜブームとなったのか自分なりの意見をまとめてみました。 サブスクリプションとは?(wikipedia) 定額料金を支払い利用するコンテンツやサービス。商品を「所有」ではなく、一定期間「利用…

時系列を基本要素に分解する

時系列データをトレンド、サイクル、季節、残りの各要素に分解する手法についてまとめていきます。 なお、こちらの記事を参考にしています。 otexts.com 時系列データは加法モデルを用いると一般的に以下のように表されます。 ここで、は時刻におけるデータ…

背景差分

動画から移動している物体や人物だけを検出したいと思う場面は多くあると思います。そんなときには背景差分やフレーム間差分の手法が役に立ちます。 今回は背景差分やフレーム間差分について紹介しようと思います。以下のページを参考にしています。 https:/…

機械学習で使える大規模な画像データセット

大規模なオープン画像データが必要になったので調査してみました。 ImageNet オープンデータの中で特に有名なデータセットです。 かなり細分化されており、大量のクラスが存在しています。 WordNetに紐づけられており、階層構造になっているので、目的の画像…

決算短信と有価証券報告書の違いとは?

他社のコーポレートサイトからIR情報を見ようとしたとき、どの書類を参考にすべきなのか、わからないことがあるかと思います。 上場会社が投資家向けに作成する決算資料として、「決算短信」と「有価証券報告書」があります。どちらも会社の財務状況に関する…

pythonのlocustで負荷テストを行う

大量のアクセスがきてもサーバーが落ちないこと。これは大事なデータを扱うサービスの重要な要素であったりします そんなことの無いようにリリース前に負荷テストをしようぜということになりました 今回はpythonのlocustという負荷テストツールを使ったメモ…

「ライゾマティクス」とデータ可視化

先日、東京都現代美術館で実施している「ライゾマティクス_マルティプレックス」展を見に行ってきました。 現在多くの美術館は完全予約制となっており、会話もなく比較的安全な娯楽かと考えておりますが、同展は若者を中心に思ったより人出があった印象です…

他社のwebメディア事業を調査してみた

webのメディア事業に携わらせて頂いている中で、成功している他社のメディアビジネスについて情報収集をしてみました。 今回は、「カカクコム」のメディア事業について調べてみました。ネット事業の中でダントツに高い営業利益率を叩き出していることが理由…

Tableau Tips(ツールヒントにシート・ハイパーリンク・会計年度と週の開始)

① ツールヒントの中にシートを入れる ツールヒントの「挿入」を押して、シートを選択するとシートを挿入できるようになります。大きさも変更できます。 ② テキストボックスにハイパーリンクを貼る 参照元:https://www.dataplusscience.com/TableauTips19.ht…

ForecasrFlowで銀行の定期貯金口座開設を予測! マーケティングキャンペーンの最良策を見つける⁉(モデル作成準備編)

引き続き、ダイレクトテレマーケティングの予測のために準備をしていきたいと思います!ここでは、さっそくForecasrFlowを使っていきます! 目次 データ準備 モデル作成の準備(本記事) モデル作成 つくったモデルを見てみよう モデル作成の準備 モデル作成…

Tableau Tips (積み上げ折れ線グラフ・メジャーバリューごとの色付け・シートの交換)

自分が仕事をやっていて役に立ったり、知って驚いたTipsをご紹介します ① 積み上げ折れ線グラフ(積み上げない棒グラフ)の書き方 参照元:https://tableautableau.hatenablog.com/entry/2016/08/18/075718 メニューバーの「分析(A)」から、「スタック マ…

ふわっと理解しているビジネス単語を整理してみた

突然ですが、「販売仲介業者を意味する単語は何?」と聞かれたら、皆さんは何を思い浮かべますか。 おそらく「代理店」、「問屋」、「卸売」、「商社」、人によっては「ディストリビューター」や「エージェント」といった単語を思い浮かべると思います。 お…

ForecasrFlowで銀行の定期貯金口座開設を予測! マーケティングキャンペーンの最良策を見つける⁉(データ準備編)

ForecasrFlowで定期貯金のダイレクトテレマーケティングの結果の予測をします!そして、次のキャンペーンでは、どの客層をダーゲティングすればいいのかを明らかにしていきたいと思います! 今回のコンセプトは、どれだけ簡単にモデルをつくれるかです。なの…

Tableau ~ヒストグラムのビンの幅と個数の調整~

数値データで、ヒストグラムの幅や数もカラムごとに調整したくなる時があります。今回は、この調整方法をご紹介します。 使用したデータセットは、kaggleの「Bank Marketing Dataset」です。 下記サイトからダウンロードできます。https://www.kaggle.com/ja…

Tableau ~条件に応じてテキストの色を変える~

利益率がプラスなら「▲%」、マイナス「▼%」となるようにします。 完成イメージは以下となります。 データはサンプル スーパーストアを利用しました。計算に必要な利益率はスーパーストアにあるものを利用しています。 ①計算フィールドの作成 利益率▲(利益率…

Tableauでの四分位数の算出ロジック

こんにちは! 分析官の望月です! 前回の記事(意外と知らない⁉ 箱ひげ図の描き方 - GRI Blog)は "Tableauで箱ひげ図を作成した際に算出される四分位数とPERCENTILE関数を用いた場合の四分位数の数値が異なる" というところで終わっていましたので、本記事…

意外と知らない⁉ 箱ひげ図の描き方

こんにちは! 分析官の望月です。 皆さんどうですか? 最近、箱ひげ図、使ってますか? 箱ひげ図をご存じでない方のために簡単に説明させていただくと、 データのばらつきを分かりやすく表現するための方法の1つであり、 "箱"とその両端にある"ひげ"で表現さ…

美味しいお店の抽出

緊急事態宣言が続いて最近外食してないなぁと思うことが多い。 外食したいと思うけど、特筆して店に詳しいわけでもない。 今回は美味しいお店を自動抽出する方法を検討した。 1. 抽出対象のお店 今回は「食べログ」に登録された店舗から選定することにした。…

BigQuery, GCS, Matillionで日本語はどこまで使えるか?

どうも、最近ふとセリーグの本塁打ランキングを見ると、村上、岡本、佐藤(照)の並びになっていて、「そっか、もう時代は、令和なんだな、、、」としみじみ思った、平成初期生まれの分析官、岡部です。 今回はGoogle BigQueryやGCS、Matillionといったデータ…

多層パーセプトロンの時代が再び到来?

最近の機械学習の研究領域で特に気になっている分野の一つに、多層パーセプトロン系があります。 多層パーセプトロンは1980年代後半頃に開発されたモデルで、現在の深層学習のベースになっています。ただし、過学習と勾配の消失という2つの致命的な問題があ…

AIに関する用語の関係を素人が一枚図にしてみた

AIに関する学習を始めてみると、AIに関する用語がたくさん出てくると思います。それら用語の関係性を一枚図にしてみました。 補足を記述します。 機械学習 機械学習は、大きく次の2つのことを行っています。 ①学習:データ(特徴量と正解ラベル)からパター…

VSCodeの拡張機能でPython docstringを生成する

前回の記事ではVSCodeによるPythonのテストとデバッグについて紹介しました。 Pythonのdocstringですが、書き方を忘れてしまったり、書くのが面倒だったりしますよね。 今回は面倒なdocstringを少しでも楽に記述する為の拡張機能を紹介します。 環境情報 拡…

VSCodeとpytestでPythonコードをテスト&デバッグする

この記事ではVSCodeとpytestでPythonコードをスムーズにテストする方法について説明します!

歩きながら考えること

答えが決まっていないテーマについて考える際、他の人がどのように考えているのか、工夫していることがあるのかとても気になります。 自分は机の上でPC越しに考えて行き詰った際、歩きながら考えてみることがあります。初めは、じっとしているのがストレスで…

1935年のインフォグラフィックス

1935年(昭和10年)の絵葉書のインフォグラフィックスについてSNSで知り、とても衝撃を受けたので、ご紹介します。こんな昔から、グラフでのメッセージの伝え方を工夫をしている人が存在するとは、想像していませんでした。 満州国における貿易統計です。 全…

GRIにおけるデータサイエンス民主化活動

この記事は何? データ分析の界隈で耳にするデータサイエンスの民主化について、GRIの取り組みを紹介します そもそも民主化とは何なのかという問いに関して考え方の一つを示します 民主化とは? Wikipediaによる民主主義(デモクラシー)の言葉の語源は以下…

決定木系アルゴリズムはいかにして特徴量空間に「斜めの線」を引くか

こちらの記事のAppendixでございます。 gri-blog.hatenablog.com 「決定木系のアルゴリズムが斜めの分割線を引くのが苦手だ」的なことを申し上げました。 その脚注で「原理的には引ける、程度問題だ」とも。 こう申し上げていたものの、実は「あれ?ほんとに…