RでベイジアンABテストやってみた。

こんにちは! データサイエンティストの望月です。 最近、私が携わっている案件で新規会員のCV率向上のため、ウェルカムメール配信を始めました。 このメール配信施策の効果を測定する際、カイ2乗検定のような古典的ABテストではなくベイジアンABテストを実…

Tableauで「困って・調べて・解決した」ちょいTIPS(2021年3月)

tableauをいじっていると、どうしてもここがしっくりいかないという点が細々とでてきます。 そこで今月つかったりWEBで探したテクニックをご紹介したいと思います。 TIPS「ドーナツチャートでのKPI表示方法」 KPIをわかりやすく表示する方法は色々あると思い…

SQLの頭で理解するTableau 其の1

私が最初Tableauをさわったときに思ったことは、この出来上がったチャートは、要は元のデータをどう集計した上で可視化してるんだ?でした。LODを使い始めると特に。そして、チャートをつくるにあたって最終的にどう集計したのかを、全部SQLで教えてくれない…

データサイエンティストって何?GRI社員の素顔に迫る!

こんにちは、分析官の早川です。 弊社では、現在2022年度新卒の採用をはじめております。 その中で、学生さんの多くから、データサイエンティストとは?データサイエンティストにはどんな人が向いているか?GRIにはどんな人材が多いのか?必要な技術は何か?…

雑記: 東京タワーと内藤多仲先生の言葉

こんにちは。初めまして。新卒1年目の早川です。 私は大学院で宇宙物理学で博士号を取り、2020年4月からデータサイエンティストとして、働いています。 弊社のブログでは、技術的な話やビジネスに関することが多いですが、今回は弊社のオフィス周りに目を向…

連合学習によるプライバシー保護と利便性を両立した新しい機械学習システムのカタチ

深層学習が表舞台に登場してから、今年(2021年)で 9年 になるでしょうか。2012年のILSVRCという画像認識のコンペティションで、深層学習は2位以下に圧倒的な大差をつけて優勝しました。冬の時代を乗り越え、ニューラルネットワークが機械学習の中心に返り…

BigQueryのユーザー定義関数(UDF)を使ってみた

こんにちは! アナリストのMです。 日々の業務でBigQueryに触れる機会が頻繁にあるのですが、 恥ずかしながら最近になってユーザー定義関数(UDF)なるものの存在を知りました(汗) ちょっと使ってみて個人的にはかなり便利だと感じたので、 本記事ではUDFを使…

イノベーション企業の時代

データ利活用、AI、IoTなどの先端技術の利用によりイノベーション社会へと変革しつつある現代社会。企業の在り方も、変革が進んでいる。 旧来の考え方では、企業は今期の利益が最重要な指標である。一方、イノベーション企業では将来得られる利益の期待値が…

GASをいじっていて、ちょっと躓いた話

GAS

こんにちは! 分析官のMです。 最近、 「spreadsheetに記入したデータをGoogle Apps Script(GAS)を用いてGoogle Cloud Storage(GCS)に格納する」 仕組みを作っていたのですが、思わぬところで時間をとられてしまいました。 本記事では私がどこで躓いてしまっ…

Airbyteを試してみた

Open SourceのETL(今のところExtract Transform LoadのうちExtractとLoadメインみたい)ツール、Airbyteを試してみました。TechCrunchでは、オープンソースのデータパイプラインプラットフォームとして紹介されていました。 airbyte.io jp.techcrunch.com …

TableauのLOD FIXEDは、SQLのWindow関数と同じか

TableauのFIXEDで、初歩的なところでハマったので共有します。 FIXEDで集計したものをIIF文に入れて平均したものと、 FIXEDの中身の時点でIIF文で条件を入れて平均したもの は結果が変わります、という話になります。ちなみに私が元々やりたかったのは、後者…

ホワイトボードアプリGoogle Jamboardを試してみた

ホワイトボードアプリGoogle Jamboardが気になったので、少し試してみました。

機械学習モデルの解釈の入門: Partial Dependence Plot(部分依存グラフ)

背景 ビジネスかアカデミアかに関わらず、機械学習モデルを扱う際には、モデルの解釈が必要になることが多いです。今回は、機械学習モデルを解釈する手法の一つ、Partial Dependence Plotを紹介いたします。 ※以下、Partial DependenceをPDと略します。 PDPl…

生き残るビジネスモデルとは

事業の構築、運営に必要な要素は、以下の4つに分類できます。 これらのうち1つ(あるいは複数)を根本から刷新することで、新しい仕組みが生まれてきます。 ヒト:新たな企業や業界、人を巻き込む モノ:物の本質的な価値を再定義する カネ:これまでお金に…

SQL Workbench/Jのインストール

SQL Workbench/Jは、フリーのSQLクライアントです。地味なやつですが抽出、集計に愛用してるので紹介します。 SQL Workbench/Jの特徴 うれしい点 動作が軽い(エディタ感覚で使える) インストーラー不要で使える(別環境へのコピーが簡単) 微妙な点 情報が少な…

SQL Workbench/Jのおすすめ設定

SQL Workbench/J、デフォルトだと常用には厳しいかなーという感じですが、設定いじるとそこそこ使えるので紹介します。 設定 メニューの[Tools] > [Options]です。設定後、SQL Workbench/Jを再起動しないと反映されません。 General Insert closing brackets…

SQL Workbench/J を使用してTREASURE DATA(Presto)に接続する

環境 TREASURE DATAに、SQL Workbench/Jから接続する想定です。 Windows 10 64bit SQL Workbench/J Build127 Presto JDBC Driver 0.179 JDBCドライバの入手 SQL Workbench/Jは、JDBCドライバを介してDBMSに接続するため、接続先に応じたJDBCドライバを入手し…

SQL Workbench/J を使用してPostgreSQLに接続する

SQL Workbench/JからPostgreSQLへの接続を紹介します。 環境 Windows 10のローカル環境で動作中のPostgreSQLに、SQL Workbench/Jから接続する想定です。 Windows 10 64bit SQL Workbench/J Build127 PostgreSQL 10.15.1(デフォルト設定でインストール) Postg…

WOW2020チャレンジ ~AND検索とOR検索の切替(Week 29)~

WOW2020 Week 29で、AND検索とOR検索を切り替える方法が紹介されました。 2020 Week 49: Can you toggle between AND & OR filtering logic? – Workout Wednesday *1 ポイントとなる作り方を解説したいと思います。 完成イメージになります。左上のフィルタ…

WOW2020チャレンジ ~二次元チャートの作成(Week 22)~

WOW2020 Week 22で、紹介されたダッシュボードを作ってみようと思います。 2020 Week 22: Profitability spotlight – is your budget recovered? – Workout Wednesday *1 チャートの上部にあるClik to expandをクリックすると下図のように変わります。また、…

TableauでPetal Chartsをつくってみた

今回は、Petal Chartsをつくります。 Petalとは花弁という意味です。花弁の大きさで数値の大小関係を直感的に理解することができるチャートとなります。 下図を作っていきます。このチャートは、サンプル スーパーストアのサブカテゴリごとの売上を表示して…

エレベーターの運行最適化に機械学習が必要?シミュレーションで体感

まずエレベータの運用ルールを振り返る 最近、機械学習の技術の発展を受けて、エレベーターを効率的に運行させるためにも機械学習を応用する試みがなされています。これを聞くと、「エレベーターの運行って、機械学習を使わなくてはならないほど複雑ではない…

やり過ごしを許す職場が長期的に安定?

私は日々、「人の成長」を対象に、教育の仕事しております。その中で、教育の重要な一部である「仕事のやり方」について考察しようと思いました。 進学、就職、転職などの人生の転機においては、次のステージで成長し、成果を出し、存在感を出していきたいと…

濫用されるマズローの法則

社会人としての心構えや自己啓発に関する本が多く流通しております。仕事のモチベーションアップやマーケティングなどに関する本にたびたび登場する概念の一つに「マズローの欲求5段階説」があります。これは新入社員のOJTに関する書籍などでも頻繁に取り上…

蒸留モデルを創薬分野へ活用

AIを用いた薬開発 この記事では、機械学習の手法を創薬に応用させているトピックを紹介します。 昨今のウィルス拡大の中、メディアでは、「人工知能を用いた治療薬開発」に関する報道が相次いでいます。現時点、開発終盤の治験の段階は人工知能(AI)に完全…

G検定に関するTwitter上の最頻出用語を解説

G検定(公式名:ジェネラリスト検定)は、一般社団法人日本ディープラーニング協会(JDLA)が実施している、ディープラーニングを事業に活かすための知識を有しているかを確認するための試験です。年に3回実施されます。G検定の詳細は以下の記事をご覧にな…

Twitterのコメントから分析するG検定

G検定は、一般社団法人日本ディープラーニング協会(JDLA)が実施している、ディープラーニングを事業に活かすための知識を有しているかを確認するための試験です。年に3回実施されます。G検定の詳細は以下の記事をご覧になってください。 G検定(ジェネラ…

BigQueryとRedshift、どっちが速いのか

Randall Munroeという方の「Comics that ask "what if?"」というTED Talkがあります。 www.ted.com 投稿されたあらゆる質問に数学や科学を使いながら答えている人で、あるときこんな質問が来たそうです。 「もし世界中のデータが全部パンチカードに記録され…

動くランキングを作ってみた!

こんにちは~ しかし今年のセリーグも読売ジャイアンツが強かったですね~ で、過去10年間で一番強いセリーグのチームはどこだろうと気になったのです。 なので、調べて動画にまとめてみました。 セリーグ2011年~2020年(勝利数ランキング) こうやってアニ…

Tableau Desktopでプライマリキーを確認する方法

こんにちは! 分析官のMです。 先日公開した記事では、 データ受領時のプライマリキー(PK)確認の重要性についてまとめさせていただきました。 https://gri-blog.hatenablog.com/entry/2020/12/09/124246 私自身、データからPKを確認する際、PythonやRを使う…