私の情報収集方法、公開します!

こんにちは、アナリティクス&デベロップメント部のTです。

以前から「Tさんって、どうやって技術や業界トレンドの情報集めてるんですか?」的な質問を受けることがちょくちょくあるので、 思い切って公開しようと思います。

3つの原則

まず、情報収集で重要なポイントとして、以下の3点を挙げます。

  • 情報収集源を一ヶ所に集約する
  • なるべく英語の記事にあたる
  • 一次情報源を調べる癖をつける

情報収集源の集約

情報ソースはいろんな媒体に散らばりがちですので、 なるべく一か所にまとめてそこだけ見ればよいようにしましょう。

複数のブログやarXivを毎回巡回して更新チェックするのは、非効率です。

英文検索のススメ

これを見たあなた、今すぐGoogle検索は英語で入力しましょう。

英語の記事の方が、量・質ともに優れているケースが多く、何よりも情報の鮮度が高いです。

自分はGoogleの地域設定をわざと米国にして、日本語の記事があまり検索上位に現れないようにしているくらいです。

情報は大元を辿れ

基本的に、公式資料ほど網羅性の面で優れた情報源はありません。

例えば言語・ライブラリ・クラウドサービスで何かわからないことがあった時、どうしますか?

最初のうちはQiitaなどでもいいかもしれませんが、慣れてきたら優先的に公式ドキュメントで調べるようにしましょう。

たいていの場合は情報が網羅的かつ系統的に記述されているので、知りたい情報を見つけられる確度が高いです。

解説記事と比べて読みにくいのは確かですが、何度も当たるうちにコツが掴めていくはずです。

公式ライブラリで不足すれば、GitHubソースコードや論文を探し、どんどん情報の出処に近づいていきましょう。

筆者のおすすめ

では、自分が普段からやっていることや、おすすめの情報収集源についてお話ししたいと思います。

RSSリーダーアプリの活用

技術ブログがいろいろありすぎて、情報を追いかけるのが大変...!

ありますよね?そういうこと。

そんな場合、RSSリーダーアプリが非常におすすめです。

RSSリーダーに技術ブログ等を登録しておくと、

  • 複数のリソースを一括して管理できる
  • 更新をまとめて通知してくれる

ので、非常に便利です。

複数のブログをブクマして定期巡回しなくても、 常に一か所だけを覗きに行けばよいのですから!

自分の場合feedlyというアプリを使っています。

feedly.com

これにお気に入りのブログやarXivなどを登録しておいて、 毎日出社後や昼休みなどに新着情報をチェックしています。

読んだ記事をカテゴリ別にブックマークしたり、 読む時間がなければ「後で読む」フラグも付けられるので、 後からゆっくり読み直すこともできる点もポイントです。

同様のRSSリーダーfeedlyのほかにもいくつかありますが, 実際に試してみて使いやすいものを選んでみてください。

おすすめの技術記事・ブログ

では、前述のfeedlyにどういう情報源を登録しているかですが、 海外のブログメディアや企業・個人の技術ブログなど様々です。

特におすすめなものをいくつか挙げてみたいと思います。

Towards Data Science in Medium

最もおすすめしたいのが、Mediumというブログプラットフォームの、Towards Data Scienceというセクションです。

towardsdatascience.com

Pythonやデータ分析のTips、最新のライブラリ・分析基盤の話から業界事情まで、 幅広い話題の記事が数多く集まっています。

内容と質の面でも、入門向けの噛み砕いた解説やチュートリアルから、中・上級者向けの専門的な解説まで様々です。

海外の有名企業在籍エンジニアが執筆した記事も多くあり,日本語で書かれた記事と比べると、

  • 情報の鮮度が比較的高い
  • 少し高度なトピックでも丁寧に書かれている

などといった差があり、非常に有用です。

基本的に月$5の有料制で、無料枠は閲覧可能な記事数に制限がありますが、 500円くらいであれば課金する価値は十二分にあります。

企業の技術ブログ

日本語の記事でも,国内有名IT企業のブログは業界の最新技術情勢を知るうえでとても役に立ちます。

例えば以下のような会社の技術ブログは、社員が積極的に記事を執筆していておすすめです。

他にも、SansanGunosyなどもおススメです。

ぜひ、前述のTowards Data Scienceとともにfeedlyに登録してみてください。

(ついでに弊GRI blogも...!)

その他の情報源

ブログ以外ですと、以下からもよく情報を得ています:

arXiv

arxiv.org

最新の論文を探すときはここですよね。 学生の時からお世話になっております。

arXivも前述のRSSフィードリーダーに登録できるので、 自分の場合統計や機械学習系のチャネルを、 arXiv専用カテゴリにまとめてチェックしています。

Twitter

思いのほか馬鹿にならない情報ソースがTwitterです。

IT系の人はTwitter利用者が多いので、そういった人たちをフォローしておくと耳寄りな情報が入ってくることも多々あります。

個人的にフォローをお勧めするアカウントは以下の通りです:

そのほか、海外のOSSコアコントリビューターなどのアカウントもフォローしておくと面白いです。

ただし、ハマりすぎにはご注意。*1

GitHub

Python等のライブラリを使っていて,公式ドキュメントを見てもどうしてもわからないことがあれば,GitHubで実装を確認することもあります。

それが何よりも確実です。

そうでなくても,不特定多数の人が使用し更新するOSSのコードは,読んでいて非常に勉強になります。

個人的にはscikit-learnが大好きなので,よくコードを辿っています。

汎用なライブラリをどう実装するかを考える上で,ものすごい参考になるのでオススメです。*2

github.com

また,レポジトリページ右上の方にあるwatchボタンを押しておくと、バージョンアップなどの更新通知がメールで飛んできます。

気に入ったライブラリはぜひ登録してみましょう。

勉強会

connpass, Doorkeeper, TECH PLAYなど、IT系の勉強会を募集するサイトを覗いてみましょう。

企業主催の規模の大きなものから、少人数向けの輪読会など、さまざまあります。

時間を作って積極的に参加してみましょう。

発表を聞きに行くタイプの勉強会で個人的におすすめなのは、以下の3つです。*3

ちなみに3つ目のDGWTですが、次回GoogleのデータサイエンティストTJO氏がゲスト登壇されるとのことで話題になっています。(当然申込数も多く、抽選倍率が、、、)

メールマガジン

こちらのPython Weeklyの購読はおすすめです。 www.pythonweekly.com

毎週木曜日,いい感じのチュートリアルや、注目のGitHubレポジトリ情報が送られてきます。

【追記】

機械学習系のメルマガをまとめているQiita記事がTwitterで話題になっていたので、併せて紹介します。

機械学習の情報収集に役立つ14のメルマガ - Qiita

おわりに

以上が自分が日頃行っている情報集めの方法です。

もし皆様の参考になるものがありましたら幸いです。

といっても、もっといい方法もあると思うので、これもやった方がいいぞ的なのがあったらぜひコメント等でお寄せください!

(TAMIYA)

*1:思わぬバズりによる社内への垢バレにも要注意。

*2:ついでながら超個人的なお話をすると,自分は学生時代に現ソフトバンク加藤はむかずさんの講演を聞き,Pythonの言語としての面白さと数理系出身データサイエンティストの目指すべき姿に感化されました。その際に機械学習の実装で参考にすべき資料として挙げられていたのが,O'Reillyの「ハイパフォーマンスPython」とscikit-learnのソースコードでした。

*3:本稿執筆時点では新型ウイルスの影響で中止・延期が相次いでいますが、、、