データを発見しそれらの起源・出自を調べるLinkedInの社内ツールWhereHowsがオープンソース化 | TechCrunch Japan

http://jp.techcrunch.com/2016/03/04/20160303linkedin-open-sources-its-wherehows-data-discovery-and-lineage-portal/

LinkedInのような大きな企業で、データに何が起こっているかを常時追跡するための、中央的リポジトリ兼Webベースのポータルだ。今では中小企業ですら、大量かつ雑多なデータの整理や管理に悩まされているだろう。LinkedInでは、WhereHowsが現在、約5万のデータ集合と14000のコメントと3500万のジョブ実行の、ステータスに関するデータを保存している。それらのステータスデータは、約15ペタバイトもの情報に対応している。
LinkedInはHadoopの大ユーザーだが、このツールはほかのシステムのデータも追跡できる(Oracleデータベース、Informatica、などなど)。

LinkedIn、データマイニングソフト「WhereHows」をオープンソースに - CNET Japan
http://japan.cnet.com/news/service/35078926/
Open Sourcing WhereHows: A Data Discovery and Lineage Portal | LinkedIn Engineering
https://engineering.linkedin.com/blog/2016/03/open-sourcing-wherehows--a-data-discovery-and-lineage-portal
linkedin/WhereHows: Data Discovery and Lineage for Big Data Ecosystem
https://github.com/linkedin/WhereHows