Hadoop World NYC

http://www.itmedia.co.jp/enterprise/articles/0910/15/news011.html
http://kzk9.net/blog/2009/10/hadoop-world-nyc-report.html
DRBMSのかわりにHadoopを使うことによるメリットは、スケール破壊レベルになっているな。
yahooのtopページログ分析では数PBのデータ処理がRDBMSC++で開発2-3W処理26日が、Hadoop上Python2,3日開発で20分で処理完了。
別の会社の36TBのデータを分析するのにRDBMSだと約一ヶ月がHadoopで13 分に。
これはコワい。
OSSがテクノロジのリーダーシップをとっているところもすごい。