« 2007年10月 | メイン | 2007年12月 »

2007年11月 アーカイブ

2007年11月19日

Pentahoトレーニング in 香港 Day1

11月19日~22日、香港にてPentahoのBAMトレーニングを受けてきました。一言でいうと、オープンソースBIの素晴らしさと不完全さをよく理解できた素晴らしいトレーニングだったと思います。
講師はPatrickというフランス人、受講生は、香港人5名+中国人1名+日本人2名(私含む)
トレーニングはすべて英語ですが、みんなNativeではないために、そんなに困ることはありません。まず、簡単にトレーニングの内容を振り返っていきたいと思います。また、今後できるだけ機会を設けて、Pentahoの内容を分かりやすく解説していきたいと思います。

Day1
初日の内容は、Pentahoの中身というよりも、オープンソースBIを取り巻く環境からのオープンディスカッションに始まり、Pentahoのアーキテクチャーの理解とPentaho1.6及びKettle2.52の
インストール等が主な内容です。以下要点のみまとめます。

1、Introduction
講師の自己紹介の後、各自簡単な自己紹介。
講師のPatrickは、リヨンでBPM-councilという会社のCEO、Pentaho、Cognosを中心にコンサル等を展開している。15年ほどCognosに勤めた後独立。かなりオープンソース好き。BIのトレンドから、技術的にも詳しい。自社でMondrian 用のOLAPツールを開発。本トレーニングでも使ったがUIがしっかりしており、かなり使いやすい。

2、Overview about Pentaho
Pentahoはご存じのようにオープンソースである。その内容は、ETLを行うKettle、OLAPであるMondrian、レポートエンジンであるJfree、データマイニングのWeka、これらがPentahoという一つのプラットフォームで動作する。ここまで広範囲のアーキテクチャーを持つオープンソースは他では見当たらない。またGoogle等他のWebアプリとの親和性・拡張性は、CognosやBOを凌駕している。一方でPentahoはそれぞれがプロジェクトで動いているため、素晴らしい成果のプロジェクトもあれば、まだまだ頑張ってもらいたいプロジェクトもある。こうしたところがオープンソースの良いところでもあり、悪いところである。
しかし、ライセンスを払わずにここまでのサービスを使えるのは、単純に素晴らしい、というのが実感である。今回の中心テーマKettleだけでも十分業務で使えるものである。

・subscription
Pentahoは、今年からProバージョンを取りやめ、サブスクリプションによるサポートのみとなった。これについてのオープンディスカッション。これは、英語圏/非英語圏によってとらえ方が異なる。フランスでは12000Euroを設定しているとのこと、アメリカでは、一般的に$12000
アジアはもっと安い等の意見がでる。日本ではどうするか?これは今後検討が必要である。

・Jasper vs Pentaho
Jasperはどちらかというと長い目でビジネスを捉えている。Pentahoはかなりドラスティクに短期的な成長を模索している(Patrick談)Jasperの内部についてはよく分かりませんが、Pentahoがドラスティックというのは各種のバージョンアップ頻度を見ても理解できます。
Pentahoは、マーケティングよりもR&Dに力を入れているところが、他の大手BI(IBM-Cognos,SAP-BO,Oracle-Hyperion)との違い。確かに大手BIはマーケティングに予算を投じ過ぎている。最近の買収再編も理解できる。

・Olap Desiner JPivot is not suppoerted by Penbtaho
気をつけなければいけない点として、Jpivotはpentahoサポートの範囲外ということである。これはサポート契約の中に書いてあるが見逃しがち。

・Jfree is not supprted by Flash
JFreeレポートでは、フラッシュを用いた動きのあるグラフは実現できない。これは特に日本のユーザー向けには痛いところである。

・ROLAP(Mondrian) vs MOLAP(Hyperion,Cognos)
OLAPについては、またDay3で触れるが、基本的MondrianはRolapである。要はMDXを処理するライブラリである。そのため、速度の点においては、いくつかのテクニックが要求される。

・Kettle
今回4日間のトレーニング中、実にまる2日間をこれに費やした。それだけ価値があるし、これがオープンソースとして提供されていることは素晴しい。
今回はKettle2.52をインストールした。先週Kettle3.0がリリースされたが、まだ1~2か月は一人で楽しむだけにした方が良い、製品に使うとNightmare(悪夢)を見るとのことである。(Patrick談)
Kettleはmatt caster氏により、開発が進められており、最新状況は彼のBlogをチェックすると良いようである。

2007年11月20日

Pentahoトレーニング in 香港 Day2

2日目はインストールしたKettleを元に様々なETLを行いました。詳細については、また後日解説していきますが、内容は以下のようなところです。DBはPostgreSQLを使用しました。

Kettle
基本的なtransfomation
Input/Output
Lookup
Select value
Calculator
Filter
Sort
Join
Merge
Group by
Normalize/Denormalize
Java script
レポジトリの考え方
Lab

基本的に、2日目はETLに始まり、ETLに終わる。
普段なれないDB操作に疲れました。終了後、同じ受講生のSさんと近くのPubへ。
PintのGinnessを飲むと、イギリスに留学してたころを思い出しました。
もうあれから3年が経つんだなあとしみじみ。

Pentaho data integration

2007年11月21日

Pentahoトレーニングin香港 Day3

3日目は、午前中にKettleの上級編、午後からはOLAPを中心に、講義と実習。
詳細に関しては、また後日解説していきます。

Kettle
複雑なトランスフォーメーション
Jobの考え方
OLAP
Monrian
Cube desiner
Workbench designer
Lab

講師Patrickの会社BPM-councilのSchema DesinerはGUIが非常に充実しており、
素晴しい。これはWorkbenchデザイナーをベースにGUIを中心にカスタマイズ
している。またROLAP/MOLAPともに対応している。
これはオープンソースではないが、Patrickの好意で自由に使っていいよ、と
いただいた。そのまま販売はできないが、内部のツールとして、今後の開発
方向性として大変参考になる。


Schema desiner

2007年11月22日

Pentahoトレーニングin香港 Day4

4日目の最終日は、Olapツールを使用したり、Pentahoのセキュリティ、JPivotについてのレクチャーと演習を行いました。フライトの関係で、名残惜しいが14時には早退。21時に無事、関空に到着。

Free analysis using ol_olap
Lab
Security
JPivot
Aggregate table
Role

Free analysis

About 2007年11月

2007年11月にブログ「Warm heart Cool mind」に投稿されたすべてのエントリーです。過去のものから新しいものへ順番に並んでいます。

前のアーカイブは2007年10月です。

次のアーカイブは2007年12月です。

他にも多くのエントリーがあります。メインページアーカイブページも見てください。