Pentahoによるデータ分析 

オープンソースBIツール「Pentaho」によるデータ分析

 

はじめに

BIツールの「BI」とは「ビジネス・インテリジェンス」の略語で、企業などの業務の中で蓄えられたデータをIT技術を用いてわかりやすく可視化、分析し、経営戦略に役立てる手法のことを言います。最近では「ビッグデータ」というキーワードとともに語られることもよく見かけます。

BIツールは、データの有効利用に非常に効果的なツールであり、また応用範囲も広く、いろいろな場面で役に立ちます。しかし、BIツールは特に企業の経営判断や意思決定などの場面で使われることが想定されており、商用のパッケージは非常に高価です(数百万円など)。

ここで紹介するPentahoは米国Pentaho社が中心になって開発されているBIツールですが、その最大の特長はオープンソースであることです。つまり、プログラムの利用については無料でできてしまいます。

弊社では機能が豊富なBIツールを気軽に使っていただくためのお手伝いをしております。本サイトはPentahoを無料で使ってみて、BIツールの便利さを試してみたい方への情報を提供しています。なお、弊社ではご要望に応じてBI環境の構築・運用支援などの業務も承っておりますので、ご自身で解決できない点などは弊社にお気軽にご相談ください。
 

Pentaho概要

Pentahoは一般的なBIツールと同様に、データ分析を行う環境として、異なる機能を持ったコンポーネントの集合として提供されています。そのコンポーネントの中心を構成するのが、「多次元分析(OLAP)」、「レポーティング」および「ETLツール」です。(下図参照)

それぞれのコンポーネントの主な機能は以下の通りです。
  • 多次元分析(OLAP)
    • 多次元(切り口の多い)データを軸を入れ替えたり、特定の切り口のみを表示したり、集計・詳細表示を自由に行うことができるツールです。
  • レポーティング
    • データを見やすく整形してレポートにまとめるツールです。レポートの作成はExcelなどで行われることが多いかと思いますが、BIツールでのレポーティング機能は、レイアウト部分とデータ部分を分離して管理するため、日々更新されるデータを同じフォーマットで自動で表示することができます。
  • ETLツール
    • ETLはExtract、Transform、Loadの頭文字をとったもので、分散された情報源からデータを抽出し、加工し、分析しやすい形でデータウェアハウス(データベース)に保存するためのツール群です。また、それらの作業をジョブとしてスケジューリングして自動実行する作業も担っています。


Pentaho_Components
 

本サイトの構成

本サイトでは、以下の情報を提供しています。

利用者別導入ガイド

Pentahoは多くの機能を持った複雑なシステムです。BIツールに詳しくない方は導入してどのようなメリットが得られるのかわかりにくいと思います。利用者別に業務の中にPentahoをどのように導入するべきかを解説しています。

Pentahoデモサイト

解説だけではなく、Pentahoを実際に操作して機能を試すことができるように、弊社サーバにデモサイトを開設しております。

Pentaho運用ガイド

Pentahoを運用していくにあたってのTipをブログ形式で掲載しています。情報は随時追加・更新しております。