創屋の統計・解析
創屋では、様々な統計・解析のオープンソースソフトウェア・ライブラリを使用した技術の提供を行っています。
R言語
オープンソースソフトウェアの統計解析向けのプログラミング言語及びその開発実行環境です。
特徴
- オープンソースソフトウェアの統計ツール
- ベクトル演算による柔軟な計算
- 標準的な統計・解析の手法をコマンドで簡単に実行
- 不足している機能はパッケージで補完し、そのパッケージも自作可能
- グラフ機能により解析結果を可視化
創屋 × R
- データの特徴の把握
- データマイニングによる相関関係・因果関係の解析
- パケットデータなどの異常検知
- 時系列データより未来予測
NumPy / SciPy / Pandas
NumPy |
Pythonにおいて、基本的な数値計算を支援するライブラリです。 |
SciPy |
Pythonにおいて、数値解析を支援するNumPyを基にしたライブラリです。 |
Pandas |
Pythonにおいて、データ解析を支援するライブラリです。
Pandsを使用することで行列計算を簡単に行うことができるようになり、Rで行っている集計作業がPythonでも容易にできるようになります。
|
特徴
NumPy / SciPy / Pandas のそれぞれの特徴をご紹介します。
NumPy |
- Pythonだけではできないような、高度な数値計算ができる
- 内部はC言語によって実装されているため、高速に動作する
|
SciPy |
- 多言語を使わずPythonのみで、統計・解析ができる
- 統計 / 最適化 / 積分 / 線形代数 / フーリエ変換 / 信号・イメージ処理 / 遺伝的アルゴリズム / ODE (常微分方程式) ソルバ / 特殊関数 を提供
|
Pandas |
- Pythonで集計作業ができる
- 処理速度がRに比べて速い
- 同じPythonで扱える NumPy / SciPy と組み合わせることでより高度な解析ができる
|
創屋 × NumPy / SciPy / Pandas
- データ整理・集計
- データマイニングによる相関関係・因果関係の解析
- 時系列データより未来予測
- 機械学習への応用