Think Simple Enjoy Life

機械学習を仕事で使うには?どんなライブラリや技術が必要なのか?調べてみた

機械学習流行っていますよね。 色々とライブラリや技術がありますが、仕事ではどんなものが求められているのでしょうか。 幾つか求人をあさって調べてみました。

注意

僕自身は機械学習のエンジニアあではありませんし、会社で機械学習のエンジニア求人を出しているわけではありません。 イチWebエンジニアが、機械学習をするにはどんなスキルが必要なのかなーとちょっとした空き時間に疑問を調べた際のメモになります。

そのため、用法用量は自己責任でお願いします。

必須スキル

Python

あいかわらず2系も使われていますが、機械学習では3系が多い模様

NumPy / Scipy

機械学習(といっても統計ですかね)でよく使う行列計算を簡単に行えるようにしてくれるPythonの数学ライブラリ

scikit-learn

scikit-learnは、データをいじるツールです。 いくつかのアルゴリズムが用意されていて、 * 分類 * クラスタリング * 次元削減 などできます。 また結果をグラフィカルに表示してくれます。

できればほしいスキル

SQLAlchemy

python製のORM(オブジェクトリレーショナルマッパー)。 ORMというと、Djangoに付属しているものもありますが、それとは別物。

pika

pikaは、AMQPのpython実装です。 なお、AMQPは、メッセージ通信のプロトコルです。

Jubatus

Jubatusは、分散データの分散基盤技術です。

xgboost

機械学習で人気の分類器

metric-learn

距離計量学習のライブラリ

mecab-python

形態素分析のライブラリ