機械学習を仕事で使うには?どんなライブラリや技術が必要なのか?調べてみた
機械学習流行っていますよね。 色々とライブラリや技術がありますが、仕事ではどんなものが求められているのでしょうか。 幾つか求人をあさって調べてみました。
注意
僕自身は機械学習のエンジニアあではありませんし、会社で機械学習のエンジニア求人を出しているわけではありません。 イチWebエンジニアが、機械学習をするにはどんなスキルが必要なのかなーとちょっとした空き時間に疑問を調べた際のメモになります。
そのため、用法用量は自己責任でお願いします。
必須スキル
Python
あいかわらず2系も使われていますが、機械学習では3系が多い模様
NumPy / Scipy
機械学習(といっても統計ですかね)でよく使う行列計算を簡単に行えるようにしてくれるPythonの数学ライブラリ
scikit-learn
scikit-learnは、データをいじるツールです。 いくつかのアルゴリズムが用意されていて、 * 分類 * クラスタリング * 次元削減 などできます。 また結果をグラフィカルに表示してくれます。
できればほしいスキル
SQLAlchemy
python製のORM(オブジェクトリレーショナルマッパー)。 ORMというと、Djangoに付属しているものもありますが、それとは別物。
pika
pikaは、AMQPのpython実装です。 なお、AMQPは、メッセージ通信のプロトコルです。
Jubatus
Jubatusは、分散データの分散基盤技術です。
xgboost
機械学習で人気の分類器
metric-learn
距離計量学習のライブラリ
mecab-python
形態素分析のライブラリ