【2022年度版】データサイエンティストやAIエンジニアになるための無料学習サイトまとめ
目次
pythonの基本を学ぶ
まずは正確なタイピングを見につけpythonの基本的な書き方と正確なコーディングを身に付けましょう。
はじめに — Python早見帳はプログラミング言語であるpytonの基礎を学習することが出来ます。データ分析やAIの開発にはpythonなどを学習する必要があります。統計解析で使用されるRなども学ぶ必要もありますが、Webサービスや何かしらのサービスを作りたい場合などを考えるとデータの取得が用意であるpythonがベストです。
データ分析に必要なライブラリを学ぶ
pythonには複数のライブラリが存在しており、それらの学習が必須になってきます。
それらのライブラリを活用してデータを可視化したり、分析したり、時には音を発生させたりすることが出来ます。様々なライブラリがありますが、まずはNumPy、Pandas、Matplotlibの3つのライブラリを重点的に学習することをおすすめします。
エクセルでも可能ですが、データの前処理や要約・可視化ができないことにはデータ分析は始まりません。
AIを作るために必要なライブラリを知る
TensorFlowは、Googleが開発しオープンソースで公開している、機械学習に用いるためのソフトウェアライブラリです。どちらかというとビジネス向けの用途で使われているケースが多いです。
PyTorchは、コンピュータビジョンや自然言語処理で利用されているTorchを元に作られた、Pythonのオープンソースの機械学習ライブラリです。最初はFacebookの人工知能研究グループAI Research labにより開発されました。どちらかというと研究向けの用途で使われるケースが多いです。
Keras は、Pythonで書かれたオープンソースニューラルネットワークライブラリです。
ChainerはChainer は、ニューラルネットワークの計算および学習を行うためのオープンソースのソフトウェアライブラリです。PyTorchの方が優れており使い続ける理由が分からなくなったということで現在サービスを終了しています。機械学習のライブラリを学ぶには適しているサイトです。
OpenAIは人工知能を研究する非営利団体です。オープンソースでのAIの開発を行っており、最近「ChatGPT」が出て衝撃を受けましたが、今後このようなAIが出現し続けるのは言うまでもなくソフトウェアエンジニアや開発者の仕事は奪われていくでしょう。
DeepMindは、人工知能を研究するイギリスの企業です。創立は2010年で、その後Googleによって買収され、現在では子会社として運営されているようです。囲碁やチェスの世界チャンピオンを打ち負かすほどの世界最強のAIを作っている会社です。
ソフトウェアの開発に必要な周辺技術を学ぶ
1-0. Colaboratory (Colab) の使い方 を通して様々なコードを実行させてみましょう。クラウドベースなので自身のPC内での環境構築が不要ですぐにコードを動かすことが出来ます。
GitHub Skillsは、英語ですがGitについて学ぶことが出来ます。GitはソフトウェアのVersion管理ツールであり、チーム開発では欠かせないツールです。Gitの概念を理解することは今後様々なプロダクトを作る上でメリットになります。
コードで学ぶAWS入門は、AWSについて学ぶことが出来ます。コーディングしたプログラムやサービスを実行する環境について学習し学ぶことが出来ます。
入門 Dockerはコンテナ仮想化を用いてアプリケーションを開発・配置・実行するためのオープンプラットフォームです。 Dockerはコンテナ仮想化を用いたOSレベルの仮想化によりアプリケーションを開発・実行環境から隔離し、アプリケーションの素早い提供を可能にします。つまり、WindowsやMacなどの環境構築の問題をより均一化するツールです。