2年ほど前からインプレスさんと一緒にデータサイエンス基礎講座をやらせていただいており、来年2月分についても募集がスタートしました。
今回は機械学習のための数学基礎編ということで、わりと、数学(統計学)をメインに扱います。いま、ディープラーニングとか機械が人間を越えるような答えを出す時代になりました。ただ、すべてを機械任せておけばよいとわけでもないと思っています。
やっぱり、何が正しいかを自分で考えて、仮説を立てて、データで検証する。その道具として統計はアリかと思っています。たとえば、確率分布でいえば、正規分布は割とポピュラーですが、カイ二乗分布、あるいはt分布、いわゆる”スモールデータ”を分析する手法ですが、母集団をよりよく知る大事なツールだと思います。
今回はこの手の確率分布の話からディープラーニングの数理までR演習を含めて取り扱います。大学のセメスターの授業を4回で扱うので、シンドイところもありますが、受講者の躓くポイントを2年かけて潰してきました。最後は巣籠さんの講演もあります。興味があればぜひ。