/GCI2020_Summer

Primary LanguageJupyter Notebook

東京大学グローバル消費インテリジェンス寄附講座(GCI2020Summer)

GCI2020Summerに関する詳細な内容はこちらからご覧になれます

本レポジトリについて

GCIは東京大学松尾研究室が主宰するデータサイエンティスト育成講座であり、2020年夏は4月29日から8月18日まで開講されていました。 この講座の中で実際に体験したことや学んだことを開催されたコンペティション・最終課題を中心にまとめてみました。

活動概要

活動内容は大きく分けて3種類でした。

  1. 通常講義
    • Pythonの基礎からNumpy・Pandasといったライブラリ、scikit-learnのようなフレームワークを学習しました。データの加工、データの可視化、教師あり学習がメインって感じでした。
    • 毎週出る宿題が講座修了条件の一つなので、講義に必死に取り組んで宿題を提出しながら基礎を掴めていけた気がします。応用はコンペで養えました!
  2. データ分析コンペ(全てkaggleからの出典でした)
    • 講義で簡単な導入を行ったあとは、自分で実装してみるのが一番力がつくと実感しました!
    • コンペでは圧倒的にPandasが必要なので、コンペガチるとPandasに強くなれました。また、僕は優秀生になりたかったので全てのコンペで上位10位を目標に頑張りましたが、 後々聞くと優秀生は最終課題で決まるらしいです😭。
    • ただ、最終課題は過去のコンペからの出題なので、優秀生を目指すなら結局コンペにしっかり取り組むのが近道だと思いました。
  3. オンライン特別講義
    • こちらの講座では、各週お一人ゲスト講師をお招きして普段の講義では聞けない貴重なお話を聞くことが出来ました。2020Summerでは小沼 竜太さん、内池 もえさん、千金楽 健司さんの御三方が参加されていました。 - 眼からうろこな話ややっぱりそうだったんだと真相に迫る話が盛り沢山で楽しかったです。

コンペ結果

第1回コンペ(Kaggle: Titanic): 3位🥉 / 335人中

第2回コンペ(Kaggle: Home Credit): 6位🎖 / 261人中

第3回コンペ(Kaggle: Predict Future Sales) 1位🥇 / 216人中

総合順位 1位🎉

とても大変でしたが、当初の目標を大幅に超える「総合順位1位」を獲得出来ました!!!GCIの参加者はとてもレベルが高いと聞いていたので、遠方からPythonを始めたばかりペーペー初心者が上位入賞するには誰よりも努力するしかないと思って、約4ヶ月頑張りました。 ぶっちゃけ週80時間以上GCIに費やしていたので、本当に嬉しいですし、これからの自信になりました!!ありがとうございました🙇‍♂️ (p.s. 第3回コンペの出典は伏せられていましたが、kaggle: Predict Future Salesからだったようです。)