株式会社ディー・エヌ・エー(本社:東京都渋谷区、代表取締役社長兼CEO:守安 功、以下DeNA)は、「DeNAのKagglerとコンペで学ぶデータサイエンス実践講座」を2020年12月から開催いたします。DeNA社内には、多くのKagglerが在籍しており、その知識はDeNAで展開しているゲーム、ライブストリーミング、スポーツなどの様々な事業で活用されています。DeNAの様々な事業でのデータサイエンスの活用実績があり、Kagglerの中でも上位にランクするKaggle Masterから直接学ぶことができるのがこの講座の特徴です。
データサイエンスを行っていく上では、座学で機械学習を学ぶだけでなく、多様なデータを扱って引き出しを増やすことが重要です。業務以外でそのような経験を積む場所として、Kaggleに代表される機械学習コンペティションへの参加が挙げられます。最近のKaggleの存在は国内で知られるようになってきましたが、そこで行われているのは世界トップを目指す競争です。競争に参加しながら学んでいくには、過去に使われた手法や、コンペ特有のノウハウも含めてそれなりの前提知識、それに膨大な時間が必要となります。
今回の講座では、勝ち負けを競うためだけのコンペではなく、教育を目的に設計された良問へのコンペ参加を通して、効率よく機械学習の実践経験を積んでいただく機会にしていただきたいと思っています。
この講座を受講し終わる頃には、指示されたデータ分析をこなすレベルやただ興味のある技術を適用するだけのレベルを脱して、テーブルデータを見れば何をすればいいか、一定の見当がつき複数のアプローチを考えられるようになることでしょう。KaggleやSIGNATEなどの機械学習コンペに参加できるようになることはもちろんですが、実務でもどのようなモデル構築をするか、どのような評価をすればいいか、自走して検討できるようになることが期待できます。
また、本講座をよりイメージしていただける事前説明会も開催いたします。受講をご検討される方はぜひご参加ください。
「DeNAのKagglerとコンペで学ぶデータサイエンス実践講座」詳細
-
スケジュール/テーマ
2020年12月開始[お申し込み締切:11月25日(水)]
機械学習モデリング入門
● 講義 12月2日(水)19:00 - 21:00
● コンペ振り返り1 12月9日(水)19:00 - 21:00
● コンペ振り返り2 12月23日(水)19:00 - 21:00
開催時間帯 19:00 - 21:00
-
講座の特色
● 機械学習コンペ形式で、座学や独学ではなかなか学べない実践に必要なノウハウを学べます
● 1テーマ1ヶ月、時間をかけてじっくりと手を動かした経験とともにスキルが身につきます
● 座学、サポート付きコンペ、自力でのコンペ、と反復しながら自走までステップアップします
● 競技のプロたちが学習のために適したデータを厳選し、良問を作成しました
● 質問対応はもちろん、レポート添削や解法のディスカッションも含め、みっちりサポートします
● 講師・メンターはほとんどがKaggle Masterで、人材育成経験が豊富です
-
前提とする知識
受講を妨げるものではありませんが、下記については学習済みとして講座を進めますので、必要に応じて事前に自習していただくと、より効果的に学習いただけます
● pythonを用いた基本的なデータハンドリング(numpy, pandas等)
● 基本的な数学・統計の知識(指数と対数、p値等)
● 機械学習モデルを構築するチュートリアルを通した経験
-
講座の内容
この講座では学習のために厳選したオープンデータを用いて、テーブルデータ(表形式のデータ)を用いた機械学習の基本的なテクニック、ノウハウを反復演習で身につけていただきます。
● 機械学習モデリング入門
● 複数テーブルの結合、集約
● 時系列データの分析
上記3つのテーマを、各テーマ1ヶ月かけて学習します。
各テーマについて、前半の週はKaggle Masterの作成したJupyter Notebookを元にした演習形式でコンペに参加して、基本を学んでいただきます。後半は別のデータを用い、前半で学んだことを元に、他の受講生と競いながら自力でのモデル構築に挑戦していただきます。
-
募集人数
10名〜20名を予定
-
参加費
500,000円(1名/税抜)
-
講師
原田 慧
AIシステム部データサイエンス第1グループ グループマネジャー
数理学博士、Kaggle Master
2011年からデータ分析に従事、2018年にDeNA入社。現在はマネージャーとして多くの案件に関わりながら、個性的なメンバーを率いる。
前職時代から社内外のデータ分析技術者の育成に取り組み、データサイエンティスト協会の養成講座初代講師、電気通信大学の非常勤講師など実績多数。
坂見耕輔
AIシステム部データサイエンス第2グループ
学生時代の専攻は物理学(大学)、情報学(大学院)。Kaggle Master
2019年新卒入社。ゲームをメインに、様々な案件に従事している。自然言語処理分野のコンペを中心に参加している。
主な実績:Google QUEST Q&A Labeling 3位入賞(ソロ)、Jigsaw Unintended Bias in Toxicity Classification 3位入賞、Kaggle Days Tokyo オフラインコンペティション優勝
-
開催方法
座学講義はウェビナーを使用
振り返りはZoomにて参加者入り混じってのディスカッションとなります
-
申し込み
事前説明会詳細
-
概要
興味はあるが、イマイチイメージが沸かず参加を迷っている方、自社のデータサイエンティストに受講させたいが、もう少し詳細を聞いてみたい人事研修ご担当者様など、講座の受講を検討している方向けに、よりイメージしていただける場をご用意させて頂きました。
講座で実際に講師をする原田より直接、講座の詳細についてご説明をさせて頂きます。また、実際に別日で講座を実施した際の動画も一部ご覧いただけるお時間もご用意しておりますので、より受講イメージも持っていただける機会になると思います。説明会後半には質疑応答の時間を設けますので、不明な点や確認したい事項は気軽にその場で解決していただくことが可能です。
-
スケジュール
① 2020年11月6日(金)13時~14時
②2020年11月11日(水)13時~14時
※内容は同じとなりますので、どちらかご都合の良いお時間にご参加ください。
-
参加費
無料
-
講師
原田 慧
AIシステム部データサイエンス第1グループ グループマネジャー
数理学博士、Kaggle Master
2011年からデータ分析に従事、2018年にDeNA入社。現在はマネージャーとして多くの案件に関わりながら、個性的なメンバーを率いる。
前職時代から社内外のデータ分析技術者の育成に取り組み、データサイエンティスト協会の養成講座初代講師、電気通信大学の非常勤講師など実績多数。
-
開催方法
ウェビナーによるオンライン開催
※エントリー後、当日のリンクをご連絡いたします。
-
申し込み
■Kaggleとは
企業や研究者がデータを投稿し、世界中の統計家やデータ分析家がその最適モデルを競い合う、予測モデリング及び分析手法関連プラットフォームです。Kaggleのシステムはコンペティション方式を採用しており、参加者の提示したモデルは即時に採点され、順位を表示。コンペティションに参加し最適モデルを提示したデータサイエンティストには、企業や研究者から賞金が支払われます。