こんにちは。滋賀大学大学院データサイエンス研究科の白瀧 豪(しらたき ごう)です。 この度2021年9、10月の2ヶ月間、データサイエンティストのインターン生としてjoinさせていただきました。 このインターン期間の振り返りと学びなど書いていこうと思います。
インターン参加の背景
今回のインターンは、来年度の新卒入社に向けての準備という位置付けにあります。 そのため私はClassiという会社の雰囲気・業務の流れなど、自分がClassiで働くことのイメージをする機会と捉えて参加しました。
主な業務内容
私が所属した部署はデータAI部で、チームはコミュニケーションチーム(校内グループ・アンケート・コンテンツボックス・欠席連絡などのコミュニケーション機能を担当しているチーム)でした。
インターン期間には主に以下の3つの業務を行いました。
- データAI部が関わっているプロジェクトのキャッチアップ
- コミュニケーションチームでのダッシュボード作成タスク
- Classiのデータを用いた探索的データ分析*1
最終週には、「Classiのデータを用いた探索的データ分析」の結果を中心にインターン期間の成果発表を行いました。
探索的データ分析を通しての学び
Classiのデータを用いた探索的データ分析を進めていく中で学びを
- テーマ設定
- 仮説の設計
- 発表後のフィードバック
の3つの段階に分けて書いていきます。
テーマ設定
Classiのデータを用いた探索的データ分析がこのインターン期間でのメインのタスクでした。 このタスクはテーマ設定などもなく、自由に分析してほしいとのことでした。 これまで私が経験した過去のインターンやデータ分析コンペでは、テーマやデータが与えられた状態からスタートでした。 そのため、何から手をつけたら良いのかわからず戸惑いました。しかしそれと同時に分析テーマを見つけるのが最も大事な仕事ということにも気付きました。
そこでまずは、サービスの理解・過去行っている分析内容・自分の興味はどこかを整理しました。 最終的には、
- 最も使われている機能は校内グループであること
- 先生ごとに活用レベルが大きく違うこと
- 入社の志望動機である「学校の先生をサポートしたい」だったこと
この3つを組み合わせて「校内グループにおける先生の活用レベルでの違いに関する分析」をテーマとして設定して分析を進めました。 (ここまでに1ヶ月ほどかかってしまった…)
仮説の設計
テーマ設定ができたので、探索的にデータ分析をするといろんな傾向が見えてきました。 しかし仮説を設定していなかったため、背景や目的がわからず、分析結果に対しても「へぇー」という感想にしかなりませんでした。 ここで仮説を立てて、その仮説を検証することの重要性に気付きました。
仮説ベースで分析を進めることができたかというと、あまり実現できなかったかなという印象です。 知識としては知っていたり、頭でわかっていてもそれを実行することの難しさを痛感しました。 この部分が自分の今後の課題かなと感じました。
発表後のフィードバック
私の成果発表に35名ほどの方に参加していただきました。(たくさんの方が参加してくれてびっくりしました…笑) 発表後にデータAI部以外にもいろんな部の方から質問・コメントをいただきました。
ユーザーストーリーをもう少し考えることができれば、より良い分析ができたのかなという気づきができました。 その他にも、資料の作成方法・テクニックや伝え方などの基本的なところから丁寧にアドバイスをいただけて大きな学びになりました。 これらのフィードバックを整理していく中で、入社後に挑戦してみたいことがいくつか思いついたのでとても良い経験・機会になったと思います。
全体を通して感じたこと
インターン期間の最初にClassiのサービスを実際に触ってみました。そこで、サービスの機能についてや使い方について疑問に思ったことをドキュメントにまとめたところ、とても反響が大きく驚きました。
「Classiのサービスをずっと触っていると気付けないから参考になる」や「実際に使い始めた先生は同じことを感じるはずだ」というコメントをしていただいて、吸収する雰囲気が社内全体にありました。 こういう雰囲気が発言しやすい環境に繋がっているのかな、と強く感じましたし、ClassiのValueにもなっているUnlearn & LearnやLove Diffenreceとはこういうことでもあるのかなと思いました。
さいごに
このインターンを通してClassiについて知ることができ、自分がClassiで働くことのイメージをつけることができた良い機会になりました。 それもメンターの方をはじめ、データAI部やコミュニケーションチームのメンバーのサポートがあったおかげだと思います。 本当に感謝しています。
これから大学院の研究に戻りますが、 研究を進める中でデータサイエンスの専門的な知識やドキュメント力などレベルアップして来年4月にClassiに戻って来たいと思います。
*1:探索的データ分析(EDA:Exploratory Data Analysis)とは、データの特徴を探索的に分析し、構造を理解することを目的とした最初に行う作業を指す