学ぶ
2021.11.10
Yuki
データサイエンティストを目指す大学生が、unerryのインターンに参加した理由 / unerryインターンレポートvol.1
現在unerryでインターンをしているYukiです。
さて、タイトルにある「データサイエンティスト」とは、計算環境の発達、AIやIoTの普及、ビッグデータの価値の高まりを背景に登場した、比較的新しい職業です。データの収集から分析、そこから得られた情報の活用まで、データに関して幅広く対応する「データのプロフェッショナル」と言え、「データサイエンティスト」になるには、プログラミングや機械学習、数理などの知識はもちろん、ビジネススキルの習得が必要です。
この記事では、データサイエンティストを目指している大学1年生の私が、unerryのインターンになぜ参加することにしたのか、unerryでどんなことをしているのかをまとめてみました!!
unerryのインターンに参加した理由
unerryでは、主にGPSとBeacon(ビーコン)と呼ばれる端末を使って、スマートフォンの位置情報を取得し、人の流れやその量を計測、ビッグデータ化しています。月間200億件を超えるリアル行動データを、データサイエンティストが独自開発のアルゴリズムで解析。データが持つ意味を見出し、可視化することで顧客企業の売上UPに繋げたり、お店の混雑状況がわかるWEBサービスを公開したりと、今の時代とテクノロジーだからこそ実現できる、さまざまなサービスを展開しています。
そこで私は、膨大なリアル行動データの分析と、そのユニークな活用に特化しているunerryに行けばビッグデータを使いこなすスキルを学ぶことができるのではないかと思い「インターンに参加してみたい!」と思い至りました。
初めての Python 、そして BigQuery と SQL
unerryでは、データサイエンティスト見習いとしてデータ処理の基礎を習得中です。
そのためにまず取り組んだのは、 Pythonというプログラミング言語と、そのライブラリである Pandas を使い、100万件を超える日本語/英語のWordファイルのデータを読み込んでデータフレーム(表のようなもの)にまとめる、というタスクです。
「表を作りたいならExcelでよいのでは?」と思われる方もいるかもしれません。しかし、100万行もあるとExcelが処理に耐えられなくなるそうです。そこで Python の出番というわけなんですね。
このデータの読み込み作業は、 Pandas を使う上での基礎基本ではあるのですが、 Python の知識・経験ともにゼロからのスタートだった私にとっては、悪戦苦闘の大変な作業でした。
特に苦労したのは、覚えるべき新しい関数が増えると、それをうまく既存の他コードと組み合わせて繋げる必要があるという点です。その度に数時間の試行錯誤を繰り返しましたが、諦めずに自力で目標を達成できた時は、かけた時間の分だけ大きな喜びを感じました!
その後も、わからない部分が出てくる度に自分で調べて改良し、どうしても解決しない場合にだけ、unerryのデータサイエンティストMarioさんにヒントを貰って先に進む、といったかたちでなんとか2週間ほどかけてやり遂げました。
その次に取り組んだのが Google が提供するデータウェアハウス BigQuery と、データベース言語の SQL です。
ビッグデータの分析に使用する BigQuery と SQL はunerryのインターンとして働く上で習得必須のツールとなっているので、必死に使い方を学びました。途中で躓くことが何度かありましたが、 Python 同様に自力で解決方法を見つけながら、なんとか基礎を習得することができました。
まだまだスキルが十分に身についていない私が言うのもおこがましいのですが、勉強中にわからなかったり、躓く部分があっても、「まずは自分で調べて答えを見つけに行く」という姿勢がプログラミングを学ぶ上では、とても重要であると思います。
安易に人に頼らず、自力でどうしてもわからない箇所に絞って、最終手段として詳しい方に教えていただく。自力で考えて苦労する時間をかけることで、より記憶に定着しやすくなり理解も深まりました。
今後していきたいこと
Python を使いこなせるようになったら、次は Python を使った、unerry社内向けのWEBアプリケーションの開発をしていきたいと思っています。
また、私がデータサイエンティストを目指すにあたり、マイルストーンの一つとしているものとして、「E資格」があります。これは、一般社団法人日本ディープラーニング協会が実施する、AI・ディープラーニングの知識と実装能力を持っていることを認定する資格です。
「E資格試験」を通してデータサイエンティストに必要な知識を体系的に学ぶことは、スキルの幅を拡げ、unerryでの実践にも活きてくると考えています。次回の試験は来年2月…。自分自身の成長を確かめるためにも、資格取得に向けて、励んで参ります!
先輩データサイエンティストから一言!
Mario
unerryでデータサイエンティストをしておりますMarioです。まずは、学生という貴重な時間を割いて、unerryのインターンとして参画して頂けることに、とても感謝しています!
unerryがもつ1次データ、さらにそこから様々なアルゴリズムによって価値化されたデータはボリュームはさることながら、ユニーク性においても他に類を見ないものとなっています。そのリソースに対して、生まれた時からデジタルネイティブとして育ってきた世代ならではの視点や考え方を活かし、世界をより良い方向に導いてくれる人になっていただけたらと思います。
私も、皆さん自身が、将来の目標へ最速で近づいていただけるようなインターン環境作りに努めますので、ぜひ一緒に頑張っていきましょう!
インターンは現在も募集中!!
ご興味いただけた方はぜひインターン募集ページよりご応募ください!(うねりの泉編集部)
この記事を書いたのは
-
Yuki 記事一覧
unerryでインターン中の慶應義塾大学 総合政策学部に在学中の3年生。データサイエンティストを目指してプログラミングやデータ分析について勉強中。趣味はアニメ鑑賞と対戦ゲーム、eスポーツの大会観戦。アイコンは我が家の愛犬のトイプードル、モコです。
ABOUT
「うねりの泉」は、「リアル行動データ」活用のTipsやお役立ち情報、そして会社の文化や「ひと」についてなど、unerryの"とっておき"をご紹介するメディアです。