banner

ブログ

Dec 09, 2023

将来のデータ サイエンティストのための SQL の力

会員限定のお話

ミーガン・ヴロ

フォローする

データドリブン投資家

--

共有

データ サイエンスの世界への私の移行は、従来とは異なるものでした。 私は心理学の学校に通い、マーケティングの仕事を始め、副業で執筆活動をし、最終的に 27 歳のときにデータ サイエンス ブートキャンプに参加しました。 とはいえ、私は Springboard でのデータ サイエンス ブートキャンプをフルタイムの仕事として扱いました。

私は週に少なくとも 40 時間を費やしてコースワークを完了し、概念をより深く理解するために自分で追加の調査を行いました。 しかし、そのプログラムを卒業した後でも、データサイエンティストとしての仕事に就くための準備が完全に整っているとは感じませんでした。 代わりに、データ アナリストとマーケティング アナリストの役割を探しました。 最初のデータ アナリストの役割に就いたとき、Python、探索的データ分析、モデリングについてはかなりの能力があるものの、データのクエリについては十分に理解していないことがわかりました。

この欠点に対処するために、私は SQL を練習するためのリソースを探しました。 振り返ってみると、これはおそらく、Python 集中型のデータ サイエンス ブート キャンプを完了した後に行うことができた最良のことでした。 データ サイエンティストとして足を踏み入れようとしている人にとって、SQL を学ぶのには十分な理由があることがわかりました。SQL は不可欠です…

大袈裟だと思われるかもしれないが、それは真実だ。 今日の雇用市場では、確実なことは何もありません。 技術者の解雇は何の理由も理由もなくあちこちで起こっている。 この種のことで不安になる私は、自分自身に向けて取り組む目標を設定しました。これが私の会社で最高のデータ サイエンス アナリストになることです。

そのためには、Python の知識だけでなく、SQL にも習熟する必要があると判断しました。 私の推論は次のとおりです。

自分のデータを取得できれば、学習モデルのマッチングに必要な情報を取得するためにアナリストやエンジニアに依存する必要はありません。

最も一般的に人々は、データ サイエンス 80/20 の法則を知っています。これは、データ サイエンスの 80% がデータの準備をしており、20% が実際に分析してレポートを作成しているというものです。 もちろん、データ クリーニングの一部は Python を使用して実行できますが、SQL をしっかりと理解することで、データを管理し、不整合やエラーをチェックし、ノートブックに取り込む前にデータをクリーンアップできることを確認しました。

共有