見出し画像

薄紙を積み重ねる

データサイエンティスト養成講座第1回提出課題へのフィードバック

先日提出したDS養成講座の統計学の提出課題へのフィードバックを昨日午後にメールで受領した。対応のない/対応のあるt検定、および重回帰分析に適したデータセットを用意して各t検定と回帰分析を実施して統計学的考察を加える、という内容だった。対象としたデータに割合が入っていたのでそこは指摘があったものの、解析結果のまとめについては、十分理解して適切に実施している、というコメントをもらえてまずは安堵した。

仕事で統計手法を使っていたのは遥か昔だけど、繰り返し実施してある程度定着していたのでできたと思う。仕事の経験、というのは本当にどこで役立つかわからない。当時、BASICで統計手法を使えるようにしてくださった上司の顔が浮かぶ。ルーティン業務に忙殺されながらも統計の基本的な内容に繰り返し触れることができて本当によかった、ありがたい、とつくづく思う。

所定のカリキュラムを順次履修して、修了認定に必要な課題を全部提出する、というのが目の前の目標なので、計画的に進めるのみ。

次のステップ

今の状況についてChatGPT-4にまた相談してみたところ、以下のアドバイスをもらうことができた:

ChatGPTのアドバイス:

次のステップとしてRやPythonをさらに深く掘り下げるのは良い方向だと思います。

ここでいくつか提案があります:

  1. プロジェクトの実施

    • 実際のデータセットを使用して小規模プロジェクトを始めてみましょう。例えば、公開されているデータセットを使って、特定の問題に対するデータ分析を行うなどです。KaggleやUCI Machine Learning Repositoryが良いデータソースになります。

  2. オンラインコースやワークショップの活用

    • 統計学とプログラミングスキルを同時に向上させるために、CourseraやedXのようなプラットフォームで関連するコースを受講することも考えてみてください。特に、実践的な課題に取り組むことができるコースを選ぶと良いでしょう。

  3. 統計的手法の応用の拡大

    • t検定や重回帰分析だけでなく、ANOVA(分散分析)、クラスタ分析、主成分分析(PCA)など、他の統計的手法にも挑戦してみてください。これらの手法をマスターすることで、より幅広いデータ分析問題に対応できるようになります。

  4. プログラミングスキルの強化

    • RやPythonでのコーディングスキルをさらに強化するために、毎日少しずつでもコーディングを続けることが大切です。また、関数やライブラリの深い理解を目指し、より効率的または洗練されたコードを書けるように努力しましょう。

これらの活動を通じて、より深い統計的知識とプログラミング技術を身に付けることができるでしょう。何か具体的なサポートが必要な場合は、遠慮なくご相談ください。
(終わり)

しかも、2回目の提出課題作成時にRのコードでエラーが出たときにそのエラーをコピペして相談したら、適切な回答をもらえて、エラーを解決することができた。プライベートインストラクターがついているのだ。何とも心強い!DSも生成AIも比較的新しい内容なので、今がチャンスなのかもしれない。

課題図書の抜き書き

前向きに、 力強く、エネルギッシュに物事を考える習慣を身につけなさい。

ナポレオン・ヒル. 私たちはできていないが、成功者はやっている52のこと (Kindle の位置No.715). KIKOSHOBO. Kindle 版.


この記事が気に入ったらサポートをしてみませんか?