新米エンジニアの僕が、1年間で任されたことをサクッとまとめたみた

こんにちは、バクラク事業部 OCRチームのソフトウェアエンジニアの秋野(@akino_1027)と申します!

本記事は「LayerXアドベントカレンダー(概念)2022」30日目の記事です。
29日目はtalosさんの「マネージャー任せにしない、今日からできる1on1満足度の高め方」でした!

最近、ありがたいことに学生エンジニアの方々とカジュアル面談させていただく機会が増えてきました。そこで「実際にアサインされるタスクのイメージが知りたい」というご質問を多くいただいたので、僕が実際に任されたタスクや活動についてお話ししていこうと思います!

登壇 (in SaaS.tech)

最も印象に残っているのが、SaaS Techでの登壇です。今までLTや登壇は未経験でしたが、良い機会なので挑戦してみることにしました!
LayerXでは経験年数に限らず、イベント参加や登壇が推奨されています。

ちなみに登壇内容は、バクラクOCRと絡めて「マルチプロダクト×非構造化データ×機械学習を支えるデータ信頼性」というテーマでお話ししました。

【登壇で使用した資料】

【登壇のYoutube動画】

OCRの精度テスト基盤の開発

バクラクでは目玉機能としてOCR(光学文字認識)機能があります。
ここからOCR機能をお試し可能です!

OCRの精度を向上させるために、内部ロジックを変更した際、下記の項目を確認する必要があります。

  • 精度はどのくらい上がった(または下がった)のか

  • どのような書類が新たに取得できるようになったのか

  • 今まで取得できていた書類が取得できないようになっていないか

OCR精度はユーザーの価値に直結するため、かなりシビアに見なければいけないところなのですが、丸っとプロジェクトを任されました。チーム内外のエンジニア方々に助けられながらテスト基盤を完成させることができました。

詳しい解説は割愛させていただきますが、内部ではかなり複雑なことをやっているので、大変苦労しました…

OCRデータ基盤開発と運用

MLにおいて、切っても切り離せない関係である「データ」の基盤開発も任せられました。データ管理方法を誤ってしまうと、OCR精度を向上させることは不可能なので、超重要なプロジェクトだと考えています。

「任される」の意味合いについて補足しておくと

🙅‍♂️「一人で頑張ってね!」
🙆‍♂️「リーダーは任せた!もちろん協力はするよ!」

みたいなニュアンスで、タスクの「舵取り」を任されるみたいなイメージです。通常のプロダクト開発では、あまり経験できないデータパイプラインの設計や開発を一気通貫で経験することができました。

今まで触れたことのなかったPythonやBigQuery、dbtをガッツリ経験したことで技術的な知見も広がりました。

OCRデータ基盤開発については先ほど紹介させていただいた登壇で詳しくお話しさせていただいているので、気になる方はご覧ください!

最近やっていること

最近はOCRデータ基盤開発をしながら、MLパイプラインの開発もしています。データパイプラインの改善や精度モニタリングの整備などもやっていたりします。とはいえ、まだまだ改善しなければいけないところがたくさんあり、やりたいことがたくさんあるのが現状です。
ということで、MLOpsエンジニア大大大募集中です!

最後に

こうして振り返ると「タスク」と言う質問をカジュアル面談でいただくことが多いのですが「イシュー」ベースで任せていただき伴走してもらえてる環境だなと思いました。お伝えしたこと以外にも、LayerXで多くのことを経験させていただいて、自分で手を挙げればガンガン挑戦できる環境を体感しています。今回は以上です、ありがとうございました!

採用募集中のポジション一覧です!


この記事が気に入ったらサポートをしてみませんか?