マガジンのカバー画像

OPTEMOエンジニアブログ

31
エンジニアメンバーのブログをまとめています。
運営しているクリエイター

2023年5月の記事一覧

AWS Certified SysOps Administrator - Associate(SOA-C02)受検からの都庁散歩

こんにちは、エンジニアのすずきです。 2月から何個かSpecialty資格(MLS, SCS, DBS, DAS)を取得してきて、ようやくAWSに少しだけ詳しくなってきました。 幸いなことに、資格を取得してから自社サービスOPTEMOのインフラ改善の仕事(以下)を任せてもらえるようになり、ChatGPTのサポートも借りながら、AWSの実務経験を積めているような状況です。 RDSのパフォーマンス監視・チューニング 既存構成の可視化(Havaの導入) リソース(EC2,

モデル学習時のGPUメモリ不足(RuntimeError: CUDA out of memory)を解消した

こんにちは、エンジニアのすずきです。 GWは日本橋へ行くので、ひさびさに小洞天のシュウマイと五目焼きそばを食べてこようと思っています。余裕があったら台南担々麺も頼んじゃうよ。 ところで、BERTベースモデル(TabBERT)の学習時、入力データのサイズを大きくしたらGPUメモリ不足のエラーがでてしまうようになってしまいました。 AlgorithmError: ExecuteUserScriptError: ExitCode 1 ErrorMessage "RuntimeE