新たなモデルの実行とエラー処理の日々(AI活動日記#4)
研究室でこちらの論文の再現実験を行ってみたけど、全然うまくいかなーい!
今回はその内容を担当の先輩に相談してみた結果になります。
今日の目標
論文(https://arxiv.org/pdf/1801.07424.pdf)のプログラム理解
担当先輩に今後の方針を共有
今日の作業内容
現状と今後やるべきことについて担当先輩に相談
新たに紹介してもらったモデルの動作確認(プログラム実行)
実行時のエラー処理
トータル作業時間:3時間14分
担当先輩からのお返事
コードの使い方はREADMEや論文に書いてなかった?
事前学習の重みを使うコードの可能性があるかも
紹介された論文は動かすなら読んで報告した方がいいよ
とりあえずモデルが動くか確認してみて、学習回してる間に論文読んでみて
良かったところ
担当先輩に分からない部分はすぐに聞けたことがよかったところかな
聞くにもちょっとだけ勇気がいるので、当たり前のことかもしれないけどよかった点ですね
改善点
今のペースで来週末のミーティングで「動きました!」と報告できるか不安🫤
ある程度の見通しが立つまでは他のタスクを一旦休止して、実験進めた方がいいかも
次の目標
現在出ているエラーの原因を追求し、解消する
次なるエラーが出てきたら、その時はまた考える
とにかく明日中に今のエラーは解決したい
コメント
今週は新しく紹介してもらったモデルを動かすのと、その論文を読むのでかなり忙しくなりそう
今週中にモデルを動かして、論文調査までいきたいなぁ
で、来週の火曜〜木曜で発表資料作れればいい感じ
これかなりハードスケジュールです😨
プログラム動かして結果まとめるだけでも時間かかりそうなのに論文調査までやるとなると1日フル稼働してやれるかどうか…
エラー文の読み方と対処方法も教えてもらったので、ある程度は対処できるかもですが、
できることならエラー処理丸投げしたい気分です😂
まあ、エラー処理で強くなることろはあると思うので、必ず必要な作業だとは思うんですけどねぇ
外注したり、うまくできないかな〜と考えていますが明日も頑張ります!!⭐️
この記事が気に入ったらサポートをしてみませんか?