『CRAB: Cross-environment Agent Benchmark for Multimodal Language Model Agents』に生成AUと震える
感想
専門外の理解ですが……。
OCRとスクショを利用して力技でフレームワークを作ったのはすごい。けど、LLMがUbuntuのターミナルも操作出来るのなら、サンドボックスなどで失敗しても害が及ばない仕組みも必要だと思いました。
Thank you for taking the time to read this.
専門外の理解ですが……。
OCRとスクショを利用して力技でフレームワークを作ったのはすごい。けど、LLMがUbuntuのターミナルも操作出来るのなら、サンドボックスなどで失敗しても害が及ばない仕組みも必要だと思いました。
Thank you for taking the time to read this.