タグ
1件 · 1週間分
LLMベースの科学研究システムは自律的に研究を進め、結果を生み出すものの、その推論プロセスが科学的探求の認識論的規範に沿っているかについては疑問が呈されています。25,000回以上のエージェント実行を通じて、ベースモデルが性能と挙動の主要な決定要因であり、科学的推論におけるLLMの限界が浮き彫りになりました。