タグ
1件 · 1週間分
LLMのユーザーは通常、単一の出力でモデルを評価しますが、これは広範な生成分布の一部に過ぎません。本研究では、この分布構造(モード、エッジケース、プロンプト変化への感度)を可視化・比較するインタラクティブなツール「GROVE」を提案しています。これにより、ユーザーはLLMの振る舞いをより深く理解し、プロンプト開発の効率化に貢献します。