ArXiv NLP 2026年5月11日

Bicameral Model: 2つのLLMが隠れ状態を通じて協調する双方向結合アプローチ

なぜ重要か

2つのLLMを隠れ状態レベルで双方向結合するBicameral Modelは、テキストに限定されない連続的なモデル間協調を実現し、多エージェントシステムの新たな可能性を拓く。

要約

既存のLLM連携がテキスト生成に限定される中、「Bicameral Model」は、2つの凍結されたLLMを訓練可能なニューラルインターフェースを介して隠れ状態レベルで双方向結合。これにより、テキストに依らない連続的かつ同時並行的なモデル間協調を可能にする。

要点

  • Bicameral Modelを提案
  • 2つのLLMを隠れ状態で結合
  • テキストを介さない連続的協調
  • プライマリ・補助モデルが同時稼働
  • 多エージェントシステムを高度化

詳細解説

これまでのマルチモデルシステムやツール拡張型システムは、テキスト生成を介して情報を交換するのが一般的でした。しかし、この方法は交換のたびに情報をシリアル化する必要があり、リアルタイム性や情報の豊かさに制約がありました。今回発表された「Bicameral Model」は、この制約を打ち破る画期的なアプローチです。このモデルは、2つの事前学習済みLLMを、テキストを介さず、それぞれの「隠れ状態(hidden states)」と呼ばれる中間表現を介して双方向に結合させます。具体的には、プライマリモデルがタスクを主導し、補助モデルがツール操作や制約解決を行う際、両者が互いのアクティベーションを翻訳ネットワークと学習可能な抑制ゲート(結合パラメータの約1%)を介して条件付けながら、同時に動作します。この技術的意義は、LLM間のコミュニケーションが、テキストという高レベルな記号表現から、より低レベルで連続的な内部状態へと移行した点にあります。これにより、モデルはより密接に、そして効率的に協調し、タスクの損失のみから選択的な通信プロトコルを学習することができます。開発者にとっては、より洗練されたエージェントシステムの構築や、複数のLLMを協調させて複雑な問題に取り組む新たな設計パラダイムが生まれます。今後は、この双方向結合アプローチが、人間とAIの協調、またはAI間の協調における新たなブレイクスルーをもたらす可能性を秘めており、多エージェントシステムや分散AIシステムの発展を加速させることが期待されます。

元記事を読む

ArXiv NLP で読む →
← 2026年5月14日(木) の一覧に戻る