2026年3月31日(火)

12件
Meta Engineering Blog TOP 90

Metaがセメント・コンクリート生産にAIを応用:持続可能な建設業界への貢献

Metaは、建設業界におけるセメント・コンクリート生産の持続可能性と品質向上を目指し、AIモデル「Bayesian Optimization」を発表しました。この技術は、特に米国産材料に特化し、最適なコンクリート配合設計を支援することで、環境負荷低減と建設効率化に貢献します。

Meta研究産業応用
3/30
ArXiv AI TOP 88

AIRA_2: AI研究エージェントのボトルネックを克服し、研究効率を飛躍的に向上

AI研究エージェントには、単一GPU実行、汎化性能の限界、LLMオペレーター能力の制約という3つの構造的ボトルネックがありました。AIRA_2は、非同期マルチGPUワーカープール、隠れた一貫性評価プロトコル、ReActエージェントを採用することでこれらの課題を克服し、実験スループットと探索性能を大幅に向上させます。

LLMエージェント研究
3/30
ArXiv AI TOP 85

大規模言語モデルがAI研究エージェントの課題を克服する「BeSafe-Bench」

大規模マルチモーダルモデル(LMMs)の進化により、エージェントは複雑なタスクをこなせるようになりましたが、意図しない行動安全リスクが懸念されています。BeSafe-Bench (BSB) は、ウェブ、モバイル、視覚・言語統合(VLM)、視覚・言語・行動統合(VLA)の4つのドメインを横断し、機能的環境下でのエージェントの行動安全リスクを明らかにする初の包括的ベンチマークです。

LLMマルチモーダルエージェント
3/30
ArXiv AI HOT 83

GUIエージェントのドメインバイアスを解決する「GUIDE」フレームワークが登場

大規模視覚言語モデルはGUIエージェントに強力な汎用能力をもたらしましたが、ドメイン固有の知識不足による性能低下が課題でした。GUIDEは、リアルタイムウェブ動画検索とプラグアンドプレイのアノテーションを通じて、ドメイン特化の専門知識を自律的に獲得し、GUIエージェントのドメインバイアスを解消するトレーニング不要のフレームワークです。

LLMマルチモーダルエージェント
3/30
ArXiv ML HOT 82

MAGNET: 分散型自律研究とBitNetトレーニングによる専門家モデルの自動生成

MAGNET (Model Autonomously Growing Network) は、分散型システムでドメイン専門家言語モデルを自律的に生成・訓練・提供します。オートリサーチパイプライン、CPU推論可能なBitNet b1.58、通信効率の良い分散マージ、オンチェーン貢献追跡を統合し、commodityハードウェア上での効率的なAI開発を実現します。

LLMオープンソース研究
3/30
ArXiv NLP HOT 80

「Doctorina MedBench」:エージェントベース医療AIのエンドツーエンド評価フレームワーク

Doctorina MedBenchは、現実的な医師と患者のインタラクションをシミュレーションすることで、エージェントベース医療AIの包括的な評価を可能にするフレームワークです。病歴聴取、資料分析、鑑別診断、個別化された推奨事項まで、医療AIの臨床能力を多角的に測定します。

エージェント研究医療
3/30
Zenn LLM HOT 78

Ubie、セキュリティ分析AIエージェントの1年間運用で得た知見を公開

Ubie社は、セキュリティアラート分析に特化した生成AIエージェントを約1年間運用し、その知見を共有しました。EDRやWAFなどからの膨大なアラートの真偽判定と対応方針策定をAIが支援することで、セキュリティ担当者の業務負担を大幅に軽減し、分析の質を向上させています。

LLMエージェント事例
3/30
Zenn LLM HOT 75

Claudeの「記憶」を永続化する「MCP Memory Server cpersona」の設計と実践

Claude CodeやDesktopのセッションを超えた記憶の課題に対し、「MCP Memory Server cpersona」は、ベクトル検索、全文検索、エピソード記憶、プロファイル記憶、エージェント分離をSQLite一本で統合し、永続的な記憶を提供します。400以上のメモリ実装が乱立する中で、学術ベンチマークでもその有効性を示しました。

LLMエージェント実践
3/30
ITmedia AI+ HOT 73

Microsoft Copilot Coworkが「Critique」と「Council」でマルチモデルAIを強化

MicrosoftはCopilot Coworkに新機能「Critique」と「Council」を導入し、マルチモデルAIによる調査支援機能を強化しました。これにより、GPTとClaudeを組み合わせ、生成と評価を分業させたり、両者の回答を比較検討したりすることで、より高度で信頼性の高い情報分析が可能になります。

LLMエージェントOpenAI
3/31
ITmedia AI+

京都市、7000人の職員にGoogle「NotebookLM Enterprise」を導入し業務効率化

京都市はMicrosoft 365の利用環境下で、Gemini Enterpriseベースの「NotebookLM Enterprise」を7000人の職員に大規模導入しました。導入職員の8割が業務の質向上を実感しており、自治体DXにおけるAI活用と「全庁統合AIアシスタント」構築の可能性を示しています。

GoogleLLM事例
3/31
YouTube

Zenn記事まとめ:Claude AI活用の深化と最適化技術

ZennではClaude AIの具体的な活用事例や最適化技術に関する記事が多数公開されています。特に、Claude Codeのスキル設計原則、APIのプロンプトキャッシュによるコスト削減、永続的な記憶を与えるMCP Memory Server「cpersona」の導入、そしてマルチエージェント特化のプラグイン「oh-my-claudecode」などが注目を集めています。

LLMエージェント実践
3/30