タグ
2件 · 2週間分
LLMの幻覚(ハルシネーション)を抑制するため、知識の境界線を認識し、適切な場面で回答を控えるよう強化学習で訓練する新フレームワーク「KARL」が提案されました。これにより、正確性と abstention のバランスを最適化します。
トヨタ自動車は、未来創生センターで開発中のヒューマノイドロボットが、強化学習を用いて歩行とバスケットボールのドリブルを習得した成果を公開しました。これは、複雑な物理運動をAIが自律的に学習する技術の進展を示すもので、実世界でのロボットの汎用的な活用に向けた大きな一歩となります。