Googleは7日(米国時間)、Gemini APIを通じてコンピューターを操作できる「Gemini 2.5 Computer Use model」を開発者向けに提供開始した。Gemini 2.5 Proのビジュアル理解・推論能力を基盤とし、コンピューターのユーザーインターフェース(UI)との対話が可能なエージェント ...
以下の記事が面白かったので、簡単にまとめました。 ・Introducing the Gemini 2.5 Computer Use model 1. Gemini 2.5 Computer Use 「Gemini 2.5 Computer use」は、「Gemini 2.5 Pro」の視覚理解・Reasoning機能を基盤として構築された、UIを操作できるエージェントを実現する新しい専用 ...
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する