Googleは7日(米国時間)、Gemini APIを通じてコンピューターを操作できる「Gemini 2.5 Computer Use model」を開発者向けに提供開始した。Gemini 2.5 Proのビジュアル理解・推論能力を基盤とし、コンピューターのユーザーインターフェース(UI)との対話が可能なエージェント ...
Googleは2025年10月7日、UI操作に最適化された新しいモデル 「Gemini 2. 5 Computer Use」 を公開プレビューで提供開始した。 これまでのAIモデルはソフトウェアと構造化APIを介して連携してソフトウェアを操作できるが、多くのデジタルタスクではフォームへの入力 ...
以下の記事が面白かったので、簡単にまとめました。 ・Introducing the Gemini 2.5 Computer Use model 1. Gemini 2.5 Computer Use 「Gemini 2.5 Computer use」は、「Gemini 2.5 Pro」の視覚理解・Reasoning機能を基盤として構築された、UIを操作できるエージェントを実現する新しい専用 ...