Google DeepMindが、単一の入力画像からプレイ可能な3D環境を生成できる基盤的世界モデル「Genie 2」を2024年12月4日に発表しました。Genie 2で生成した世界は、人間やAIエージェントがキーボードとマウスを使った操作で移動することが可能です。 Genie 2: A large-scale ...
チャットAIのChatGPTや音声認識AIのWhisperを開発するOpenAIが2023年5月に3Dモデル作成AI「Shap-E」を発表しました。Shap-Eはオープンソースで開発されており、誰でも利用可能とのことなので実際にGoogle Colaboratory上で使ってみました。 shap-e/sample_text_to_3d.ipynb at main ...
Google DeepMindは4日、大規模な基盤ワールドモデル「Genie 2」を発表した。Genie 2は、画像を入力して3D環境を生成し、キーボードやマウスを使って直接操作可能なモデル。この技術により、AIや人間が仮想世界でインタラクティブに行動できる環境を構築できる。
Google's Gemini is pushing the boundaries of what everyday users can do with photos. You can turn your pet into a tiny ...
中国テンセント(Tencent)社は6月14日(土)、オープンソースの3Dモデル生成AI「Hunyuan 3D 2.1」をGitHubで公開し、HuggingFaceにデモスペースをオープンした。4月に先行リリースされた「Hunyuan 3D 2.5」が100億パラメータ、8~20秒の高速生成、APIアクセスを基本とした ...
Making 3D figurines using Google Nano Banana (Gemini 2.5 Flash Image) has never been easier, courtesy of easy prompts and high-end features in Google AI Studio. From seeing yourself as a collectible, ...
このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 米Google Researchと米UC Berkeleyの研究チームが発表した論文「DreamFusion: Text-to-3D using 2D ...