tradingkey.logo

谷歌發佈人工智能工具,可從其他圖像創建圖像

Cryptopolitan2024年12月17日 13:23

谷歌推出了 Whisk,這是一種新的人工智能工具,可以使用其他圖像作爲提示來生成圖像。據報道,與嚴重依賴長而詳細的文本描述的舊工具不同,Whisk允許用戶上傳圖像來defi他們想要生成的主題、場景和風格。

工具還支持每個輸入的多個圖像,爲用戶提供了極大的實驗靈活性。如果您沒有開始的圖像,Google 有一個骰子圖標,可以自動用視覺效果填充提示。

然而,這些佔位符圖像似乎也是人工智能生成的。用戶還可以添加一些文本來微調輸出,但文本框是可選的。據該公司稱,在沒有它的情況下,Whisk 仍然可以產出結果。

然後,該工具會生成圖像以及在創建圖像時使用的相應文本提示。如果您喜歡結果,可以收藏或下載。如果不這樣做,您可以通過編輯底層文本提示或生成全新的內容來完善它。

Imagen 3 爲 Google Whisk AI 提供支持

谷歌表示,Whisk 是爲“快速視覺探索,而不是像素完美編輯”而構建的。因此,雖然它使用起來靈活且有趣,但它不會每次都提供完美的結果。該公司承認該工具可能“達不到目標”,這就是爲什麼他們允許快速編輯以獲得更高的準確性。

Whisk 運行在 Google 最新的 Imagen 3 圖像生成模型上,該公司還與該工具一起發佈了該模型。 Imagen 3 爲 Whisk 提供人工智能生成的結果,據說底層技術可以提高輸出的整體質量。

除了 Imagen 3 之外,谷歌還推出了 Veo 2,其升級版視頻生成模型。據報道,Veo 2 更好地掌握了電影攝影,並修復了幻覺特徵等常見問題,例如多餘手指的classic人工智能錯誤。

該模型首先在 Google 的 VideoFX 平臺上推出,該平臺仍在通過 Google 實驗室進行有限測試。該公司表示,Veo 2 最終將在 2025 年的某個時候擴展到 YouTube Shorts 和其他 Google 產品。

目前,該公司將 Whisk 定位爲一種探索工具,而不是專業的編輯解決方案。它是否能與 OpenAI 的 DALL-E 等競爭對手抗衡還有待觀察。

從零到 Web3 Pro:您的 90 天職業啓動計劃

免責聲明:本網站提供的資訊僅供教育和參考之用,不應視為財務或投資建議。
Tradingkey

相關文章

KeyAI