踢蘋果、打OpenAI、AI安卓、GoogleAI搜尋都在這裡

[TechWeb]5 月 15 日消息，雖然 OpenAI 在 Google I/O 2024 大會之前發布了主要模型和音視頻交互功能，但今天谷歌一次性發布了 20 多項 AI 重大進展，這是嚴肅的一步。一個遊戲。

在Google的主要AI進展中，AI搜尋系統和Android AI在應用程式方面能夠快速獲得用戶認可。

搜尋人工智慧

在昨天的 OpenAI 新聞發布會上，並沒有公佈備受期待的 AI 搜尋。在今天的 Google I/O 2024 大會上，Google 和 Alphabet 執行長 Sundar Pichai 花了很長時間介紹他最新的 AI 搜尋。

這些人工智慧搜尋功能包括：

1. AI概覽功能，與傳統搜尋引擎的結果相比，它為用戶提供了包括意見、詳細資訊、連結等在內的完整答案。谷歌宣布，即日起將向所有人推出改進的基於Gemini的搜尋體驗美國用戶並將於本週擴展到更多國家。

支援更複雜搜尋的人工智慧概述。

例如，如果你想找到一個合適的普拉提工作室，你需要考慮時間、價格、距離等因素。有關他們的詳細信息以及從燈塔山步行需要多長時間。

人工智慧概述引入了多步驟推理，將大問題分解為小部分並確定優先順序。

例如，搜尋「為一群人創建一個易於準備的3天飲食計畫」之類的內容，你會從網路上得到很多食譜，你可以直接將食譜中使用的食材匯出到購物清單。這意味著用戶只需詢問即可將他們需要的所有東西添加到購物車中。

此外，Google搜尋即將推出影片搜尋功能。例如，您在舊貨店購買了一台錄音機，但當您打開它時，它不起作用，並且帶有插針的金屬片會飄走。您可以錄製電唱機問題的影片並詢問如何解決它，我們將向您提供解決問題的逐步說明和資源。

2.新增Gemini模型功能後增強的照片搜尋功能（Ask Photo）；

利用這個功能，使用者可以自然地詢問他們想要的東西。

例如：“向我展示我去過的每個國家公園的最佳照片。” Google 相簿將準確顯示您需要的照片，從而節省您滾動尋找它們的時間。

Ask Photos 將於今年夏天推出。

此外，谷歌還宣布其人工智慧搜尋引擎很快就會推出多輪推理功能，可以分析複雜的問題，並將最初需要幾分鐘甚至幾週的研究壓縮到幾秒鐘內完成。它還將支援搜尋詢問有關影片的問題。和更多。

人工智慧安卓

同樣在Google I/O 2024 大會前一周，外媒報道稱，蘋果正在考慮將OpenAI 技術整合到下一代iPhone 作業系統iOS 18 中，併計劃在今年晚些時候推出多項使用OpenAI 的iPhone 新功能。技術。

不過，蘋果與OpenAI的合作細節仍處於討論與規劃階段，合作的具體內容與持續時間尚未最終確定。

在Google I/O 2024大會上，Google宣布將把AI直接嵌入到Android作業系統中，打造AI Android——「首個整合後端AI的行動作業系統」。並直接發布未來專門實作AI的Android版本－Android 15 Beta 2。

這意味著，在Android系統後端使用Gemini之後，所有搭載Android系統的手機只要升級到Android 15 Beta 2及更高版本，就可以享受Google Gemini的AI能力。

蘋果的iOS生態系統一直是自成一體，iOS系統的穩定性和易用性是蘋果手機產品維持高價值的重要因素。

這次，Google率先整合Android，Gemini AI Android取得先發優勢，對蘋果iOS帶來壓力。

具體來說，在 Android 上體驗 Google AI 的方式包括：

1.圈出搜尋：這表示您不會圈出任何內容。您可以透過簡單的手勢在手機上圈選並蒐索任何內容，而無需停止正在做的事情或切換到另一個頁面。

例如，當學生圈出他們遇到的線索時，他們將收到解決問題的逐步說明，而無需離開當前頁面。

目前，Circle to Search 在超過 1 億台裝置上使用，預計到今年年底這一數字將增加一倍。

2.互動體驗：使用者很快將能夠在他們正在使用的應用程式上方顯示Gemini疊加層，從而在許多方面更輕鬆地使用Gemini。

例如，您可以將生成的圖像拖放到 Gmail、Google Messages 和其他位置，或按一下「詢問此影片」以尋找 YouTube 影片中的特定資訊。

更新將在未來幾個月內推廣到數億台設備。

3.TalkBack中將包含Gemini Nano的多模態功能，幫助盲人或弱視人士獲得更豐富、更清晰的視覺描述。

雙子座系列大型號

當然，Google I/O 2024大會上最大的篇幅專門用於Gemini系列大型模型，這些模型讓Google超越了蘋果的iOS並攻擊了OpenAI的AI搜尋。

會上，Google發布了輕量級模型Gemini 1.5 Flash、進階版Gemini 1.5 Pro、影片創作模型Veo、圖形模型Vincent Imagen 3、音樂創作模型Lyria等，以及大開源的下一代Gemma 2。

1.Gemini 1.5 Flash：比Gemini 1.5 Pro更輕的型號，擁有100萬個上下文窗口，旨在快速高效地執行大規模服務。

Gemini 1.5 Flash 擅長總結摘要、聊天應用程式、為圖像和視訊添加字幕以及從長文件和表格中提取資料。

2. Gemini 1.5 Pro：上下文視窗擴展到200萬個token，程式碼產生、規劃和邏輯推理、多輪對話、視聽理解也透過數據和演算法的進步得到增強。

Gemini 1.5 Pro可以對上傳到Google AI Studio的影片進行視覺和音訊推理。同時，Gemini 1.5 Pro已整合到Google產品中，包括Gemini Advanced和Workspace應用程式。

目前，具有 100 萬代幣上下文視窗的 Gemini 1.5 Pro 和 Gemini 1.5 Flash 目前正在 Google AI Studio 和 Vertex AI 中公開預覽。使用API的開發者和Google Cloud客戶還可以透過候補名單獲得Gemini 1.5 Pro，上下文期間有200萬個代幣。

3. Gemma 2開源型號將在未來幾週推出：Gemma 2採用新架構 Gemma 2 27B的性能與Llama 3 70B相當，尺寸不到Llama 3 70B的一半。

4. Veo視頻模型：可創建1080p解析度的高品質視頻，可持續超過一分鐘。 Veo 建立在多年的生成視訊模型基礎上，包括生成查詢網路 (GQN)、DVD-GAN、Imagen-Video、Phenaki、WALT、VideoPoet 和 Lumiere — 結合架構、縮放規則縮放和其他新技術來提高輸出品質和分辨率。

5. 高品質文字到影像模型圖 3：Google 最高品質的文字到影像模型，能夠創造比以前的模型細節更好、光照更豐富且破壞性偽影更少的影像。

6. Lyria音樂創作模型：除了模型之外，還正在開發名為Music AI Sandbox的AI音樂創作工具包。

還有更多型號，這裡無法一一列舉。如有需要，您可以閱讀 Google 文件。

#踢蘋果打OpenAIAI安卓GoogleAI搜尋都在這裡

给这篇文章的作者打赏