踢蘋果、打OpenAI、AI安卓、GoogleAI搜尋都在這裡

[TechWeb]5 月 15 日消息,雖然 OpenAI 在 Google I/O 2024 大會之前發布了主要模型和音視頻交互功能,但今天谷歌一次性發布了 20 多項 AI 重大進展,這是嚴肅的一步。 一個遊戲。

在Google的主要AI進展中,AI搜尋系統和Android AI在應用程式方面能夠快速獲得用戶認可。

搜尋人工智慧

在昨天的 OpenAI 新聞發布會上,並沒有公佈備受期待的 AI 搜尋。 在今天的 Google I/O 2024 大會上,Google 和 Alphabet 執行長 Sundar Pichai 花了很長時間介紹他最新的 AI 搜尋。

這些人工智慧搜尋功能包括:

1. AI概覽功能,與傳統搜尋引擎的結果相比,它為用戶提供了包括意見、詳細資訊、連結等在內的完整答案。 谷歌宣布,即日起將向所有人推出改進的基於Gemini的搜尋體驗美國用戶並將於本週擴展到更多國家。

支援更複雜搜尋的人工智慧概述。

例如,如果你想找到一個合適的普拉提工作室,你需要考慮時間、價格、距離等因素。有關他們的詳細信息以及從燈塔山步行需要多長時間。

人工智慧概述引入了多步驟推理,將大問題分解為小部分並確定優先順序。

例如,搜尋「為一群人創建一個易於準備的3天飲食計畫」之類的內容,你會從網路上得到很多食譜,你可以直接將食譜中使用的食材匯出到購物清單。 這意味著用戶只需詢問即可將他們需要的所有東西添加到購物車中。

此外,Google搜尋即將推出影片搜尋功能。 例如,您在舊貨店購買了一台錄音機,但當您打開它時,它不起作用,並且帶有插針的金屬片會飄走。 您可以錄製電唱機問題的影片並詢問如何解決它,我們將向您提供解決問題的逐步說明和資源。

2.新增Gemini模型功能後增強的照片搜尋功能(Ask Photo);

利用這個功能,使用者可以自然地詢問他們想要的東西。

例如:“向我展示我去過的每個國家公園的最佳照片。” Google 相簿將準確顯示您需要的照片,從而節省您滾動尋找它們的時間。

Ask Photos 將於今年夏天推出。

此外,谷歌還宣布其人工智慧搜尋引擎很快就會推出多輪推理功能,可以分析複雜的問題,並將最初需要幾分鐘甚至幾週的研究壓縮到幾秒鐘內完成。 它還將支援搜尋詢問有關影片的問題。 和更多。

人工智慧安卓

同樣在Google I/O 2024 大會前一周,外媒報道稱,蘋果正在考慮將OpenAI 技術整合到下一代iPhone 作業系統iOS 18 中,併計劃在今年晚些時候推出多項使用OpenAI 的iPhone 新功能。 技術。

不過,蘋果與OpenAI的合作細節仍處於討論與規劃階段,合作的具體內容與持續時間尚未最終確定。

在Google I/O 2024大會上,Google宣布將把AI直接嵌入到Android作業系統中,打造AI Android——「首個整合後端AI的行動作業系統」。 並直接發布未來專門實作AI的Android版本-Android 15 Beta 2。

這意味著,在Android系統後端使用Gemini之後,所有搭載Android系統的手機只要升級到Android 15 Beta 2及更高版本,就可以享受Google Gemini的AI能力。

蘋果的iOS生態系統一直是自成一體,iOS系統的穩定性和易用性是蘋果手機產品維持高價值的重要因素。

這次,Google率先整合Android,Gemini AI Android取得先發優勢,對蘋果iOS帶來壓力。

具體來說,在 Android 上體驗 Google AI 的方式包括:

1.圈出搜尋:這表示您不會圈出任何內容。 您可以透過簡單的手勢在手機上圈選並蒐索任何內容,而無需停止正在做的事情或切換到另一個頁面。

 

例如,當學生圈出他們遇到的線索時,他們將收到解決問題的逐步說明,而無需離開當前頁面。

目前,Circle to Search 在超過 1 億台裝置上使用,預計到今年年底這一數字將增加一倍。

2.互動體驗:使用者很快將能夠在他們正在使用的應用程式上方顯示Gemini疊加層,從而在許多方面更輕鬆地使用Gemini。

例如,您可以將生成的圖像拖放到 Gmail、Google Messages 和其他位置,或按一下「詢問此影片」以尋找 YouTube 影片中的特定資訊。

更新將在未來幾個月內推廣到數億台設備。

3.TalkBack中將包含Gemini Nano的多模態功能,幫助盲人或弱視人士獲得更豐富、更清晰的視覺描述。

雙子座系列大型號

當然,Google I/O 2024大會上最大的篇幅專門用於Gemini系列大型模型,這些模型讓Google超越了蘋果的iOS並攻擊了OpenAI的AI搜尋。

會上,Google發布了輕量級模型Gemini 1.5 Flash、進階版Gemini 1.5 Pro、影片創作模型Veo、圖形模型Vincent Imagen 3、音樂創作模型Lyria等,以及大開源的下一代Gemma 2。

1.Gemini 1.5 Flash:比Gemini 1.5 Pro更輕的型號,擁有100萬個上下文窗口,旨在快速高效地執行大規模服務。

Gemini 1.5 Flash 擅長總結摘要、聊天應用程式、為圖像和視訊添加字幕以及從長文件和表格中提取資料。

2. Gemini 1.5 Pro:上下文視窗擴展到200萬個token,程式碼產生、規劃和邏輯推理、多輪對話、視聽理解也透過數據和演算法的進步得到增強。

Gemini 1.5 Pro可以對上傳到Google AI Studio的影片進行視覺和音訊推理。 同時,Gemini 1.5 Pro已整合到Google產品中,包括Gemini Advanced和Workspace應用程式。

目前,具有 100 萬代幣上下文視窗的 Gemini 1.5 Pro 和 Gemini 1.5 Flash 目前正在 Google AI Studio 和 Vertex AI 中公開預覽。 使用API​​的開發者和Google Cloud客戶還可以透過候補名單獲得Gemini 1.5 Pro,上下文期間有200萬個代幣。

3. Gemma 2開源型號將在未來幾週推出:Gemma 2採用新架構 Gemma 2 27B的性能與Llama 3 70B相當,尺寸不到Llama 3 70B的一半。

4. Veo視頻模型:可創建1080p解析度的高品質視頻,可持續超過一分鐘。 Veo 建立在多年的生成視訊模型基礎上,包括生成查詢網路 (GQN)、DVD-GAN、Imagen-Video、Phenaki、WALT、VideoPoet 和 Lumiere — 結合架構、縮放規則縮放和其他新技術來提高輸出品質和分辨率。

5. 高品質文字到影像模型 圖 3:Google 最高品質的文字到影像模型,能夠創造比以前的模型細節更好、光照更豐富且破壞性偽影更少的影像。

6. Lyria音樂創作模型:除了模型之外,還正在開發名為Music AI Sandbox的AI音樂創作工具包。

還有更多型號,這裡無法一一列舉。 如有需要,您可以閱讀 Google 文件。

 

#踢蘋果打OpenAIAI安卓GoogleAI搜尋都在這裡

本文来自网络,不代表海外中文網立场,转载请注明出处:https://www.yaozhongkao.com/10252.html
返回顶部