近日,谷歌創(chuàng)始人謝爾蓋·布林接受了知名播客主理人洛根的訪談。對話探討了谷歌 I/O 大會上的最新動態(tài),以及谷歌 AI 開發(fā)的整體現(xiàn)狀。布林說,這一系列發(fā)布非常精彩,甚至有一些令他感到意外的元素,例如谷歌搜索中的虛擬試穿功能,反響熱烈。但仍有大量工作要做,才能順利實現(xiàn)所有已宣布的功能。
布林表示,縱觀人工智能發(fā)展的更廣闊軌跡,看到當前的進展與幾年前對奇點的理性推理截然不同,人工智能的發(fā)展方式令人驚訝:
1、語言模型已成為人工智能發(fā)展的主要驅(qū)動力,這在 15 年前并不明顯,尤其是考慮到 DeepMind 過去專注于物理基礎(chǔ)。
2、思維模型的驚人可解釋性,可以洞察其推理過程,從安全角度來看具有顯著的積極意義。
從架構(gòu)上看,布林發(fā)現(xiàn)不同的模型非常相似,甚至看似不同的模型,例如視頻傳播模型訓練過程正在不斷發(fā)展。后訓練階段(微調(diào)、強化學習工作)在整體工作中所占的比例越來越大,此階段添加了工具使用等功能,使模型更加強大。
關(guān)于推理擴展,特別是深度思考計劃。布林說,谷歌的愿景是讓模型能夠思考更長時間(數(shù)小時、數(shù)天甚至數(shù)月),從而對復(fù)雜問題給出更好的答案,這與克服實現(xiàn)長上下文輸入的挑戰(zhàn)相比,谷歌一直在努力實現(xiàn)這一點。從短期任務(wù)的訓練模型推廣,到期望它們在幾天內(nèi)開發(fā)出新的東西,是一個正在克服的重大差距。人工智能時刻凸顯了評估問題的普遍難度,無論對于人類還是人工智能而言。
最后,布林還反思了谷歌的地位和創(chuàng)新步伐。他認為,企業(yè)必須定期進行自我改造,盡管充滿挑戰(zhàn),但谷歌憑借其在大規(guī)模數(shù)據(jù)、谷歌大腦和 Transformer 方面的經(jīng)驗,已經(jīng)為人工智能轉(zhuǎn)型做好了充分準備。他對目前看到的加速發(fā)展感到樂觀,并解釋了谷歌大模型從跟隨到領(lǐng)跑的原因。他特提到,與 2024 年的趕超相比,2025 年已經(jīng)取得了顯著進展。Gemini 2.5 Pro是一次明顯的飛躍,在大多數(shù)排行榜上仍然位居第一。最近推出的Gemini 2.5 Flash也被認為是一款速度超快、性能強大的模型,在許多排行榜上排名第二。