<tr id="drtcl"><delect id="drtcl"><ruby id="drtcl"></ruby></delect></tr>

<track id="drtcl"><delect id="drtcl"><form id="drtcl"></form></delect></track>

當前位置：首頁 > 熱訊

阿里云創業者社群｜大模型的 2024：「天上」的技術，和「地上」的創業者

2024-02-08 14:29:14 來源：今日熱點網

2023 年，OpenAI 引領了科技圈久違的興奮，創業者感到有奔頭的同時，卻也隨著 AI 模型的一再進化，感受到了壓力。

在春節前夕，算力、模型、應用等領域的大模型創業者，齊聚在一場創業者社群的活動上，切磋各自在不斷進化的大模型中找到的空間。面對呼之欲出的 GPT-5 和 Llama3，他們也有新的思考。

站在模型層面，差異化很難，方向幾乎是明確的——增強推理能力和多模態。也有技術路線的分野，比如阿里云通義實驗室智能對話負責人李永彬透露，目前在思考是否能把搜索增強這樣的外掛能力，做到模型里，進一步提升模型的可用性。

但站在應用層，多的是非共識和機會。比如，跑得最快的一批創業者，已經實現了一定程度的商業閉環，得出的結論甚至有些意外：「大模型含量」不宜過高。

這群下場做大模型的實干家也談到了行業內最真實的情況。智譜 AI COO 張帆道出，今天的榜單其實不反映真實問題，GPT-4 可能連榜單前 10 名都進不了。他認為，這種情況下，2024 年一定會發生從模型為王到價值為王的變化。

百川智能聯合創始人洪濤則更關心成本，他表示，一年下來苦哈哈做各種私有化項目，到底掙多少錢，其實內心沒把握。在這一點上，大家也探討了云計算廠商能否在整個行業沒有商業模式之前，降低算力成本的路徑，讓該花的錢少一點。

近日，阿里云創業者社群在北京舉辦創業者之夜活動|阿里云

在「創業者之夜」，各位大模型的先行者分享了各自對行業的「預言」;AI 應用的創業者們，也分享了對于大模型的「焦慮」。

01 2024，大模型往哪走?

2023 年，阿里云李永彬游走于大模型業務一線。一整年忙活下來，他發現：最初，大模型讓「AI 解決問題」這件事的效果從 20 分提高到 60 分，就能夠驚艷所有人，但是對于很多問題，60 分和 0 分差不多。因為在一些應用場景，沒辦法拿 60 分的產品上線，效果到不了 90 分，客戶可能也不會買單。

這也是 2023 年大模型創業者們共同的體感。從興奮回歸到理性，背后是共同的困惑——大模型還不夠通用，它會不會像上一波 AI 一樣，盡管展現出驚人的能力，但落到場景時仍舊需要逐個項目定制化?

大家自然就產生了 2024 年對大模型的第一個期待——通用能力進一步提升，甚至期待模型在一些復雜場景能直接做到 90 分。

這種可能性不是無跡可尋。IDEA 研究院講席科學家張家興認為，從目前 OpenAI、谷歌等大廠對下一代大模型的判斷，大模型能解決復雜問題會成為接下來進化的方向。

AlphaGeometry: An Olympiad-level AI system for geometry|圖片來源：DeepMind 官網

就在兩周前，谷歌 DeepMind 推出的 AlphaGeometry(阿爾法幾何)AI 系統，已經能在 30 道國際奧數題中做對 25 道，接近人類水平(人類金牌得主平均做對 25.9 道)。像這樣能解決奧數級別的幾何問題，被視為邁向更先進、更通用 AI 的重要里程碑。在 IDEA 研究院張家興看來，「奧數就是復雜問題，問題的描述很復雜，求解過程、證明過程也很復雜」，能解決復雜問題是模型變得更通用的表現之一。

阿里云創業孵化事業部總經理李中雨認為，從 GPT-5 目前釋放的信息看，模型的泛化能力在提升，解決復雜任務的能力也在提升，甚至接下來 GPT-5 可以解決 15%-20% 人類的任務。

在提升模型的通用性上，也有新思路。

一位來自模型廠商的與會者分享，最近絕大多數企業落地大模型時都會用到 RAG(搜索增強)，從而將大模型和私有數據結合起來，提升模型可用性。但作為模型側的開發者，也在探索算法創新，通過算法創新提高模型的學習能力，把像 RAG 這樣的外掛知識庫囊括進去，從而減少對模型數據訓練的依賴。換言之，通過算法創新，以期讓模型像人類學習一樣，看一本書就可以理解知識，而不需要看所有書來理解一個問題。

在這一點上，GPT-5 提供了很好的示范。智譜 AI 張帆認為，更強大的推理能力讓處理復雜任務成為可能，同時也帶來了非常強的泛化能力。模型會在各個行業場景都能有很好的 Zero-Shot、One-Shot 能力(給模型一個例子甚至不給例子，它就可以涌現出對應的能力)，從而減少對訓練數據的依賴。通過小數據集的訓練，就可以把模型引入到更多更垂直的領域。如此一來，可以降低客戶使用模型的門檻，增加其可用性。

除了通用性，多模態能力也被期待在 2024 年能有更大突破。

去年底，從 GPT-4 到谷歌 Gemini，已經充分展現了大模型的演進，拓展以大語言模型為核心的更大體系的 AI，必然會涉及多模態能力。

張家興預判，就像 2022 年底 ChatGPT 的出現，導致 2023 年所有人都在做大語言模型一樣，2024 年整個業界可能會聚焦多模態。這并不只是因為多模態能帶來更強的能力，更因為多模態的應用場景多，在端側比如車和機器人的場景，多模態非常重要。

在多模態的技術實現上，也有一些技術融合的新視角。

在多模態領域做探索，中科深智創始人成維忠注意到前段時間圖靈獎得主 Lecun 的一個采訪，他并不認同現在大家做多模態的技術路線——把圖片視頻還原為像素，Lecun 認為未來的多模態訓練是應該以表征事件為主。

在這一話題的討論上，與會者一方面認為，ChatGPT 也不是規劃出來的，技術路線可能是干出來的，能用今天的技術落地往前走、不斷改進是前提。另一方面，盡管路線之爭的存在，但也不是不能調和的，有很多中間的路線可以走，是連續的。比如，張家興分享了 IDEA 內部的實踐，稱稱目標識別等計算機視覺特征是可以作為多模態大模型的輸?，實踐下來的效果?常好。

從左到右分別是阿里云創業孵化事業部總經理李中雨;智譜 AICOO 張帆;百川智能聯合創始人、總裁洪濤;元璟資本管理合伙人劉毅然;IDEA 研究院認知計算與自然語言講席科學家張家興、通義實驗室對話智能負責人李永彬 | 阿里云

02 2024，大模型如何落地?

如前所述，對于大模型接下來的趨勢預判，推理能力和多模態能力的提升成為清晰、明確的目標。但談到 AI 應用，更多是非共識的思考，創業者一致認為需要在非共識中尋找機會。

就拿大模型落地應用要考慮的第一件事——模型選型來說，目前也還沒有達成共識。智譜 AI 張帆笑稱，以現在模型評測卷出天際的背景下，「OpenAI 的 GPT-4 都排不到模型評測榜單的前兩頁」。

的確，幾個月以來，不少模型創業者都向極客公園表達了類似的觀察：模型評測榜單不反映真實情況。在「模型為王」的愿景下，的確會出現提前讓模型「看題」、「背題」來獲得高分的情況。但更重要的是，當涉及到千行百業的不同場景，很難用一套標準來評價模型的可用性。

實踐過后，大家更認同在一個個真實的具體場景里不斷測試評估。比如，獵聘在+大模型的探索上，最大的研發成本就花在測試不同的模型上。獵聘 CEO 戴科彬表示，對于什么場景用什么模型、多大尺寸的模型最高效，沒有標準答案，就連評價標準也要根據情況調整。

除了模型選型，模型落地也開始出現一些可操作的判斷標準。無論是在原有應用里+大模型，還是一些 AI Native 應用的探索，都出現了能形成商業閉環的可能性。

這里首先要考慮大模型技術分布的獨特性。元璟資本管理合伙人劉毅然認為，AI 應用存在巨大的不確定和非共識機會，這與這一波 AI 技術的特點有關。

移動互聯網時代，應用的底層基礎設施是一樣的，都是基于蘋果 iOS 和 LBS 定位來做產品。相比之下，大模型應用則是一個個垂直優化的過程，底層模型哪部分用開源版、哪部分微調、調整哪些問題，再視情況優化功能和應用。創業者需要充分懂技術，再做產品的封裝，這個過程存在很大優化空間和機會。

這就提出了探索 AI 應用的第一條原則——TPF(技術產品匹配)，百川智能創始人王小川在極客公園創新大會 2024 大會上曾提到過這個名詞，指的是在現有大模型技術不完美時，先明確「這樣一個技術適合什么樣的產品」，而不是產品經理洞察市場有什么需求，回來就開始做。

因為從大模型到 AI 應用，「今天最大的挑戰不是找到『什么不行』，這件事不難，人人都能夠做到。難的是能找到它『什么行』，找到模型能力和業務的最大公約數，變成正向循環?！怪亲V AI 張帆認為，這會成為 2024 年大模型落地的重點。

盡管這樣的實踐可能不是投資人尋找的 AI Native 應用，但是務實地看，通過在可用場景里，基于模型和工程化手段把大模型應用產品化，數據和客戶反饋的飛輪會推著 AI 應用向前迭代。百川智能聯合創始人洪濤提到了一個有趣的觀察，做 AI 應用的創業者甚至覺得以當前大模型技術成熟度，AI 應用「含大模型量」不宜過高。

在游戲領域，昆侖萬維集團董事長兼 CEO 方漢有類似的觀察。通過純 AI 大模型直接生成 3D 游戲內容，會造成面數特別多、規格不匹配等問題。這時如果換一個思路，把傳統的一些簡單動畫工具，融合進 AI 大模型的工作流之后，產品的可用性就大大提高。

在他看來，什么好用就用什么，拼出對用戶最有價值的工作流，這是作為 AI 應用開發商的價值所在。

看得出，在原有應用里+大模型、探索更好的工作流，是把大模型智力變成生產力最直接的方式。智譜 AI 張帆認為，這也是 2024 年產業關注的重點。

與此同時，一些令人驚艷的 AI Native 應用也開始出現。

就像移動互聯網技術下，出現隨時隨地刷短視頻的用戶需求一樣，大模型技術下也開始出現一些獨有的場景。比如一位 AI 應用投資人現場分享了一款還在定向邀測的海外應用 Can of Soup，一款想象力社交軟件。用戶利用 AI 生成虛擬圖像，發布在網站上，互相評論，還可以邀請朋友進行「想象力」共創、點評，這款產品可以類比為「想象力版 Instagram」。

「這款應用在海外 DAU 增長非?？?，不知道最后能不能成，但是非常有意義的探索，代表不僅現實的生活可以分享、可以社交，你的想象力也可以被社交，這就是非常典型的 AI 原生的應用，發現了新的行為模式」，他補充說。

除了像 Can of Soup 這樣捕捉新技術下的人類新需求，新技術也給熟悉的場景帶來了更好的解決方案，為用戶帶來更易用、好用的體驗。

就拿現在最火熱的智能體來說，智譜 AI 張帆認為，很多 GPTs 能做的事情非常淺，很難用作生產工具。這些 GPTs 背后的流程大體是按照人的理解邏輯來執行，先做分類、再做模型、再做任務，但是這種智能體運行的方式是受限的，他認為，「嚴格來講，這種外掛工程的方式不算是 agent，只是大號的模型應用」。

相比之下，他發現字節跳動在海外推出的 Coze 玩法不一樣，同樣是 GPTs 類應用，Coze 的模式是利用背后大模型的遞歸和迭代的能力和表達力，這是更加原生的智能體，效果也更好。

張帆稱，這是他看到比較興奮的方向，能夠用更簡單的方式、更通用的方式，不需要微調，僅僅用基礎的表述就能夠解決真正的復雜問題，把從模型到應用之間的 100 公里降到 100 米。但也有前提，像 Coze 這樣的原生模式，高度依賴背后的模型能力，模型強大到足夠通用，才可以實現。

智譜 AI COO 張帆在活動上做分享|阿里云

除了軟件類 AI 應用，結合端側場景的應用也值得期待，尤其機器人領域。說起 2023 年最眼前一亮的應用，張家興認為是谷歌的 RT-2(Robotics Transformer 2，一款機器人大模型)，看到了??然語?定義任意機器人任務的曙光。他認為，?模型在機器?領域正在期待 ChatGPT 時刻。

元璟資本劉毅然舉了一個例子，過去機器人領域有一些常規，比如用數學規律來描述復雜動態體的運動，現在，大模型對于像這樣的數學描述過程有放大作用，但距離大模型真正進入機器人或者手機、車、AI Pin 等硬件，可能還需要些時間。

「天上的大模型能否落在地上的設備上面，是值得期待的」他說道。盡管通用的物理世界大模型的價值最大，是科學家夢寐以求的，但在前面加合適的定語，是創業者今天就可以做、也可以有收獲的。難點在于，前面怎么加定語，能符合今天的技術階段，也能把商業化和產品結合在一起，不停向前進。

03 2024，大模型「基建」的意義

有了對 AI 應用百花齊放的期待和判斷，創業者也對整個大模型的技術體系寄予新期待，尤其是數據、算力和開源算法。

數據被視為模型訓練、微調等動作產生效果最重要的因素之一。在獲取高質量數據上，方漢提出了不同的思考。在他看來，很多大模型有更快的方法獲取數據，比如通過用 GPT-4 做「教練」來獲得，但是在數據獲取方面，團隊應該有「長期主義」精神，不然「很難走遠」。

昆侖萬維董事長、CEO 方漢在交流環節分享昆侖萬維+大模型的實踐|圖片來源：阿里云

在對比了全球市場后，昆侖萬維方漢認為，垂類數據是中國公司上場和發力的方向。有了垂類高質量數據，才有機會在垂直場景里面做到 SOTA(指前沿、第一梯隊的模型)，率先獲得垂直場景的紅利。

在算力層，成本成為主要的關注點。

百川智能洪濤坦言，大模型商業模式的探索有相對長期的試錯過程，云計算層面繼續突破、攤薄創新成本，是眼下比較關注的方向。

在這一點上，阿里云公共云總裁劉偉光認為云和 AI 的結合會逐漸解決這個問題。

云計算對傳統 IT 的意義，和融合AI的意義完全不同。AI 和云是魚和水，密不可分，二者的結合是 AI 應用的催化劑。同時，云計算能力的不斷演進，包括 GPU 算力、配套的計算存儲、網絡能力的演進，會對 AI 產生非常大的支撐。

「在談AI原生應用之前，其實有一點被忽略了——AI 是云的原生應用。二者的結合還有很大優化空間」他說道。隨著大模型包括 AIGC(應用)更加細分，對算力的需求也會逐漸細分化，而不是簡單粗暴地購買算力，這也是阿里云不斷探索的事情。

在這一點上，云、端結合的方式也被寄予厚望，昆侖萬維方漢認為，降低模型推理成本，要結合端側推理，手機側可以做小參數量模型的推理，和云端大參數量模型推理結合起來。

算法層面，meta 開源的 LLaMA 和 Llama2 為產業模型發展提速，帶來了繁榮的開發者生態。不久前，Mistral 創始人也袒露借鑒了 Llama2 的開源模型，但開發者普遍稱，Mistral 的效果實際用下來要比 Llama2 更好。

國內模型廠商也越來越多地選擇開源模型，但也有創業者表示，不確定國內尤其是大廠開源模型背后的考量，會不會只是一時的。比如，獵聘戴科彬就認為，阿里云開源的 72B 大模型效果非常好，但也好奇其背后的思考。

在創業者之夜上，阿里云市場總裁劉湘雯直面這一提問。她表示，阿里云會持續開源，這并非僅僅為了公益，而是基于對商業的判斷。

阿里云創業者之夜活動現場|阿里云

在這場創業者活動中，極客公園看到了共識，也看到了更多共識的觀點在嘉賓之中激烈碰撞。而這恰恰代表了由大模型引發的新一波 AI 浪潮中所蘊含的機遇。你可以想象，在 20 年前移動互聯網剛剛興起的時候，在類似活動，同樣充滿了相同的爭論和見解。

不同的是，變革的「基建」從運營商，變成了現在以阿里云為代表的云計算廠商。在大模型時代，阿里云不僅要自己下場「摸清」大模型上下游的真實情況，更需要在這樣的創業者之夜活動中，和大模型行業的「玩家」共同找到行業發展的方向，根據后者不斷變化的需求，增加阿里云「AI 基建」的各種能力，來和創業者們一起成長、成功。

大模型時代，「計算，為了無法計算的價值」有新的內涵，在阿里云舉辦的創業者之夜活動上，這群先行者率先開始探索最開放的技術體系里，新的變化。

寫在最后：

創業者之夜活動由阿里云創業者社群舉辦。社群聚集中國最前沿的技術創新者，聚焦云與 AI 技術方向、以及 AI 在產業中的落地應用等核心主題，發起各類技術及產業閉門活動與研討，與社群成員形成長期共創體系，與技術創新者們共同成長。

標簽：

精彩要聞

阿里云創業者社群｜大模型的 2024：「天上」的技術，和「地上」的創業者

2024-02-08 14:29:14
訊飛AI翻譯筆P20 Plus：為孩子提供全面的英語學習支持！

2024-02-06 15:20:15
不是國外去不起，而是香港更有性價比！ “港味”新年嗨起來！

2024-02-02 15:48:04
富士膠片商業創新發布《企業韌性創新白皮書》

2024-02-01 15:28:32
一個視頻引發全網熱議，這片暖心又感人

2024-02-01 15:30:58
海蘭三秀：小U、小Q、小艾電腦一體機震撼來襲

2024-02-01 11:30:30
海蘭GS40U電腦一體機 “小U”助您春節期間暢享數字生活

2024-01-30 15:59:42
天貓新品創新中心發布年度新品榜單，夢百合三體聯名智能床入選

2024-01-30 13:34:01
敢為家人更新年味，TCL新年智慧生活提案來了！

2024-01-27 09:36:04
一塊守護“國寶”！騰訊游戲攜玩家共同助力河南災后文物修繕和長城、敦煌、云岡數字化保護

2021-08-30 22:50:00
騰訊數據中心節能黑科技吸引外媒關注巧用余熱回收助力碳中和

2021-10-15 18:20:00
攜手防止網絡沉迷

2021-08-05 17:38:00
游戲防沉迷，要靠“聯防”而非“單防”

2021-08-05 17:37:00
全新傳導冷卻設計 ROG游戲手機8散熱架構再度開售

2024-01-26 17:19:33
武漢電子健康卡上線34省市區“盲盒皮膚”致敬全國，網友：這份中秋禮物太暖了

2021-11-03 16:00:00
165Hz三星柔性屏加持 ROG8 縱享《QQ飛車》絲滑漂移！

2024-01-25 19:44:55
科大訊飛再創新高：訊飛雙屏翻譯機適配MAC系統，用戶體驗升級

2024-01-25 16:32:25
海蘭GS40K電腦一體機 45度大俯仰打造辦公新體驗

2024-01-24 11:18:02
新春高鐵專列啟程 | TCL 光伏科技為歸鄉旅途添暖意

2024-01-23 14:50:56
新春高鐵專列啟程 | TCL光伏科技為歸鄉旅途添暖意

2024-01-23 13:45:00
展位招募火熱進行中!來第七屆成果展秀出你的“硬實力”!

2024-01-22 13:47:35
品牌力量，驅動產業前行 | “2023電子信息影響力品牌榜”正式揭曉

2024-01-22 11:46:15
倍思240W氮化鎵桌面快充充電器：卓越性能引領快充潮流

2024-01-22 10:32:47
“小而美” 的A3彩色數碼多功能機Apeos C2450 S

2024-01-19 14:49:21
中國文辦協會調研走訪富士膠片商業創新中國

2024-01-19 14:33:02
騰訊公益第二期“數字人才開放計劃”首站落地重慶，深化區域人才培育體系

2023-03-17 13:09:00
小身材大能量海蘭T1 mini電腦開啟高效生活

2024-01-17 13:56:29
鎖定1月18日：三星Galaxy全球新品發布會開啟倒計時

2024-01-15 17:36:18
倍思氮化鎵桌面快充充電器240W：讓游戲筆記本暢享無限動力

2024-01-15 11:51:21
一加 Ace 3 上市以來好評不斷，「鳴沙金」配色今日正式開售

2024-01-15 10:53:16
紫星之光成艾特獎贏家，首倡健康空間理念獲大咖點贊

2024-01-12 23:28:42
大中小企業融通創新，助力中小企業數字化轉型

2022-11-14 18:52:00
騰訊張立軍：聚焦數實融合，做好行業轉型升級的數字化助手

2022-11-11 16:34:00
2024新啟程海蘭GS40i電腦一體機帶您共赴辦公新境界

2024-01-12 11:30:57
中國宋慶齡基金會與騰訊發起“全國青少年編程與人工智能計劃”

2022-06-06 18:39:00
固德威X北汽重卡｜1500V逆變芯勢力，助力零碳造車

2024-01-11 17:08:13
助力醫百科技等北京中小企業數字化轉型騰訊云“專精特新”成長直通車今日啟航

2022-06-30 16:48:00
一汽-大眾虛擬形象品牌官“Ida”亮相！騰訊云小微提供交互智能驅動技術

2022-06-29 16:44:00
聚焦未成年保護等三大賽道，第二屆騰訊Light·公益創新挑戰賽決賽即將開啟

2022-06-22 16:31:00
騰訊云小微技術登頂權威榜單XTREME基準，跨語言技術遷移開發助力企業出海

2022-06-11 16:17:00
海蘭品牌多款顯示器熱銷 “會說話”的SD40iF備受青睞

2024-01-09 11:42:10
數字化創造協同價值：孩子王的「不卷」經營秘方

2024-01-09 11:05:54
“奔赴山?！ぶ蓖◤B馬”2023年廈門馬拉松聯賽華安站暨2023華安土樓半程馬拉松賽圓滿舉辦

2024-01-07 15:09:48
海蘭GS40K電腦一體機45度大俯仰實現站立辦公好幫手

2024-01-05 13:35:27
倍思氮化鎵桌面快充充電器：240W大功率打造高效快充方案

2024-01-05 11:10:00
常笑-保持前進的互聯網運營管理專家

2024-01-05 11:09:42
為鄉村守護人蓄能｜固德威光儲電站走進千萬大V“張同學”家

2024-01-04 14:34:22
夢百合0壓床墊登上長城，民族品牌全球化彰顯文化自信

2024-01-03 15:12:24
留學人才歸國“第一站”！25載海交會打造全球人才高地！

2024-01-03 11:22:35
同檔位性能新標桿，一加 Ace 3 安兔兔跑分超 174 萬

2024-01-02 14:32:41

最新文章

延時下班解用戶燃眉之急，華為服務溫暖人心

2023-12-29 16:18:37
一加 Ace 3 全球首發 1.5K 東方屏，全面繼承一加 12 旗艦屏幕體驗

2023-12-28 11:03:29
托管在亞馬遜云科技的向量數據庫MyScale如何借助AWS基礎設施構建穩定高效的云數據庫

2023-12-28 10:10:02

圖文推薦

淘寶秒殺店鋪主要是干啥的？淘寶網是亞太地區較大的網絡零售嗎？_全球播報

2023-04-12 15:49:12
什么情況下可以申請房貸延期還款？申請房貸延期需要什么資料？-環球最資訊

2023-04-12 15:14:22
東京機場有幾個？成田機場和羽田機場哪個大？

2023-04-12 09:53:28

新聞推送

99久久精品免费观看国产,XXXXX爽日本护士在线播放,国产成A人片在线观看视频下载,无遮掩H黄纯肉动漫在线观看星

<tr id="drtcl"><delect id="drtcl"><ruby id="drtcl"></ruby></delect></tr>

<track id="drtcl"><delect id="drtcl"><form id="drtcl"></form></delect></track>