ng體育自媒體

-ng體育自媒體
首頁/網絡熱點/ 正文

Kimi爆火后,大廠角逐長文本

admin2024-03-24網絡熱點7 ℃0 評論

  月之暗面不再“晦暗”。近期,由這家公司創作的大模型應用Kimi,吸引了大量目光。Kimi產生的效應已經從大模型圈外溢至資本市場,Kimi概念股在本周應運而生。用戶激增,巨大流量突然涌入,甚至讓Kimi服務器一度宕機。

  Kimi在這一輪大模型應用當中突圍,核心優勢在于長文本讀取和解析能力。頗為巧合的是,就在22日晚間,阿里高調宣布通義千問開放1000萬字長文本能力。360當晚緊隨其后,宣布360智腦正式內測500萬字長文本處理功能,即將入駐360AI瀏覽器。

  而據《科創板日報》了解,百度也將在下個月開放200萬-400萬的長文本能力。

  阿里巴巴、百度等互聯網巨頭紛紛布局并升級自家的大模型產品,強化長文本處理能力,正讓業界重新審視長文本處理在大模型領域的必要性和重要性。而隨著Kimi的崛起,這也讓大模型的討論焦點從大模型本身轉移到了應用端,2024年是否會成為AI大模型應用落地元年?

  長文本是必要的嗎?

  相較于其他大模型應用,Kimi的長處在于長文本分析聯網搜索、文檔處理和等功能上,尤其在深度解析厚重書籍內容方面,其性能遠超遠超其他模型。3月18日,月之暗面甚至一口氣將無損上下文長度提升了十倍,直達200萬字級別。

  據目前的用戶體驗來看,Kimi也不是全能選手。有用戶反饋表示,對于一些較為困難的任務,包括結構化信息處理和圖像中潦草文字的識別,對話連續性上,Kimi仍顯示出一些短板。在生成能力和語音能力上,目前Kimi還未加入這些模態。

  盡管如此,長文本能力的重要性不言而喻。目前,市面上的大模型應用,GPT-4Turbo-128k公布的文本范圍約為10萬漢字,Claude3200k上下文約16萬漢字。

  一家AI上市公司大模型架構業務人士告訴記者,由于模型訓練結構的限制,以往大模型的文本范圍都不算長,但復雜任務和行業知識通常是長篇巨制,這種情況下,只能拆分輸入提問,但這可能會導致輸出的結果上下不連貫邏輯不通順。長文本可以全篇連貫的去理解上下文,滿足理解和問答的需求,長文本能力在此時是具備優勢的。

  而國內大廠們,則正在長文本領域快速布局。

  《科創板日報》記者從知情人士方面了解到,百度在下個月將對文心一言進行升級,屆時也將開放長文本能力,文本范圍在200萬-500萬。目前,文心一言的文本最高上限在3.2萬。

  而阿里已經先行一步。22日晚間,阿里的通義千問官宣升級,向所有人免費開放1000萬字的長文檔處理功能。用戶可通過通義千問網站和APP快速讀研報、分析財報、讀科研論文、研判案情、讀醫療報告、解讀法律條文、分析考試成績、總結深度文章。

  360緊隨其后,其在當晚宣布,360智腦正式內測500萬字長文本處理功能,即將入駐360AI瀏覽器。

  Kimi成功在前,阿里、百度、360先后角逐長文本。長文本能力會是大模型未來差異化的競爭點嗎?

  上述大模型架構人士表示,長文本能力目前在訓練和效果上仍存在一些難點,比如如何避免遺漏細節。事實上,文本長度也可以通過RoPE等算法技術去拓展,但是此時會嚴重丟失細節,這就導致輸出效果不準確。因此,核心標準是看輸出結果的精準性連貫性,并不是文本長度越長越好。

  另外一名大模型行業人士也告訴記者,長文本實際是大模型的基礎能力,只要算力資源足夠,理論上長文本可以追求無限長,“但是如果使用場景根本用不上長文本,那么此時的長文本就沒有任何意義”。

  2024年是大模型應用落地元年嗎?

  Kimi的火爆,一定程度上也反應了當下國內大模型的發展階段,從打基建開始走向應用落地。那么,2024年是否會成為AI大模型應用落地元年?

  瀾舟科技CEO周明認為,從長遠來看,人工智能在逼近AGI。而經過去一年的發展,大模型已經具備了落地的能力,企業側也積攢了很多業務落地場景。加上國家政策的推動,2024年將會是大模型落地元年。

  零一萬物聯合創始人祁瑞峰也表達了類似的看法,但他是聚焦在B端場景。目前,內容生成、理解、摘要和對話等應用仍占據主導,但隨著新一代模型推理、決策和執行能力的提升,有望更快地將AI技術植入企業業務系統,真正開啟大模型賦能的騰飛。

  電商是AI應用最具代表性的領域之一。魔琺科技目前是阿里媽媽、淘寶直播生態官方指定的3D超寫實虛擬直播服務商,旗下有一款3D虛擬人直播AIGC產品“有光”。

  魔琺科技CEO柴金祥在接受《科創板日報》記者采訪時表示,電商是公司AI產品應用的最主要一個行業。從已有的使用效果來看,多個知名頭部美妝品牌在使用魔琺科技提供的3D虛擬人后,午夜6小時的直播時段內累計年GMV增量高達數千萬。3D虛擬直播午夜超級直播廣告投放高于行業均值2倍以上,ROI大于5倍。

  盡管2024年被寄予厚望,但是各方仍然保持著審慎樂觀的態度。

  祁瑞峰認為,在C端市場,目前成本還很高,商業模式還未完全跑通。即便是對于現在已經可以創收的B端市場,周明也認為,要想做好產品標準化和完整交付,訓練和部署成本、行業適配能力、幻象問題、數據安全四方面的問題,還有待解決。

  夢餉科技CTO曹均濤在接受《科創板日報》記者采訪時表示,雖然AI在電商行業的應用,想象空間非常大,夢餉也在通過GPT大模型重構業務場景,包括解決模特圖片生成、素材差異化、服裝秀、AI創作助手、聊天室導購等問題。

  “但是現在的階段,基礎設施并不完善?!辈芫鶟嬖V記者,夢餉在去年為創作者做了AI創作平臺,雖然能生成模特圖,但是成圖率并不高,還是需要技術升級和內部做技術提示詞、算法模型的調優,這個平臺到現在還沒有開放,“現在大家都在找應用場景,估計2024年開始能夠看到更多AI、大模型帶來的變化”。

  在42章經創始人曲凱看來,2024年仍會是技術上不斷突破的一年,很難真的做到大規模的落地和有非常多的場景,不過,不管是在B端還是C端,今年有望看到更多應用開始跑出來。與此同時,應用端的項目今年也將更受投資人青睞。

  “去年大家投了非常多資金和精力在大模型本身,要想將這個故事持續下去,就需要有落地,因此會在應用端繼續探索,找到PMF(Product Market Fit,產品市場匹配)?!鼻鷦P說。

  本文轉載自“ 財聯社”,智通財經編輯:李佛。

額 本文暫時沒人評論 來添加一個吧

發表評論

97超碰亚洲中文字幕一区-亚洲国产一区二区三区中文字幕-国产色在线?|?日韩-久久精品国产999久久久