![]()
出品|虎嗅科技組
作者|陳伊凡
編輯|苗正卿
頭圖|AI生成
這是虎嗅WAIC“追蹤Token商業(yè)新范式”系列文章第【03】期。
過去兩年,Token的生產(chǎn)成本一直在下降,但售價(jià)卻一直漲。
看起來前后矛盾的事,背后是一筆基于Token商業(yè)模式逐漸成熟而成立的生意。
硬件和模型,這幾年不斷優(yōu)化迭代,幾乎都指向同一個(gè)方向:更便宜的推理、更低廉的算力。
但另一面,是逐漸成熟的智能體以及已經(jīng)閉環(huán)的業(yè)務(wù)。“真正靠AI賺到錢的人,根本不會(huì)被價(jià)格勸退,只會(huì)默默想辦法降本。”夏立雪說,他幾乎沒有任何思考時(shí)間就下了這個(gè)判斷,似乎是已經(jīng)提前看明白了這個(gè)問題。他是無問芯穹的聯(lián)合創(chuàng)始人兼CEO。這家2023年成立的、與清華大學(xué)電子工程系有深厚淵源的公司,做的一部分事情,在行業(yè)里有一個(gè)越來越流行的說法:Token工廠。
可能很難在市場上找到對(duì)標(biāo)無問芯穹模式的公司,其卡住了一個(gè)此前未被發(fā)現(xiàn)的場景,或是長在了隨著AI需求拉動(dòng)而新誕生的結(jié)構(gòu)洞上的創(chuàng)新模式。它不研發(fā)通用大模型,不做芯片,也不做面向C端的應(yīng)用,它坐在芯片和模型之間,把供不應(yīng)求的算力資源進(jìn)行調(diào)度、匹配、優(yōu)化,更高效地轉(zhuǎn)化為Token,芯片廠商、模型廠商、應(yīng)用廠商等各方都需要在無問芯穹的Agentic Infra體系上集成,由無問芯穹進(jìn)行調(diào)度和分配,這是一種由技術(shù)領(lǐng)先的軟件與算法定義的商業(yè)模式。
這種特殊的模式讓無問芯穹比任何一個(gè)在Token產(chǎn)業(yè)鏈上的公司都能率先感知始于青萍之末的變化。
我在上海模速空間無問芯穹的會(huì)議室見到夏立雪,黑色的公司文化衫,語速極快,說到技術(shù)問題,似乎進(jìn)入一種“心流”狀態(tài)。模速空間是上海AI創(chuàng)新的核心,以無問芯穹為圓心的2公里,產(chǎn)業(yè)鏈的上下游在此匯聚。
![]()
夏立雪本人 圖片由無問芯穹提供
據(jù)公司今年5月披露,去年12月到今年4月底,無問芯穹的Agentic MaaS業(yè)務(wù)中,Token調(diào)用量增速超過20倍,這是過去從未有過的增長。
這個(gè)數(shù)字背后,是一件已經(jīng)成為現(xiàn)實(shí)的事:推理,正在成為比訓(xùn)練大得多的市場。
過去三年,AI產(chǎn)業(yè)的敘事主線是訓(xùn)練。誰有更多GPU,誰訓(xùn)練出更大的模型,誰就站在食物鏈頂端。算力競賽的邏輯清晰粗暴:堆卡、堆電力、堆錢。英偉達(dá)的H100在黑市上賣到六位數(shù)美元,甚至要靠提前囤貨。
但2025年底開始,這個(gè)邏輯變了。2026年推理的數(shù)據(jù)量首次超過了訓(xùn)練。根據(jù)國際數(shù)據(jù)機(jī)構(gòu)統(tǒng)計(jì),2026年全球企業(yè)在推理基礎(chǔ)設(shè)施上的資本支出預(yù)計(jì)達(dá)680億美元,而訓(xùn)練基礎(chǔ)設(shè)施支出為450億美元。
當(dāng)AI不再只是回答一個(gè)問題,而是要完成一項(xiàng)復(fù)雜的任務(wù):寫完整的代碼、審閱一份合同、持續(xù)跟進(jìn)一個(gè)項(xiàng)目,它消耗的Token數(shù)量是聊天場景的幾十倍甚至上百倍。無問芯穹的數(shù)據(jù)是,在其Agentic MaaS平臺(tái)調(diào)用的Token中,95%以上都是智能體場景。
推理需求的爆發(fā),正在把AI產(chǎn)業(yè)鏈的價(jià)值重心往下移。芯片制造商、模型公司、云服務(wù)商,每一層都在重新定價(jià),而位處中樞的基礎(chǔ)設(shè)施服務(wù)商,正在從“管道”變成“工廠”,又從工廠變?yōu)樵趦r(jià)值鏈擁有更大影響力的Token生產(chǎn)力轉(zhuǎn)化。
衡量這個(gè)工廠運(yùn)轉(zhuǎn)得好不好,無問芯穹內(nèi)部有一個(gè)指標(biāo):每月能產(chǎn)出多少有價(jià)值的萬億參數(shù)級(jí)模型的Token。這個(gè)指標(biāo)拆開來看,有兩個(gè)衡量標(biāo)準(zhǔn),一個(gè)是效率:單位時(shí)間的token產(chǎn)出量;另一半是穩(wěn)定性,系統(tǒng)能不能連續(xù)不宕機(jī)地跑下去。兩個(gè)指標(biāo),在萬億參數(shù)大模型場景下,無問芯穹過去一兩年實(shí)現(xiàn)了5到10倍的性價(jià)比提升。
在無問芯穹,有一個(gè)公式:AI生產(chǎn)力=智能規(guī)模*Token生產(chǎn)效率*Token價(jià)值轉(zhuǎn)化。
當(dāng)Token業(yè)務(wù)在產(chǎn)業(yè)中能實(shí)現(xiàn)商業(yè)化閉環(huán)的時(shí)候,就能為市場提供更充沛、更穩(wěn)定、更高性價(jià)比的優(yōu)質(zhì)Token,進(jìn)而在產(chǎn)業(yè)內(nèi)獲得口碑,吸引更多用戶使用。
拿到更多需求之后,也能提煉出更好的優(yōu)化空間,一方面是接觸到更多真實(shí)場景,可以明確不同優(yōu)化技術(shù)在場景中的價(jià)值;另一方面是需求足夠多的情況下,資源分配的調(diào)整空間更大,需求種類越豐富,和非同質(zhì)化資源的適配可能性就越多,M種模型乘以N種芯片的優(yōu)化空間也會(huì)越來越大。
這也解釋了為什么agent的崛起對(duì)無問芯穹是一個(gè)乘數(shù)效應(yīng),而非加法。
在這套公式下,飛輪正在轉(zhuǎn)動(dòng)。
推理需求爆發(fā),國產(chǎn)芯片和解決方案正在迎來全新的機(jī)會(huì),這件事與曾經(jīng)在這個(gè)領(lǐng)域常見的國產(chǎn)替代敘事截然不同。中國芯片廠商對(duì)成本的敏感和工程化的能力,正在為這個(gè)產(chǎn)業(yè)鏈帶來在全球市場角逐的競爭力。
AI算力市場的現(xiàn)實(shí)是:芯片種類越來越多,但沒有哪一張芯片能高效跑所有任務(wù);模型規(guī)模越來越大,單機(jī)八卡早就存不下萬億參數(shù)的模型,需要集群協(xié)作;不同的推理任務(wù),對(duì)延遲、吞吐量、精度的要求截然不同。這一切疊加在一起,讓“把算力用好”這件事,變成了一個(gè)極其復(fù)雜的系統(tǒng)工程問題。當(dāng)然,這也是中國工程化能力優(yōu)勢的體現(xiàn)。
這個(gè)判斷在推理側(cè),prefill和decode的分離上得到了具體驗(yàn)證。大模型推理分為兩個(gè)階段:prefill負(fù)責(zé)理解輸入、構(gòu)建上下文,計(jì)算密集;decode負(fù)責(zé)逐步生成輸出,通信密集、對(duì)延遲更敏感。兩種任務(wù)對(duì)芯片的要求完全不同。這是AI算力精細(xì)化需求下爆發(fā)出的新的場景。
依托團(tuán)隊(duì)長期在軟硬協(xié)同等方面的技術(shù)積累,無問芯穹很早就開始深度研究P/D分離,把兩類任務(wù)分配給更適合的芯片——國產(chǎn)芯片在prefill場景已經(jīng)可以落地,這意味著供不應(yīng)求的市場里,國產(chǎn)算力有了真實(shí)的著力點(diǎn),不再是非黑即白的“能不能用”,而是“在哪里用最合適”,甚至是“用好”。
無問芯穹以token作為其AI生產(chǎn)力公式的核心變量之一,是在2026年,這意味著整個(gè)公司的優(yōu)化目標(biāo),變?yōu)樵凇霸趺窗研酒脻M”的基礎(chǔ)上,還要解決“怎么讓每一個(gè)Token產(chǎn)生最大價(jià)值”——技術(shù)優(yōu)化節(jié)省的成本,直接轉(zhuǎn)化為毛利,再投入下一輪研發(fā),形成正向循環(huán)。Token,正在成為AI產(chǎn)業(yè)里最接近貨幣的單位。它可以被生產(chǎn)、被消耗、被定價(jià)、被交易。
更大的判斷,夏立雪用了一個(gè)類比:Token的爆發(fā),像極了移動(dòng)互聯(lián)網(wǎng)從3G到4G的階段。
但他補(bǔ)了一句,4G時(shí)代最重要的“應(yīng)用”不是微信,也不是淘寶,而是那些充分使用流量、敢于在流量便宜之后重新設(shè)計(jì)組織的公司。到了token時(shí)代,真正改變產(chǎn)業(yè)格局的未必是某一款殺手級(jí)AI應(yīng)用,而是那些用AI重構(gòu)內(nèi)部分工、讓人和AI真正協(xié)作起來的小型組織——十人、二十人,甚至一兩個(gè)人,但生產(chǎn)效率遠(yuǎn)超傳統(tǒng)同規(guī)模團(tuán)隊(duì)。
![]()
無問芯穹團(tuán)隊(duì)討論 圖片由無問芯穹提供
這類組織已經(jīng)在出現(xiàn)了。“現(xiàn)在不用擔(dān)心沒有應(yīng)用場景,核心是我們能不能接得住這么多需求。”
這句話引出了無問芯穹正在做的下一步:跳出純token工廠的邊界,開始介入Token的生產(chǎn)力轉(zhuǎn)化環(huán)節(jié)。
結(jié)構(gòu)洞上長出的創(chuàng)新模式
虎嗅:當(dāng)華為、中興等這些系統(tǒng)廠商他們也在用集群的方式提高Token的性價(jià)比,無問芯穹這個(gè)模式的壁壘在哪里?
夏立雪:表層的壁壘是我們在軟硬協(xié)同領(lǐng)域有充足的積累和成熟成果。我們是基于系統(tǒng)算法做硬件適配優(yōu)化,不針對(duì)單一硬件廠商或單一模型,能力可以覆蓋產(chǎn)業(yè)全生態(tài),是中立的第三方,技術(shù)適配性強(qiáng),在各類場景下都可以使用。
其次,我們的視野是面向整個(gè)供不應(yīng)求的產(chǎn)業(yè)做布局,把市場上所有芯片產(chǎn)能都作為優(yōu)化的輸入變量,最終實(shí)現(xiàn)讓整個(gè)生態(tài)中所有現(xiàn)有主體都發(fā)揮最大價(jià)值。這不是單點(diǎn)的一對(duì)一優(yōu)化,當(dāng)產(chǎn)業(yè)生態(tài)復(fù)雜度提升——比如出現(xiàn)多種模型、多種芯片并存的情況,我們這種大體系資源優(yōu)化能力就會(huì)形成生態(tài)層面的壁壘。
我們團(tuán)隊(duì)內(nèi)在的核心壁壘是始終跟進(jìn)業(yè)界最新的發(fā)展變化。此前做稠密模型和MoE優(yōu)化,之后又針對(duì)萬億參數(shù)模型難以在單一硬件上規(guī)模化擴(kuò)展的問題,很早就開始深度研究P/D分離和半分離相關(guān)技術(shù),目前也在研發(fā)可以差異化體現(xiàn)國產(chǎn)芯片能力的相關(guān)技術(shù)。
我們的壁壘不是單點(diǎn)的技術(shù)領(lǐng)先,而是系統(tǒng)化的、滾動(dòng)式的持續(xù)創(chuàng)新。
虎嗅:從芯片到模型之間存在中間優(yōu)化的空間,針對(duì)Token經(jīng)濟(jì)學(xué),不同廠商也提出了不同的解決方案,例如華為和一些芯片廠商提出的“超節(jié)點(diǎn)”的方法,以集群能力應(yīng)對(duì)單卡算力不足,從無問芯穹的立場,如何建立中間的優(yōu)化層?
夏立雪:現(xiàn)在是算法牽引系統(tǒng)、硬件和集群建設(shè)的時(shí)代,我們和芯片廠商有共同的目標(biāo),就是要實(shí)現(xiàn)真實(shí)的產(chǎn)業(yè)落地,只要各方能對(duì)接上、跑通業(yè)務(wù),就是好的生態(tài)。芯片廠商最核心的是要做好自己的“產(chǎn)品說明書”,而怎么把芯片這個(gè)復(fù)雜精密的硬件用好,是我們作為行業(yè)專家要做的事。現(xiàn)在國內(nèi)各種各樣的芯片都有類似CUDA的層,有CAN、SUCA、MARCA等不同的架構(gòu),我們的生態(tài)就是把這些架構(gòu)統(tǒng)一接入、調(diào)度、精細(xì)化管理和資源分配,保證服務(wù)穩(wěn)定,最終實(shí)現(xiàn)商業(yè)化閉環(huán)。
虎嗅:有沒有具體的數(shù)字說明客戶選擇你們的方案,在同等推理任務(wù)和同等效果下,Token成本下降了多少?穩(wěn)定性達(dá)到了什么程度?
夏立雪:比如在萬億參數(shù)規(guī)模的大模型場景下,我們實(shí)現(xiàn)的token每秒產(chǎn)能對(duì)應(yīng)的性價(jià)比和一兩年前相比已經(jīng)做到了五到十倍的下降,這是軟硬協(xié)同優(yōu)化帶來的運(yùn)行成本下降。
Token產(chǎn)能有兩個(gè)核心維度,一個(gè)是微觀運(yùn)行層面的生產(chǎn)效率,也就是單位時(shí)間內(nèi)的Token產(chǎn)出量;另一個(gè)是宏觀層面的穩(wěn)定性,避免頻繁停機(jī)維護(hù)導(dǎo)致實(shí)際產(chǎn)能下降。我們在這兩個(gè)指標(biāo)上都取得了很好的成果,最直接的證明就是客戶都在持續(xù)使用我們的服務(wù)。
虎嗅:內(nèi)部最看重的核心指標(biāo)是什么?
夏立雪:本質(zhì)上最終都會(huì)歸攏到單位時(shí)間內(nèi)的Token產(chǎn)出量,這是檢驗(yàn)優(yōu)化效果的唯一指標(biāo)。我們核心關(guān)注的是無問芯穹每月能夠產(chǎn)生多少有價(jià)值的萬億參數(shù)大模型的Token。
這個(gè)指標(biāo)下涵蓋兩個(gè)部分:一個(gè)是Token每秒的生產(chǎn)效率,另一個(gè)是可參與生產(chǎn)的資源規(guī)模。軟硬協(xié)同優(yōu)化中也包含大規(guī)模系統(tǒng)穩(wěn)定性的優(yōu)化,這點(diǎn)常常被忽略,但非常重要。
因?yàn)楫?dāng)我們從小而美的技術(shù)團(tuán)隊(duì)轉(zhuǎn)向系統(tǒng)服務(wù)商時(shí),需要為客戶交付大規(guī)模持續(xù)穩(wěn)定的業(yè)務(wù),規(guī)模的擴(kuò)張必須以穩(wěn)定性作為支撐。
虎嗅:2026年被認(rèn)為是推理大年,你們哪條業(yè)務(wù)線有明顯增速?
夏立雪:以公司Agentic MaaS平臺(tái)為例,從2025年年底到今年5月,Token調(diào)用量增速在20倍以上。而且這種增長是健康的結(jié)構(gòu)化增長,是多種需求同時(shí)存在、有分層結(jié)構(gòu)的增長,并非難以持續(xù)的單點(diǎn)增長。
現(xiàn)在整個(gè)模型產(chǎn)業(yè)的發(fā)展類似金字塔從底部向上突破,尖端應(yīng)用在不斷拓展新的需求領(lǐng)域,AI已經(jīng)可以實(shí)現(xiàn)寫代碼、做設(shè)計(jì)、做營銷,未來還可能覆蓋法律等場景。推理需求的快速增長帶動(dòng)了全產(chǎn)業(yè)鏈的健康發(fā)展,覆蓋模型公司、應(yīng)用公司、基礎(chǔ)設(shè)施服務(wù)商甚至芯片公司。
從這一年的經(jīng)驗(yàn)來看,全鏈路都完成數(shù)字化、所有信號(hào)都可以在數(shù)字世界閉環(huán)的任務(wù)和組織,會(huì)更快進(jìn)入自我閉環(huán)的迭代,也會(huì)最優(yōu)先吃到AI進(jìn)化帶來的紅利乃至利潤增長。人工智能本身擅長自我迭代,類似AlphaGo可以通過自我對(duì)弈實(shí)現(xiàn)快速進(jìn)化。
虎嗅:這些場景具體都是哪些?能舉幾個(gè)例子嗎?
夏立雪:比如代碼生成場景最早爆發(fā),一方面是研發(fā)人工智能的程序員本身最熟悉代碼場景,另一方面是代碼的提交、評(píng)審全流程都有數(shù)字化記錄,類似的還有線上營銷場景,相關(guān)流程都有數(shù)字世界的記錄。整體來看,上一波數(shù)字化轉(zhuǎn)型做得好的、或者互聯(lián)網(wǎng)時(shí)代原生的場景,需求增長都非常快。
如果按需求復(fù)雜度劃分,我們公司95%的需求都來自智能體場景,也就是由AI完成完整可交付的任務(wù),而非簡單的聊天需求,用戶更愿意為生產(chǎn)力和最終結(jié)果付費(fèi),這是產(chǎn)業(yè)落地的良性趨勢。現(xiàn)在在代碼生成這類賽道,已經(jīng)可以實(shí)現(xiàn)AI團(tuán)隊(duì)協(xié)作,不同的AI分別承擔(dān)代碼編寫、質(zhì)量保障的工作,形成最簡單的協(xié)作模式,這類場景已經(jīng)跑通,后續(xù)也會(huì)在其他行業(yè)逐步落地,當(dāng)前人工智能落地的節(jié)奏非常好,我們作為產(chǎn)業(yè)中資源打通的主體也會(huì)獲得對(duì)應(yīng)的價(jià)值。
虎嗅:這是年初OpenClaw出現(xiàn)之后帶來的拐點(diǎn)?
夏立雪:在OpenClaw推出之前相關(guān)需求就已經(jīng)出現(xiàn)了,OpenClaw是產(chǎn)業(yè)發(fā)展到一定階段孕育出的產(chǎn)品之一。核心原因是人工智能的智能性突破了臨界點(diǎn)——當(dāng)AI的智能性達(dá)到可以完成子任務(wù)、具備長上下文記憶能力的臨界點(diǎn)之后,才具備作為"大腦"指揮子任務(wù)完成管理工作的基礎(chǔ)。后續(xù)還會(huì)有更多針對(duì)不同場景的同類產(chǎn)品出現(xiàn)。
一個(gè)token工廠的生意飛輪
虎嗅:無問芯穹有一個(gè)公式:AI生產(chǎn)力=智能規(guī)模×Token生產(chǎn)效率×Token價(jià)值轉(zhuǎn)化,從無問芯穹的角度,這幾個(gè)變量里可以怎么賺到錢?無問在這個(gè)公式里,飛輪怎么轉(zhuǎn)起來?
夏立雪:Token業(yè)務(wù)在商業(yè)化能閉環(huán)的產(chǎn)業(yè)里,是非常好的模式。當(dāng)自身優(yōu)化能力足夠強(qiáng)的時(shí)候,就能為市場提供更充沛、更穩(wěn)定、更高性價(jià)比的優(yōu)質(zhì)Token,進(jìn)而在產(chǎn)業(yè)內(nèi)獲得口碑,吸引更多用戶使用。
拿到更多需求之后,也能提煉出更好的優(yōu)化空間,一方面是接觸到更多真實(shí)場景,可以明確不同優(yōu)化技術(shù)在場景中的價(jià)值;另一方面是需求足夠多的情況下,資源分配的調(diào)整空間更大,需求種類越豐富,和非同質(zhì)化資源的適配可能性就越多,M種模型乘N種芯片的優(yōu)化空間也會(huì)越來越大。
這兩點(diǎn)會(huì)使得接到的需求越多、可使用的資源能支撐的需求越多,優(yōu)化能力就越強(qiáng),優(yōu)化能力越強(qiáng)又能反過來提供更穩(wěn)定、更便宜、更充沛的服務(wù),吸引更多需求,飛輪就此轉(zhuǎn)動(dòng)。
虎嗅:這種算力精細(xì)化需求下催生的模式,無問芯穹的商業(yè)模式是按結(jié)果收費(fèi)還是case by case?
夏立雪:目前Token工廠的模式已經(jīng)比此前成熟很多,有更偏向結(jié)果的定價(jià)方式,就是按照Token計(jì)費(fèi),Token本身也有差異化,類似廣告行業(yè)的CPM計(jì)費(fèi)。現(xiàn)在Token已經(jīng)是非常貼近業(yè)務(wù)的定價(jià)指標(biāo),用戶可以直觀感知到token對(duì)應(yīng)的價(jià)值,不用關(guān)心底層用了什么芯片。
以Token作為結(jié)算維度有很多好處:一方面能讓整個(gè)賽道更關(guān)注AI產(chǎn)生的價(jià)值,而不是單純的資源,我們所有技術(shù)優(yōu)化節(jié)省的成本,都會(huì)提升公司的毛利率水平,可以再投入到新的技術(shù)研發(fā)里,形成正向的循環(huán);另一方面Token作為結(jié)算指標(biāo)也能很好地兼容跨行業(yè)的差異化,不用每個(gè)行業(yè)都做一套獨(dú)立的計(jì)價(jià)方式,更利于產(chǎn)業(yè)結(jié)構(gòu)的擴(kuò)展。
虎嗅:推理大年里,國產(chǎn)芯片的機(jī)會(huì)大嗎?
夏立雪:2026年行業(yè)內(nèi)大家都很看好,國產(chǎn)芯片的機(jī)會(huì)非常大。市場是健康的,各類需求都有缺口。現(xiàn)在的任務(wù)就是先把能填上的缺口填上。
虎嗅:推理需求進(jìn)一步分化,分為Prefill(預(yù)填充)和Decode(解碼),國產(chǎn)芯片的優(yōu)勢在這個(gè)細(xì)分需求里有差異嗎?
夏立雪:國產(chǎn)芯片已經(jīng)越過了“能不能用”的非黑即白,進(jìn)入了“好不好用”的性能較量階段。
其實(shí)現(xiàn)在的算力需求非常多樣化。比如,應(yīng)用端有對(duì)延時(shí)極度敏感的,也有相對(duì)包容的;模型端有萬億參數(shù)級(jí)別的極限挑戰(zhàn),也有千億參數(shù)就能高效解決的場景。
回到Prefill和Decode的細(xì)分。相對(duì)來說,Prefill更契合當(dāng)下國產(chǎn)芯片的能力狀態(tài)。因?yàn)樗怯?jì)算密集型任務(wù);而Decode階段不僅是訪存密集型,還對(duì)卡間通信帶寬、以及芯片底層的整體軟硬件生態(tài)提出了苛刻得多的要求。
虎嗅:如果拋開國產(chǎn)化敘事,無問芯穹的業(yè)務(wù)依然能增長這么好嗎?
夏立雪:到了2026年這個(gè)時(shí)間點(diǎn),中國市場和海外市場沒有根本的區(qū)別,整體都是健康的產(chǎn)業(yè)分配狀態(tài),也同時(shí)面臨著資源不夠用的現(xiàn)狀,并且在未來相當(dāng)長的時(shí)間,仍會(huì)供不應(yīng)求。我們公司所處的賽道核心,恰好是如何解決供不應(yīng)求的問題。
Token進(jìn)入5G階段,可能出現(xiàn)真正的AI型組織
虎嗅:你之前把Token的增長比成手機(jī)流量從3G到4G的階段。移動(dòng)互聯(lián)網(wǎng)時(shí)代的流量爆發(fā)帶來了微信或電商這樣的模式,進(jìn)入Token 4G甚至5G階段,最有可能爆發(fā)的AI應(yīng)用會(huì)是什么?
夏立雪:我覺得對(duì)應(yīng)的不是單一的業(yè)務(wù),而是AI型的組織。OPC是最近比較火的極致概念,一人公司大規(guī)模出現(xiàn)難度比較大,但十人、二十人或者幾個(gè)人的小公司,這類充分使用AI、人和AI充分合作的組織會(huì)大量爆發(fā),這才是Token流量進(jìn)入4G階段真正產(chǎn)生的核心“應(yīng)用”。
4G、5G時(shí)代的移動(dòng)應(yīng)用特點(diǎn)是大量使用流量,是基于流量充足的前提誕生的和以往不同的產(chǎn)品。對(duì)應(yīng)到AI領(lǐng)域,不是某類應(yīng)用會(huì)大量使用AI,而是某類組織會(huì)大量使用AI并創(chuàng)造出好的新作品。已經(jīng)完成數(shù)字化的賽道,會(huì)更早誕生這類原生AI化的機(jī)構(gòu)和組織。
虎嗅:這類AI智能組織現(xiàn)在已經(jīng)出現(xiàn)了嗎?
夏立雪:已經(jīng)有很多了,有很多很有趣的組織產(chǎn)生,大家會(huì)把AI用在工作的方方面面,而且這些組織里使用的不同AI之間還會(huì)交互,形成人與AI共生的組織形態(tài),這些組織創(chuàng)造的產(chǎn)品就是AI 4G時(shí)代最有趣的新興產(chǎn)品。
虎嗅:隨著AI快速發(fā)展,對(duì)無問芯穹來說最大的挑戰(zhàn)是什么?如果未來出現(xiàn)競爭對(duì)手,有可能是哪一類公司?
夏立雪:從人工智能整體發(fā)展來看,核心問題還是資源限制。表面看有兩個(gè)限制,一個(gè)是模型能不能突破到下一個(gè)范式,目前距離真正的AGI還有大概一到兩個(gè)范式的差距,而范式突破需要大量的訓(xùn)練資源和人員投入,最終還是回到資源問題。
我們認(rèn)為短期內(nèi)AI范式不會(huì)有根本性的突破,但目前AI已經(jīng)突破了可用的臨界點(diǎn),正在不斷拓展新的應(yīng)用場景,核心問題變成我們能不能接得住這么多需求。這取決于資源是否夠用、資源效率是否足夠高。
關(guān)于競爭對(duì)手,我認(rèn)為現(xiàn)在是需求大于供給的市場,遠(yuǎn)遠(yuǎn)沒到零和博弈階段。產(chǎn)業(yè)鏈有上下游分配,不同主體有不同的資源稟賦,橫向縱向都可以找到自己的市場空間,只要?jiǎng)?chuàng)造價(jià)值就能獲得收益,核心產(chǎn)業(yè)層面的競爭其實(shí)很稀薄,企業(yè)自身的發(fā)展才是最重要的。
虎嗅:如果AI進(jìn)入了下一個(gè)范式,當(dāng)前的商業(yè)模式依然成立嗎?
夏立雪:AI范式不會(huì)出現(xiàn)跳變,就像5G出來之后4G技術(shù)依然有應(yīng)用場景,會(huì)有一個(gè)過渡的節(jié)奏。如果范式突破帶來新的基礎(chǔ)設(shè)施變化,反而會(huì)產(chǎn)生新的機(jī)會(huì)和發(fā)展空間,我們不怕事情難——無問芯穹的技術(shù)團(tuán)隊(duì)從一開始就是奔著解決最難的技術(shù)問題去的,并且找到了很好的TMF(技術(shù)-市場適配)。
虎嗅:Token相關(guān)產(chǎn)業(yè)什么時(shí)候能迎來類似通信領(lǐng)域5G的拐點(diǎn)?
夏立雪:用通信領(lǐng)域4G、5G的劃分來類比AI產(chǎn)業(yè)不是特別合適,下一個(gè)時(shí)代的跳變有兩種可能性。一種是模型真的發(fā)生范式變化,但這種變化是什么目前沒有人能夠預(yù)測。第二種是模型的成本降到足夠低,現(xiàn)在計(jì)費(fèi)方式已經(jīng)從千Token多少錢降到百萬Token多少錢,如果成本再下降一到兩個(gè)數(shù)量級(jí),就會(huì)出現(xiàn)類似流量包、包月的概念,屆時(shí)整個(gè)產(chǎn)業(yè)的付費(fèi)模式會(huì)發(fā)生質(zhì)變。
成本下降1-2個(gè)數(shù)量級(jí)是有可行路徑的,核心是更深層次的軟硬件結(jié)合,對(duì)模型結(jié)構(gòu)、模型組合和硬件結(jié)構(gòu)都進(jìn)行調(diào)整,提升兩者的匹配度,還有1-2個(gè)量級(jí)的優(yōu)化空間。我們一方面會(huì)在成本下降1-2個(gè)數(shù)量級(jí)的過程中創(chuàng)造價(jià)值,另一方面也在提前做布局,推出匹配未來新的生產(chǎn)關(guān)系和商業(yè)模式的新產(chǎn)品和新能力。
AI 行業(yè)開始認(rèn)真算賬了。不是只看模型能力,而是看 AI 是否真正進(jìn)入業(yè)務(wù)、產(chǎn)生結(jié)果、跑出回報(bào)。
這也是虎嗅想追問的:錢燒哪了?干成啥了?賺還是虧了?能復(fù)用嗎?
圍繞這四問,我們將深度對(duì)話AI產(chǎn)業(yè)鏈條上的重要公司,沉淀AI賬本樣本庫;還將在7月WAIC期間推出系列直播、閉門會(huì),與企業(yè)關(guān)鍵決策者共探AI生意。
詳情請(qǐng)戳,一起見證AI時(shí)代商業(yè)落地的真實(shí)變化。
![]()
本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4867715.html?f=wyxwapp
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.