<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      DeepSeek塞進蘋果本兒,分幣不花實現“龍蝦自由”

      0
      分享至



      在agent時代最貴的是什么?是token。

      一些重度agent使用者,一個月用掉幾億token,賬單小幾萬塊錢也是常有的事。

      然而現在開始,有這么一個開發者他開源了一個本地方案,一臺蘋果筆記本就能部署,也就是說,你從此實現了“龍蝦自由”,跑再多任務,也不會再為token付出一分錢了。最關鍵的是,他用的還是DeeSeek V4 Falsh。

      幾天前,antirez在GitHub上發布了一個項目,叫ds4。

      這是一個專門為DeepSeek V4 Flash寫的推理引擎。一共幾千行C代碼,可以讓DeepSeek V4 Flash這個模型在128G內存的蘋果電腦上跑起來。

      開發者antirez,本名Salvatore Sanfilippo,是意大利程序員,同時他也是開源數據庫Redis的原作者。Redis后來成為全球互聯網基礎設施里最常用的內存數據庫之一。

      往好的方面去想,DeepSeek影響力足夠大,吸引到了圈內頂流的程序員,但是壞的方面是,DeepSeek這回真的免費了。

      任何開發者都可以用ds4,去把DeepSeek V4 Flash裝進自己的MacBook Pro里,本地跑代碼、本地讀上下文、本地做agent任務,而這一切的一切,不需要給DeepSeek付1分錢。

      雖然DeepSeek V4 Flash本身開源,可FP16精度的原始模型要吃掉284G內存,顯存需求更是高達160G。

      因此,想運行它,你至少得有兩張英偉達A100 80GB、一條512GB DDR5 ECC內存,以及一個4TB NVMe SSD。總成本50萬人民幣。

      而現在,一臺3萬塊錢的MacBook Pro就能跑。

      那antirez為什么偏偏選中DeepSeek V4 Flash呢?

      原因是DeepSeek最適合被“塞進本地電腦”。

      它有284B總參數,足夠大;但每次推理只激活13B參數,又不像傳統大模型那樣沉重。

      它支持100萬token上下文,適合編程助手這種長任務;同時KV cache壓縮得足夠狠,給本地內存和SSD留下了操作空間。

      DeepSeek V4 Flash剛好站在了這樣一個神奇的平衡點上,既大到值得折騰,又小到能被塞進蘋果筆記本里。



      YC的CEO Garry Tan在X上轉了這條消息,只打了一行字:正在下載……100萬token上下文窗口,可用的編程助手能力,全在一臺128GB的MacBook Pro上,太瘋狂了。

      01

      ds4究竟是什么?

      先說結論,ds4不是一個模型,它是一臺“專用發動機”。DeepSeek V4 Flash是車,蘋果電腦是路,ds4負責把這輛原本更適合跑在云端的大車,改到本地機器上能跑、能接API、還能被coding agent調用。



      過去大家想在自己電腦上跑大模型,普遍用的都是llama.cpp這個工具。它的好處是什么模型都能跑,Llama、Qwen、DeepSeek全都支持。

      可問題就是,什么都能跑,就意味著什么都跑不到最快。為了照顧所有模型,llama.cpp必須做很多妥協,性能上不可能做到極致。

      antirez的想法正好相反,他才不管別的模型死活,他就專門伺候DeepSeek V4 Flash這一個,把它優化到極限。

      他一共做了3件事。

      第一件事,是不對稱的2-bit量化。

      DeepSeek V4 Flash的架構是MoE(Mixture of Experts),284B總參數里,每次推理只激活13B,這13B是路由挑出來的若干個專家子網絡。

      就像一個工具箱里有284把工具,每次只拿出13把來用。這284B里面,有一大堆“備選專家”占了90%以上的空間,但它們不是每次都用,只是候補。

      antirez的做法是,只對這批routed experts做激進的2-bit量化,up和gate矩陣用IQ2_XXS,down矩陣用Q2_K,而模型里所有關鍵路徑上的組件,包括shared experts、projections、routing網絡,全部保持原始精度不動。

      也就是說,antirez把這些“候補專家”狠狠壓縮,壓到只剩原來1/4的大小,但那些每次都要用的核心組件,一點都不動,保持原樣。

      這是一種不對稱的壓縮策略,砍掉體積大頭,保住質量命脈。

      第二件事,是把KV Cache搬到SSD上。

      DeepSeek V4 Flash支持100萬token的上下文,這相當于你可以把一整本小說扔給它,它能全記住。

      但這么長的上下文,意味著AI在工作時要不停地回頭翻看前面的內容。為了讓這個“回頭翻看”的動作不至于慢到卡死,AI需要把這些內容暫存在一個叫“緩存”的地方,方便隨時調用。

      以前的做法是把這個緩存放在內存里。內存速度快,AI每次生成一個字都要頻繁查這個緩存,所以必須放內存。

      但問題是,如果讓128GB內存的MacBook Pro跑DeepSeek-V4 Flash,光緩存就能把內存吃光,模型本身都沒地方放了。

      所以antirez的做法是直接把緩存扔到硬盤(SSD)上。ds4把一部分KV狀態做成可落盤、可恢復的緩存,讓長提示詞和agent反復續寫時,不必每次從頭處理。

      這聽起來有點離譜,因為硬盤比內存慢多了。

      然而現代Mac SSD足夠快,適合做KV緩存持久化和恢復。加上DeepSeek V4 Flash本身對緩存做過壓縮,讀寫量不大,所以硬盤完全頂得住。

      結果就是內存省出來了,100萬token的超長對話真的在一臺MacBook上跑起來了。

      不過這不等于128GB MacBook可以毫無壓力地把100萬token全部拉滿。

      按照ds4自己的說明,2-bit模型本身已經要占掉大約80GB級別的內存,真正日常使用時,100k到300k上下文會更現實一點。

      第三件事,是純Metal原生路徑。

      antirez把所有優化都押在蘋果電腦的GPU上。

      因此他專門為蘋果芯片寫了一套代碼,讓DeepSeek V4 Flash能在蘋果電腦上跑得飛快。

      至于CPU,并不是這個項目的重點。README里也寫得很直白,CPU模式目前還不穩定,甚至可能觸發系統崩潰。antirez進一步表示,如果有人真想走這條路,后續大概還得靠社區來補救。

      在M3 Max 128GB的MacBook Pro上,實測速度是每秒能生成26個字左右。M3 Ultra 512GB的Mac Studio上能跑到每秒36個字。

      不算快,但寫代碼、調試這些日常工作完全夠用。

      更有意思的是,antirez是獨自一人通過GPT-5.5完成的整個這個項目。

      02

      利好DeepSeek

      根據外媒報道,DeepSeek目前正在尋求高達73.5億美元的融資,梁文鋒現在就處在這個關鍵的轉折點上,用商業敘事取代DeepSeek過往的技術敘事。

      那投資人看什么?不只是看模型跑分,不只是看API調用量,更看生態位和不可替代性。

      一個海外知名開發大佬,愿意為你的模型寫專用引擎,這本身就說明DeepSeek在海外有著一定的生態地位。

      過去一年,中國開源模型的出海敘事里,主流衡量標準是benchmark,MMLU、HumanEval、SWE-bench,一串又一串的數字。

      但有人愿意圍繞你做二次工程,才代表你的模型被認可了。Anthropic用千問做實驗,Cursor蒸餾Kimi,這種認可比分數更值錢。

      antirez不是AI圈里那種什么新模型都要試一遍的博主

      他選一個模型,然后還要花幾周的時間去寫專用推理引擎、做特制量化、搭HTTP服務層、做agent集成測試,顯然是他認為DeepSeek值得。

      這就變相等于,一個有信譽的第三方,在用自己的時間和名聲給DeepSeek-V4背書。

      說到國產模型出海,目前我能想到的路有兩條。

      一條是API被調用。你提供服務,別人付費使用,你是service provider,客戶是consumer。

      這條路很直接,也很現實,別人可以隨時切換,你無時無刻都得對抗你的競品,從性能到價格。

      另一條是模型被改造。有人把你的權重拿走,做量化、做蒸餾、做專用runtime、做本地部署、做agent工具鏈。在這條路里,你的模型成了材料。

      材料和服務的區別在于,材料會被嵌入到別人的工具鏈里,然后就很難被換掉了。

      舉個例子,某個開發者把ds4集成到自己的coding agent里,寫了一堆配置文件、調試腳本、自動化流程。他的團隊成員也都習慣了這套工具,公司的代碼庫里到處都是基于DeepSeek本地推理的調用。

      這時候如果要換成別的模型,就不是“改個API key”那么簡單了,而是要重新適配引擎、重寫腳本、重新培訓團隊習慣。成本太高,大概率就不換了。

      這就是“被嵌入”的性。

      ds4把DeepSeek V4 Flash嵌進了Metal原生本地推理這個場景。截至發稿,Hugging Face上antirez那個deepseek-v4-gguf倉庫,就已經有25000次下載了。



      每一次下載,都意味著有人在自己的機器上跑起了DeepSeek,粘性也就這么一點一點的建立起來了。

      更值得注意的是連鎖效應。

      Hacker News上有這樣一條高贊評論,他說如果以后針對精確的GPU加模型組合構建超優化推理引擎會怎樣?GPU越來越貴,抽象層去掉得越多,優化空間就越大。

      這個方向一旦被驗證,意味著每一代有分量的開源模型發布時,都會有人跳出來給它做專屬引擎、專屬量化、專屬agent接入。

      相當于是每一代模型都應該有一個自己的“antirez”,開發出一個自己的“ds4”。

      DeepSeek V4 Flash正好踩在了這個起點上。

      如果這套邏輯成立,那么后續每個V4 Flash的小版本迭代,都會天然地被嵌入到這個“一代模型配一個專用引擎”的循環里。

      梁文鋒成了第一個吃螃蟹的人。

      DeepSeek也從一個模型品牌,變成海外開發者手里的基礎設施材料。

      對于現階段的DeepSeek來說,這種“升維”非常重要。

      03

      焉知非福

      講完了利好,必須講另一面。

      目前來看,DeepSeek的核心商業化路徑是API。開發者調用,按token付費,薄利多銷。

      這是DeepSeek最擅長的打法。

      但ds4這種項目,本質上是在“勸退”一部分API用戶。

      你可以這么來理解,一個獨立開發者或者小團隊,過去用Claude Code或者DeepSeek的API跑coding agent。coding agent是高token消耗場景,長上下文、多輪對話、頻繁工具調用、反復重試。

      按token計費的話,一個重度agent的開發者每個月可能要花幾千塊錢的token費用。

      然而現在他面前出現了另一個選項。

      花幾萬塊錢買一臺128GB的MacBook Pro,然后跑ds4。

      前期投入一次,之后推理沒有邊際成本,數據不出本地,延遲完全可控。

      外網論壇上有個開發者分享了他的方法:日常寫代碼、改bug這些簡單任務,全扔給本地的ds4跑,不花錢。只有遇到復雜的架構設計問題,才切換到云端的DeepSeek V4-Pro或者Claude Opus。

      高token消耗的部分被本地化了,只有少量高價值調用還留在云端。

      相當于一分錢沒有給到DeepSeek,卻在絕大多數時間都在使用DeepSeek。

      同時,antirez采用的量化方法也是有“坑”的。

      即使是不對稱量化策略,只壓MoE專家不壓關鍵路徑,也不可能完全沒有質量損失。

      外網論壇上已經有人發出了測試結果,ds4本地量化版本在超2000行代碼的文件里偶爾丟失變量作用域,幻覺略多,MoE路由層對量化噪聲尤其敏感。

      這就引出了另一個更麻煩的問題,叫做體驗解釋權。

      就像DeepSeek服務器崩了,我不知道是為什么崩的,我只會覺得是DeepSeek不行。

      用戶調用DeepSeek官方API,如果效果不好,他大概率會認為是DeepSeek自己的問題。但用戶在本地跑ds4時,面對的是2-bit量化、Metal runtime、SSD KV cache、上下文截斷、agent配置等一整套變量。

      這里面任何一個環節出問題,最后往往被歸因到“DeepSeek不行”。

      別人幫你擴散模型,但他并不會幫你去維護口碑,主要是人家也沒這義務。

      更深一層看,“成為材料”和“成為平臺”是完全不同的兩件事,梁文鋒更想要的是后者,可是ds4卻讓DeepSeek成為了前者。

      材料只會被嵌入別人的工具鏈,不能為DeepSeek提供商業閉環,只有平臺才掌握分發、計費、賬戶、數據、開發者關系和升級節奏。

      DeepSeek如果只是提供權重,被antirez、Cursor、各種本地agent和第三方runtime拿去改造,它當然獲得了名聲。不過真正能留住用戶的人,可能是那些工具鏈的開發者。

      這就是開源模型的悖論。

      模型越成功,越容易成為別人的底層能力;但底層能力如果沒有抓住開發者的入口,就有可能被上層產品吃掉大部分商業價值。

      所以ds4對DeepSeek不是簡單的好消息,也不是壞消息。

      可以肯定的是,對于DeepSeek來說,他們又有故事可以講給投資人聽了。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      中印新一輪較量開始!這一次印軍先下手為強,要堵巴鐵潛艇回家路

      中印新一輪較量開始!這一次印軍先下手為強,要堵巴鐵潛艇回家路

      可樂愛微笑
      2026-06-03 05:25:42
      好消息,天大的好消息,你徹底好了,而且好得讓人想放鞭炮!

      好消息,天大的好消息,你徹底好了,而且好得讓人想放鞭炮!

      趣味萌寵的日常
      2026-06-03 17:08:32
      抗議無效!

      抗議無效!

      安安說
      2026-06-04 11:19:49
      性侵迷局:雙方在車內有親密行為,女方收取30萬元后多次改口稱“自愿”,法院一審認定強奸罪成立

      性侵迷局:雙方在車內有親密行為,女方收取30萬元后多次改口稱“自愿”,法院一審認定強奸罪成立

      大風新聞
      2026-05-17 09:52:05
      當年20萬的“宇宙神車”,如今只要1萬多,二手油車徹底崩了

      當年20萬的“宇宙神車”,如今只要1萬多,二手油車徹底崩了

      閑搞機
      2026-06-04 11:07:25
      他曾擔任中央辦公廳代主任,大肆迫害年邁的彭老總,后被判刑18年

      他曾擔任中央辦公廳代主任,大肆迫害年邁的彭老總,后被判刑18年

      輿圖看世界
      2026-06-03 06:45:03
      悲劇還是發生了!機器人突然轉身,一腳精準踢向旁邊小男孩!

      悲劇還是發生了!機器人突然轉身,一腳精準踢向旁邊小男孩!

      阿振觀點
      2026-06-04 09:21:54
      我如今已68了,以親身血淚教訓告訴你:不要跟任何人,包括你的父母、子女、枕邊人,分享這兩件事

      我如今已68了,以親身血淚教訓告訴你:不要跟任何人,包括你的父母、子女、枕邊人,分享這兩件事

      心理觀察局
      2026-05-23 07:00:06
      追夢:交易霍姆格倫過于瘋狂 雷霆會否交易被戲稱為“文玩”的他?

      追夢:交易霍姆格倫過于瘋狂 雷霆會否交易被戲稱為“文玩”的他?

      仰臥撐FTUer
      2026-06-04 10:03:24
      “斬首”計劃意外成功,伊朗新目標落地僅一天,美軍再次發動突襲

      “斬首”計劃意外成功,伊朗新目標落地僅一天,美軍再次發動突襲

      尋墨閣
      2026-06-03 00:10:49
      徐志勝女友曝光,長相漂亮學歷高,見父母婚期將至,還是他的初戀

      徐志勝女友曝光,長相漂亮學歷高,見父母婚期將至,還是他的初戀

      庭小娛
      2026-06-01 15:20:06
      大年夜婆婆甩我10塊叫滾,當晚全家被物業請出門,打88個電話求我

      大年夜婆婆甩我10塊叫滾,當晚全家被物業請出門,打88個電話求我

      曉艾故事匯
      2026-06-03 10:17:40
      賴清德對日菲軟弱卻搞“抗中”,港媒:民眾只會更加反感

      賴清德對日菲軟弱卻搞“抗中”,港媒:民眾只會更加反感

      海峽導報社
      2026-06-04 12:10:03
      馬刺300萬先生險成奇兵!尚帕尼空砍5記三分連創紀錄 獲贊無名英雄

      馬刺300萬先生險成奇兵!尚帕尼空砍5記三分連創紀錄 獲贊無名英雄

      夢憶之淺
      2026-06-04 12:25:12
      A股:緊急提醒2.5億股民!從今天6月4日起,A股或將再次歷史重演?

      A股:緊急提醒2.5億股民!從今天6月4日起,A股或將再次歷史重演?

      趨勢清風俠
      2026-06-04 07:10:02
      官宣!曼聯中鋒離隊,美媒披露,格雷澤有意出售球隊

      官宣!曼聯中鋒離隊,美媒披露,格雷澤有意出售球隊

      嗨皮看球
      2026-06-04 11:12:16
      當不成總統了?特朗普體檢報告被曝,快80歲的他,或將被迫下臺

      當不成總統了?特朗普體檢報告被曝,快80歲的他,或將被迫下臺

      人間無味啊
      2026-06-04 00:38:33
      現身廣東摘荔枝的張家齊,揭開退役后真實處境,全紅嬋果然沒說錯

      現身廣東摘荔枝的張家齊,揭開退役后真實處境,全紅嬋果然沒說錯

      眼底星碎
      2026-06-04 04:54:28
      印度極限高溫,“每天熱死3000人”

      印度極限高溫,“每天熱死3000人”

      半島官網
      2026-06-04 09:31:14
      美軍第五艦隊總部被炸!伊朗攤牌:霸權時代結束,全面戰爭你敢接

      美軍第五艦隊總部被炸!伊朗攤牌:霸權時代結束,全面戰爭你敢接

      滕哥說評
      2026-06-04 08:51:06
      2026-06-04 13:03:00
      字母榜 incentive-icons
      字母榜
      讓未來不止于大。
      2513文章數 8064關注度
      往期回顧 全部

      科技要聞

      歷史最大IPO!馬斯克下周沖擊萬億富豪

      頭條要聞

      男子帶20萬練功券約見女主播 發生關系后騙走對方1萬

      頭條要聞

      男子帶20萬練功券約見女主播 發生關系后騙走對方1萬

      體育要聞

      王俊杰11前板成第一尖刀 媒體人:獨一檔

      娛樂要聞

      奚夢瑤頭紗上的古董發卡也是四太的

      財經要聞

      SpaceX發行價135美元 6月12日上市交易

      汽車要聞

      北京現代5月銷量強勢反彈:國內17065輛 出口環比翻倍

      態度原創

      健康
      親子
      游戲
      家居
      軍事航空

      違規干細胞抗衰美容,為何肆無忌憚

      親子要聞

      ?閃閃小葵花,成長正當時? 「尋找閃亮小主角」闖關合集上線!小手勇闖趣味關卡,留住玩耍美好時光!

      《幸福工廠》更新1.2上線 好評開放世界工廠建設

      家居要聞

      220平對味兒家 空間情緒宅

      軍事要聞

      美眾議院要求特朗普停止對伊動武并撤軍

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 高清中文字幕一区二区| 国产亚洲精品福利片| 亚洲日韩久久综合中文字幕| 成人污视频| 亚洲中文字幕版| 国产精品久久久一区二区| 亚洲日本在线va中文字幕| 成人网站免费观看永久视频下载 | 在线亚洲视频网站www色| 亚洲国产日韩a在线播放性色| 亚洲国产精品线播放| jizzjizzyou| 人妻少妇偷人无码视频| 成人中文在线| 黄片av毛片在线观看| 一本色道久久综合精品婷婷| 日韩中文字幕在线观看| 99视频都是精品热在线播放| 黑人异族巨大巨大巨粗| 国产免费又黄又爽又色毛| 精品合集播放| 无码中出人妻| 97精品久久九九中文字幕| 亚洲国产成人无码av在线影院 | 手机在线观看不卡av| 性中国videossexo另类| 日本无人区一区二区三区| 国产中文字幕在线精品| 成人一二三| 欧洲天堂网| 人妻av一区二区三区| 国产精品久久精品久久精品久久| brazzers欧美巨大| 久久亚洲色www成人| 奶头好大揉着好爽视频| 国产91成人亚洲综合在线 | 欧美在线观看免费做受视频| 亚洲色综网| 欧美极品色午夜在线视频| 国产真人无遮挡免费视频| 人人妻人人澡人人爽久久av|