<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      DeepSeek開眼!核心技術全公開,推理范式大顛覆

      0
      分享至



      4月底,國產大模型DeepSeek悄悄上線灰度識圖模式,一夜之間,這個曾專注文本推理的AI,終于擁有了“看懂世界”的能力。4月30日,其官方發布技術報告《用視覺原語思考》,揭開了這款多模態模型的神秘面紗。不同于行業內堆砌分辨率、追求“看得清”的常規思路,DeepSeek另辟蹊徑,讓AI學會“邊想邊指”,用空間坐標錨定思維,在復雜視覺推理任務中實現對GPT-5.4、Gemini-3-Flash等頂尖模型的反超。這場技術革新,不僅是多模態賽道的一次彎道超車,更在探索AI“系統二級”智能的新路徑。



      一、打破“指代鴻溝”:從“純語言空想”到“邊指邊想”

      長期以來,多模態大模型的研發重心都在“感知鴻溝”上——通過更高清的圖像切分、更精細的動態分塊,讓AI看清圖片里的每一個細節。但DeepSeek團隊發現,就算把感知做到極致,AI在復雜視覺推理中依然容易“崩潰”,核心問題在于自然語言的“指代鴻溝”。



      簡單說,當你對AI說“左邊那個紅色物體”,在擁擠的畫面里,“左邊”“那個”到底指什么,AI根本沒法精準鎖定。純語言思維鏈看似連貫,每一步都可能跑偏,一旦遇到密集計數、迷宮導航、多步空間推理這類任務,邏輯鏈條就會徹底崩塌。

      為了破解這個難題,DeepSeek給出了顛覆性方案:把語言推理升級為“語言邏輯+空間坐標”的雙軌思維。讓AI思考時不再只靠文字,而是像人一樣,用點和框在圖上“指出來”,把這些視覺原語變成思維的基本單元。

      它的工作邏輯很直觀:用戶上傳圖片后,DeepSeek-ViT先把圖像轉為視覺特征,文本分詞器處理文字指令,兩者輸入基座模型DeepSeek-V4-Flash融合推理,最終輸出文字+坐標框/點的聯合響應。比如推理時,AI會先框出圖中的目標,后續每一步思考都引用這個框定的“視覺錨點”,基于空間位置做判斷,徹底解決指代模糊的問題。

      二、4000萬數據淬煉:讓AI學會“精準指向”

      想法很創新,但要讓AI真正“學會指”,并把這個動作變成思維習慣,離不開海量高質量數據和針對性訓練。DeepSeek團隊為此搭建了“預訓練-冷啟動-強化學習”的完整訓練流水線,每一步都精準發力。

      1.預訓練:篩選4000萬優質樣本打基礎

      預訓練階段,團隊從互聯網爬取近10萬個目標檢測相關數據源,用嚴格的自動化審查機制過濾低質量數據——亂碼標簽、覆蓋全圖的“巨型框”、模糊不清的標注全部剔除,最終篩選出3萬多個高質量數據源,提煉出超4000萬個精準樣本。這批數據先讓AI掌握基礎的定位能力,知道“該指哪里”。

      2.冷啟動:四類任務專項練“推理”

      有了基礎能力后,團隊針對計數、空間推理、迷宮導航、路徑追蹤這四類最考驗視覺原語的任務,合成了帶精確思考軌跡的冷啟動數據,手把手教AI“怎么邊指邊推理”。

      計數任務:要求AI先批量框出所有候選物體,再逐個校驗、累加,避免漏數、重復數;

      迷宮任務:每一步探索都要輸出點坐標標記位置,撞墻就回溯,學會一步步規劃路徑。

      這種訓練讓AI在起步階段就建立“指向-推理”的強關聯,不是靠猜答案,而是靠精準的視覺定位推導結論。



      3.強化學習:稠密獎勵逼AI“認真指”

      冷啟動后的模型,再通過“訓練專家再融合”策略精細化打磨。核心創新是稠密獎勵機制,不再只看最終答案對錯,而是把獎勵拆成多個維度:

      迷宮任務:探索進度、不撞墻、路徑有效都給正向獎勵,哪怕答案對了,中途撞墻也會扣分;

      計數任務:框選精準、校驗嚴謹才得分,模糊標注直接懲罰。

      同時,團隊還分別訓練了“框定位”和“點指向”兩個專家模型,再用在線策略蒸餾融合,避免兩種能力互相干擾。這套機制讓AI必須認真對待每一個坐標、每一個框,沒法靠“蒙混過關”拿獎勵。

      三、7000倍壓縮:高效推理的“輕量密碼”

      讓AI“邊指邊想”解決了推理準度問題,但新的挑戰來了:高清圖片像素海量,直接處理會讓推理變得又慢又耗資源。DeepSeek的解決方案,是一套超高效的視覺編碼壓縮架構,把“笨重”的圖像數據,變成AI能快速處理的“精簡索引”。



      壓縮過程分三步走,以756×756分辨率的圖片為例:

      ViT切分:把圖片切成14×14的小塊,生成2916個視覺token;

      空間壓縮:將每9個相鄰token合并成1個,數量驟降;

      稀疏注意力壓縮:底座模型再將KV緩存中的視覺條目壓縮4倍。

      最終,2916個原始token只保留81個視覺條目,整體壓縮比高達7056倍。這意味著AI推理時,不用在海量像素里反復找信息,每一步思考都很“輕量”,復雜空間推理也能高效完成。

      這種高效率帶來了直觀體驗:實測中,DeepSeek識圖模式分“思考/非思考”雙模式。非思考模式秒回答案,適合簡單識別;開啟深度思考后,能攻克空間拼圖、復雜場景解析等難題,雖然耗時稍長,但推理邏輯清晰、準確率大幅提升。



      四、能力碾壓與邊界:多模態智能的新起點

      技術的突破直接體現在性能上。在高難度視覺QA任務測試中,這款284B參數、13B激活的多模態模型,全面超越GPT-5.4、Claude-Sonnet-4.6、Gemini-3-Flash、Qwen3-VL等主流頂尖模型,成為視覺推理賽道的新標桿。



      實際測試中,它的表現同樣亮眼:能精準識別兔子品種、描述姿態;僅憑靈隱寺路燈上的草書字樣和建筑風格,就能鎖定地理位置并給出精確經緯度;解析無文字提示的風景照時,能從植被、建筑、山脈輪廓一步步推導拍攝地,誤差不到十公里。

      當然,這項技術仍有邊界:復雜拓撲推理的跨場景泛化能力不足,視覺基元的激活還需依賴觸發詞,沒法完全自發調用。但這不妨礙它成為多模態領域的里程碑——DeepSeek沒有跟著行業卷分辨率,而是換了個思路,用空間坐標錨定抽象思維,探索出了一條通往“系統二級”多模態智能的新路徑。

      從純文本推理到圖文雙軌交互,DeepSeek的識圖模式,是國產大模型在多模態賽道的一次關鍵突破。它讓我們看到,AI的視覺智能,不只是“看得清”,更要“想得明白”——像人一樣,用手指著目標,一步步理清邏輯。

      未來,隨著權重整合進基礎模型并正式發布,這套技術或將徹底改變AI識圖的應用場景:從日常的圖片解析、信息提取,到專業的工業質檢、地理測繪、科研分析,都能用上精準、高效的視覺推理能力。而DeepSeek的“指物思考”之路,也為整個行業提供了新方向:多模態智能的終極目標,從來不是模仿人類的眼睛,而是模仿人類的思維方式。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      周三你需要知道的隔夜全球要聞:美股光通信板塊領漲、邁威爾科技大漲超32%;英偉達與微軟共同推出統一技術棧用于部署Agentic AI;歐央行報告顯示黃金...

      周三你需要知道的隔夜全球要聞:美股光通信板塊領漲、邁威爾科技大漲超32%;英偉達與微軟共同推出統一技術棧用于部署Agentic AI;歐央行報告顯示黃金...

      財聯社
      2026-06-03 06:02:08
      深圳K11店員譏諷顧客窮逛后續:臉丟光,工作沒了,商場慘遭牽連

      深圳K11店員譏諷顧客窮逛后續:臉丟光,工作沒了,商場慘遭牽連

      老特有話說
      2026-06-02 21:21:03
      官網公布FMVP排行榜:文班居首布倫森第二 卡斯爾第四哈珀第六

      官網公布FMVP排行榜:文班居首布倫森第二 卡斯爾第四哈珀第六

      羅說NBA
      2026-06-03 06:20:55
      上海丟G4發布會!盧偉表揚球員,拒談判罰問題!弗格主動攬責!

      上海丟G4發布會!盧偉表揚球員,拒談判罰問題!弗格主動攬責!

      籃球資訊達人
      2026-06-02 22:41:44
      重大外交挫折:卡塔爾拒絕給120億美元,伊朗談判底牌被當場按住

      重大外交挫折:卡塔爾拒絕給120億美元,伊朗談判底牌被當場按住

      流史歲月
      2026-06-02 17:10:03
      李楠已任中國農業發展銀行黨委委員

      李楠已任中國農業發展銀行黨委委員

      澎湃新聞
      2026-06-02 19:02:26
      真人短劇付費日大盤已不足4000萬!

      真人短劇付費日大盤已不足4000萬!

      新腕兒
      2026-06-01 10:50:12
      055和基洛夫并排的對比圖,我才驚覺軍艦設計已經隔了一個時代

      055和基洛夫并排的對比圖,我才驚覺軍艦設計已經隔了一個時代

      安安說
      2026-06-02 12:46:29
      24小時已過,普京政府準時斷供,航油不賣中國,歐盟啟動應急方案

      24小時已過,普京政府準時斷供,航油不賣中國,歐盟啟動應急方案

      好賢觀史記
      2026-06-02 18:19:24
      換了5臺車才明白:家用車最沒用的,就是車企吹爆的這6個“配置”

      換了5臺車才明白:家用車最沒用的,就是車企吹爆的這6個“配置”

      周哥一影視
      2026-06-01 13:33:05
      全球股市,全線跳水!霍爾木茲海峽,最新消息!

      全球股市,全線跳水!霍爾木茲海峽,最新消息!

      中國經濟網
      2026-06-02 10:35:08
      一場針對亞洲的無聲洗劫,已經到了最高潮。

      一場針對亞洲的無聲洗劫,已經到了最高潮。

      果媽聊娛樂
      2026-06-01 08:38:41
      再見,楊瀚森,8換1或去雄鹿

      再見,楊瀚森,8換1或去雄鹿

      體育新角度
      2026-06-02 19:59:18
      5月29日新華社一份數據曝光,開2噸以上新能源車的車主集體失眠

      5月29日新華社一份數據曝光,開2噸以上新能源車的車主集體失眠

      音樂時光的娛樂
      2026-05-31 12:26:42
      花滑奧運冠軍陳巍考入哈佛醫學院,曾任霍普金斯大學研究助理

      花滑奧運冠軍陳巍考入哈佛醫學院,曾任霍普金斯大學研究助理

      懂球帝
      2026-06-02 16:45:55
      萬萬沒想到,西貝翻車的路,愛奇藝又走了一遍,網友群嘲:沒底線

      萬萬沒想到,西貝翻車的路,愛奇藝又走了一遍,網友群嘲:沒底線

      離離言幾許
      2026-05-31 21:21:29
      資治通鑒:當你混到沒人給你打電話發信息、沒人找你聚會、沒人約你吃飯的時候,那么說明你可能在慢慢變好,你的人生正在走上坡路

      資治通鑒:當你混到沒人給你打電話發信息、沒人找你聚會、沒人約你吃飯的時候,那么說明你可能在慢慢變好,你的人生正在走上坡路

      心理觀察局
      2026-06-03 07:06:09
      紀委核查通訊記錄的獨門手段,很多人到落馬都不知道

      紀委核查通訊記錄的獨門手段,很多人到落馬都不知道

      細說職場
      2026-06-01 18:36:34
      油價大逆轉!國內油價調整時間定了,6月4日歷史罕見油價大幅下調

      油價大逆轉!國內油價調整時間定了,6月4日歷史罕見油價大幅下調

      有料財經
      2026-06-02 19:38:40
      炸裂!捐精有多亂,雙方直接在賓館完成懷孕過程,一次八百到幾萬

      炸裂!捐精有多亂,雙方直接在賓館完成懷孕過程,一次八百到幾萬

      就一點
      2026-06-02 15:45:51
      2026-06-03 07:40:49
      魏家東 incentive-icons
      魏家東
      一個人的營銷商學院!
      2787文章數 12247關注度
      往期回顧 全部

      科技要聞

      燒掉千億后,美團、阿里、京東誰先止血?

      頭條要聞

      特朗普:已同以黎通話協調停火 一周內將與伊達成協議

      頭條要聞

      特朗普:已同以黎通話協調停火 一周內將與伊達成協議

      體育要聞

      1米74的業余聯賽替補,在英超踢中衛

      娛樂要聞

      奚夢瑤何猷君補辦婚禮超幸福

      財經要聞

      智元和宇樹的“暗戰”愈演愈烈

      汽車要聞

      星途神秘新車輪廓曝光 又一款性能SUV要來了?

      態度原創

      游戲
      數碼
      本地
      公開課
      軍事航空

      離發售不遠了!《寂靜嶺》系列新作已公開游戲評級

      數碼要聞

      微軟推出迷你Surface開發機 用RTX Spark填補高通空缺

      本地新聞

      用剪紙的方式,打開江蘇揚州

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      伊朗媒體新發布最高領袖照片

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 欧美精品v国产精品v日韩精品| 成人小说一区二区中文在线| 久久久www成人免费无遮挡大片| 一区二区三区日本久久九| 一本色道婷婷久久欧美| 亚洲中久无码永久在线观看软件| 国产欧美一区二区精品久久久| av无码久久久久不卡网站蜜桃| 久久精品99国产国产精| 国产边摸边吃奶边做爽视频| 中文字幕亚洲二| 麻豆一区二区三区香蕉视频| 青青草成人免费自拍视频| 日韩成人无码v清免费| 影音先锋av中文字幕| 国产专区精品三级免费看| 中文字幕永久精品国产| 欧美大胆老熟妇乱子伦视频| 欧美激情综合一区二区| 国产精品极品自拍视频| 天堂中文最新版在线官网在线 | 国产精品第一二三区久久| 无套内谢少妇一二三四| 久久婷婷丁香五月综合五| 综合欧美小说另类图| 日本免费一区二区三区| 99国产精品白浆在线观看免费| 操碰网| 自拍视频在线观看三级| 亚洲自拍偷拍二区| 国产成人亚洲无码淙合青草| 国产伦精品一区二区三区视频优播| 伊人久久中文字幕久久cm| 少妇人妻无码专区视频| 国产精品乱人伦一区二区| 99久久精品国产一区二区蜜芽| 亚洲VA久久久噜噜噜久久| 色综合中文色综合网| 四虎永久在线精品无码| 久久福利视频一区二区| 性欧美丰满熟妇xxxx性|