<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      蘋果用AI重新發明了圖像壓縮:同樣畫質,文件只要三分之一

      0
      分享至

      編輯|Panda

      一張圖能壓多小?

      2025 年 2 月,國際圖像專家組(JPEG)宣布了一件被行業低調慶祝的事:JPEG AI,這項歷時多年、被寄予厚望的第一個端到端學習型圖像編碼國際標準,正式發布。



      消息傳開,不少研究者在社交媒體上轉發,配上「AI 終于進了標準」的評論。

      JPEG 標準誕生于 1992 年,三十多年來一直是人類數字圖像的一門基礎語言。而現在,人工智能開始接手重寫這門語言的語法。

      然而,慶祝背后有一個微妙的現實:即便是 JPEG AI,距離真正的「感知壓縮」,仍有相當距離。

      工程師們知道,傳統衡量壓縮質量的指標峰值信噪比(PSNR)其實和人眼看到的「好不好看」關系并不大。一張圖在 PSNR 上得了高分,人看了卻可能覺得平平無奇;而另一張 PSNR 偏低的圖,人卻覺得細節豐富、質感真實。優化數學指標,和優化人眼感知,是兩件完全不同的事。

      幾十年來,從 JPEG 到 VVC,再到 JPEG AI,幾乎所有編解碼器的設計邏輯,都還是在數學指標的框架里兜圈子。感知壓縮(直接針對人眼體驗來優化)一直像是學術論文里的遠景目標,而非可以裝進手機的工程現實。

      就在這個節骨眼上,蘋果的一支工程師團隊悄悄發了一篇論文,給出了他們的答案,代號:PICO



      • 論文標題:What Matters in Practical Learned Image Compression
      • 論文地址:https://arxiv.org/pdf/2605.05148

      為什么「看起來更好」比「數字更高」難得多?

      理解 PICO 之前,先要理解圖像壓縮到底在做什么。

      把一張照片存成文件,本質上是一道「忘記什么、記住什么」的取舍題。存儲空間有限,就必須扔掉一部分信息,同時讓看的人盡量察覺不到。不同的編解碼器,遵循不同的「扔法」。

      JPEG、AV1、VVC 等傳統編解碼器都是工程師手工設計的規則系統。它們把圖像切塊、變換、量化、熵編碼,每一步都是數十年積累的人工經驗。這類系統可以在 PSNR 這樣的數學指標上表現極好,但它們的設計本質上是面向「減少像素誤差」,而非「減少人眼不適感」。

      問題在于,人眼并不是像素誤差計。人眼對紋理、對文字、對細節的敏感程度,遠比數學公式復雜。當你把一張街景照片壓縮得很小,PSNR 可能依然體面,但你會看到建筑邊緣模糊、路牌文字變形 —— 而這些,恰恰是人眼最先察覺的東西。

      學習型編解碼器的出現,理論上打開了一扇新門:神經網絡可以直接針對人的感知進行端到端訓練,而不是針對數學公式。但在 PICO 之前,已有的感知型學習編解碼器,要么速度慢得無法實用,要么缺乏跨設備兼容性,要么無法靈活控制碼率,根本裝不進一款消費級產品。

      三個核心問題,三種解法

      PICO 的全稱是Perceptual Image Codec(感知圖像編解碼器)。這個名字直接點明了它的目標:讓人眼滿意。



      研究團隊系統探索了數百萬種模型配置,并引入了幾項關鍵技術創新。

      第一個問題:熵編碼慢,怎么辦?

      圖像壓縮里有一個難題:為了壓得更小,編解碼器需要用「熵模型」來精確估計每個像素的信息量。最精確的方法叫自回歸編碼:每壓縮一個像素,都要先看看周圍已壓縮的像素,依次預測。這就像廚師每放一塊食材,都要回頭看看鍋里的狀態,才能決定下一步。精確,但極慢。

      PICO 的解法是「一次性上下文模型」(One-shot Context Model):把熵編碼里最關鍵的「尺度參數」單獨拆出來,在一次前向傳播中全部算完,不再需要來回等待;而其余參數可以并行計算,保留了自回歸的精度,卻繞開了它的速度瓶頸。結果是:去掉這個模塊,模型性能下降 10.28%;加上它,速度幾乎不受影響。



      第二個問題:感知訓練會產生幻覺,怎么辦?

      用 GAN(對抗神經網絡)訓練出來的圖像往往「看起來很真實」,但可能是編造出來的真實 —— 頭發絲變成了不存在的花紋,平滑表面多出了虛假紋理。更麻煩的是,人眼對文字極度敏感,哪怕一個字母變形一點點,就會立刻察覺。

      PICO 針對文字專門設計了TextFidelityLoss:用一個現成的文字檢測器自動找出圖中的文字區域,在這些區域強制施加嚴格的像素保真約束,同時壓制 GAN 在文字區域的「發揮空間」。實驗顯示,加上這項損失函數后,文字區域的絕對誤差降低了整整一半。



      第三個問題:圖像分塊處理會留下色塊邊界,怎么辦?

      為了在手機芯片上快速運行,PICO 把圖像切成一塊塊 504×504 像素的瓦片,分別處理再拼回去。但 GAN 在訓練時傾向于忽略低頻色彩,導致相鄰瓦片之間常出現可見的色差,類似于修圖時「沒有拼好」的感覺。研究團隊專門引入了TilingArtifactLoss,一種多分辨率的 L1 損失,強制模型在多個空間頻率上保持色彩一致。這項措施讓瓦片邊界的誤差也下降了一半以上。

      實驗結果

      蘋果團隊沒有只靠基準評測指標說話。他們委托第三方平臺 Mabyduck,組織了一次大規模的人類主觀評測。

      評測采用盲測兩兩對比的方式:610 位經過篩選的評測者(需通過色盲檢測和壓縮偽影辨別測試),對同一張圖在不同編解碼器下的重建結果進行配對比較,最終匯總為 Bayesian ELO 分數。共收集了 74,925 次配對比較結果。



      最終數字說明了一切:在相同視覺質量下,PICO 的文件體積只有 AV1、AV2、VVC、ECM 和 JPEG AI 的三分之一到二分之一—— 換言之,存同樣的圖,它需要的比特數只有這些標準的 30%-43%。對比目前最強的學習型感知編解碼器(HiFiC、MRIC 等),PICO 也節省了 20%-40% 的文件大小。



      速度方面,在 iPhone 17 Pro Max 上,PICO 編碼一張 12MP 的照片僅需 230 毫秒,解碼只需 150 毫秒。而大多數頂級 ML 編解碼器在 NVIDIA V100 服務器顯卡上運行,都比這個慢。

      值得注意的是,論文還專門記錄了一個「反例」:在 PSNR 這個傳統指標上,PICO 表現平平,甚至不如 DCVC-RT 和 VVC。這恰好印證了團隊的基本判斷:優化感知質量和優化數學指標,本質上是兩個方向,魚與熊掌不可兼得。

      一個時代節點,而非終點

      PICO 當然也有局限性。論文坦承,對于卡通、示意圖等高度規則化的合成圖像,PICO 的壓縮效率不如傳統編解碼器,因為這類內容天然適合規則驅動的自回歸建模,而非感知生成。

      但這些局限并不掩蓋這項工作的意義所在。

      過去三十年,圖像壓縮的技術進步,幾乎都發生在「讓數字更好看」的賽道上。從 JPEG 到 HEVC,再到 VVC,工程師一代代優化的是 PSNR、SSIM 這類指標。而人眼的感知,始終是個被繞開的「難題」。

      PICO 是第一次有人系統地把這道難題正面拆解:從架構搜索、損失函數設計,到大規模人類主觀評測,并最終裝進了一款可以在手機上實時運行的編解碼器。

      當你下一次用蘋果設備分享一張照片,也許不會感受到任何不同。但或許在那個安靜的壓縮過程里,一套針對人眼感知量身打造的算法,正在決定哪些信息值得留下,哪些可以悄悄遺忘。

      團隊:從 WaveOne 到蘋果

      這篇論文的通訊作者是 Oren Rippel,蘋果研究員,壓縮領域的老面孔。

      他的名字最早大規模出現,是在 2017 年。彼時他還在初創公司 WaveOne,發表了一篇名為「實時自適應圖像壓縮」的論文,用神經網絡打敗了當時所有主流編解碼器,同時維持實時運行速度。那篇論文在學界引發了不小的波瀾,也奠定了 Rippel 在學習型壓縮領域的地位。



      之后,同一批核心人員在 WaveOne 繼續深耕,推出了面向視頻壓縮的 ELF-VC,在 UVG 視頻測試集上相比 H.264 實現了 44% 的碼率節省,同時運行速度比同類 ML 編解碼器快五倍以上。

      WaveOne 的這支團隊后來整體加入蘋果。而這次的 PICO,是他們帶著蘋果的算力和平臺資源,在圖像感知壓縮上交出的第一份系統性答卷。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      終于要來了!蘋果將發布 mini 新品

      終于要來了!蘋果將發布 mini 新品

      花果科技
      2026-06-01 15:35:18
      降價2萬!上汽大眾官宣:全新SUV,價格下調

      降價2萬!上汽大眾官宣:全新SUV,價格下調

      科技堡壘
      2026-05-31 09:34:47
      張雪,拿下寧德時代的大單

      張雪,拿下寧德時代的大單

      渝魯大道
      2026-06-01 22:58:17
      3年!從落選秀到總決賽!!逆襲之王!!

      3年!從落選秀到總決賽!!逆襲之王!!

      柚子說球
      2026-06-01 23:13:32
      中國人均商鋪率僅有美國1/8!利潤太微薄為房東打工,人口和消費又不景氣

      中國人均商鋪率僅有美國1/8!利潤太微薄為房東打工,人口和消費又不景氣

      風向觀察
      2026-05-31 11:49:14
      伊朗:要求滿足前不會舉行任何談判,計劃徹底封鎖霍爾木茲海峽并啟動曼德海峽“戰線”

      伊朗:要求滿足前不會舉行任何談判,計劃徹底封鎖霍爾木茲海峽并啟動曼德海峽“戰線”

      澎湃新聞
      2026-06-01 23:02:08
      校長怒批成人禮:他們是成人了,不是成婚了!

      校長怒批成人禮:他們是成人了,不是成婚了!

      復轉這些年
      2026-05-31 21:08:55
      太難了!東莞家長哭訴民辦高中每學期2.5萬元以上,3年花費超20萬

      太難了!東莞家長哭訴民辦高中每學期2.5萬元以上,3年花費超20萬

      火山詩話
      2026-05-31 08:37:55
      全球股市,全線跳水!原油狂飆,伊朗突然宣布:暫停談判!

      全球股市,全線跳水!原油狂飆,伊朗突然宣布:暫停談判!

      中國基金報
      2026-06-01 22:23:04
      庫里曬海邊半裸照!這是我們能看的嗎!!!

      庫里曬海邊半裸照!這是我們能看的嗎!!!

      柚子說球
      2026-06-01 21:23:54
      日本記者曾問:北方四島屬于哪國?中方的巧妙回答令對方如芒刺背

      日本記者曾問:北方四島屬于哪國?中方的巧妙回答令對方如芒刺背

      元哥說歷史
      2026-05-16 15:10:03
      司馬南代表不了底層,以及多所高校撤銷外語學院!

      司馬南代表不了底層,以及多所高校撤銷外語學院!

      胖胖說他不胖
      2026-06-01 09:55:16
      為什么說小孩子說一些奇奇怪怪的話,千萬不要以為是開玩笑?

      為什么說小孩子說一些奇奇怪怪的話,千萬不要以為是開玩笑?

      另子維愛讀史
      2026-06-01 19:09:09
      排面拉滿!半個娛樂圈齊聚謝霆鋒演唱會,臺下明星陣容堪比頒獎禮

      排面拉滿!半個娛樂圈齊聚謝霆鋒演唱會,臺下明星陣容堪比頒獎禮

      鄉野小珥
      2026-06-01 18:24:21
      解說員:庫里簽約李寧已經八九不離十了,近期會官宣

      解說員:庫里簽約李寧已經八九不離十了,近期會官宣

      懂球帝
      2026-06-01 15:58:18
      前線3天損失4400人,如果威脅有用,俄羅斯應該早贏了

      前線3天損失4400人,如果威脅有用,俄羅斯應該早贏了

      山河路口
      2026-06-01 21:16:32
      32歲白舉綱喜為人父,1歲女兒白胖可愛,妻子非圈內人

      32歲白舉綱喜為人父,1歲女兒白胖可愛,妻子非圈內人

      書慧我心
      2026-06-01 14:13:33
      何猷君婚禮四代同堂,梁安琪母親罕現身雍容華貴,何超欣挽著外婆

      何猷君婚禮四代同堂,梁安琪母親罕現身雍容華貴,何超欣挽著外婆

      科學發掘
      2026-06-01 22:04:40
      臺灣42歲老師性侵6年級小學生,4個月9次 生下一孩,判17年仍不服

      臺灣42歲老師性侵6年級小學生,4個月9次 生下一孩,判17年仍不服

      墨策史
      2026-06-01 01:30:05
      塞爾電臺:恩里克曾告知納賽爾,有姆巴佩無法掌控球隊

      塞爾電臺:恩里克曾告知納賽爾,有姆巴佩無法掌控球隊

      懂球帝
      2026-06-01 21:47:21
      2026-06-01 23:28:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      13139文章數 142658關注度
      往期回顧 全部

      科技要聞

      黃仁勛演講實錄|40年來PC首次重設計!

      頭條要聞

      女孩14年后打開亡兄的QQ 相冊里藏著"最最最愛的妹妹"

      頭條要聞

      女孩14年后打開亡兄的QQ 相冊里藏著"最最最愛的妹妹"

      體育要聞

      杰威:如果我沒受傷,我們能擊敗馬刺

      娛樂要聞

      奚夢瑤婚禮現場圖!一雙兒女當花童

      財經要聞

      宇樹過會,杭州贏麻了

      汽車要聞

      奇瑞集團5月銷量24.8萬輛 同比增長20.5% 出口18.2萬輛再創新高

      態度原創

      游戲
      教育
      家居
      時尚
      軍事航空

      《使命召喚》新作線上模式將大改?官方終于不裝死了

      教育要聞

      一場“沒有攀比,也沒有煽情”的成人禮,被全網點贊,看哭網友

      家居要聞

      自信舒展 高背座椅

      夏天褲子不用多買,闊腿褲一整個夏天都能穿,日常出行好打理

      軍事要聞

      韓國最大軍工企業爆炸 已造成5人死亡

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 精品国产乱码久久久久夜深人妻| 夜爽8888视频在线观看| 亚洲成aⅴ人在线观看| 中文字幕亚洲中文字幕无码码| 亚洲老女人区一区二视频| 痉挛高潮喷水av无码免费| 亚洲精品第一| 国产精品久久久久久久久鸭| 免费无码VA一区二区三区| 久久精品国产99久久久古代| 国产综合色网| 国产免费的野战视频| 亚洲精品日本久久一区二区三区| 日本一区不卡高清更新二区| 热99re久久精品这里都是精品| 艾小青国产精品40分钟| 国产sm调教折磨视频| 亚洲精国产一区二区三区| 亚洲国产日韩伦中文字幕 | 成人网站亚洲| 宜州市| 极品少妇被猛的白浆直喷白浆 | 欧美亚洲另类一区二区三区| 国产成人高清亚洲综合| 国产婬妇无码无遮挡A片在线观看| 日韩欧美的偷拍?一区二区| 337p日本欧洲亚洲大胆色噜噜| 久久久久无码中| 国产精品ⅴ无码大片在线看| 国产人妖ts在线观看网站| 五月天福利导航| 亚洲成人网在线观看| 亚洲欧美综合另类图片小说区| Av无码一区二区三区| 欧美丰满熟妇乱XXXXX网站| 国产亚洲AV电影院之毛片| 国产精品hd| 韩国无码av片在线观看| 久久精品女厕偷拍视频| 欧美久久久| 久久精产国品一二三产品|