上次Microcode那篇簡單的跟大家回顧了FDIV Bug的問題 今天看到Intel受訪的文章,有種熟悉的既視感,來跟大家幹個古 Intel出包是不太意外,現在電路、晶片設計的規模比以前大很多了 很多細節「人」沒注意到很正常,講這些不是要護航我個人也是受災戶,超頻用平台加上 主力工作站,我手上13~14th gen平台有很多組 講這個是因為Intel技術出包我能諒解,但在當年事件後公關處理居然還能那麼糟糕 目前Intel出過最大包的位置應該要讓給目前的事件了,規模看起來是這樣,實際商譽損失 和財務損失就不得而知了。 1. Bug的發現與背景 FDIV Bug是由University of Lynchburg(以前叫Lynchburg College)的數學系教授 Thomas Nicely在1994年進行prime(質數)相關研究時發現的,教授寫了一系列包含了 twin primes、prime triplet、prime quadruplet的程式碼,其中有計算Brun's constant的程式(所有twin primes的倒數和會趨近一個constant),教授在計算Brun's constant的時候發現不管怎麼算都結果都是錯誤的,研究是在6月進行的,一直到10月 底左右教授才排除其他bug發現是CPU的問題。 教授用的CPU是Pentium(P5),是當年世界上最先進的處理器之一,教授發現在計算 824,633,702,441和824,633,702,443 這兩個數字的倒數時,小數後10位會計算錯誤,為了確定是軟體還是硬體錯誤,他還使 用了前一代CPU i486進行計算,最後才確認是Pentium CPU的問題,並向Intel回報該 Bug 2. FDIV Bug的技術細節 Intel當年為了加速floating point除法的速度,使用了SRT algorithm取代了先前在 486上使用的shift-and-subtract algorithm,SRT在一個Clock cycle可以算出2 bits 的結果,後者只能算出一個,改用SRT algorithm也並不是錯誤的決定。 錯誤在哪裡呢? SRT algorithm使用了2048 cells的PLA(programmable logic array)來 implement,SRT的計算仰賴一張lookup table,這張lookup table要被填入PLA裡,其 中1066個cells應該填入-2、-1、0、+1、+2,原始的array在compile的時候出錯了5個 值應該要是+2但是變成了0,這個錯誤一路傳到到了蝕刻PLA進入chip的設備裡。 SRT的特性之一是recursive(遞迴),所以誤差會不斷累積,最糟的狀況會到第四有效位 數,大部分的錯誤只到第9、10有效位數而已。這邊給大家一個實例4,195,835除以3,14 5,727,正確答案是1.333820449136241002。 這兩個數字在運算的時候要轉換成hexadecimal(16進制),前者是0x4005FB,後者是 0x2FFFFF,0x4005FB的5會需要access前面提到錯誤的array cells,這導致結果是 1.333"739068902037589" 3. Intel的回應與處理 其實這個Bug在一般使用的情況下不太會遇到,統計是90億個長除法才會遇到一個錯誤 ,而且也並不是所有的除法運算都會遇到這個bug,因此Intel在最初的回應中是「這 是個微不足道的錯誤,並不影響大多數的使用者,Intel願意向那些提出證據受到影響 的用戶更換CPU。」 10/24 教授向Intel報告 10/30 教授向學術界的其他人發了有關FDIV bug的報告,這個消息很快就透過網路傳開 了 11/7 該Bug首次出現在媒體上,發表在EE times上的一篇文章 11/22 被CNN報導,同時也被New York Times和the Boston Globe報導 12/20 Intel正式宣布召回所有有Bug的Pentium CPU 1995/1/17 Intel的年度報告中指出處理FDIV bug的成本是4.75億美元(應該相當於現在 的8.多億美元) 這件事件的影響很大,半導體業界使用formal verification的數量明顯增加 1996有一種針對SRT的技術問世,叫做"word-level model checking",Intel在開發 Pentium 4的時候用了STE等方式也發現了很多錯誤,這些沒被發現很可能是規模更大的 召回。但一直到2008年Intel才有架構使用了formal verification作為主要驗證方式 (Nehalem)。 這整件事件除了財務上的損失,公關處理得更是糟糕,Intel是禁止OEM和經銷商進行召 回的,理由是應該由end user決定該bug是否影響他們的使用。 John Romero(雷神之槌 Quake的開發者)曾經在一次的演講說他們當年也因為這個Bug花 費了許多時間在追蹤問題。 商業的部分IBM甚至宣布停賣Intel CPU的產品,當然IBM這個決策是有點爭議的(因為當 時IBM有PowerPC)。 回到一般消費者上,Intel一開始怎麼說呢? 「這件事情影響不大日常不可能受到影響 ,除非你能證明你有被影響,才會更換你的CPU」,Intel的回應引起了不少業界人士的 反彈,到後來媒體和輿論開始發酵後,甚至平常用電腦都不會進行計算的人這類族群也 想採取行動,Intel才終於發現事情不對勁宣布全面召回,消費者對於Intel的信心明顯 是被動搖的。忘了寫補充一下,後續報導證明Intel在1994年6月就發現了問題,但選擇 不披露細節也不召回秘密修補,但最後還是被發現了。 相信看完的你也能明白為甚麼我會想起FDIV的事件,也回應我開頭所講,我很難相信Intel 這種公司在經歷過這種事件後還會犯一樣的公關錯誤。 -- ※ 發信站: 批踢踢實業坊(web-ptt.org.tw), 來自: 36.227.165.47 (臺灣) ※ 文章網址: https://web-ptt.org.tw/PC_Shopping/M.1722102481.A.E84
wahaha99: 當年8億鎂(相對今日)解決118.169.30.161 07/28 01:57
wahaha99: 現在如果全面召回 要不要花到80億... 118.169.30.161 07/28 01:58
wahaha99: 這次錯 坦白說intel現在的狀態 扛不起.. 118.169.30.161 07/28 01:58
autoupdate: 筆電似乎沒這個問題!? 114.45.198.233 07/28 01:59
wahaha99: 查了一下 當年賠掉的是intel年淨利1/10?118.169.30.161 07/28 02:03
muiwo: 求包養...管飽就好XD118.169.30.161 07/28 02:03
wahaha99: 現在這賠下去不知道要多少錢 如果要賠掉 118.169.30.161 07/28 02:04
wahaha99: 1/3年淨利 那就非常痛了118.169.30.161 07/28 02:04
wahaha99: 算錯 不到1/10...118.169.30.161 07/28 02:06
KGSox: 看來這間公司的本質就是傲慢36.234.57.36 07/28 02:10
ekgs: 悲劇的是即使用了形式化驗證還是做出有問題61.230.123.119 07/28 02:13
sunuzo: 阿姨!我不想努力了(求包養)61.230.123.119 07/28 02:13
ekgs: 的東西61.230.123.119 07/28 02:13
ekgs: AMD過去比較大包的應該就只有Phenom TLB bug61.230.123.119 07/28 02:24
mrme945: 推幹古,原po文章寫得挺不錯的111.71.212.122 07/28 02:32
Cubelia: 補充:後來Windows有提供偵測CPU型號111.255.25.252 07/28 02:37
Cubelia: 並可以選擇是否關閉FPU的功能111.255.25.252 07/28 02:37
UNIQC: 有沒有富二代要包養111.255.25.252 07/28 02:37
Cubelia: 沒被回收的CPU反而成為收藏家的逸品111.255.25.252 07/28 02:38
Clarkliu: 可是20年前的主管早退休了 1.168.4.191 07/28 02:49
a000000000: 尼用當年角度看這就很微妙惹 67.180.4.167 07/28 03:20
a000000000: 當年幾乎只有一種產品 67.180.4.167 07/28 03:20
a000000000: pc也好server也好都同一顆 67.180.4.167 07/28 03:21
dewaro: 身邊有朋友被包養 67.180.4.167 07/28 03:21
a000000000: 速度也沒有動態調節 67.180.4.167 07/28 03:21
a000000000: 現在問題可以確定pc diy直接影響最大67.180.4.167 07/28 03:22
a000000000: 而這市場很小 最重要在筆電 67.180.4.167 07/28 03:22
a000000000: 除非高階低功耗到商用全面大爆炸 67.180.4.167 07/28 03:23
a000000000: 不然論危機還太早 67.180.4.167 07/28 03:23
Elfego: 亞洲最大包養平台上線了 67.180.4.167 07/28 03:23
lordlpg: 有Quake有推114.33.77.43 07/28 03:44
bhmagic: 文組理工史 76.82.233.154 07/28 04:48
huckerbying: 拿這件事情來對比也沒錯啊,當初FVI 211.76.58.252 07/28 07:22
huckerbying: B是在各種媒體推波助瀾下讓這種少見 211.76.58.252 07/28 07:22
huckerbying: 用戶錯誤放大到大家都要抵制 211.76.58.252 07/28 07:22
Nicodim: 包養SD = SugarDaddy? 211.76.58.252 07/28 07:22
huckerbying: 現在這問題連幾家公司都跳出來投訴211.76.58.252 07/28 07:27
huckerbying: 用intel的機櫃都有常報修的問題,再 211.76.58.252 07/28 07:27
huckerbying: 加上有名硬體媒體也出來講近期不推 211.76.58.252 07/28 07:27
huckerbying: 薦intel,那也很難保不會重演FVIB事 211.76.58.252 07/28 07:27
huckerbying: 件 211.76.58.252 07/28 07:27
Foning: 這個包養網正妹好多 是真的嗎 211.76.58.252 07/28 07:27
dildoe: 製造問題margin的 統計資料又不在end user118.168.170.234 07/28 07:49
dildoe: 除了問題比例偏高,沒人leak一般人連細節大118.168.170.234 07/28 07:50
dildoe: 都不會知道吧.要leak就是不吞的意思吧XD118.168.170.234 07/28 07:50
kuroshizu21: 推好文, 原PO的文章我個人都看得蠻開114.47.85.63 07/28 07:57
kuroshizu21: 心的, 希望之後還有續篇114.47.85.63 07/28 07:57
AKNY: 真的有這麼多人在找包養114.47.85.63 07/28 07:57
DivineSX: 推,原po 文筆真的很好,寫得深入淺出114.40.137.7 07/28 08:06
kira925: 這種製程問題我很難相信只有DIY被影響42.72.85.174 07/28 08:24
huckerbying: 連公司Server級都跳出來質疑的話, 211.76.58.252 07/28 08:28
huckerbying: 那公司高層就不得不重視了211.76.58.252 07/28 08:28
ClarinetWork: 推考古42.72.201.115 07/28 08:31
mysister: 有人可以分析一下包養平台的差異嗎42.72.201.115 07/28 08:31
zseineo: 推 111.243.67.9 07/28 08:34
ABA0525: 這家真的爛220.132.95.162 07/28 08:35
ABA0525: 今年這次更嚴重220.132.95.162 07/28 08:35
olozil: 不然你要用AMD...當年沒AMD嗎?218.161.55.246 07/28 08:38
huckerbying: 當年有AMD,跟Pentium對壘的是AMD K 211.76.58.252 07/28 08:42
cir72: 那個包養網人最多XD 211.76.58.252 07/28 08:42
huckerbying: 5 211.76.58.252 07/28 08:42
Gocoba: 所以現在13/14代用戶不鬧大就等著吃鱉阿172.56.176.19 07/28 08:42
klm619: 推個 220.129.198.73 07/28 09:05
Azure5200: 長知識推 42.73.51.146 07/28 09:18
ltytw: 當年一堆CPU好選 不買AMD也能買cryix貨win114.33.46.227 07/28 09:30
ATrain: 我妹上包養網被我發現= =114.33.46.227 07/28 09:30
atlaswhz: 現在很難鬧大,大家用手機平板筆電,桌機 61.61.61.19 07/28 09:30
atlaswhz: 用戶根本稀有 61.61.61.19 07/28 09:30
ltytw: chip114.33.46.227 07/28 09:30
AerobladeIII: 不會吃鱉啦,不然那些印粉要含淚買111.246.26.111 07/28 09:34
AerobladeIII: AMD嗎111.246.26.111 07/28 09:34
grado0802: 隔壁桌的人竟然在討論包養...111.246.26.111 07/28 09:34
zenki0127: 做成鑰匙圈那次嗎 203.204.139.70 07/28 09:44
NeCool: 推 27.53.155.22 07/28 10:59
avans: 哇 很棒的分享,謝謝說明典故114.137.200.253 07/28 11:05
cancelpc: 這次認也沒用,沒有正常的可以換。 111.249.146.39 07/28 11:24
cancelpc: 且不是用軟體檢測的出來,是看運作環境 111.249.146.39 07/28 11:25
smilejin: 樓上是不是被包養 111.249.146.39 07/28 11:25
cancelpc: 決定壽命。 111.249.146.39 07/28 11:25
minato711208: 推 39.10.57.255 07/28 11:31
ym010273: 就冷處理賭事情不會發酵,每件事都要積27.52.101.119 07/28 11:35
ym010273: 極處理反而更糟吧 27.52.101.119 07/28 11:35
ym010273: 反正出事獻祭幾個人頭就好了 27.52.101.119 07/28 11:38
qusekii: 樓下被包養 27.52.101.119 07/28 11:38
lc85301: 有處理啊,Fab 的 OOO 都換人了 36.231.113.220 07/28 11:40
cancelpc: DIY市場問題不大,品牌機處理問題的成本 111.249.146.39 07/28 11:48
cancelpc: 才大。量大通路多替換成本高。更況沒正111.249.146.39 07/28 11:48
cancelpc: 常的可換。死路一條。 111.249.146.39 07/28 11:48
lu19900217: 登,登 登 登,登個幾年看能不能像k8 42.73.197.236 07/28 12:15
Y949731: 現包養都上檯面了嗎 42.73.197.236 07/28 12:15
lu19900217: 那時挺過去 42.73.197.236 07/28 12:15
roseritter: 看server線,I社目前的命脈 122.117.187.82 07/28 12:40
sank: 推 36.227.237.237 07/28 13:11
applejone: 當年的 k5 k6 是浮點運算被 Intel屌打180.217.42.135 07/28 13:19
sjimmy43: 想問個跟文章主旨無關的問題,IBM停賣In 114.39.101.45 07/28 13:34
T730733: 在包養網遇到朋友= = 114.39.101.45 07/28 13:34
sjimmy43: tel 產品會產生什麼爭議?跟powerPC的關 114.39.101.45 07/28 13:34
sjimmy43: 聯是什麼? 114.39.101.45 07/28 13:34
cancelpc: 資料中心也被A大舉攻佔,因為空間/電力 111.249.146.39 07/28 13:36
cancelpc: 就是成本。多核製程是競爭力。 111.249.146.39 07/28 13:36
cancelpc: 當初是PC開始入侵原本IBM獨佔的市場111.249.146.39 07/28 13:37
FireStation: 問卦:有包養SD的卦嗎111.249.146.39 07/28 13:37
cancelpc: 唯有系統不爭氣,不穩定。 111.249.146.39 07/28 13:38
cancelpc: 所以PC server後面好幾年才進入。IBM這111.249.146.39 07/28 13:40
cancelpc: 幾年也開始把PowerPC給EOS,EOL了,改採x111.249.146.39 07/28 13:40
cancelpc: 86架構 111.249.146.39 07/28 13:40
cancelpc: 拼了老本買下伺服器系統龍頭Redhat111.249.146.39 07/28 13:41
Thobel: 隔壁桌好像是包養SD在見面XD111.249.146.39 07/28 13:41
cancelpc: 上面系統少了字,作業系統 111.249.146.39 07/28 13:42
cancelpc: IBM這幾年賣掉一大堆部門,剩自己的CPU 111.249.146.39 07/28 13:53
cancelpc: 因一些原因不能賣沒人買不能停(政府/國111.249.146.39 07/28 13:53
cancelpc: 防) 111.249.146.39 07/28 13:53
cancelpc: 已經開始針對專屬架構的電腦客戶發出EOL111.249.146.39 07/28 13:55
Reji: aSugarDating = 包養SD?111.249.146.39 07/28 13:55
cancelpc: ,EOS通知,要轉x86架構。 111.249.146.39 07/28 13:55
yymeow: x86 server算是後來居上,早年都是Sun、 114.25.194.188 07/28 14:20
yymeow: AIX、sparc、MIP等等的天下114.25.194.188 07/28 14:21
yymeow: ^s 114.25.194.188 07/28 14:21
hn9480412: AMD也有zen的segfault問題啦 223.137.103.4 07/28 14:26
Hathael: 未看先猜這包養網 223.137.103.4 07/28 14:26
xbearboy: 當年雷鳥裝個散熱都能崩角了,好在自己114.136.239.228 07/28 14:37
xbearboy: 沒遇崩到不能用的情況,但看到散熱沒裝114.136.239.228 07/28 14:37
xbearboy: 好燒掉要玩家自負的態度,基本上就不會114.136.239.228 07/28 14:37
xbearboy: 相信這家會好到哪去了,就兩家比下限而114.136.239.228 07/28 14:37
xbearboy: 已114.136.239.228 07/28 14:37
yovroc: 有人知道包養SD是什麼嗎114.136.239.228 07/28 14:37
kuninaka: 這個以前讀書有看到過XD 1.174.79.139 07/28 14:44
kuninaka: 只能說Pat Gelsinger脫離工程太遠了 1.174.79.139 07/28 14:54
kuninaka: 當初這問題爆發的時候他還在INTEL當 1.174.79.139 07/28 14:54
kuninaka: 工程師 1.174.79.139 07/28 14:54
kuninaka: 鬧得這麼大,結果現在整個裝死混過去XD 1.174.79.139 07/28 14:54
helgalie: 一定又是這包養網 1.174.79.139 07/28 14:54
kuninaka: 裝死也不能說不是好決策XD 1.174.79.139 07/28 14:54
cancelpc: 是阿,有段時期PC Server跟封閉架構互競111.249.146.39 07/28 14:56
kanding255: 這次的影響範圍更大欸 intel感覺會倒 49.215.56.78 07/28 15:04
kanding255: 除非下一代能超越 49.215.56.78 07/28 15:04
smallreader: 感謝介紹..長知識36.237.108.127 07/28 16:01
OREOMZA: 包養平台不意外36.237.108.127 07/28 16:01
yymeow: Xeon出事才會倒 114.25.194.188 07/28 16:08
ltytw: 說倒 我覺得不至於 不過就是元氣大傷 114.33.46.227 07/28 16:23
ltytw: 變成小咖廠商 比VIA還小 並且晶圓廠被割114.33.46.227 07/28 16:24
ltytw: 出去 之如此類 114.33.46.227 07/28 16:24
ltytw: 就好像大隻刃下心一戰之後縮水變成 114.33.46.227 07/28 16:26
punjab: 覺得包養網EY嗎 114.33.46.227 07/28 16:26
yymeow: 或是像IBM一樣變昨日黃花吧 114.25.194.188 07/28 16:32
yymeow: 小時候看到同學PS/55電腦一開機的IBM字樣 114.25.194.188 07/28 16:32
yymeow: 純血的PC,不是廉價相容機。真的羨慕 114.25.194.188 07/28 16:33
amos30627: 這次就損商譽而已 Xeon筆電都沒事111.185.172.124 07/28 16:35
amos30627: 手握x86跟先進製程不可能倒111.185.172.124 07/28 16:36
sashare: 包養網站葉配啦111.185.172.124 07/28 16:36
amos30627: DIY仔就去死吧 何況很多不會發現CPU壞111.185.172.124 07/28 16:37
amos30627: 了 以為是自己問題或其他零件111.185.172.124 07/28 16:37
mainsa: 當初Intel號稱有外星人 技術大幅領先 毛 49.216.177.168 07/28 16:41
mainsa: 利又高 召回沒啥差 但最近每季Intel都虧49.216.177.168 07/28 16:41
mainsa: 損十幾億甚至幾十億鎂 24 Q1稍有收斂還是49.216.177.168 07/28 16:41
sijiex: 記者收了包養網多少啦49.216.177.168 07/28 16:41
mainsa: 虧4億鎂喔 他們現在是真的沒有那個能力召49.216.177.168 07/28 16:41
mainsa: 回了 這弄下去直接多幾十億鎂的虧損欸49.216.177.168 07/28 16:41
mrme945: 所以外星人去哪裡了111.71.212.122 07/28 16:43
yymeow: 回家去了 XD114.25.194.188 07/28 16:43
amos30627: 被dell收購了111.185.172.124 07/28 16:43
VLADINA: 包養真亂111.185.172.124 07/28 16:43
kuroshizu21: 外星人去了dell那裡了啊 XDD 114.47.88.191 07/28 16:58
snowpoint: dell有啥東西發功嗎?小弟沒關注不知道 114.32.218.42 07/28 19:09
bw212: Dell 的電競電腦系列Alienware 綽號外星人 111.83.138.4 07/28 19:20
felaray: 當年賺爛了 現在賠錢不說 還賠信譽 1.163.240.51 07/28 20:38
felaray: Pat信誓旦旦要把恢復intel往日榮光,看來 1.163.240.51 07/28 20:39
odemagus: 演藝圈一堆包養好嗎 1.163.240.51 07/28 20:39
felaray: 可能只是南柯一夢. 1.163.240.51 07/28 20:40
nicetw20xx: 推 36.234.29.183 07/28 21:57
user1120: 推好文 106.104.32.220 07/28 22:04
lukeatlee: 推 錯誤難免 重要的是解決問題的態 123.50.45.219 07/28 22:24
lukeatlee: 度與方法 這才是決定I家未來的關鍵 123.50.45.219 07/28 22:24
yes500: 政治圈一堆包養好嗎 123.50.45.219 07/28 22:24
yeeouo: 那為什麼compile會出錯124.213.115.96 07/28 22:58
wei115: 推 就是因為這個 才引入形式化驗證 但之 27.51.89.194 07/29 04:48
wei115: 後還是出現幽靈 熔斷這類分支預測的bug 27.51.89.194 07/29 04:48
potatososo: pro 推 27.51.96.76 07/29 05:31
potatososo: pentium iii 7mhz我的第一顆買的 27.51.96.76 07/29 05:32
alexantiy: 有錢人一堆包養好嗎 27.51.96.76 07/29 05:32
potatososo: #70mhz 27.51.96.76 07/29 05:33
potatososo: 700nhz 27.51.96.76 07/29 05:33
youcanfindit: 推講古 27.242.230.161 07/29 08:27
kenphin0729: 推講古好文220.138.120.236 07/29 11:45
jakkx: 推一個。對比下來搞不好這一次也是早知道175.182.110.108 07/29 11:56
sowrey: 學生妹被包養多嗎175.182.110.108 07/29 11:56
lc85301: 形式化驗證本來就沒那麼神 36.231.113.220 07/29 22:07
lc85301: 有驗的東西是可以保證沒錯,但沒驗的還是 36.231.113.220 07/29 22:08
lc85301: 不知道有沒有問題 36.231.113.220 07/29 22:08
SilverFox: 推 101.10.6.251 07/30 01:17
donkilu: 拿當年來比很正常吧 Intel的嘴臉始終如一 216.228.112.22 07/30 02:49
cw758: 有錢人為啥都想包養 216.228.112.22 07/30 02:49
donkilu: 當年訊息流通沒有現在發達都能全面炎上 216.228.112.22 07/30 02:51
donkilu: 現在一堆自媒體都虎視眈眈要打Intel臉 216.228.112.22 07/30 02:52