淺談浮點數
時間:2017-01-06作者:華清遠見
浮點型變量在計算機內存中占用4字節(Byte),即32-bit。遵循IEEE-754格式標準。 一個浮點數由2部分組成:底數m 和 指數e。 ±mantissa × 2exponent(注意,公式中的mantissa 和 exponent使用二進制表示) 底數部分 使用2進制數來表示此浮點數的實際值。 指數部分 占用8-bit的二進制數,可表示數值范圍為0-255。 但是指數應可正可負,所以IEEE規定, 此處算出的次方須減去127才是真正的指數。所以float的指數可從 -126到128。 底數部分實際是占用24-bit的一個值,由于其高位始終為 1 ,所以高位省去不存儲,在存儲中只有23-bit。 到目前為止, 底數部分 23位 加上指數部分 8位 使用了31位。那么前面說過,float是占用4個字節即 32-bit,那么還有一位是干嘛用的呢? 還有一位,其實就是4字節中的高位,用來指示浮點數的正負,當高位是1時,為負數,高位是0時,為正數。 浮點數據就是按下表的格式存儲在4個字節中:
Address+0 Address+1 Address+2 Address+3 注意:這里有個特例,浮點數 為0時,指數和底數都為0,但此前的公式不成立。因為2的0次方為1,所以0是個特例。當然,這個特例也不用認為去干擾,編譯器會自動去識別。 通過上面的格式,我們下面舉例看下-12.5在計算機中存儲的具體數據:
Address+0 Address+1 Address+2 Address+3 接下來我們驗證下上面的數據表示的到底是不是-12.5,從而也看下它的轉換過程。 由于浮點數不是以直接格式存儲,他有幾部分組成,所以要轉換浮點數,首先要把各部分的值分離出來。
Address+0 Address+1 Address+2 Address+3 這里,在底數左邊省略存儲了一個1,使用實際底數表示為 1.10010000000000000000000 。 現在,我們通過指數部分E的值來調整底數部分M的值。調整方法為:如果指數E為負數,底數的小數點向左移,如果指數E為正數,底數的小數點向右移。小數點移動的位數由指數E的絕對值決定。 這里,E為正3,使用向右移3為即得:1100.10000000000000000000。 至次,這個結果就是12.5的二進制浮點數,將他換算成10進制數就看到12.5了,如何轉換,看下面: 小數點左邊的1100 表示為 (1 × 23) + (1 × 22) + (0 × 21) + (0 × 20), 其結果為 12 。 小數點右邊的 .100… 表示為 (1 × 2-1) + (0 × 2-2) + (0 × 2-3) + ... ,其結果為.5 。 以上二值的和為12.5, 由于S 為1,使用為負數,即-12.5 。 所以,16進制 0XC1480000 是浮點數 -12.5 。 上面是如何將計算機存儲中的二進制數如何轉換成實際浮點數,下面看下如何將一浮點數裝換成計算機存儲格式中的二進制數。 舉例將17.625換算成 float型。 首先,將17.625換算成二進制位:10001.101 ( 0.625 = 0.5+0.125, 0.5即 1/2, 0.125即 1/8 如果 不會將小數部分轉換成二進制,請參考其他書籍。) 再將 10001.101 向右移,直到小數點前只剩一位 成了 1.0001101 x 2的4次方 (因為右移了4位)。此時 我們的底數M和指數E就出來了: 底數部分M,因為小數點前必為1,所以IEEE規定只記錄小數點后的就好,所以此處底數為 0001101 。 指數部分E,實際為4,但須加上127,固為131,即二進制數 10000011 符號部分S,由于是正數,所以S為0。 綜上所述,17.625的 float 存儲格式就是:0 10000011 00011010000000000000000 轉換成16進制:0x41 8D 00 00 所以,一看,還是占用了4個字節。 接下來看存儲:
Float數據結構:
Double數據結構: Exp在公式中是2的冪,接近零的小數的描述應為有符號數,有符號數的表示可以為符號位+數字位、補數等,IEEE754采用的是偏移法,不作過多解釋。 對Float偏移量為0x7F(127)、Double偏移量為0x3FF(1023)。 Frac便是有效位數,
注釋 浮點值 S Exp Frac 數學值 首先舉例求Float_Max正正規數:
Exp =0xFE = 254; 其它的可自己求。 所以float 型的冪是38,Double的冪應該是308。
相關資訊
發表評論
|