更新時間:2020-01-16 來源:黑馬程序員 瀏覽量:
今天由黑馬程序員老師給大家講解計算機的原碼,反碼和補碼。并且進行了深入探求了為何要使用反碼和補碼,以及更進一步的論證了為何可以用反碼,補碼的加法計算原碼的減法。
一、機器數和真值
在學習原碼,反碼和補碼之前,需要先了解機器數和真值的概念。
1、機器數
一個數在計算機中的二進制表示形式,叫做這個數的機器數。機器數是帶符號的,在計算機用一個數的最高位存放符號,正數為0,負數為1.
比如,十進制中的數 +3 ,計算機字長為8位,轉換成二進制就是00000011。如果是 -3 ,就是 10000011 。
那么,這里的 00000011 和 10000011 就是機器數。
2、真值
機器數的第一位是符號位,后邊才是真正的數值,所以機器數的形式值就不等于真正的數值。例如上面的有符號數10000011,其最高位1代表負,其真正數值是 -3 而不是形式值131(10000011轉換成十進制等于131)。所以,為區(qū)別起見,將帶符號位的機器數對應的真正數值稱為機器數的真值。
例:
0000 0001的真值 = +000 0001 = +1
1000 0001的真值 = –000 0001 = –1
二、原碼,反碼,補碼的基礎概念和計算方法
在探求為何機器要使用補碼之前,讓我們先了解原碼,反碼和補碼的概念。對于一個數,計算機要使用一定的編碼方式進行存儲。 原碼,反碼,補碼是機器存儲一個具體數字的編碼方式。
1. 原碼
原碼就是符號位加上真值的絕對值,即用第一位表示符號,其余位表示值。比如如果是8位二進制:
[+1](原碼) = 0000 0001
[-1](原碼) = 1000 0001
第一位是符號位。因為第一位是符號位,所以8位二進制數的取值范圍就是:
[1111 1111 , 0111 1111]
即
[-127 , 127]
原碼是人腦最容易理解和計算的表示方式。
2. 反碼
反碼的表示方法是: 正數的反碼是其本身,負數的反碼是在其原碼的基礎上,符號位不變,其余各個位取反。
[+1] = [00000001](原碼)= [00000001](反碼)
[-1] = [10000001](原碼)= [11111110](反碼)
可見如果一個反碼表示的是負數,人腦無法直觀的看出來它的數值。通常要將其轉換成原碼再計算。
3. 補碼
補碼的表示方法是:正數的補碼就是其本身,負數的補碼是在其原碼的基礎上,符號位不變,其余各位取反,最后+1 (即在反碼的基礎上+1)。
[+1] = [00000001](原碼) = [00000001](反碼) = [00000001](補碼)
[-1] = [10000001](原碼) = [11111110](反碼) = [11111111](補碼)
對于負數,補碼表示方式也是人腦無法直觀看出其數值的。通常也需要轉換成原碼在計算其數值。
三、為何要使用原碼,反碼和補碼
在開始深入學習前,我的學習建議是先"死記硬背"上面的原碼,反碼和補碼的表示方式以及計算方法。
現在我們知道了計算機可以有三種編碼方式表示一個數。對于正數因為三種編碼方式的結果都相同:
[+1] = [00000001](原碼) = [00000001](反碼) = [00000001](補碼)
所以不需要過多解釋. 但是對于負數:
[-1] = [10000001](原碼) = [11111110](反碼) = [11111111](補碼)
可見原碼, 反碼和補碼是完全不同的。既然原碼才是被人腦直接識別并用于計算表示方式。為何還會有反碼和補碼呢?
首先, 因為人腦可以知道第一位是符號位,在計算的時候我們會根據符號位, 選擇對真值區(qū)域的加減 (真值的概念在本文最開頭)。但是對于計算機,加減乘數已經是最基礎的運算,要設計的盡量簡單。計算機辨別"符號位"顯然會讓計算機的基礎電路設計變得十分復雜! 于是人們想出了將符號位也參與運算的方法。我們知道,根據運算法則減去一個正數等于加上一個負數,即: 1-1 = 1 + (-1) = 0 ,所以機器可以只有加法而沒有減法,這樣計算機運算的設計就更簡單了。
于是人們開始探索,將符號位參與運算,并且只保留加法的方法。首先來看原碼:
計算十進制的表達式: 1-1=0
1 - 1 = 1 + (-1) = [00000001]原 + [10000001]原 = [10000010]原 = -2
如果用原碼表示, 讓符號位也參與計算, 顯然對于減法來說, 結果是不正確的.這也就是為何計算機內部不使用原碼表示一個數。
為了解決原碼做減法的問題,出現了反碼:
計算十進制的表達式: 1-1=0
1 - 1 = 1 + (-1) = [0000 0001]原 + [1000 0001]原= [0000 0001]反 + [1111 1110]反 = [1111 1111]反 = [1000 0000]原 = -0
發(fā)現用反碼計算減法,結果的真值部分是正確的。而唯一的問題其實就出現在"0"這個特殊的數值上。雖然人們理解上+0和-0是一樣的,但是0帶符號是沒有任何意義的。而且會有[0000 0000]原和[1000 0000]原兩個編碼表示0。
于是補碼的出現,解決了0的符號以及兩個編碼的問題:
1-1 = 1 + (-1) = [0000 0001]原 + [1000 0001]原 = [0000 0001]補 + [1111 1111]補 = [0000 0000]補=[0000 0000]原
這樣0用[0000 0000]表示, 而以前出現問題的-0則不存在了.而且可以用[1000 0000]表示-128:
(-1) + (-127) = [1000 0001]原 + [1111 1111]原 = [1111 1111]補 + [1000 0001]補 = [1000 0000]補
-1-127的結果應該是-128,在用補碼運算的結果中,[1000 0000]補 就是-128。但是注意因為實際上是使用以前的-0的補碼來表示-128,所以-128并沒有原碼和反碼表示 (對-128的補碼表示[1000 0000]補算出來的原碼是[0000 0000]原,這是不正確的)。
使用補碼,不僅僅修復了0的符號以及存在兩個編碼的問題,而且還能夠多表示一個最低數. 這就是為什么8位二進制,使用原碼或反碼表示的范圍為[-127, +127],而使用補碼表示的范圍為[-128, 127]。推薦了解C++培訓課程。
因為機器使用補碼,所以對于編程中常用到的32位int類型,可以表示范圍是: [-231, 231-1] 因為第一位表示的是符號位.而使用補碼表示時又可以多保存一個最小值。