數(shù)據(jù)是關(guān)于組織及其業(yè)務(wù)活動的原始事實,是信息系統(tǒng)中最活躍的元素。大部分數(shù)據(jù)本身沒有任何意義和用途,可以從不同的角度進行不同的分類。
數(shù)據(jù)可以分為兩類:模擬數(shù)據(jù)和數(shù)字數(shù)據(jù)。模擬網(wǎng)站設(shè)計數(shù)據(jù)是在一定區(qū)間內(nèi)連續(xù)變化的數(shù)值。例如,聲音和視頻是幅度不斷變化的波形,溫度和壓力也是不斷變化的數(shù)值;數(shù)字數(shù)據(jù)是離散值,例如文本信息和整數(shù)。
一個企業(yè):業(yè)務(wù)要處理的數(shù)據(jù)通常有三種不同類型的數(shù)據(jù),應(yīng)用數(shù)據(jù)和派生數(shù)據(jù),它們的特點有很大的不同。
? 業(yè)務(wù)數(shù)據(jù)代表事實,例如捕獲的業(yè)務(wù)電話記錄等,它們在一段時間內(nèi)是不變的。
應(yīng)用數(shù)據(jù)主要描述人或事物的屬性。如客戶的姓名、地址、電話和傳真號碼、電子郵件地址等。應(yīng)用數(shù)據(jù)一般是在客戶請求服務(wù)時獲得的,并且經(jīng)??缦到y(tǒng)復(fù)制,具有很大的可變性。相同的應(yīng)用數(shù)據(jù)可能版本不一致,容易產(chǎn)生沖突,管理復(fù)雜。
派生數(shù)據(jù)是對已有數(shù)據(jù)進行某種數(shù)學(xué)運算或數(shù)據(jù)變換得到的事實,如累計費用、不同稅種的應(yīng)繳納稅款總額等。
數(shù)據(jù)有多種形式,所有這些都可以數(shù)字化并存儲在計算機中。下面是如何在計算機中表示數(shù)據(jù)。數(shù)據(jù)在計算機中的表示與存儲
數(shù)據(jù)是計算機處理的內(nèi)容。從外在形式上,計算機可以處理數(shù)值、文本、圖像、聲音、視頻等。但是,在計算機系統(tǒng)內(nèi)部,這些不能直接由計算機處理和存儲,必須由計算機以特殊的形式進行處理。這種特殊的表示形式就是二進制編碼的形式,即用二進制編碼來表示數(shù)值、文本、圖像、聲音和視頻等。計算機系統(tǒng)中的數(shù)據(jù)都是以二進制編碼的形式出現(xiàn)的。
在二進制編碼系統(tǒng)中,只有0和1兩種基本符號,二進制數(shù)的每一位都可以用兩個穩(wěn)定的物理器件(如三極管)來表示。例如,用高低兩個電位,是否有脈沖,或脈沖的正負極性等,都可以方便可靠地表示出來。 1、如圖2-1所示。1.計算機中的數(shù)據(jù)單位
1人
在二進制系統(tǒng)中,每個.和1被稱為二進制位(Binary bit),簡稱位(bit)??梢允褂貌煌慕M合將位組織在一起以表示數(shù)據(jù)——數(shù)字、字母、標點符號等。例如字母H可以用01001000表示(即off-on-off-off-on-off-off-off)。
2)字節(jié)
在計算機系統(tǒng)中,8個二進制位構(gòu)成一個字節(jié)(Byte),縮寫為B,即1B=8b。字節(jié)是計算機處理數(shù)據(jù)的基本單位。一個字節(jié)可以表示2'=256個狀態(tài),可以存儲一個整數(shù)(0-255范圍內(nèi)),也可以是一個英文字母的代碼,也可以是一個符號。
在計算機中,字節(jié)常用于表示文件或數(shù)據(jù)的長度和存儲容量的大小。
3)字和字長
計算機一次存取、處理和傳輸?shù)臄?shù)據(jù)稱為一個字(Word),即一組二進制位作為一個整體參與運算或處理的單元。一個字通常由一個或多個字節(jié)組成,用于存儲一條指令或一條數(shù)據(jù)。
一個字所包含的二進制位數(shù)稱為字長。不同電腦的字長是不一樣的。常用的字長有16位、32位和“位”,常被稱為16位機、32位機和64位機。字長是計算機性能的重要指標。字長越長,一次可以處理的位數(shù)越多,速度也越快。2.計算機中常用的數(shù)據(jù)編碼
數(shù)字可以分為無符號數(shù)(沒有符號的數(shù)字)和有符號數(shù)(有符號的數(shù)字)。對于無符號數(shù),所有位都用于表示數(shù)的大小。有符號數(shù)用最高位表示數(shù)的符號,即設(shè)置一個符號位,該位為0表示正數(shù),1表示負數(shù),其他位表示數(shù)的大小。
符號和數(shù)字的組合構(gòu)成了數(shù)字的內(nèi)部表示,稱為機器號。而它實際代表的帶符號的值稱為機器號的真值。機器數(shù)分為定點數(shù)和浮點數(shù)。機器號中,真值的正負號用0、1代替。機器號用一定的字長表示,即假設(shè)字長為,一個機器號總是用n位二進制表示。
在計算機中,機號有三種表示方式:原碼、補碼和反碼。
1)原碼、補碼和反碼
(1) 原碼: 對于無符號數(shù),原碼是由數(shù)值本身表示的二進制碼。
對于有符號數(shù),原始代碼是由符號和值表示的二進制代碼。原來有符號數(shù)的編碼規(guī)則是:用最高位表示符號,正數(shù)用0表示,負數(shù)用1表示,其他位表示數(shù)的絕對值。例如,如果字長為8 位,則10
進制整數(shù)+1的原碼表示為0000 0001,一1的原碼表示為1000 0001。(2)反碼:反碼使用得較少,它只是補碼的一種過渡。
對于無符號數(shù),反碼是一種對數(shù)值按位取反(對0取反得到1,對1取反得到0)表示的二進制編碼。
對于有符號數(shù),反碼是一種用符號位和對數(shù)值按位取反表示的二進制編碼。有符號數(shù)的反碼編碼規(guī)則是:用最高位表示符號,正數(shù)用。表示,負數(shù)用1表示,正數(shù)的反碼是其原碼本身,負數(shù)反碼的數(shù)值部分是原碼的數(shù)值部分按位取反。例如,設(shè)字長為8位,則十進制整數(shù)+1的反碼表示為0000 0001,一1的反碼表示為1111 1110。
(3)補碼:補碼是計算機中表示和處理有符號數(shù)的運算時常用的一種方式。
對于無符號數(shù),補碼是一種對數(shù)值按位取反并加1表示的二進制編碼。對于有符號數(shù),補碼是一種用符號和對數(shù)值按位取反并加1表示的二進制編碼.有符
號數(shù)的補碼編碼規(guī)則是:用最高位表示符號,正數(shù)用。表示,負數(shù)用1表示;正數(shù)的補碼是其原碼本身,負數(shù)補碼的數(shù)值部分是對其原碼的數(shù)值部分按位取反后加1。例如,設(shè)字長為8位,則十進制整數(shù)+1的補碼表示為0000 0001,一1的補碼表示為1111 1111。
2) BCD碼
計算機使用二進制數(shù)來處理信息,但是如果用二進制的形式來輸人和輸出數(shù)據(jù),就十分不方便了.一般來說,輸入時采用十進制數(shù)。因此計算機把十進制數(shù)轉(zhuǎn)換成二進制數(shù)就要用到一種轉(zhuǎn)換碼,BCD碼就是其中的一種。BCD碼分為壓縮BCD碼和非壓縮BCD碼。對于壓縮BCD碼,每位BCD碼用四個二進制位表示,一個字節(jié)表示兩位BCD碼.非壓縮BCD碼用一個字節(jié)表示一位BCD碼,其高四位總是0000,低四位從0000-1001,分別表示0-9。
3) ASCII碼
ASCII碼(American Standard Code for Information Interchange,美國標準信息交換碼)已經(jīng)被國際標準化組織(International Standard Organization, ISO)采納,作為國際通用的標準信息交換碼。ASCII碼包含5;個大、小寫英文字母,0---9共10個數(shù)字字符,32個標點符號、運算符號、特殊符號,還有34個不可顯示和打印的控制字符編碼,一共有128個編碼。
ASCII碼一般在計算機的輸人輸出過程中使用,而二進制碼和BCD碼則在運算、處理過程中使用。因此,在應(yīng)用計算機解決實際問題時,常常需要在這幾種機器碼之間進行轉(zhuǎn)換。
4)小數(shù)的表示
當所要處理的數(shù)含有小數(shù)部分時,就存在一個如何表示小數(shù)點的問題。在計算機中并不用某個二進制位來表示小數(shù)點,而是規(guī)定小數(shù)點的隱含位置。若約定小數(shù)點的位置是固定的,則稱為定點表示法,用這種方法表示的數(shù)稱為定點數(shù);若約定小數(shù)點的位置是可以變動的,則稱為浮點表示法,用這種方法表示的數(shù)稱為浮點.數(shù)。
對于定點表示法,通常小數(shù)點的固定位置有兩種情況,一種是默認固定在數(shù)的最右邊,即只有整數(shù)部分而沒有小數(shù)部分,實際上也就是整數(shù).因此這種數(shù)也被稱為定點純整數(shù)。另一種是把小數(shù)點固定在符號位之后、最高數(shù)值位之前,即只有小數(shù)部分而沒有整數(shù)部分,因此也被稱為定點純小數(shù)。
當要處理的數(shù)既有整數(shù)部分又有小數(shù)部分時,采用定點表示法很不方便,因此一般采用浮點數(shù)來表示。
浮點數(shù)由階碼和尾數(shù)兩部分組成,表示為:
? ? ? ? ? ? N=2E X S
其中E是有符號的純整數(shù),表示浮點數(shù)N的階碼;S表示N的尾數(shù),是數(shù)值的有效數(shù)字部分,一般規(guī)定取二進制定點純小數(shù)形式.底數(shù)2在機器數(shù)中不出現(xiàn),是隱含的。
浮點數(shù)的格式如下:
5)其他編碼
原碼、補碼與反碼通常用來表示數(shù)值數(shù)據(jù),對于文字、圖形圖像、聲音等非數(shù)值數(shù)據(jù)的表示也有對應(yīng)的編碼標準.
(1)漢字編碼:為了使計算機能處理漢字,也必須對漢字進行編碼,在計算機中存放漢字實際上就是存放漢字的編碼。由于漢字數(shù)量大、字形復(fù)雜,因此漢字的編碼要比ASCII碼復(fù)雜得多。
為了能顯示和打印漢字,必須存儲漢字的字形.現(xiàn)在普遍使用的漢字字型碼是用點陣方式表示的,通常稱為“點陣字模碼”。
目前,漢字編碼通常采用雙七位編碼方案,即用兩個字節(jié)存放一個漢字,并規(guī)定兩個字節(jié)的首位必須為1,以便與西文ASCII碼區(qū)別。
(2) Unicode: Unicode(統(tǒng)一碼、萬國碼、單一碼)是基于通用字符集(UniversalCharacter Set)標準、在計算機上使用的一種字符編碼,它為全世界每種語言的每個字符設(shè)定了統(tǒng)一并且唯一的二進制編碼,以滿足跨語言、跨平臺進行文本轉(zhuǎn)換、處理的要求。
(3)音頻和視頻編碼:聲音信號是一種模擬信號,計算機要對它進行處理,必須將它轉(zhuǎn)換成為數(shù)字聲音信號,即用二進制數(shù)字的編碼形式來表示聲音。最基本的聲音信號數(shù)字化步驟是采樣、量化和編碼?;谝纛l數(shù)據(jù)的統(tǒng)計特性進行編碼的典型技術(shù)是波形編碼,PCM(脈沖編碼調(diào)制)是其中最簡單、最基本的編碼方法。改進方法則有差值量化(DPCM)、自適應(yīng)量化(APCM)和自適應(yīng)預(yù)測編碼(ADPCM)等,實現(xiàn)了數(shù)據(jù)的壓縮。此外,還有參數(shù)編碼和混合編碼方法。數(shù)字語音壓縮編碼有多種國際標準,如G.711,G.721,G. 726,G. 727 , G. 722 , G. 728.G. 729A,G. 723. 1, IS96 (CDMA)等。
計算機中的圖形數(shù)據(jù)有兩種常用的表示形式:一種稱為幾何圖形或矢量圖形,簡稱圖形;另一種稱為點陣圖像或位圖圖像。一般可以通過硬件(輸人輸出設(shè)備)或軟件實現(xiàn)圖形和圖像之間的轉(zhuǎn)換.圖像壓縮編碼方法有多種國際標準和工業(yè)標準,目前廣泛使用的編碼及壓縮標準有JPEG,MPEG和H. 261,MPEG是運動圖像壓縮算法的國際標準,它包括MPEG視頻、MPEG音頻和MPEG系統(tǒng)(視頻、音頻同步)三個部分。
3.數(shù)據(jù)在計算機中的存儲方式
用來存儲數(shù)據(jù)的設(shè)備稱為計算機的存儲設(shè)備,如內(nèi)存、硬盤、軟盤、光盤等。不同的存儲設(shè)備因所采用的材料不同而采用不同的方式來存儲數(shù)據(jù)。磁存儲、光存儲和半導(dǎo)體存儲是目前所使用的三種主要的存儲方式。
1)磁存儲
自從有計算機以來,磁介質(zhì)就一直在數(shù)據(jù)和信息的存儲中起著重要的作用。硬盤、軟盤和磁帶都是磁存儲器。
數(shù)據(jù)通過讀寫磁頭存儲到磁介質(zhì)上。讀寫磁頭實際上是用軟磁材料做鐵芯、繞有讀寫線圈的電磁鐵,它是通過磁化方式排列磁介質(zhì)上的金屬顆粒(氧化鐵與貓合劑的混合物)來記錄數(shù)據(jù)的。這些金屬顆粒對應(yīng)于二進制數(shù)位(例如,排成直線表示二進制數(shù)1,沒有排成直線則表示0)。寫磁頭記錄數(shù)據(jù),讀磁頭獲取數(shù)據(jù)。
2)光存儲
光存儲使用光信號來存儲信息.激光器產(chǎn)生的一束光通過一些透鏡,最后匯集在某個金屬盤片或塑料渦流盤的表面上.該盤片的反射模式(對應(yīng)于它所承載的數(shù)據(jù))是讀寫數(shù)據(jù)和信息的關(guān)鍵部分。典型的光存儲設(shè)備就是光盤。記錄數(shù)據(jù)時,一束強大的激光在光盤的表面打一個凹槽,這些激光凹槽的有和無對應(yīng)于二進制編碼中的1和0。讀取光盤上存儲的信息時,一束較弱的激光掃描光盤表面,感知凹槽的模式.該模式被反饋給閱讀器,由它解釋出數(shù)據(jù)并把數(shù)據(jù)發(fā)送給CPU(中央處理器或中央處理單元)。
3)半導(dǎo)體存儲
半導(dǎo)體存儲器(Semi-conductor Memory)是一種以半導(dǎo)體電路作為存儲媒體的存儲器。按其功能可分為隨機存取存儲器(Random Access Memory, RAM)和只讀存儲器(Read?Only Memory, ROM);按其制造工藝可分為雙極晶體管存儲器和MOS晶體管存儲器;按其存儲原理可分為靜態(tài)(Static)和動態(tài)(Dynamic)兩種。
ROM的電路結(jié)構(gòu)包含存儲矩陣、地址譯碼器和輸出緩沖器三個組成部分,使用時其內(nèi)容只能讀取,不可改寫。
靜態(tài)MOS存儲器由存儲體、讀寫電路、地址譯碼電路和控制電路等組成,其存儲體的基本單元為觸發(fā)器,接通表示1,斷開表示。。這種存儲器速度快,但功耗大且集成度較低,因此存儲容量較小。
動態(tài)MOS存儲器是靠電容的電荷存儲效應(yīng)存儲數(shù)據(jù)的,即電容充有電荷表示存儲1,沒有電荷表示存儲。,因此除了具有存儲體、讀寫電路、地址譯碼器和控制電路等部件外,還需要刷新電路,對存儲單元進行定期刷新以保證數(shù)據(jù)不丟失。這種存儲器速度較慢,但功耗低且集成度高,因此存儲容量大。
我們專注高端建站,小程序開發(fā)、軟件系統(tǒng)定制開發(fā)、BUG修復(fù)、物聯(lián)網(wǎng)開發(fā)、各類API接口對接開發(fā)等。十余年開發(fā)經(jīng)驗,每一個項目承諾做到滿意為止,多一次對比,一定讓您多一份收獲!