主頁 > 教育培訓 > 電腦培訓 > 計算機等級四級數(shù)據(jù)庫工程師復(fù)習資料

計算機等級四級數(shù)據(jù)庫工程師復(fù)習資料

  一、數(shù)據(jù)模型

  1.數(shù)據(jù)模型的三要素

  (1)數(shù)據(jù)結(jié)構(gòu) 數(shù)據(jù)結(jié)構(gòu)是所研究的對象類型(Object Type)的集合。這些對象和對象類型是數(shù)據(jù)庫的組成成分。一般可分為兩類:一類是與數(shù)據(jù)類型、內(nèi)容和其它性質(zhì)有關(guān)的對象;一類是與數(shù)據(jù)之間的聯(lián)系有關(guān)的對象。前者如網(wǎng)狀模型中的數(shù)據(jù)項和記錄,關(guān)系模型中的域、屬性和關(guān)系等。后者如網(wǎng)狀模型中的關(guān)系模型(set type)。在數(shù)據(jù)庫領(lǐng)域中,通常按照數(shù)據(jù)結(jié)構(gòu)的類型來命名數(shù)據(jù)模型,進而對數(shù)據(jù)庫管理系統(tǒng)進行分類。如層次結(jié)構(gòu)、網(wǎng)狀結(jié)構(gòu)和關(guān)系結(jié)構(gòu)的數(shù)據(jù)模型分別稱作為層次模型、網(wǎng)狀模型和關(guān)系模型。相應(yīng)地,數(shù)據(jù)庫分別稱作為層次數(shù)據(jù)庫、網(wǎng)狀數(shù)據(jù)庫和關(guān)系數(shù)據(jù)庫。

  (2)數(shù)據(jù)操作 數(shù)據(jù)操作是指對各種對象類型的實例(或值)所允許執(zhí)行的操作的集合,包括操作及有關(guān)的操作規(guī)則。在數(shù)據(jù)庫中,主要的操作有檢索和更新(包括插入、刪除、修改)兩大類。數(shù)據(jù)模型定義了這些操作的定義、語法(即使用這些操作時所用的語言)。數(shù)據(jù)結(jié)構(gòu)是對系統(tǒng)靜態(tài)特性的描述,而數(shù)據(jù)操作是對系統(tǒng)動態(tài)特性的描述。兩者既有聯(lián)系,又有區(qū)別。

  (3)數(shù)據(jù)的約束條件 數(shù)據(jù)的約束條件是完整性規(guī)則的集合。完整性規(guī)則是指在給定的數(shù)據(jù)模型中,數(shù)據(jù)及其聯(lián)系所具有的制約條件和依存條件,用以限制符合數(shù)據(jù)模型的數(shù)據(jù)庫的狀態(tài)以及狀態(tài)的變化,確保數(shù)據(jù)的正確性、有效性和一致性。

  2.概念模型

  數(shù)據(jù)模型是數(shù)據(jù)庫系統(tǒng)的核心和基礎(chǔ)。每個DBMS軟件都是基于某種數(shù)據(jù)模型的。為了把現(xiàn)實世界中的具體事物或事物之間的聯(lián)系表示成DBMS所支持的數(shù)據(jù)模型,人們首先必須將現(xiàn)實世界的事物及其之間的聯(lián)系進行抽象,轉(zhuǎn)換為信息世界的概念模型;然后將信息世界的概念模型轉(zhuǎn)換為機器世界的數(shù)據(jù)模型。也就是說,首先把現(xiàn)實世界中的客觀對象抽象成一種信息結(jié)構(gòu)。這種信息結(jié)構(gòu)并不依賴于具體的計算機系統(tǒng)和DBMS。然后,再把概念模型轉(zhuǎn)換為某一計算機系統(tǒng)上某一DBMS所支持的數(shù)據(jù)模型。因此,概念模型是從現(xiàn)實世界到機器世界的一個中間層次。現(xiàn)實世界的事物反映到人的大腦之中,然后人們開始認識這些事物,經(jīng)過選擇、命名、分類和組織等抽象工作之后形成概念模型,并進入到信息世界。

  •用戶(user) 關(guān)心的是現(xiàn)實世界中的事物、事物的屬性及其相互關(guān)系。例如,用戶可能關(guān)心他的顧客及其屬性,如顧客地址、銀行帳號等等。用戶也關(guān)心自己的定貨帳目,如誰訂的貨、訂的什么和訂多少等等。

  •系統(tǒng)分析員(analyst) 同樣也關(guān)心現(xiàn)實世界,但是系統(tǒng)分析員需要分析用戶的信息需求。作為需求分析的結(jié)果,分析員必須以文檔的形式對需求進行結(jié)構(gòu)化的描述;這個文檔就是信息模型。

  •實體(Entity) 實體是構(gòu)成數(shù)據(jù)庫的基本元素。實體是指一個存在的東西以區(qū)別這個東西所具有的屬性和這個東西與其它東西的聯(lián)系。實體可以是人,也可以是物;可以是實際對象,也可以是概念;可以是事物本身,也可以是指事物之間的聯(lián)系。

  •屬性(Attribute) 一個實體可以由若干個屬性來刻畫。屬性是相對實體而言的,是實體所具有的特性。

  •關(guān)鍵字(Key) 能唯一地標識實體的屬性的集合稱為關(guān)鍵字(或碼)。

  •域(Domain) 屬性的取值范圍稱作域。

  •實體型(Entity Type) 一類實體所具有的共同特征或?qū)傩缘募戏Q為實體型。一般用實體名及其屬性來抽象地刻畫一類實體的實體型。

  •實體集(Entity Set) 同型實體的集合叫實體集。例如,學生就是一個實體集。實體集的名即是實體型。對于學生和(學號,姓名,年齡,系,年級)均是實體型,而學生是對實體型(學號,姓名,年齡,系,年級)所起的名稱,兩者是指同一客觀對象。但本科生和研究生可以為相同實體型,而實體集不同。

  •聯(lián)系(Relationship) 現(xiàn)實世界的事物之間是有聯(lián)系的。一般存在兩類聯(lián)系:一是實體內(nèi)部的組成實體的屬性之間的聯(lián)系,二是實體之間的聯(lián)系。在考慮實體內(nèi)部的聯(lián)系時,是把屬性看作為實體。一般來說,兩個實體之間的聯(lián)系可分為三種:

  (1)一對一(1∶1)聯(lián)系 若對于實體集A中的每一個實體,實體集B中至多有唯一的一個實體與之聯(lián)系,反之亦然,則稱實體集A與實體集B具有一對一聯(lián)系,記作1∶1。

  (2)一對多(1∶n)聯(lián)系 若對于實體集A中的每個實體,實體集B中有n個實體(n≥0)與之聯(lián)系;反之,對于實體集B中的每一個實體,實體集A中至多只有一個實體與之聯(lián)系,則稱實體集A與實體集B有一對多聯(lián)系,記為1∶n。相應(yīng)地有多對一(n∶1)聯(lián)系 多對一聯(lián)系,從本質(zhì)上說,是一對多聯(lián)系的逆轉(zhuǎn)。其定義同一對多聯(lián)系類似,不再贅述。

  (3)多對多(m∶n)聯(lián)系 若對于實體集A中的每一個實體,實體集B中有n個實體(n≥0)與之聯(lián)系;反之,對于實體集B中的每一個實體,實體集A中也有m個實體(m≥0)與之對應(yīng),則稱實體集A與實體集B具有多對多聯(lián)系,記作m∶n。實質(zhì)上,多對多聯(lián)系是任意一種聯(lián)系。另外,同一實體集內(nèi)的各個實體間也可以有各種聯(lián)系。概念模型的表示方法最常用的是實體一聯(lián)系方法(Entity-Relationship Approach),簡稱E-R方法。該方法是由P.P.S.Chen在1976年提出的。E-R方法用E-R圖來描述某一組織的概念模型。在這里僅介紹E-R圖的要點。在E-R圖中:

  (1)長方形框表示實體集,框內(nèi)寫上實體型的名稱。

  (2)用橢圓框表示實體的屬性,并用有向邊把實體框及其屬性框連接起來。

  (3)用菱形框表示實體間的聯(lián)系,框內(nèi)寫上聯(lián)系名,用無向邊把菱形框及其有關(guān)的實體框連接起來,在旁邊標明聯(lián)系的種類。如果聯(lián)系也具有屬性,則把屬性框和菱形框也用無向邊連接上。

  3.三種主要的數(shù)據(jù)模型

  實際DBMS所支持的數(shù)據(jù)模型主要有三種:

  •層次模型(Hierarchical Model)

  •網(wǎng)狀模型(Network Model)

  •關(guān)系模型(Relational Model)其中,關(guān)系模型是當前DBMS所支持的數(shù)據(jù)模型的主流。90年代運行的DBMS幾乎都是基于關(guān)系模型的。層次模型和網(wǎng)狀模型統(tǒng)稱為非關(guān)系模型。非關(guān)系模型的結(jié)構(gòu)可以和圖論中的圖相對應(yīng),比較直觀,但在理論上不完備,實現(xiàn)效率較低,故此目前很少用。但是最近,層次模型在研究面向?qū)ο蟮腄BMS中已得到重視。在關(guān)系模型中,數(shù)據(jù)在用戶的觀點中(或在用戶視圖中)的邏輯結(jié)構(gòu)是一張二維表(Table)。

  •關(guān)系(Relation),對應(yīng)于平常講的一張表。

  •元組(Tuple),表中的一行。

  •屬性(Attribute),表中的一列稱為一個屬性,給每一列起一個名,稱為屬性名。這一列或這個屬性所有可能取的值的集合稱為這個屬性的值域(Domain),值域中的一個元素叫做這個屬性的值。

  •主關(guān)鍵字(Primary Key Attribute或Primary Key),是指能唯一標識一個元組的一個或一組屬性。

  •分量(Attribute value),是指元組中的一個屬性值。

  •關(guān)系模式(Relational Schema),是對關(guān)系的描述,一般用關(guān)系名(屬性名1,屬性名2,…,屬性名n)來表示。同層次模型和網(wǎng)狀模型相比較,關(guān)系模型具有下列特點:

  (1)概念單一 在關(guān)系模型中,無論是實體還是實體之間的聯(lián)系都用關(guān)系來表示。在關(guān)系模型中,在用戶的觀點中,數(shù)據(jù)的邏輯結(jié)構(gòu)就是表,也只有這唯一的概念。在非關(guān)系模型中,用戶要區(qū)分記錄型與記錄型之間的聯(lián)系兩個概念;當環(huán)境復(fù)雜時,數(shù)據(jù)結(jié)構(gòu)異常復(fù)雜,難以掌握。而關(guān)系模型,由于概念單一,可以變復(fù)雜為直觀、簡單,易學易用。

  (2)規(guī)范化 所謂關(guān)系規(guī)范化是指在關(guān)系模型中,每一個關(guān)系都要滿足一定的條件要求。這些條件被稱為規(guī)范條件。對于關(guān)系,一個最基本的規(guī)范條件是,要求關(guān)系中的每一個屬性(或分量)均是不可分的數(shù)據(jù)項;也就是說不允許表中有表,表是不可嵌套的。

  (3)在關(guān)系模型中,用戶對數(shù)據(jù)的操作的輸入和輸出都是表,也就是說,用戶通過操作舊表而得到一張新表。總之,關(guān)系模型概念簡單,結(jié)構(gòu)清晰,用戶易學易用,有嚴格的以數(shù)學為基礎(chǔ)的關(guān)系理論作指導,便于DBMS的實現(xiàn)?;陉P(guān)系的DBMS簡化了應(yīng)用程序員的工作,便于數(shù)據(jù)庫應(yīng)用系統(tǒng)的設(shè)計和維護。故此,關(guān)系模型自誕生以后就得到了迅速的發(fā)展,成為應(yīng)用最為廣泛的、唯一的數(shù)據(jù)模型。

免責聲明:該文觀點僅代表作者本人,查查吧平臺系信息發(fā)布平臺,僅提供信息存儲空間服務(wù),不承擔相關(guān)法律責任。圖片涉及侵權(quán)行為,請發(fā)送郵件至85868317@qq.com舉報,一經(jīng)查實,本站將立刻刪除。返回查查吧首頁,查看更多>>
提示

該文觀點僅代表作者本人,查查吧平臺系信息發(fā)布平臺,僅提供信息存儲空間服務(wù),不承擔相關(guān)法律責任。圖片涉及侵權(quán)行為,請發(fā)送郵件至85868317@qq.com舉報,一經(jīng)查實,本站將立刻刪除。

優(yōu)惠商城

更多