Chương 1
Các khái niệm về RDBMS
Mục tiêu bài học
Giải thích khái niệm về dữ liệu và cơ sở dữ liệu.
Miêu tả cách tiếp cận để quản lý dữ liệu.
Định nghĩa hệ quản trị Cơ sở dữ liệu và các ưu điểm của nó.
Giải thích sự khác nhau giữa các mô hình Cơ sở dữ liệu.
Định nghĩa và giải thích về RDBMS.
Miêu tả các thực thể, các bảng và các tính chất của bảng.
Sự khác nhau giữa một DBMS và RDBMS.
Dữ liệu và Cơ sở dữ liệu
Thông tin được lưu trữ trở thành dữ liệu (data). Tổng hợp các dữ liệu lại trở thành thông tin
Ví dụ :
Thông tin về mỗi trận đấu của một kỳ bóng đá WorldCup được lưu lại gồm đội tham gia, tỷ số, danh sách cầu thủ,…
Dựa vào các dữ liệu (thông tin của mỗi trận đấu đã được lưu lại) chúng ta có thể biết được thông tin về 10 trận đấu hay nhất, các đội chơi hay, cầu thủ xuất xắc,… trong kỳ WorldCup
Khái niệm dữ liệu hẹp hơn khái niệm thông tin. Thông tin luôn mang ý nghĩa và gồm nhiều giá trị dữ liệu.
Ví dụ :
Cô Đào ngụ ở 17 Lê Duẩn Đà nẵng đã đặt mua bia chai Tiger ngày 15/11/1998.
Một cơ sở dữ liệu là một tập hợp các dữ liệu về hoạt động (mua bán, tuyển sinh, khám chữa bệnh, …) của một tổ chức cụ thể được lưu trữ trên các thiết bị lưu trữ và được các chương trình ứng dụng khai thác cho việc xử lý, tìm kiếm, tra cứu, sửa đổi, bổ sung hay loại bỏ dữ liệu.
Ví dụ:
Trong quản lý thư viện có các dữ liệu về sách, về độc giả, mượn trả,…phục vụ cho chương trính ứng dụng quản lý thư viện.
Tổ chức ngân hàng có các dữ liệu về khách hàng, dữ liệu về số tài khoản, các lần giao dich … phục vụ cho các chương trình ứng dụng của ngân hàng
Trường học có các dữ liệu về sinh viên, giáo viên,…phục vụ cho các chương trình quản lý đào tạo
Dữ liệu và Cơ sở dữ liệu
Minh họa một CSDL đơn giản




Vì vậy, một CSDL là một tập dữ liệu được tổ chức sao cho dễ dàng truy cập, quản lý và cập nhật.
Quản lý dữ liệu
Quản lý dữ liệu là xử lý số lượng lớn thông tin, bao gồm sự lưu trữ và thao tác thông tin.
Có hai cách tiếp cận khác nhau để quản lý dữ liệu:
Các hệ thống file
Các hệ thống CSDL
Các hệ thống file 1-3
Các điểm đặc trưng của các hệ thống file:
Mỗi chương trình ứng dụng có một file lưu trữ dữ liệu riêng biệt.
Ví dụ:
Phòng quản lý sinh viên, sử dụng hệ thống quản lý danh sách sinh viên, lưu trữ thông tin cá nhân của sinh viên. Phòng đào tạo dùng hệ thống quản lý điểm theo dõi thông tin về học tập của sinh viên. Hai chương trình có các file dữ liệu riêng.
Trong hệ thống này, một nhóm các file được lưu trữ trên một máy tính và có thể được truy cập bởi một điều hành viên.
Ví dụ



CSDL bán hàng sẽ chứa các bảng sau:
PropertyForRent (PropertyNo, Address, Type, Rent, OwnerNo)
PrivateOwner (OwnerNo, Name, Address, TelNo)
Client (ClientNo, Name, Address, TelNo, PrefType, MaxRent)
Các hệ thống file 2-3
CSDL
bán hàng
Các hệ thống file 3-3
Nhược điểm của các hệ thống file:
Dư thừa và không nhất nhất quán dữ liệu
Những truy vấn dị thường
Sự cô lập dữ liệu
Dị thường khi truy cập dữ liệu
Các vấn đề về bảo mật
Các vấn đề về toàn vẹn
Các hệ thống CSDL
Các CSDL được dùng để lưu trữ dữ liệu một cách hiệu quả và có tổ chức sao cho quản lý được nhanh chóng và dễ dàng.
Các ưu điểm của các hệ thống CSDL:
Giảm bớt sự dư thừa dữ liệu
Nhất quán dữ liệu
Dữ liệu lưu trữ có thể được chia sẻ
Có thể thiết lập các luật lên dữ liệu
Toàn vẹn dữ liệu
Bảo mật dữ liệu
Hệ quản trị CSDL (DBMS) 1-2
Hệ quản trị CSDL là hệ thống phần mềm cho phép định nghĩa, xây dựng và bảo trì csdl. Toàn bộ các thao tác truy cập, cập nhật trên csdl của người dùng đều do hệ quản trị csdl điều khiển.
Hệ quản trị csdl cung cấp môi trường thuận tiện và hiệu quả để khi có một khối lượng dữ liệu lớn và giao dịch được xử lý
DBMS hổ trợ các ngôn ngữ truy vấn khác nhau, ngôn ngữ truy vấn phổ biến nhất là SQL (Structured Query Language – Ngôn ngữ vấn tin có cấu trúc ).
Hệ quản trị CSDL (DBMS) 2-2
CSDL
Dữ liệu vào / ra
DBMS
Dữ liệu vào / ra
Các lợi ích của DBMS 3-2
Các lợi ích phổ biến của DBMS:
Lưu trữ dữ liệu
Định nghĩa dữ liệu
Thao tác trên dữ liệu
Bảo mật và toàn vẹn dữ liệu
Khôi phục dữ liệu
Truy cập đồng thời và điều khiển khiển đa truy cập
Các ngôn ngữ truy xuất CSDL và các giao diện lập trình ứng dụng
Các mô hình CSDL 1-5
Tùy vào mục đích xây dựng hệ thống mà các CSDL có thể khác nhau về chức năng và mô hình dữ liệu.
Một mô hình dữ liệu mô tả kho chứa dữ liệu, mô tả xử lý và truy xuất dữ liệu từ kho đó.
Một mô hình dữ liệu gồm có:
Hệ thống các ký hiệu biểu diễn dữ liệu
Tập hợp các phép toán thao tác trên csdl
Các mô hình CSDL 2-5
Mô hình phân cấp
Mô hình mạng
Mô hình quan hệ
Các mô hình CSDL 3-5
Mô hình dữ liệu phẳng
Mô hình này được dùng cho các CSDL đơn giản. CSDL chỉ chứa một bảng hoặc 1 file.
Nhược điểm
Không quản lý được khối lượng dứ liệu lớn
Dữ liệu bị dư thừa
Ví dụ: cấu trúc của mô hình file dữ liệu phẳng
Các mô hình CSDL 3-5
Mô hình phân cấp
Các bản ghi liên quan với nhau được biểu diễn bằng cấu trúc cây.
Một csdl phân cấp là tập các cây (rừng cây). Mỗi cây chỉ có một và chỉ một bản ghi gốc (bản ghi cha), và dưới nó là tập các bản ghi phụ thuộc (các bản ghi con). Một bản ghi cha có thể có nhiều bản ghi con, nhưng một bản ghi con chỉ có một bản ghi cha. Bản ghi con cũng có thể có các bản ghi con khác

Ví dụ mô hình phân cấp










Ưu điểm:
Dữ liệu được lưu giữ trên csdl, vì vậy được chia sẻ một cách dễ dàng, và được bảo mật bởi hệ quản trị csdl
Độc lập dữ liệu được hệ quản trị csdl giúp giảm được chi phí bảo trì chương trình
Các mô hình CSDL 4-5
Mô hình mạng
Nó tương tự như mô hình phân cấp.
Thực tế mô hình phân cấp là tập con của mô hình mạng.
Mô hình mạng sử dụng kiến trúc cây phân cấp và cho phép các bản ghi con có thể có nhiều bản ghi cha.
Dữ liệu được lưu trữ trong các bộ thay vì lưu trong định dạng cây phân cấp. Điều này giải quyết vấn đề dư thừa dữ liệu.

Ví dụ mô hình mạng








Sinh viên
Môn học
Điểm
Ưu điểm:
Thiết lập các quan hệ trên mô hình mạng dễ dàng hơn trên mô hình phân cấp
Mô hình này đảm bảo sự toàn vẹn dữ liệu
Đạt được sự độc lập dữ liệu cần thiết
Nhược điểm
Khó thiết kế csdl theo mô hình này
Phải nắm rõ cấu trúc bên trong csdl người lập trình mới có thể truy cập csdl
Truy cập bản ghi dữ liệu theo phương pháp tuần tự
Các mô hình CSDL 5-5
Lý thuyết mô hình quan hệ được xây dựng dựa trên nền tảng khái niệm của lý thuyết tập hợp trong toán học
Trong mô hình quan hệ, không có các liên kết vật lý. Tất cả dữ liệu được biểu diễn dưới dạng thống nhất là dạng bảng hai chiều.
Dữ liệu trong hai bảng, quan hệ thông qua một trường chung.
Các thao tác thực hiên trên các hàng của bảng.
Trong mô hình này CSDL như là một tập các bản ghi quan hệ. Một hàng gọi là một tuple, một cột gọi là một thuộc tính và một bảng gọi là một quan hệ. Danh sách các giá trị của một trường gọi là miền giá trị.
Mô hình quan hệ

Ví dụ mô hình quan hệ








Hệ quản trị CSDL quan hệ (RDBMS)
Một hệ quản trị CSDL quan hệ (RDBMS) là một hệ quản trị CSDL được xây dựng trên mô hình quan hệ.
Một CSDL quan hệ là một CSDL được chia nhỏ thành các đơn vị logic gọi là bảng, các bảng có quan hệ với nhau trong CSDL.
Bảng 1
Khóa

Dữ liệu...
Bảng 2
Khóa


Dữ liệu...
Quan hệ
CSDL
Các khái niệm liên quan đến RDBMS
Các khái niệm thường dùng trong RDBMS:
Dữ liệu được biểu diễn như một tập các bản ghi quan hệ.
Mỗi một quan hệ mô tả một bảng.
Các cột là các thuộc tính.
Các hàng (“tuples”) biểu diễn một thực thể.
Mọi bảng có một tập các thuộc tính là khóa, mà giá trị chứa trong nó xác định duy nhất mỗi thực thể.
Người dùng RDBMS
Nhiều nhóm người dùng như thiết kế, sử dụng và thao tác trên một CSDL lớn:
Người quản trị CSDL
Người thiết kế CSDL
Người phân tích hệ thống và lập trình ứng dụng
Người thiết kế DBMS và thực thi
Người dùng đầu cuối.
Các thực thể và các bảng
Một thực thể là một người, một đối tượng, một sự kiện, … mà nó có thể xác định riêng biệt.
Một thực thể có một số tính chất được xem như là các thuộc tính và mỗi thực thể được gán một tên.
Một bảng chứa một nhóm các thực thể gọi là tập các thực thể.
Khái niệm bảng và tập các thực thể có thể thay thế cho nhau. Một bảng được gọi là một quan hệ, các hàng được xem như tuples và các cột được xem như các thuộc tính.
Các thuộc tính
EMPLOYEE
Bảng
Tuple
Sự khác nhau giữa DBMS và RDBMS
Tóm tắt bài học
Một CSDL là một tập dữ liệu có quan hệ được lưu trữ trong các bảng.
Một hệ quản trị CSDL có thể được định nghĩa như một tập các bản ghi quan hệ và các chương trình có thể truy cập và thao tác trên các bản ghi.
Một mô hình dữ liệu mô tả một bộ chứa dữ liệu và xử lý dữ liệu từ bộ chứa đó.
DBMS là một tập các chương trình mà nó cho phép người dùng lưu trữ, cập nhật và trích rút thông tin từ một CSDL.
Một hệ quản trị CSDL quan hệ (RDBMS) là một phần mềm cho phép tạo, thao tác, cập nhật trên một CSDL quan hệ.
Một CSDL quan hệ được chia nhỏ thành các đơn vị logic gọi là bảng. Các đơn vị logic này có quan hệ với nhau trong CSDL.
nguon VI OLET