Tiến hóa của kỹ thuật cơ sở dữ liệu – Phần VIII


5/ Tăng năng suất phát triển các ứng dụng. Ưu điểm chính của tiếp cận theo cơ sở dữ liệu là giảm được giá và thời gian phát triển các ứng dụng kinh doanh mới. Có hai lý do quan trọng khiến các ứng dụng về cơ sở dữ liệu cần phát triển nhanh so với các ứng dụng trên tệp quen thuộc (i) thường người thiết kế quá chăm chú vào các chức năng dùng trong ứng dụng mới mà quên rằng đã có cơ sở dữ liệu và nhiều ứng dụng đang được sử dụng, (ii) việc phát triển các ứng dụng mới cũng đơn giản, thông qua các ngôn ngữ và công cụ tiện dụng.

6/ Tính chuẩn hóa cao. Khi dữ liệu được sử dụng trong nhiều hoạt động của tổ chức, tham gia vào quá trình ra quyết định thì chúng cần được chuẩn hóa để phù hợp với nhiều nhu cầu; việc theo chuẩn chung cho phép tăng hiệu quả sử dụng dữ liệu;

7/ Chất lượng dữ liệu được cải thiện. Theo Redman, năm 1995, chất lượng của dữ liệu là chủ đề được đề cập nhiều trong quản trị dữ liệu ngày nay. Nhiều công cụ suy luận, khai phá dữ liệu từ cơ sở dữ liệu yêu cầu dữ liệu có chất lượng đảm bảo. Hai trong số các biện pháp cho phép cải thiện chất lượng của dữ liệu là (i) người thiết kế cơ sở dữ liệu sử dụng các ràng buộc trên dữ liệu để ép dữ liệu thỏa mãn các điều kiện trong hệ quản trị cơ sở dữ liệu, và (ii) làm sạch dữ liệu. Trong công tác khai phá dữ liệu, kho dữ liệu, người ta luôn thực hiện các thao tác làm sạch dữ liệu.

Định nghĩa: Ràng buộc dữ liệu (constraint) là luật định mà người dùng trong cơ sở dữ liệu không được vi phạm;

8/ Tăng tính sẵn sàng và dễ truy cập của dữ liệu. Mỗi mô hình dữ liệu đều có ngôn ngữ truy cập dữ liệu phù hợp. Chẳng hạn cơ sở dữ liệu quan hệ cho phép người dùng sử dụng nhiều loại ngôn ngữ dữ liệu, như SQL, QUEL, QBE,…

9/ Giảm bớt việc bảo trì các chương trình. Cho dù các dữ liệu thường xuyên được cập nhật theo các nhu cầu sử dụng khác nhau, hệ thống cơ sở dữ liệu không nhất thiết phải chỉnh lý chương trình đã có. Tuy nhiên do yêu cầu đặc biệt, có thể phải chỉnh lý chương trình, nhưng cũng không nhiều như trong hệ thống xử lý tệp.

Tuy rằng tiếp cận theo cơ sở dữ liệu hứa hẹn nhiều ưu điểm, người ta không thể hi vọng đạt được tất cả những ưu điểm, nhất là khi mô hình dữ liệu trong tổ chức không còn hợp lý, đang sử dụng nhiều loại cơ sở dữ liệu đa dạng, mà các công nghệ mới không thể áp dụng được, chẳng hạn như công nghệ về kho dữ liệu, về khai phá dữ liệu.

4.5.1 Giá phải trả cho ứng dụng cơ sở dữ liệu

Như với bất kỳ quyết định kinh doanh nào, ứng dụng theo hướng cơ sở dữ liệu cần trả giá và chịu một vài rủi ro, như cần đến nhân sự mới và chuyên sau, chi phí quản lý và thực hiện, giải quyết va chạm tâm lý…

1/ Nhu cầu về nhân sự mới, chuyên môn. Người ta thường đi thuê hay tự đào tạo các chuyên gia công nghệ thông tin để phân tích, thiết kế, thực hiện cơ sở dữ liệu trong tổ chức. Mặt khác, công nghệ ngày càng phát triển nhanh đã khiến các hệ thống cơ sở dữ liệu thường xuyên cập nhật tri thức cho các cán bộ;

2/ Chi phí về quản lý, thực hiện. Hệ thống quản trị cơ sở dữ liệu nhiều người dùng thường lớn và phức tạp, đòi hỏi nhiều người tham gia và bảo trì. Người ta cần tính đến chi phí thiết bị máy tính, chi phí phần mềm, chi phí truyền thông;

3/ Chi phí chuyển đổi hệ thống. Trước khi áp dụng cơ sở dữ liệu, tổ chức đã xử lý dữ liệu theo phương pháp thủ công, hay sử dụng hệ thống xử lý tệp. Để chuyển công nghệ xử lý dữ liệu sang tiếp cận mới, tổ chức cần có kinh phí chuyển các mô hình cũ sang mô hình mới, chuyển đổi dữ liệu cho phù hợp với môi trường mới;

4/ Nhu cầu sao chép và khôi phục dữ liệu. Tuy không mong muốn, nhưng đôi khi vẫn xảy ra rủi ro với cơ sở dữ liệu, như mất dữ liệu, hỏng phần mềm, hư phần cứng… Hệ thống cơ sở dữ liệu có các công cụ cho phép sao chép dữ liệu phòng khi hỏng hóc và khôi phục lại dữ liệu khi xảy ra sự cố;

5/ Va chạm về quan điểm sử dụng cơ sở dữ liệu. Trước khi cơ sở dữ liệu được áp dụng trong tổ chức, người ta cần thống nhất về mô tả dữ liệu, các khuôn dạng thể hiện dữ liệu,… Sau khi hình thành cơ sở dữ liệu, việc sử dụng dữ liệu của cơ sở dữ liệu cần đạt hiệu quả. Do một số bộ phận muốn độc quyền thông tin hay e ngại dùng hệ thống tự động hóa, cho nên có thể có xu hướng giảm hiệu quả của cơ sở dữ liệu.

4.5.2/ Lý do dùng cơ sở dữ liệu

Lý do sử dụng cơ sở dữ liệu hay những ưu điểm của hệ thống cơ sở dữ liệu còn tùy thuộc vào hệ thống có một hay nhiều người dùng. Trước hết hãy xét trường hợp một người dùng.

+ Các dữ liệu được cô đọng, không cần lưu trữ trên nhiều trang, nhiều tệp;

+ Tốc độ nhanh;

+ Không gây mệt nhọc;

+ Kết quả chính xác;

+ Một ưu điểm phụ nữa là cho phép người ta xử lý dữ liệu tập trung.

Về những lợi ích của kiểu tiếp cận cơ sở dữ liệu, người ta có thể liệt kê các ưu điểm đặc biệt rút ra từ công tác điều khiển tập trung của hệ thống.

+ Dùng chung dữ liệu;

+ Giám bớt dư thừa dữ liệu;

+ Tránh được vi phạm tính nhất quán của dữ liệu;

+ Có thể đảm bảo xử lý giao tác. Giao tác là đơn vị thao tác logic, điển hình là cần đến một vài phép toán cơ sở dữ liệu. Chẳng hạn một giao tác gồm vài phép cập nhật. Một lưu ý đối với xử lý ở mức giao tác là tính nhỏ nhất của thao tác; tính chất này không những là ưu điểm của xử lý giao tác có nhiều người dùng mà còn cần thiết trong xử lý một người dùng.

+ Đảm bảo được tính toàn vẹn về dữ liệu. Các điều kiện mà dữ liệu cần thỏa mãn được phát biểu dưới dạng các ràng buộc về tính toàn vẹn. Người quản trị dữ liệu xác định ràng buộc về tính toàn vẹn và người quản trị cơ sở dữ liệu cài đặt. Cần lưu ý rằng tính toàn vẹn dữ liệu trong hệ thống cơ sở dữ liệu càng quan trọng hơn so với hệ thống các tệp dùng riêng, do việc dùng chung các dữ liệu là một yêu cầu nhất thiết đối với hệ thống cơ sở dữ liệu;

+ An toàn dữ liệu được nâng lên;

+ Cân đối được các yêu cầu tương tranh;

+ Tính chuẩn hóa tăng lên;

4.6/ Các thành phần của hệ thống cơ sở dữ liệu

Người ta sử dụng cơ sở dữ liệu để tạo nên môi trường cho phép  nhiều người dùng truy cập các dữ liệu dùng chung. Dữ liệu không gắn chặt vào một ứng dụng nào, cũng như không bị một ứng dụng nào điều khiển. Điều này đạt được là do người ta đã chia việc quản lý dữ liệu theo nhiều tầng độc lập; cụ thể là trách nhiệm tạo và bảo trì dữ liệu lưu trữ do phần mềm đặc biệt quản lý. Đó là hệ quản trị cơ sở dữ liệu, giữ vai trò điều khiển giữa người dùng và dữ liệu.

Các dữ liệu vẫn được ghi trong các tệp, nhưng dưới mắt người sử dụng các tệp được nhìn đại thể như kho dữ liệu. Mỗi người dùng đều cảm thấy chỉ có một mình ứng dụng của mình truy cập kho dữ liệu. Chẳng hạn đối với việc quản lý sách trong thư viện; các bộ phận khác nhau cùng truy cấp đến cơ sở dữ liệu, nhưng với các yêu cầu đa dạng như bổ sung sách mới, quản lý kho sách, quản lý bạn đọc.

Phần nhỏ của cơ sở dữ liệu dùng cho một ứng dụng cụ thể thường được mô tả trong khung nhìn người dùng. Các mục tin xuất hiện trong các khung nhìn không nhất thiết như nhau, mà cần theo dạng phù hợp với ứng dụng. Theo yêu cầu của ứng dụng cụ thể, mục tin được gọi theo tên riêng, không giống cách gọi của ứng dụng khác. Chẳng hạn dữ liệu về tên cuốn sách trong công tác bạn đọc được gọi là tên tài liệu, còn trong công tác quản lý kho được gọi là tên. Chính hệ quản trị cơ sở dữ liệu cần quản lý tên, ý nghĩa của từng dữ liệu đối với các khung nhìn.

(còn tiếp)

TH: T.Giang – CSCI

Nguồn tham khảo: Đỗ Trung Tuấn – An toàn cơ sở dữ liệu – NXB ĐHQGHN 2018

Bình luận về bài viết này