Bảo mật kho dữ liệu khổng lồ của VietinBank
Ông Phạm Thế Trường |
Ngày 17/2/2014, VietinBank cùng các đối tác ETC TechMahindra và SAP Việt Nam đã chính thức khởi động Dự án Kho Dữ liệu Doanh nghiệp đặt tại Hội sở VietinBank. Đây là dự án kho dữ liệu DN được cho là lớn nhất trong ngành Ngân hàng Việt Nam, với quy mô gần 40 terabyte dữ liệu (gấp 40 lần so với 1 hệ thống core banking bình thường). Tổng chi phí đầu tư cho dự án lên đến 5,6 triệu USD (khoảng 122 tỷ đồng).
Dự án sẽ giúp VietinBank xây dựng nền tảng dữ liệu được vận hành và quản lý bằng công nghệ mạnh mẽ và tin cậy, đáp ứng các yêu cầu hiện tại và nhu cầu phát triển, mở rộng của VietinBank trong tương lai. Ngoài ra, dự án cũng đóng vai trò quan trọng trong việc hỗ trợ VietinBank nâng cao hoạt động quản lý, giám sát và quản trị rủi ro theo tiêu chuẩn quốc tế.
Ông Phạm Thế Trường, Giám đốc điều hành SAP Việt Nam cho biết: Việc bảo toàn những dữ liệu nhạy cảm trong lĩnh vực ngân hàng là một trong những thách thức lớn nhất khi triển khai dự án này.
Ông có thể nói rõ hơn về những thách thức trong việc xây dựng kho dữ liệu này?
Đây là dự án lớn và đặc biệt trong lĩnh vực ngân hàng, nơi có nhiều dữ liệu "nhạy cảm" cần được bảo toàn. Thách thức đầu tiên của chúng tôi là làm thế nào để tích hợp tất cả các dữ liệu từ trên 20 nguồn dữ liệu khác nhau mà vẫn đảm bảo chất lượng và sự vẹn toàn của dữ liệu. Thứ hai là chuyển đổi dữ liệu từ vài hệ thống core banking (Internet banking, Trade finance, Fidelity Core banking...) một cách êm ái và không ảnh hưởng tới các hoạt động hàng ngày tại VietinBank.
Ngoài ra còn có thách thức về mặt quy mô dữ liệu. Ước tính hệ thống này sẽ có quy mô gần 40 terabyte dữ liệu, trong khi hiện tại cũng chưa có hệ thống core banking nào có quy mô trên 1 terabyte dữ liệu. Nguyên tắc xử lý dữ liệu là khi chúng ta tăng gấp đôi khối lượng dữ liệu, thời gian xử lý (response time) sẽ không chỉ lâu gấp đôi mà sẽ lâu gấp nhiều lần. Vì vậy, thách thức của chúng tôi sẽ là làm thế nào để đảm bảo hiệu suất trong một hệ thống lên đến 40 terabyte, vì rõ ràng nếu hệ thống mất 3 ngày trời để xử lý một truy vấn thì sẽ không còn nhiều ý nghĩa nữa.
Trong quá trình chuẩn bị làm dự án, chúng tôi đã làm POC (chứng minh khả năng - Proof of Concept) để chứng minh hiệu năng công nghệ của giải pháp. Và đó là cơ sở để chúng tôi chắc chắn rằng Dự án Kho dữ liệu DN sẽ thành công và mang lại hiệu suất cao nhất cho VietinBank.
Với khối lượng dữ liệu lớn như vậy, việc đảm bảo an toàn sẽ như thế nào, thưa ông?
Đối với bất kỳ hệ thống nào, chúng ta cũng phải có được sự cân bằng giữa hiệu năng và tính bảo mật của hệ thống. Trong hệ thống Kho Dữ liệu DN, chúng ta không có nhiều người tương tác với hệ thống. Công tác bảo mật sẽ là cô lập từng tầng dữ liệu. Những người dùng sẽ chỉ khai thác vào tầng tổng hợp ở trên và số lượng người dùng thường xuyên cũng không nhiều. Điều này trái ngược với những hệ thống như internet banking vốn đặt vấn đề bảo mật lên trên hết, vì hệ thống internet banking rất dễ bị xâm nhập từ Internet.
Đối với các hệ thống kho dữ liệu, ưu tiên về bảo mật sẽ là tạo ra một vùng an toàn về dữ liệu và chỉ có những chuyên viên khai thác được phép truy cập, để tránh phải sử dụng quá nhiều tầng mã hóa bảo mật sẽ làm giảm hiệu năng. Tuy nhiên, công nghệ SAP cũng cho phép triển khai rất nhiều tầng bảo mật và trong mỗi tầng sẽ có nhiều phương thức bảo mật như mã hóa, ngụy trang (masking), phân quyền. Chúng tôi sẽ chia dữ liệu thành các lớp khác nhau và tách giữa tầng logic và tầng physical để tránh việc những người dùng cuối có thể truy cập vào dữ liệu gốc. Mặc dù hiệu suất của hệ thống là quan trọng nhưng thiết kế của hệ thống vẫn đảm bảo tất cả các tiêu chí về bảo mật trong ngân hàng.
Dự án giúp VietinBank nâng cao hoạt động quản lý, giám sát và quản trị rủi ro theo tiêu chuẩn quốc tế
Còn về khả năng phòng ngừa rủi ro của hệ thống?
Có nhiều tầng dự phòng để đảm bảo hệ thống sẽ chạy liên tục, không gián đoạn. Kho dữ liệu được thiết kế để có 1 hệ thống chính chạy tại trụ sở VietinBank và 1 hệ thống dự phòng y hệt ở cách đây 30 km. 2 hệ thống kết nối với nhau bằng đường cáp quang, đồng bộ liên tục về dữ liệu và tương đương về mặt hiệu năng. Mỗi máy đều có máy dự phòng có thể giải quyết các vấn đề tại chỗ.
Đặc biệt, trong mỗi node đều có hệ thống dự phòng nội bộ, nên nếu có 1 ổ đĩa hay 1 thanh ram hỏng thì cả hệ thống vẫn chạy chứ không cần phải chuyển sang hệ thống dự phòng. Chỉ trong trường hợp có thảm họa, lúc đó chúng ta mới cần đến hệ thống dự phòng.
Xin cảm ơn ông!
Nguyễn Hà lược ghi