Máy học không cần giám sát của
công ty Darktrace có khả năng phát hiện ra kẻ xâm nhập trước khi bị gây ra thiệt
hại nghiêm trọng.
Bài viết thuộc về KarenHao,
tháng 11 năm 2018.
Vào năm 2013, một nhóm các đặc
vụ tình báo của Anh đã phát hiện ra một số hoạt động chưa từng thấy trước đó. Để
bảo vệ tài nguyên mạng thì tất cả sẽ chọn cách chống kẻ tấn công từ bên ngoài,
nghĩa là không cho kẻ tấn công lọt vào trong hệ thống. Nhưng ở Anh có một nhóm
làm điều ngược lại nghĩa là cho kẻ tấn công có thể lọt vào hệ thống nhưng không
cho thông tin chiếm đoạt được lọt ra ngoài.
Một nhóm các nhà Toán học có
chuyên môn tại Đại Học Cambridge đã phát triển một công cụ sử dụng máy học để
hiểu và phát hiện các vi phạm trong nội bộ hệ thống. Chuyện này gần giống như
là việc huấn luyện thuật toán dựa vào các cuộc tấn công mạng đã diễn ra trước
đó, tuy nhiên hệ thống vẫn cần những cách khác để có thể nhận ra các cuộc tấn
công “kì dị” nghĩa là một hình thái tấn công mạng chưa từng có trước đó. Từ
đây, hệ thống bắt đầu hiểu và tự mình xử lý các cuộc tấn công phức tạp hay nói
cách khác các máy học lúc này không cần sự giám sát hay chỉ dẫn của con người.
“Cơ chế hoạt động của nó giống
như là hệ thống miễn dịch của con người, cơ bản chúng chỉ tìm hiểu những gì
đang tồn tại trong bản thân và nếu không phải thì nó
phản ứng lại một cách cực
nhanh và chính xác”- CEO của Darktrace là Nicole Eagan nói.
Phần lớn các ứng dụng của trí
tuệ nhân tạo trong thực tế là trí thông minh nhân tạo được giám sát. Điều đó
nghĩa là để các máy học này trở nên thông minh hơn thì cần chăm nuôi chúng bằng
một khối lượng khổng lồ về dữ liệu được phân loại rõ ràng để chúng có thể xác định
và trả các kết quả phân loại đúng như mong muốn.
Ví dụ để làm ra một bạn máy học có khả năng
xác định đâu là cục vàng đâu là cục c*t thì các nhà khoa học phải nuôi nó từ
hàng trăm đến hàng ngàn bức ảnh đâu là cục vàng đâu là không phải cục vàng. Vậy
là sau nhiều lần học máy học bắt đầu có khả năng xác định đâu là vàng để lấy và
đâu là không phải để bỏ qua. Càng nuôi nhiều dữ liệu được nuôi thì máy học càng
cho kết quả chính xác.
Trong nghành bảo mật, máy học
có giám sát hoạt động rất tốt. Bạn nuôi chúng càng nhiều loại hình tấn công đã
có trước đó thì chúng càng thông minh và có khả năng dự đoán loại hình tấn công
để ngăn chặn càng chính xác.
Nhưng có hai vấn đề chính.
Một là chúng chỉ có thể phát
hiện ra các loại hình tấn công mà chúng đã từng được học, nếu kẻ xâm nhập dùng
các phương pháp tấn công dị dị thì máy học lúc đó cũng chịu. Vấn đề thứ hai là
dữ liệu để nuôi máy học trong ngành công nghiệp bảo mật không thật sự dồi dào,
các tình huống tấn công đặc biệt có rất ít thông tin so với các tình huống tấn
công bình thường còn lại.
May thay, khi mà các máy học
được hướng dẫn đem lại kết quả không đáp ứng được nhu cầu của người thiết kế nó
thì các máy học không cần hướng dẫn lại cho các kết quả cực kì khả quan.Mỉa mai
ở chỗ các máy học “thất học” lại có thể đọc và hiểu các dữ kiện chưa được phân
loại cực chính xác và có khả năng nhận ra các hình thái tấn công chưa từng có
trước đó. Nhờ vậy mà các máy học không cần giám sát lại có thể vượt qua các cuộc
tấn tấn công chưa từng có đối với hệ thống và yêu cầu ít dữ liệu về các trường
hợp dị hơn là loại máy học còn lại.
Khi công ty Darktrace triển
khai phần mềm, họ phải thiết lập các cảm biến cả về mặt phần cứng và phần mềm
xung quanh mạng lưới khách hàng để xác định được các hoạt động. Dữ liệu thô được
đổ vào 60 thuật máy học không giám sát và để chúng tự cạnh tranh lẫn nhau để
tìm ra các hình thái tấn công bất thường.
Các thuật toán này sau đó trả
một kết quả về một thuật toán trung tâm có sử dụng một số phương pháp thống kê
để quyết định xem các thuật toán nào trong 60 thuật toán máy học để làm theo và
những thuật toán nào sẽ bị loại bỏ. Tất cả sự phức tạp đó sẽ được đóng gói vào
một phiên bản mô phỏng cuối cùng cho phép người dùng quan sát trực tiếp và phản
hồi lại các nguy cơ tiềm ẩn đang được phát hiện. Khi mà người dùng suy nghĩ phải
làm gì tiếp theo thì hệ thống này cách ly các nguy cơ tiềm tàng cho đến khi nó
được xử lý, cách ly bằng cách cắt đứt mọi quan hệ của thiết bị đang gặp phải.
Loại máy học không cần giám
sát từ Darktrace tuy có hiệu quả nhưng không phải là viên đạn bạc mà có thể trừ
tà mọi tình huống tấn công xảy ra. Điều này chỉ càng làm cho kẻ tấn công ngày
càng tinh vi hơn, chuyên nghiệp hơn khi lừa qua hệ thống. “Chuyện này cũng giống
như là trò chơi mèo vờn chuột, kẻ tấn công sẽ thích nghi và bắt đầu thay đổi
cách tấn công của mình” – Dawn Song một chuyên gia về bảo mật và máy học từ đại
học Berkeley, Calofornia nói.
Thực tế, thì cộng đồng bảo mật
an ninh mạng chuyển dần sang xu hướng tiếp cận vấn đề một cách chủ động hơn- “Bảo
mật tốt hơn khi mà cấu trúc bảo mật bền vững hơn và các nguyên tắc được tuân thủ
nghiêm ngặt” – Song nói. Còn rất lâu để có thể xác định các trường hợp mà máy học
bị lừa cũng như là xóa hết các nguy cơ bảo mật tiềm tàng trong hệ thống. Sau
cùng, cô ấy nói “Cả hệ thống bảo mật này được thể hiện qua các mối nối bảo mật
bên trong nó”.
-->
Nguồn: MIT technology review
Link: https://bom.to/XYbmY
0 nhận xét:
Post a Comment