Saturday, December 8, 2018

Ứng dụng của trí tuệ nhân tạo để phát hiện hackers ít được biết đến




Máy học không cần giám sát của công ty Darktrace có khả năng phát hiện ra kẻ xâm nhập trước khi bị gây ra thiệt hại nghiêm trọng.



Bài viết thuộc về KarenHao, tháng 11 năm 2018.

Vào năm 2013, một nhóm các đặc vụ tình báo của Anh đã phát hiện ra một số hoạt động chưa từng thấy trước đó. Để bảo vệ tài nguyên mạng thì tất cả sẽ chọn cách chống kẻ tấn công từ bên ngoài, nghĩa là không cho kẻ tấn công lọt vào trong hệ thống. Nhưng ở Anh có một nhóm làm điều ngược lại nghĩa là cho kẻ tấn công có thể lọt vào hệ thống nhưng không cho thông tin chiếm đoạt được lọt ra ngoài.

Một nhóm các nhà Toán học có chuyên môn tại Đại Học Cambridge đã phát triển một công cụ sử dụng máy học để hiểu và phát hiện các vi phạm trong nội bộ hệ thống. Chuyện này gần giống như là việc huấn luyện thuật toán dựa vào các cuộc tấn công mạng đã diễn ra trước đó, tuy nhiên hệ thống vẫn cần những cách khác để có thể nhận ra các cuộc tấn công “kì dị” nghĩa là một hình thái tấn công mạng chưa từng có trước đó. Từ đây, hệ thống bắt đầu hiểu và tự mình xử lý các cuộc tấn công phức tạp hay nói cách khác các máy học lúc này không cần sự giám sát hay chỉ dẫn của con người.

“Cơ chế hoạt động của nó giống như là hệ thống miễn dịch của con người, cơ bản chúng chỉ tìm hiểu những gì đang tồn tại trong bản thân và nếu không phải thì nó
phản ứng lại một cách cực nhanh và chính xác”- CEO của Darktrace là Nicole Eagan nói.



Phần lớn các ứng dụng của trí tuệ nhân tạo trong thực tế là trí thông minh nhân tạo được giám sát. Điều đó nghĩa là để các máy học này trở nên thông minh hơn thì cần chăm nuôi chúng bằng một khối lượng khổng lồ về dữ liệu được phân loại rõ ràng để chúng có thể xác định và trả các kết quả phân loại đúng như mong muốn.

 Ví dụ để làm ra một bạn máy học có khả năng xác định đâu là cục vàng đâu là cục c*t thì các nhà khoa học phải nuôi nó từ hàng trăm đến hàng ngàn bức ảnh đâu là cục vàng đâu là không phải cục vàng. Vậy là sau nhiều lần học máy học bắt đầu có khả năng xác định đâu là vàng để lấy và đâu là không phải để bỏ qua. Càng nuôi nhiều dữ liệu được nuôi thì máy học càng cho kết quả chính xác.

Trong nghành bảo mật, máy học có giám sát hoạt động rất tốt. Bạn nuôi chúng càng nhiều loại hình tấn công đã có trước đó thì chúng càng thông minh và có khả năng dự đoán loại hình tấn công để ngăn chặn càng chính xác.



Nhưng có hai vấn đề chính.
Một là chúng chỉ có thể phát hiện ra các loại hình tấn công mà chúng đã từng được học, nếu kẻ xâm nhập dùng các phương pháp tấn công dị dị thì máy học lúc đó cũng chịu. Vấn đề thứ hai là dữ liệu để nuôi máy học trong ngành công nghiệp bảo mật không thật sự dồi dào, các tình huống tấn công đặc biệt có rất ít thông tin so với các tình huống tấn công bình thường còn lại.

May thay, khi mà các máy học được hướng dẫn đem lại kết quả không đáp ứng được nhu cầu của người thiết kế nó thì các máy học không cần hướng dẫn lại cho các kết quả cực kì khả quan.Mỉa mai ở chỗ các máy học “thất học” lại có thể đọc và hiểu các dữ kiện chưa được phân loại cực chính xác và có khả năng nhận ra các hình thái tấn công chưa từng có trước đó. Nhờ vậy mà các máy học không cần giám sát lại có thể vượt qua các cuộc tấn tấn công chưa từng có đối với hệ thống và yêu cầu ít dữ liệu về các trường hợp dị hơn là loại máy học còn lại.



Khi công ty Darktrace triển khai phần mềm, họ phải thiết lập các cảm biến cả về mặt phần cứng và phần mềm xung quanh mạng lưới khách hàng để xác định được các hoạt động. Dữ liệu thô được đổ vào 60 thuật máy học không giám sát và để chúng tự cạnh tranh lẫn nhau để tìm ra các hình thái tấn công bất thường.



Các thuật toán này sau đó trả một kết quả về một thuật toán trung tâm có sử dụng một số phương pháp thống kê để quyết định xem các thuật toán nào trong 60 thuật toán máy học để làm theo và những thuật toán nào sẽ bị loại bỏ. Tất cả sự phức tạp đó sẽ được đóng gói vào một phiên bản mô phỏng cuối cùng cho phép người dùng quan sát trực tiếp và phản hồi lại các nguy cơ tiềm ẩn đang được phát hiện. Khi mà người dùng suy nghĩ phải làm gì tiếp theo thì hệ thống này cách ly các nguy cơ tiềm tàng cho đến khi nó được xử lý, cách ly bằng cách cắt đứt mọi quan hệ của thiết bị đang gặp phải.

Loại máy học không cần giám sát từ Darktrace tuy có hiệu quả nhưng không phải là viên đạn bạc mà có thể trừ tà mọi tình huống tấn công xảy ra. Điều này chỉ càng làm cho kẻ tấn công ngày càng tinh vi hơn, chuyên nghiệp hơn khi lừa qua hệ thống. “Chuyện này cũng giống như là trò chơi mèo vờn chuột, kẻ tấn công sẽ thích nghi và bắt đầu thay đổi cách tấn công của mình” – Dawn Song một chuyên gia về bảo mật và máy học từ đại học Berkeley, Calofornia nói.



Thực tế, thì cộng đồng bảo mật an ninh mạng chuyển dần sang xu hướng tiếp cận vấn đề một cách chủ động hơn- “Bảo mật tốt hơn khi mà cấu trúc bảo mật bền vững hơn và các nguyên tắc được tuân thủ nghiêm ngặt” – Song nói. Còn rất lâu để có thể xác định các trường hợp mà máy học bị lừa cũng như là xóa hết các nguy cơ bảo mật tiềm tàng trong hệ thống. Sau cùng, cô ấy nói “Cả hệ thống bảo mật này được thể hiện qua các mối nối bảo mật bên trong nó”.

-->

Nguồn: MIT technology review
Link: https://bom.to/XYbmY

khuy

Author & Editor

You may come here to learn not to laugh sorry bout that btw haha

0 nhận xét:

Post a Comment

 
biz.