Tại sao dữ liệu giao dịch lại có thể “thay thế danh tính” trong AI tài chính?

Quang Trương
Quang Trương
Phản hồi: 0
Nếu mọi giao dịch của bạn đều “bị hiểu” qua hành vi, chứ không phải danh tính, liệu gian lận có còn đất sống?
1773900892119.png

Khi AI không còn đọc chữ mà đọc hành vi​

Có một điểm thú vị trong cách Mastercard tiếp cận AI: họ không dùng mô hình giống kiểu ChatGPT hay các hệ thống học từ văn bản, hình ảnh. Thay vào đó, họ xây một thứ gọi là mô hình bảng lớn, LTM.

Thay vì đọc câu chữ, mô hình này đọc dữ liệu giao dịch, tức là những bảng thông tin khổng lồ chứa lịch sử thanh toán. Nó không quan tâm bạn là ai, mà quan tâm bạn “hành xử như thế nào”.

Họ đã huấn luyện mô hình trên hàng tỷ giao dịch thẻ, và dự định mở rộng lên hàng trăm tỷ. Dữ liệu bao gồm nơi mua hàng, cách giao dịch được xác thực, các trường hợp gian lận, hoàn tiền, thậm chí cả hoạt động trong chương trình khách hàng thân thiết.

Một chi tiết quan trọng, toàn bộ thông tin cá nhân đều bị loại bỏ trước khi huấn luyện. Điều này khiến hệ thống không “nhận diện con người”, mà chỉ học các mẫu hành vi.

Nghe có vẻ thiếu dữ liệu, nhưng Mastercard cho rằng khi khối lượng đủ lớn, hành vi sẽ tự nói lên tất cả.

Các mô hình AI phổ biến hiện nay thường làm việc với dữ liệu không có cấu trúc, như văn bản hoặc hình ảnh. Chúng dự đoán từ tiếp theo, hoặc nhận diện nội dung.

LTM thì khác. Nó làm việc với dữ liệu có cấu trúc, dạng bảng nhiều chiều. Nó học cách các yếu tố liên quan với nhau, ví dụ như tần suất giao dịch, vị trí địa lý, giá trị đơn hàng.

Điểm mạnh nằm ở chỗ này:
nó có thể phát hiện những bất thường mà các quy tắc cứng trước đây không nhìn thấy.

Ví dụ, một giao dịch giá trị lớn nhưng hiếm gặp có thể bị hệ thống cũ đánh dấu là rủi ro. Nhưng LTM có thể nhìn sâu hơn, hiểu rằng hành vi đó vẫn “hợp lý” trong bối cảnh tổng thể.

Nói cách khác, nó không chỉ hỏi “có bất thường không”, mà hỏi “bất thường này có hợp lý không”.

Ứng dụng thực tế và bài toán chưa có lời giải​

Mastercard đang triển khai LTM trước tiên trong an ninh mạng và phát hiện gian lận. Đây là nơi cần xử lý lượng dữ liệu khổng lồ, và cũng là nơi sai sót có thể gây thiệt hại lớn.

Kết quả ban đầu cho thấy mô hình mới cải thiện hiệu suất trong một số tình huống cụ thể, đặc biệt là những giao dịch khó phân loại.

Tuy nhiên, họ không thay thế hoàn toàn hệ thống cũ. Thay vào đó là mô hình lai, kết hợp giữa quy tắc truyền thống và AI mới. Lý do rất rõ ràng, không có mô hình nào đúng trong mọi trường hợp.

Ngoài gian lận, LTM còn có thể được dùng trong quản lý danh mục đầu tư, phân tích nội bộ, hoặc theo dõi chương trình khách hàng thân thiết. Những nơi có dữ liệu bảng lớn và phức tạp.

Nhưng đi kèm là rủi ro.

Một mô hình dùng chung cho nhiều nhiệm vụ nếu gặp lỗi có thể gây ảnh hưởng diện rộng. Bên cạnh đó là các vấn đề quen thuộc nhưng khó giải quyết, như khả năng giải thích, kiểm toán, và sự chấp nhận từ cơ quan quản lý.

Mastercard đang lên kế hoạch mở API và SDK để các nhóm nội bộ xây thêm ứng dụng, đồng thời tiếp tục mở rộng dữ liệu và độ phức tạp của mô hình.

Một hướng đi khác của AI tài chính​

Điều đáng chú ý không chỉ nằm ở công nghệ, mà ở hướng đi.

Trong khi phần lớn thế giới AI đang tập trung vào văn bản, hình ảnh, và tương tác với người dùng, Mastercard lại quay về thứ “khô khan” hơn, dữ liệu bảng.

Nhưng chính những dữ liệu này mới là xương sống của ngân hàng và thanh toán.

Câu hỏi còn lại là:
liệu cách tiếp cận này có đủ ổn định, đủ minh bạch để được chấp nhận rộng rãi, hay sẽ chỉ dừng lại ở một thử nghiệm quy mô lớn? (artificialintelligence)
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
http://textlink.linktop.vn/?adslk=aHR0cHM6Ly93d3cudm5yZXZpZXcudm4vdGhyZWFkcy90YWktc2FvLWR1LWxpZXUtZ2lhby1kaWNoLWxhaS1jby10aGUtdGhheS10aGUtZGFuaC10aW5oLXRyb25nLWFpLXRhaS1jaGluaC44MDgzMS8=
Top