Microsoft NLWeb: Biến website thành ứng dụng AI, mở ra kỷ nguyên web mới

Derpy
Derpy
Phản hồi: 0

Derpy

Intern Writer
Trình duyệt web đã là giao diện mặc định để chúng ta truy cập thông tin trực tuyến suốt nhiều thập kỷ, nhưng giờ đây, tìm kiếm bằng AI đang dần thay đổi hoàn toàn giả định đó. Các công cụ như Microsoft Copilot đã cho phép người dùng đặt câu hỏi bằng ngôn ngữ tự nhiên và nhận câu trả lời trực tiếp, bỏ qua trang kết quả truyền thống.

Microsoft đang nỗ lực mở rộng sự thay đổi này xuống cấp độ từng trang web với NLWeb. Được công bố tại sự kiện Build 2025, đây là một giao thức mở cho phép bất kỳ tài sản web nào cũng có thể phản hồi các truy vấn bằng ngôn ngữ tự nhiên mà không cần thông qua công cụ tìm kiếm trung gian. Liệu Build 2026 có đánh dấu một bước tiến đáng kể trong việc áp dụng NLWeb, hay chỉ xác nhận rằng đây vẫn là một thử nghiệm đang tìm kiếm một tiêu chuẩn, là điều chúng ta cần đặc biệt chú ý.

NLWeb là viết tắt của Natural Language Web, một dự án mã nguồn mở từ Microsoft. Nó cho phép bất kỳ trang web nào chấp nhận và phản hồi các truy vấn bằng ngôn ngữ tự nhiên, biến một trang web thông thường thành thứ mà Microsoft mô tả là một ứng dụng được hỗ trợ bởi AI.
1780278806191.png

Dự án này được thai nghén và xây dựng bởi R.V. Guha, người đã gia nhập Microsoft với vai trò Phó Chủ tịch Tập đoàn (CVP) và Kỹ sư Kỹ thuật (Technical Fellow). Kinh nghiệm của Guha trong hạ tầng web rất quan trọng ở đây: ông là người đã tạo ra RSS, RDF và Schema.org – ba định dạng hiện đang là nền tảng cho cách nội dung có cấu trúc được chia sẻ và lập chỉ mục trên phần lớn web.

Microsoft đã giới thiệu NLWeb tại Build 2025 vào tháng 5 năm 2025 và so sánh trực tiếp vai trò của nó với HTML trong việc giúp việc tạo trang web trở nên dễ tiếp cận. Đây là một cách nhìn đầy tham vọng, và chúng ta nên xem xét nó một cách cẩn trọng. HTML đã giải quyết vấn đề xuất bản nội dung; NLWeb đang cố gắng giải quyết cách cả con người và các tác nhân AI truy vấn nội dung đó sau khi nó được xuất bản.

Điều làm NLWeb khác biệt so với một widget chatbot thông thường là mỗi điểm cuối (endpoint) của NLWeb cũng hoạt động như một máy chủ Giao thức Ngữ cảnh Mô hình (Model Context Protocol – MCP). MCP là một tiêu chuẩn mở mà Anthropic ban đầu phát triển vào tháng 11 năm 2024 để kết nối các hệ thống AI với các nguồn dữ liệu bên ngoài, và kể từ đó đã được ngành công nghiệp chấp nhận rộng rãi. Bằng cách xây dựng NLWeb trên nền tảng MCP, Microsoft đang kết nối trực tiếp nội dung trang web vào hệ sinh thái rộng lớn hơn của các tác nhân AI.

Một số đơn vị đã sớm áp dụng NLWeb bao gồm Shopify, TripAdvisor, Eventbrite, O'Reilly Media, các tài sản của Hearst như Delish, Chicago Public Media và Common Sense Media. Điểm chung rõ ràng giữa các tên tuổi này là các trang web được tổ chức tốt với danh mục nội dung có cấu trúc, loại nội dung dễ dàng ánh xạ vào các định dạng web mà NLWeb phụ thuộc.

Vậy giao thức NLWeb hoạt động như thế nào? NLWeb hoạt động dựa trên dữ liệu có cấu trúc mà hầu hết các trang web đã xuất bản. Nó đọc các định dạng như Schema.org và RSS, vốn đang được sử dụng trên hơn 100 triệu trang web theo tài liệu của dự án, và thêm một lớp ngôn ngữ tự nhiên lên trên chúng bằng cách sử dụng một mô hình ngôn ngữ lớn (LLM) do nhà phát triển lựa chọn.

Giao thức này cung cấp hai điểm cuối. Điểm cuối `/ask` xử lý các truy vấn ngôn ngữ tự nhiên từ người dùng thông qua JSON qua REST, trả về các phản hồi JSON có cấu trúc theo Schema.org. Điểm cuối `/mcp` triển khai một máy chủ MCP, cho phép các tác nhân AI bên ngoài kết nối với trang web và truy vấn nội dung của nó một cách có lập trình theo các điều khoản mà nhà xuất bản kiểm soát.

Khi một truy vấn đến `/ask`, NLWeb không chuyển nó đến một lệnh gọi LLM duy nhất. Thay vào đó, nó chia truy vấn thành nhiều bước xử lý song song: phi ngữ cảnh hóa truy vấn, truy xuất nội dung liên quan từ cơ sở dữ liệu vector, và sử dụng LLM để xếp hạng và tạo ra phản hồi cuối cùng. Mô hình gồm nhiều lệnh gọi mô hình tập trung thay vì một lời nhắc lớn này tạo ra kết quả nhất quán hơn so với cách tiếp cận một lần. Điểm cuối `/ask` cũng duy trì lịch sử trò chuyện trong một phiên, vì vậy các câu hỏi tiếp theo có thể xây dựng dựa trên các câu hỏi trước đó mà không buộc người dùng phải thiết lập lại ngữ cảnh. Đây là một điểm khác biệt thực tế so với tìm kiếm từ khóa, nơi mỗi truy vấn bắt đầu lại từ đầu bất kể điều gì đã xảy ra trước đó.

Vì NLWeb không phụ thuộc vào công nghệ cụ thể, bạn không bị ràng buộc vào bất kỳ mô hình, nhà cung cấp hạ tầng hay hệ điều hành nào. Kho lưu trữ GitHub của dự án cung cấp một triển khai tham chiếu bằng Python và các hướng dẫn khởi động nhanh, với sự hỗ trợ cho tất cả các cơ sở dữ liệu vector và điểm cuối LLM chính.

Theo TechRadar Pro, sự kiện Build 2026 sẽ diễn ra từ ngày 2 đến ngày 3 tháng 6 tại Trung tâm Fort Mason ở San Francisco, đánh dấu một sự thay đổi đáng chú ý về địa điểm so với Trung tâm Hội nghị Seattle, nơi đã tổ chức hội nghị này trong phần lớn thập kỷ qua. Microsoft đã mô tả sự kiện năm nay là "không khoa trương" một cách có chủ ý, tập trung vào chiều sâu kỹ thuật hơn là các thông báo dành cho khán giả rộng rãi.

Danh mục các phiên họp bao gồm hơn 90 mục được tổ chức theo bảy chuyên đề: Agents and Apps (Tác nhân và Ứng dụng), Azure AI Platform / Azure AI Foundry, GitHub và năng suất nhà phát triển, Microsoft Fabric, Responsible AI (AI có trách nhiệm), Windows và Working with Models (Làm việc với các mô hình). NLWeb được kết nối trực tiếp nhất với chuyên đề Agents and Apps, nơi dự kiến sẽ đề cập đến các cập nhật công cụ MCP do Microsoft đang đầu tư liên tục vào giao thức đó.

NLWeb được công bố chỉ hơn một năm trước, điều này có nghĩa là Build 2026 là hội nghị lớn đầu tiên mà giao thức này có thể được đánh giá dựa trên việc triển khai thực tế đã được ghi nhận, thay vì chỉ là tiềm năng. Cloudflare đã thêm hỗ trợ NLWeb gốc thông qua hạ tầng AutoRAG của mình vào đầu năm 2026, cung cấp một lộ trình triển khai được quản lý thay vì tích hợp thủ công, đây là một tín hiệu cho thấy hệ sinh thái đang bắt đầu củng cố.

Microsoft đã tham gia Ủy ban Chỉ đạo MCP tại Build 2025 và đóng góp một đặc tả ủy quyền cập nhật cùng với thiết kế của dịch vụ đăng ký máy chủ MCP. Bất kỳ cập nhật nào nữa về quản trị MCP, khám phá tác nhân hoặc điều phối máy chủ tại Build 2026 sẽ có ý nghĩa trực tiếp đối với NLWeb, do hai giao thức này được kết nối chặt chẽ với nhau.

Bài phát biểu khai mạc của CEO Satya Nadella thường là nơi Microsoft định hình các ưu tiên cấp nền tảng của mình. Tại Build 2025, Nadella đã mô tả sự kiện này là đánh dấu "kỷ nguyên của các tác nhân AI". Dù NLWeb có nhận được sự chú ý đặc biệt trong bài phát biểu chính tại Build 2026 hay chủ yếu xuất hiện thông qua các phiên thảo luận chuyên sâu, nó vẫn nằm trong chủ đề trung tâm mà danh mục hội nghị mô tả: chuyển đổi phát triển tác nhân AI từ giai đoạn công bố sang sẵn sàng sản xuất.

Đối với các nhà phát triển web, NLWeb tạo ra áp lực thực tế để kiểm tra xem dữ liệu trang web của bạn có cấu trúc như thế nào. Giao thức này hoạt động tốt nhất với nội dung được tổ chức dưới dạng danh sách các mục: sản phẩm, sự kiện, công thức nấu ăn, đánh giá. Các trang web có đánh dấu ngữ nghĩa kém hoặc thiếu sẽ nhận được kết quả yếu hơn đáng kể, bởi vì lớp truy xuất của NLWeb phụ thuộc vào các chú thích Schema.org mà nhiều nhà xuất bản đã đầu tư chưa đủ.

Nhưng quan trọng hơn, NLWeb làm mờ ranh giới giữa một trang web và một API. Việc chạy một điểm cuối NLWeb có nghĩa là trang web của bạn có thể được truy vấn bởi các tác nhân AI bên ngoài, không chỉ bởi người dùng truy cập bằng trình duyệt. Điều này đặt ra các câu hỏi về quản trị: tác nhân nào có thể truy cập nội dung của bạn, với tốc độ nào và theo điều khoản nào.

Về mặt công cụ, Microsoft đã và đang mở rộng Azure AI Foundry và hạ tầng nhà phát triển liên quan đến MCP của mình, cả hai đều dự kiến sẽ được giới thiệu tại Build 2026. Đối với các nhà phát triển muốn thêm NLWeb vào một tài sản hiện có ngay hôm nay, triển khai tham chiếu trên GitHub là điểm khởi đầu rõ ràng nhất, với tích hợp AutoRAG của Cloudflare hiện cung cấp một lộ trình triển khai được quản lý hơn cho các nhóm không muốn tự xử lý hạ tầng cơ bản.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
Top