Khánh Phạm
Writer
Đây không phải là lần đầu tiên chatbot nổi tiếng Trung Quốc bị lỗi. Theo phản ánh của cư dân mạng Trung Quốc, DeepSeek V3.1 đang gặp một bug lạ trong quá trình sinh văn bản/mã. Cụ thể, mô hình bất ngờ chèn thêm ký tự “极/極” (nghĩa là “cực”, “extreme”) vào những chỗ hoàn toàn không liên quan, ví dụ như trong tên biến lập trình hoặc chuỗi ký tự. Điều này khiến đầu ra bị sai, thậm chí làm code không chạy được.
Ban đầu, cộng đồng nghi ngờ do lỗi kỹ thuật ở khâu lượng tử hóa (nén mô hình xuống bit thấp) hoặc dữ liệu huấn luyện, nhưng sau khi thử trên phiên bản FP8 độ chính xác cao mà lỗi vẫn xuất hiện, thì có thể khẳng định đây không chỉ là lỗi triển khai thấp tầng.
Nguyên nhân sâu xa có thể đến từ:
DeepSeek V3.1 không hẳn “hỏng nặng”, mà đang gặp một bug ở tầng giải mã token, có thể do sai lệch nhỏ trong phân phối xác suất hoặc quy tắc hậu kỳ. Muốn khắc phục, nhà phát triển cần rà lại cách mô hình xử lý token và chuỗi proxy (gọi công cụ – parse kết quả – retry). Hiện bug này chưa khắc phục được.
Ban đầu, cộng đồng nghi ngờ do lỗi kỹ thuật ở khâu lượng tử hóa (nén mô hình xuống bit thấp) hoặc dữ liệu huấn luyện, nhưng sau khi thử trên phiên bản FP8 độ chính xác cao mà lỗi vẫn xuất hiện, thì có thể khẳng định đây không chỉ là lỗi triển khai thấp tầng.

Nguyên nhân sâu xa có thể đến từ:
- Phân phối xác suất giải mã: Khi mô hình sinh chữ, nó chọn token tiếp theo theo xác suất. Nếu phân phối này bị “lệch” một chút (do huấn luyện, tinh chỉnh hoặc thay đổi hệ thống), thì một token có tần suất cao như “极” có thể bị chen vào sai chỗ.
- Quy tắc hệ thống hoặc hậu xử lý: Nhiều nhà cung cấp AI thường chỉnh nhanh (hotfix) bằng cách thêm quy tắc vào prompt hệ thống, thay đổi nhiệt độ, hoặc sửa bộ phân tích cú pháp. Nếu những quy tắc này xung đột với kịch bản lập trình, có thể sinh ra hiện tượng bất thường như trên.
- Mô hình “ghép nối” máy móc: Về bản chất, LLM chỉ ghép chuỗi ký tự dựa trên xác suất chứ không thực sự “hiểu”. Khi quá trình tách từ hoặc tái ghép gặp trục trặc, nó có thể nhét vào những từ vô nghĩa nhưng có xác suất cao.
DeepSeek V3.1 không hẳn “hỏng nặng”, mà đang gặp một bug ở tầng giải mã token, có thể do sai lệch nhỏ trong phân phối xác suất hoặc quy tắc hậu kỳ. Muốn khắc phục, nhà phát triển cần rà lại cách mô hình xử lý token và chuỗi proxy (gọi công cụ – parse kết quả – retry). Hiện bug này chưa khắc phục được.