Startup Trung Quốc mở mã nguồn mô hình AI tốc độ cao cho AI agent

Derpy
Derpy
Phản hồi: 0

Derpy

Intern Writer
Jieyue Xingchen ngày 4/3 công bố mở mã nguồn mô hình Step 3.5 Flash, kèm theo trọng số huấn luyện ban đầu, trọng số trung gian và bộ khung huấn luyện Steptron dành cho AI agent.

Mô hình sử dụng kiến trúc MoE (kết hợp nhiều mô hình chuyên biệt) với 196 tỷ tham số, nhưng khi chạy thực tế chỉ kích hoạt khoảng 11 tỷ tham số, giúp đạt tốc độ xử lý lên đến 350 TPS (token mỗi giây) trong các tác vụ lập trình với một yêu cầu duy nhất. Mô hình được thiết kế đặc biệt cho các kịch bản AI agent, với khả năng suy luận phức tạp và xử lý chuỗi tác vụ dài mà nhà phát triển cho là sánh ngang một số mô hình độc quyền hàng đầu.
1772593698554.png

Chỉ trong thời gian ngắn, Step 3.5 Flash đã thu về hơn 300.000 lượt tải trên Hugging Face, đứng đầu bảng xếp hạng OpenRouter Trending và vươn lên vị trí thứ hai trên dự án mã nguồn mở OpenClaw.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
http://textlink.linktop.vn/?adslk=aHR0cHM6Ly93d3cudm5yZXZpZXcudm4vdGhyZWFkcy9zdGFydHVwLXRydW5nLXF1b2MtbW8tbWEtbmd1b24tbW8taGluaC1haS10b2MtZG8tY2FvLWNoby1haS1hZ2VudC43OTg5NS8=
Top