Mô hình AI mã nguồn mở mới từ Trung Quốc - Hunyuan hé lộ đá Deepseek, Qwen và ChatGPT ra "chuồng gà"

Tuan Anh Vo
Tuan Anh Vo
Phản hồi: 0

Tuan Anh Vo

Intern Writer
Tencent đã phát hành Hunyuan-A13B, một mô hình ngôn ngữ lớn mã nguồn mở được thiết kế để mang lại hiệu suất mạnh mẽ ngay cả trong môi trường có nguồn lực hạn chế.

1751271750130.png


Mô hình AI mã nguồn mở Hunyuan-A13B​

Mô hình kết hợp kiến trúc Mixture-of-Experts (MoE) chi tiết, có 13 tỷ tham số hoạt động trong tổng số 80 tỷ. Kiến trúc MoE cho phép mô hình chỉ kích hoạt một tập hợp con các tham số của nó cho một tác vụ nhất định, cải thiện hiệu quả và khả năng mở rộng so với các mô hình dày đặc truyền thống trong đó tất cả các tham số đều hoạt động.

Hunyuan-A13B được trang bị chế độ lý luận lai có thể điều chỉnh độ sâu xử lý một cách linh hoạt dựa trên độ phức tạp của tác vụ đang xử lý. Nó cũng tự hào có cửa sổ ngữ cảnh siêu dài 256.000 mã thông báo ấn tượng, khiến nó đặc biệt phù hợp với các ứng dụng yêu cầu thông tin cơ bản mở rộng.

Trong các bài kiểm tra chuẩn, mô hình đã chứng minh được khả năng mạnh mẽ trên nhiều lĩnh vực, bao gồm toán học, khoa học, mã hóa, lý luận và các tác vụ dựa trên tác nhân.

Để đảm bảo suy luận hiệu quả, Hunyuan-A13B sử dụng công nghệ Grouped Query Attention (GQA), công nghệ này tối ưu hóa cơ chế chú ý bằng cách nhóm các truy vấn tương tự, dẫn đến thời gian xử lý nhanh hơn. Tencent đã cung cấp nhiều định dạng lượng tử hóa cho các nhà phát triển, bao gồm các phiên bản được đào tạo trước, điều chỉnh theo hướng dẫn, FP8 và INT4.

Mô hình và các tài nguyên của nó, bao gồm hướng dẫn tương tác và đào tạo với Hugging Face Transformers, có thể truy cập trên Hugging Face và GitHub.

AI nguồn mở đang thúc đẩy chuyển đổi kinh tế và dân chủ hóa đổi mới​


1751272100599.png

Nguồn: SmartDEV

Việc Tencent phát hành Hunyuan-A13B diễn ra sau sự chuyển dịch rộng rãi của ngành sang các mô hình AI nguồn mở đang định hình lại bối cảnh kinh tế.

AI nguồn mở đã đạt được sự chấp nhận rộng rãi, với 89% các tổ chức hiện đang sử dụng nó ở một số khả năng và hai phần ba thấy rằng việc triển khai nó rẻ hơn so với các giải pháp thay thế độc quyền. Cách tiếp cận này cho phép những công ty nhỏ hơn cạnh tranh với những gã khổng lồ công nghệ bằng cách xóa bỏ rào cản tài chính đối với công nghệ AI tiên tiến, cho phép các công ty khởi nghiệp và nhà nghiên cứu ở nhiều khu vực đổi mới mà không cần đầu tư vốn đáng kể.

Các tổ chức sử dụng mô hình nguồn mở báo cáo tiết kiệm chi phí đáng kể—giảm tới 50% chi phí của đơn vị kinh doanh—đồng thời đạt được lợi ích bảo mật khi chạy mô hình trên cơ sở hạ tầng riêng với tính minh bạch hoàn toàn vào mã cơ sở.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
http://textlink.linktop.vn/?adslk=aHR0cHM6Ly93d3cudm5yZXZpZXcudm4vdGhyZWFkcy9tby1oaW5oLWFpLW1hLW5ndW9uLW1vLW1vaS10dS10cnVuZy1xdW9jLWh1bnl1YW4taGUtbG8tZGEtZGVlcHNlZWstcXdlbi12YS1jaGF0Z3B0LXJhLWNodW9uZy1nYS42Mzk5OS8=
Top