Homelander The Seven
I will laser every f****** one of you!
Startup AI Trung Quốc DeepSeek đã vượt qua OpenAI để trở thành ứng dụng miễn phí được tải xuống nhiều nhất trên App Store của Apple tại Mỹ vào thứ Hai, soán ngôi ChatGPT với trợ lý AI của DeepSeek. Cổ phiếu công nghệ toàn cầu bị bán tháo và đang trên đà xóa sổ hàng ngàn tỷ USD vốn hóa thị trường.
Các nhà lãnh đạo công nghệ, nhà phân tích, nhà đầu tư và nhà phát triển cho rằng sự cường điệu - và nỗi sợ hãi bị tụt hậu sau đó trong chu kỳ cường điệu AI luôn thay đổi - có thể là điều dễ hiểu. Đặc biệt là trong kỷ nguyên của cuộc chạy đua vũ trang AI tạo sinh, nơi các gã khổng lồ công nghệ và các công ty khởi nghiệp đều đang chạy đua để đảm bảo không bị tụt hậu trong một thị trường được dự đoán đạt doanh thu hơn 1 nghìn tỷ USD trong vòng một thập kỷ tới.
DeepSeek được thành lập vào năm 2023 bởi Liang Wenfeng, đồng sáng lập của quỹ đầu cơ định lượng tập trung vào AI High-Flyer. Công ty khởi nghiệp AI đã phát triển từ bộ phận nghiên cứu AI của quỹ đầu cơ vào tháng 4 năm 2023, tập trung vào các mô hình ngôn ngữ lớn và đạt được trí tuệ nhân tạo tổng quát hay AGI - một nhánh của AI ngang bằng hoặc vượt qua trí tuệ của con người trong một loạt các nhiệm vụ mà OpenAI và các đối thủ đang theo đuổi. DeepSeek vẫn thuộc sở hữu hoàn toàn và được tài trợ bởi High-Flyer, theo các nhà phân tích tại Jefferies.
Tin đồn xung quanh DeepSeek bắt đầu nổi lên vào đầu tháng này khi công ty khởi nghiệp phát hành R1, mô hình suy luận cạnh tranh với o1 của OpenAI. Nó là nguồn mở, có nghĩa bất kỳ nhà phát triển AI nào cũng có thể sử dụng và đã nhanh chóng vươn lên dẫn đầu các cửa hàng ứng dụng lẫn bảng xếp hạng ngành, người dùng khen ngợi hiệu suất và khả năng lập luận của nó.
Giống như các chatbot Trung Quốc khác, nó có những hạn chế khi được hỏi về một số chủ đề nhất định: Ví dụ: khi được hỏi về một số chính sách của nhà lãnh đạo Trung Quốc Tập Cận Bình, DeepSeek được cho là đã hướng người dùng tránh xa những câu hỏi tương tự.
Một phần quan trọng khác của cuộc thảo luận: R1 của DeepSeek được chế tạo bất chấp việc Hoa Kỳ hạn chế xuất khẩu chip sang Trung Quốc ba lần trong ba năm. Ước tính khác nhau về chi phí chính xác của R1 của DeepSeek hoặc có bao nhiêu GPU đã sử dụng. Các nhà phân tích của Jefferies ước tính rằng một phiên bản gần đây có “chi phí đào tạo chỉ 5,6 triệu USD (giả sử chi phí thuê 2 USD/giờ H800). Con số đó chưa bằng 10% chi phí của Llama của Meta.” Nhưng bất kể con số cụ thể là bao nhiêu, các báo cáo đều đồng ý rằng mô hình này được phát triển với chi phí chỉ bằng một phần nhỏ so với các mô hình cạnh tranh của OpenAI, Anthropic, Google và những công ty khác.
Do đó, lĩnh vực AI tràn ngập những câu hỏi, bao gồm cả việc liệu số lượng vòng gọi vốn khổng lồ và định giá hàng tỷ đô la ngày càng tăng của ngành có cần thiết hay không - và liệu bong bóng có sắp vỡ hay không. Cổ phiếu của Nvidia đã giảm 11% vào thứ Hai, với nhà sản xuất chip ASML giảm hơn 6%. Nasdaq giảm hơn 2% và bốn gã khổng lồ công nghệ - Meta, Microsoft, Apple và ASML đều sẽ báo cáo thu nhập trong tuần này. Rất có thể cổ phiếu sẽ lao dốc nếu các con số kém khả quan.
Các nhà phân tích tại Raymond James đã nêu chi tiết một số câu hỏi gây khó khăn cho ngành công nghiệp AI trong tháng này, viết, “Những tác động đầu tư là gì? Nó nói gì về mô hình nguồn mở so với mô hình độc quyền? Ném tiền vào GPU có thực sự là thuốc chữa bách bệnh? Các hạn chế xuất khẩu của Hoa Kỳ có hiệu quả không? Những tác động rộng lớn hơn của [DeepSeek] là gì? Chà, chúng có thể rất thảm khốc hoặc không phải là một sự kiện, nhưng hãy yên tâm, ngành công nghiệp đang xôn xao với sự hoài nghi và suy đoán.”
Các nhà phân tích của Bernstein đã viết trong một ghi chú hôm thứ Hai rằng “theo nhiều quan điểm nóng hổi (đôi khi là cuồng loạn) mà chúng tôi thấy [vào cuối tuần], ý nghĩa của nó dao động từ ‘Điều đó thực sự thú vị’ đến ‘Đây là hồi chuông báo tử của khu phức hợp cơ sở hạ tầng AI như chúng ta biết.’”
Một số Giám đốc điều hành công nghệ Mỹ đang tìm cách ứng phó trước khi khách hàng chuyển sang các dịch vụ rẻ hơn tiềm năng từ DeepSeek, Meta được cho là đã thành lập bốn “phòng chiến tranh” liên quan đến DeepSeek trong bộ phận AI tạo sinh của mình.
CEO Satya Nadella của Microsoft đã viết trên X rằng hiện tượng DeepSeek chỉ là một ví dụ về nghịch lý Jevons, viết: “Khi AI trở nên hiệu quả và dễ tiếp cận hơn, chúng ta sẽ thấy việc sử dụng nó tăng vọt, biến nó thành một mặt hàng mà chúng ta không thể có đủ.” CEO Sam Altman OpenAI đã tweet một câu trích dẫn mà ông cho là của Napoleon, viết: “Một cuộc cách mạng không thể tạo ra cũng như không thể ngăn chặn. Điều duy nhất có thể làm là để một trong số những đứa con của nó định hướng bằng chiến thắng.” Yann LeCun, nhà khoa học AI hàng đầu của Meta, đã viết trên LinkedIn rằng thành công của DeepSeek cho thấy sự thay đổi của làn sóng trong lĩnh vực AI có lợi cho công nghệ nguồn mở.
LeCun đã viết rằng DeepSeek đã hưởng lợi từ một số công nghệ của riêng Meta, tức là các mô hình Llama của họ và công ty khởi nghiệp này “đã đưa ra những ý tưởng mới và xây dựng chúng dựa trên công việc của những người khác. Vì công việc của họ được xuất bản và nguồn mở nên ai cũng có thể hưởng lợi từ đó. Đó là sức mạnh của nghiên cứu mở và nguồn mở.” Alexandr Wang, Giám đốc điều hành của Scale AI, nói với CNBC vào tuần trước rằng mô hình AI cuối cùng của DeepSeek là “gây chấn động” và việc phát hành R1 của họ thậm chí còn mạnh mẽ hơn.
Wang nói: “Những gì chúng tôi phát hiện ra là DeepSeek… hoạt động tốt nhất hoặc gần bằng với các mô hình tốt nhất của Mỹ”, đồng thời cho biết thêm rằng cuộc đua AI giữa Mỹ và Trung Quốc là “cuộc chiến AI”. Công ty của Wang cung cấp dữ liệu đào tạo cho những người chơi AI quan trọng bao gồm OpenAI, Google và Meta.
Đầu tuần này, Tổng thống Donald Trump đã công bố một liên doanh với OpenAI, Oracle và SoftBank để đầu tư hàng tỷ đô la vào cơ sở hạ tầng AI của Hoa Kỳ. Dự án Stargate đã được Trump, Giám đốc điều hành SoftBank Masayoshi Son, người đồng sáng lập Oracle Larry Ellison và Giám đốc điều hành OpenAI Sam Altman công bố tại Nhà Trắng. Các đối tác công nghệ ban đầu quan trọng sẽ bao gồm Microsoft, Nvidia và Oracle, cũng như công ty bán dẫn Arm. Họ cho biết sẽ đầu tư 100 tỷ USD để khởi động và lên tới 500 tỷ USD trong bốn năm tới.
Tin tức về năng lực của DeepSeek cũng xuất hiện trong bối cảnh sự cường điệu ngày càng tăng xung quanh các tác nhân AI - các mô hình vượt xa chatbot để hoàn thành các nhiệm vụ phức tạp nhiều bước cho người dùng - mà cả những gã khổng lồ công nghệ và các công ty khởi nghiệp đều đang theo đuổi. Meta, Google, Amazon, Microsoft, OpenAI và Anthropic đều bày tỏ mục tiêu xây dựng AI tác nhân.
Công ty khởi nghiệp AI Anthropic được Amazon hậu thuẫn do các cựu giám đốc điều hành nghiên cứu của OpenAI thành lập, đã đẩy mạnh phát triển công nghệ trong suốt năm qua. Vào tháng 10, công ty khởi nghiệp này cho biết các tác nhân AI của họ đã có thể sử dụng máy tính như con người để hoàn thành các nhiệm vụ phức tạp. Khả năng sử dụng máy tính cho phép công nghệ của họ diễn giải những gì trên màn hình máy tính, chọn phím, nhập văn bản, điều hướng web và thực hiện các tác vụ thông qua bất kỳ phần mềm và duyệt internet thời gian thực nào.
Giám đốc khoa học Jared Kaplan của Anthropic nói với CNBC trong một cuộc phỏng vấn vào thời điểm đó: “Về cơ bản, công cụ này có thể ‘sử dụng máy tính theo cách giống như chúng ta’" Ông nói rằng nó có thể thực hiện các nhiệm vụ với “hàng chục hoặc thậm chí hàng trăm bước”. OpenAI đã phát hành một công cụ tương tự vào tuần trước, giới thiệu một tính năng có tên Operator, sẽ tự động hóa các tác vụ như lập kế hoạch kỳ nghỉ, điền vào biểu mẫu, đặt chỗ nhà hàng và đặt hàng tạp hóa.
Công ty khởi nghiệp được Microsoft hậu thuẫn mô tả nó là “một tác nhân có thể truy cập web để thực hiện các nhiệm vụ cho bạn” và nói thêm rằng nó được đào tạo để tương tác với “các nút, menu và trường văn bản mà mọi người sử dụng hàng ngày” trên web. Nó cũng có thể đặt các câu hỏi tiếp theo để cá nhân hóa hơn nữa các tác vụ mà nó hoàn thành, chẳng hạn như thông tin đăng nhập cho các trang web khác. Người dùng có thể kiểm soát màn hình bất cứ lúc nào.
#DeepSeek
Các nhà lãnh đạo công nghệ, nhà phân tích, nhà đầu tư và nhà phát triển cho rằng sự cường điệu - và nỗi sợ hãi bị tụt hậu sau đó trong chu kỳ cường điệu AI luôn thay đổi - có thể là điều dễ hiểu. Đặc biệt là trong kỷ nguyên của cuộc chạy đua vũ trang AI tạo sinh, nơi các gã khổng lồ công nghệ và các công ty khởi nghiệp đều đang chạy đua để đảm bảo không bị tụt hậu trong một thị trường được dự đoán đạt doanh thu hơn 1 nghìn tỷ USD trong vòng một thập kỷ tới.
DeepSeek được thành lập vào năm 2023 bởi Liang Wenfeng, đồng sáng lập của quỹ đầu cơ định lượng tập trung vào AI High-Flyer. Công ty khởi nghiệp AI đã phát triển từ bộ phận nghiên cứu AI của quỹ đầu cơ vào tháng 4 năm 2023, tập trung vào các mô hình ngôn ngữ lớn và đạt được trí tuệ nhân tạo tổng quát hay AGI - một nhánh của AI ngang bằng hoặc vượt qua trí tuệ của con người trong một loạt các nhiệm vụ mà OpenAI và các đối thủ đang theo đuổi. DeepSeek vẫn thuộc sở hữu hoàn toàn và được tài trợ bởi High-Flyer, theo các nhà phân tích tại Jefferies.

Tin đồn xung quanh DeepSeek bắt đầu nổi lên vào đầu tháng này khi công ty khởi nghiệp phát hành R1, mô hình suy luận cạnh tranh với o1 của OpenAI. Nó là nguồn mở, có nghĩa bất kỳ nhà phát triển AI nào cũng có thể sử dụng và đã nhanh chóng vươn lên dẫn đầu các cửa hàng ứng dụng lẫn bảng xếp hạng ngành, người dùng khen ngợi hiệu suất và khả năng lập luận của nó.
Giống như các chatbot Trung Quốc khác, nó có những hạn chế khi được hỏi về một số chủ đề nhất định: Ví dụ: khi được hỏi về một số chính sách của nhà lãnh đạo Trung Quốc Tập Cận Bình, DeepSeek được cho là đã hướng người dùng tránh xa những câu hỏi tương tự.
Một phần quan trọng khác của cuộc thảo luận: R1 của DeepSeek được chế tạo bất chấp việc Hoa Kỳ hạn chế xuất khẩu chip sang Trung Quốc ba lần trong ba năm. Ước tính khác nhau về chi phí chính xác của R1 của DeepSeek hoặc có bao nhiêu GPU đã sử dụng. Các nhà phân tích của Jefferies ước tính rằng một phiên bản gần đây có “chi phí đào tạo chỉ 5,6 triệu USD (giả sử chi phí thuê 2 USD/giờ H800). Con số đó chưa bằng 10% chi phí của Llama của Meta.” Nhưng bất kể con số cụ thể là bao nhiêu, các báo cáo đều đồng ý rằng mô hình này được phát triển với chi phí chỉ bằng một phần nhỏ so với các mô hình cạnh tranh của OpenAI, Anthropic, Google và những công ty khác.

Do đó, lĩnh vực AI tràn ngập những câu hỏi, bao gồm cả việc liệu số lượng vòng gọi vốn khổng lồ và định giá hàng tỷ đô la ngày càng tăng của ngành có cần thiết hay không - và liệu bong bóng có sắp vỡ hay không. Cổ phiếu của Nvidia đã giảm 11% vào thứ Hai, với nhà sản xuất chip ASML giảm hơn 6%. Nasdaq giảm hơn 2% và bốn gã khổng lồ công nghệ - Meta, Microsoft, Apple và ASML đều sẽ báo cáo thu nhập trong tuần này. Rất có thể cổ phiếu sẽ lao dốc nếu các con số kém khả quan.
Các nhà phân tích tại Raymond James đã nêu chi tiết một số câu hỏi gây khó khăn cho ngành công nghiệp AI trong tháng này, viết, “Những tác động đầu tư là gì? Nó nói gì về mô hình nguồn mở so với mô hình độc quyền? Ném tiền vào GPU có thực sự là thuốc chữa bách bệnh? Các hạn chế xuất khẩu của Hoa Kỳ có hiệu quả không? Những tác động rộng lớn hơn của [DeepSeek] là gì? Chà, chúng có thể rất thảm khốc hoặc không phải là một sự kiện, nhưng hãy yên tâm, ngành công nghiệp đang xôn xao với sự hoài nghi và suy đoán.”
Các nhà phân tích của Bernstein đã viết trong một ghi chú hôm thứ Hai rằng “theo nhiều quan điểm nóng hổi (đôi khi là cuồng loạn) mà chúng tôi thấy [vào cuối tuần], ý nghĩa của nó dao động từ ‘Điều đó thực sự thú vị’ đến ‘Đây là hồi chuông báo tử của khu phức hợp cơ sở hạ tầng AI như chúng ta biết.’”
Một số Giám đốc điều hành công nghệ Mỹ đang tìm cách ứng phó trước khi khách hàng chuyển sang các dịch vụ rẻ hơn tiềm năng từ DeepSeek, Meta được cho là đã thành lập bốn “phòng chiến tranh” liên quan đến DeepSeek trong bộ phận AI tạo sinh của mình.

CEO Satya Nadella của Microsoft đã viết trên X rằng hiện tượng DeepSeek chỉ là một ví dụ về nghịch lý Jevons, viết: “Khi AI trở nên hiệu quả và dễ tiếp cận hơn, chúng ta sẽ thấy việc sử dụng nó tăng vọt, biến nó thành một mặt hàng mà chúng ta không thể có đủ.” CEO Sam Altman OpenAI đã tweet một câu trích dẫn mà ông cho là của Napoleon, viết: “Một cuộc cách mạng không thể tạo ra cũng như không thể ngăn chặn. Điều duy nhất có thể làm là để một trong số những đứa con của nó định hướng bằng chiến thắng.” Yann LeCun, nhà khoa học AI hàng đầu của Meta, đã viết trên LinkedIn rằng thành công của DeepSeek cho thấy sự thay đổi của làn sóng trong lĩnh vực AI có lợi cho công nghệ nguồn mở.
LeCun đã viết rằng DeepSeek đã hưởng lợi từ một số công nghệ của riêng Meta, tức là các mô hình Llama của họ và công ty khởi nghiệp này “đã đưa ra những ý tưởng mới và xây dựng chúng dựa trên công việc của những người khác. Vì công việc của họ được xuất bản và nguồn mở nên ai cũng có thể hưởng lợi từ đó. Đó là sức mạnh của nghiên cứu mở và nguồn mở.” Alexandr Wang, Giám đốc điều hành của Scale AI, nói với CNBC vào tuần trước rằng mô hình AI cuối cùng của DeepSeek là “gây chấn động” và việc phát hành R1 của họ thậm chí còn mạnh mẽ hơn.
Wang nói: “Những gì chúng tôi phát hiện ra là DeepSeek… hoạt động tốt nhất hoặc gần bằng với các mô hình tốt nhất của Mỹ”, đồng thời cho biết thêm rằng cuộc đua AI giữa Mỹ và Trung Quốc là “cuộc chiến AI”. Công ty của Wang cung cấp dữ liệu đào tạo cho những người chơi AI quan trọng bao gồm OpenAI, Google và Meta.
Đầu tuần này, Tổng thống Donald Trump đã công bố một liên doanh với OpenAI, Oracle và SoftBank để đầu tư hàng tỷ đô la vào cơ sở hạ tầng AI của Hoa Kỳ. Dự án Stargate đã được Trump, Giám đốc điều hành SoftBank Masayoshi Son, người đồng sáng lập Oracle Larry Ellison và Giám đốc điều hành OpenAI Sam Altman công bố tại Nhà Trắng. Các đối tác công nghệ ban đầu quan trọng sẽ bao gồm Microsoft, Nvidia và Oracle, cũng như công ty bán dẫn Arm. Họ cho biết sẽ đầu tư 100 tỷ USD để khởi động và lên tới 500 tỷ USD trong bốn năm tới.

Tin tức về năng lực của DeepSeek cũng xuất hiện trong bối cảnh sự cường điệu ngày càng tăng xung quanh các tác nhân AI - các mô hình vượt xa chatbot để hoàn thành các nhiệm vụ phức tạp nhiều bước cho người dùng - mà cả những gã khổng lồ công nghệ và các công ty khởi nghiệp đều đang theo đuổi. Meta, Google, Amazon, Microsoft, OpenAI và Anthropic đều bày tỏ mục tiêu xây dựng AI tác nhân.
Công ty khởi nghiệp AI Anthropic được Amazon hậu thuẫn do các cựu giám đốc điều hành nghiên cứu của OpenAI thành lập, đã đẩy mạnh phát triển công nghệ trong suốt năm qua. Vào tháng 10, công ty khởi nghiệp này cho biết các tác nhân AI của họ đã có thể sử dụng máy tính như con người để hoàn thành các nhiệm vụ phức tạp. Khả năng sử dụng máy tính cho phép công nghệ của họ diễn giải những gì trên màn hình máy tính, chọn phím, nhập văn bản, điều hướng web và thực hiện các tác vụ thông qua bất kỳ phần mềm và duyệt internet thời gian thực nào.
Giám đốc khoa học Jared Kaplan của Anthropic nói với CNBC trong một cuộc phỏng vấn vào thời điểm đó: “Về cơ bản, công cụ này có thể ‘sử dụng máy tính theo cách giống như chúng ta’" Ông nói rằng nó có thể thực hiện các nhiệm vụ với “hàng chục hoặc thậm chí hàng trăm bước”. OpenAI đã phát hành một công cụ tương tự vào tuần trước, giới thiệu một tính năng có tên Operator, sẽ tự động hóa các tác vụ như lập kế hoạch kỳ nghỉ, điền vào biểu mẫu, đặt chỗ nhà hàng và đặt hàng tạp hóa.
Công ty khởi nghiệp được Microsoft hậu thuẫn mô tả nó là “một tác nhân có thể truy cập web để thực hiện các nhiệm vụ cho bạn” và nói thêm rằng nó được đào tạo để tương tác với “các nút, menu và trường văn bản mà mọi người sử dụng hàng ngày” trên web. Nó cũng có thể đặt các câu hỏi tiếp theo để cá nhân hóa hơn nữa các tác vụ mà nó hoàn thành, chẳng hạn như thông tin đăng nhập cho các trang web khác. Người dùng có thể kiểm soát màn hình bất cứ lúc nào.
#DeepSeek