GPT-4 ra mắt chưa đầy nửa năm, GPT-5 sắp ra mắt?
Gần đây, một tài liệu từ Văn phòng nhãn hiệu và bằng sáng chế Hoa Kỳ (USPTO) cho thấy OpenAI đã gửi đơn đăng ký nhãn hiệu cho "GPT-5" vào ngày 18 tháng 7 và nó đã được Văn phòng USPTO chấp nhận (đáp ứng các yêu cầu ứng dụng tối thiểu) và sẽ được tiếp tục phê duyệt.
OpenAI đã đề cập đến thông tin cơ bản của GPT-5 trong đơn đăng ký nhãn hiệu này. GPT-5 sẽ là một mô hình ngôn ngữ lớn (LLM) để xử lý, tạo, hiểu và phân tích ngôn ngữ tự nhiên. Điều đáng chú ý là ngoài văn bản, GPT-5 cũng sẽ có khả năng hiểu và tạo lời nói.
Cụ thể, các chức năng của GPT-5 bao gồm dịch văn bản hoặc lời nói từ ngôn ngữ này sang ngôn ngữ khác, nhận dạng giọng nói, tạo văn bản và giọng nói... Ngoài ra, GPT-5 cũng có thể có khả năng học, phân tích, phân loại và phản hồi dữ liệu.
Điều thú vị là trong nửa đầu năm nay, các chuyên gia và học giả trong lĩnh vực máy học đã nhiều lần cùng nhau đưa ra những bức thư ngỏ, kêu gọi mọi người chú ý đến những rủi ro tiềm ẩn của AI tổng quát và hạn chế xây dựng các mô hình AI lớn. Trong số đó, Geoffrey Hinton, người đoạt giải thưởng Turing, đã từ chức khỏi Google vào tháng 4, cảnh báo mọi người rằng trí tuệ nhân tạo sẽ "gây ra mối đe dọa cho nhân loại". Là công ty đứng sau các mô hình lớn như ChatGPT và GPT-4, OpenAI chắc chắn đã được đẩy lên hàng đầu.
Vào thời điểm đó, OpenAI tuyên bố rằng họ sẽ tập trung vào việc cải thiện phiên bản GPT-4 và GPT-5 không nằm trong kế hoạch trước mắt của họ.
Hiện tại, trong khi OpenAI đã nộp đơn đăng ký nhãn hiệu, GPT-5 cũng sẽ không sớm ra mắt. Giám đốc điều hành OpenAI Sam Altman cũng đã giải thích điều này tại Hội nghị Zhiyuan Bắc Kinh vào tháng Sáu.
Thông thường, các công ty công nghệ đăng ký thương hiệu cho các khái niệm chưa được khai thác để giữ chúng trước các đối thủ cạnh tranh và bảo vệ tài sản trí tuệ. Hầu hết các chức năng GPT-5 được mô tả trong ứng dụng đã có sẵn trong GPT-4 và GPT-5 là phiên bản cải tiến của GPT-4 ở một mức độ nhất định.
Sau khi phát hành GPT-4, giới học thuật và ngành đã tiến hành nghiên cứu và thảo luận chuyên sâu hơn về các mô hình lớn. Hiệu suất mạnh mẽ của ChatGPT và GPT-4 khiến mọi người nhìn thấy tiềm năng to lớn của các mô hình lớn, vì vậy có nhiều kỳ vọng cho GPT-5.
Trước hết, về khả năng đa phương thức, hiện tại GPT-4 mới chỉ xử lý được 2 dạng dữ liệu là văn bản và hình ảnh, người ta hy vọng GPT-5 có thể đột phá ở các phương thức khác như thoại và video.
Thứ hai, xét về hiệu quả và chi phí điện toán, GPT-4 có giá 0,03 USD cho mỗi 1 nghìn mã thông báo nhanh và giới hạn tốc độ mặc định là 40 nghìn mã thông báo mỗi phút và 200 yêu cầu mỗi phút. Giá của GPT-3.5-turbo là 0,002 USD trên 1k mã thông báo, chỉ bằng 1/15 so với GPT-4. Giá của GPT-5 có thể cao hơn so với GPT-4.
Cuối cùng, các mô hình ngôn ngữ lớn như ChatGPT và GPT-4 có một số vấn đề cố hữu, bao gồm "ảo ảnh", "thiên vị", v.v., khiến các mô hình lớn khó áp dụng trực tiếp vào thực tế. GPT-4 đã giảm thiểu đáng kể vấn đề ảo giác so với các mẫu trước đó. Trong đánh giá chủ nghĩa hiện thực đối nghịch nội bộ của OpenAI, điểm GPT-4 cao hơn 40% so với mô hình GPT-3.5 hiện đại nhất:
Hy vọng GPT-5 sẽ cải thiện hơn nữa về "ảo giác" và "căn chỉnh".
Ngoài ra, một số mô hình mới gần đây đã tạo ra những bước đột phá mới trong cửa sổ ngữ cảnh, chẳng hạn như Anthropic đã mở rộng cửa sổ ngữ cảnh của Claude 2 lên 200 nghìn mã thông báo (phiên bản phát hành hiện tại chỉ hỗ trợ 100 nghìn mã thông báo), điều này sẽ cải thiện đáng kể khả năng của mô hình đọc tài liệu dài. Điều này cũng tạo ra áp lực mới đối với các bản phát hành LLM sau này, bao gồm cả GPT-5.
Tất nhiên, GPT-5 thực sự sẽ có những khả năng gì sẽ không được tiết lộ cho đến ngày nó ra mắt, chúng ta cùng chờ xem.
Liên kết tham khảo:
www.searchenginejournal.com
www.wbolt.com
www.windowslatest.com
Gần đây, một tài liệu từ Văn phòng nhãn hiệu và bằng sáng chế Hoa Kỳ (USPTO) cho thấy OpenAI đã gửi đơn đăng ký nhãn hiệu cho "GPT-5" vào ngày 18 tháng 7 và nó đã được Văn phòng USPTO chấp nhận (đáp ứng các yêu cầu ứng dụng tối thiểu) và sẽ được tiếp tục phê duyệt.
Điều thú vị là trong nửa đầu năm nay, các chuyên gia và học giả trong lĩnh vực máy học đã nhiều lần cùng nhau đưa ra những bức thư ngỏ, kêu gọi mọi người chú ý đến những rủi ro tiềm ẩn của AI tổng quát và hạn chế xây dựng các mô hình AI lớn. Trong số đó, Geoffrey Hinton, người đoạt giải thưởng Turing, đã từ chức khỏi Google vào tháng 4, cảnh báo mọi người rằng trí tuệ nhân tạo sẽ "gây ra mối đe dọa cho nhân loại". Là công ty đứng sau các mô hình lớn như ChatGPT và GPT-4, OpenAI chắc chắn đã được đẩy lên hàng đầu.
Vào thời điểm đó, OpenAI tuyên bố rằng họ sẽ tập trung vào việc cải thiện phiên bản GPT-4 và GPT-5 không nằm trong kế hoạch trước mắt của họ.
Hiện tại, trong khi OpenAI đã nộp đơn đăng ký nhãn hiệu, GPT-5 cũng sẽ không sớm ra mắt. Giám đốc điều hành OpenAI Sam Altman cũng đã giải thích điều này tại Hội nghị Zhiyuan Bắc Kinh vào tháng Sáu.
Sau khi phát hành GPT-4, giới học thuật và ngành đã tiến hành nghiên cứu và thảo luận chuyên sâu hơn về các mô hình lớn. Hiệu suất mạnh mẽ của ChatGPT và GPT-4 khiến mọi người nhìn thấy tiềm năng to lớn của các mô hình lớn, vì vậy có nhiều kỳ vọng cho GPT-5.
Trước hết, về khả năng đa phương thức, hiện tại GPT-4 mới chỉ xử lý được 2 dạng dữ liệu là văn bản và hình ảnh, người ta hy vọng GPT-5 có thể đột phá ở các phương thức khác như thoại và video.
Thứ hai, xét về hiệu quả và chi phí điện toán, GPT-4 có giá 0,03 USD cho mỗi 1 nghìn mã thông báo nhanh và giới hạn tốc độ mặc định là 40 nghìn mã thông báo mỗi phút và 200 yêu cầu mỗi phút. Giá của GPT-3.5-turbo là 0,002 USD trên 1k mã thông báo, chỉ bằng 1/15 so với GPT-4. Giá của GPT-5 có thể cao hơn so với GPT-4.
Cuối cùng, các mô hình ngôn ngữ lớn như ChatGPT và GPT-4 có một số vấn đề cố hữu, bao gồm "ảo ảnh", "thiên vị", v.v., khiến các mô hình lớn khó áp dụng trực tiếp vào thực tế. GPT-4 đã giảm thiểu đáng kể vấn đề ảo giác so với các mẫu trước đó. Trong đánh giá chủ nghĩa hiện thực đối nghịch nội bộ của OpenAI, điểm GPT-4 cao hơn 40% so với mô hình GPT-3.5 hiện đại nhất:
Ngoài ra, một số mô hình mới gần đây đã tạo ra những bước đột phá mới trong cửa sổ ngữ cảnh, chẳng hạn như Anthropic đã mở rộng cửa sổ ngữ cảnh của Claude 2 lên 200 nghìn mã thông báo (phiên bản phát hành hiện tại chỉ hỗ trợ 100 nghìn mã thông báo), điều này sẽ cải thiện đáng kể khả năng của mô hình đọc tài liệu dài. Điều này cũng tạo ra áp lực mới đối với các bản phát hành LLM sau này, bao gồm cả GPT-5.
Tất nhiên, GPT-5 thực sự sẽ có những khả năng gì sẽ không được tiết lộ cho đến ngày nó ra mắt, chúng ta cùng chờ xem.
Liên kết tham khảo:

OpenAI Files Trademark Application For GPT-5
Explore the implications of OpenAI's recent trademark application for GPT-5, which signals new development in the world of AI advancement.


OpenAI GPT-5:发布日期、功能、AGI传言、猜测等
距离GPT-4的发布只有两个多月,但用户已经开始期待GPT-5的发布。我们已经看到GPT-4在各种测试和定性评估中的能力和实力。有了许多新的功能,如ChatGPT插件和互联网浏览能力,它已经变得更好了。现在,用户正在等待了解更多关于即将到来的OpenAI模型、GPT-5、AGI的可能性等等。

Microsoft-backed OpenAI files trademark for ChatGPT powered by GPT-5
Over the years, Microsoft-backed OpenAI has developed its fair share of language model systems, including GPT-4, which is a large multimodal model with text and image inputs support, DALL·E (AI to generate and edit images), Whisper (audio-to-text), Embeddings, Moderation, and more. According to...
