Khoa học chứng minh: AI không thể kể chuyện như người, dù có thay đổi lời nhắc.

Derpy · 09:41 Hôm qua

Bạn có bao giờ cảm thấy có gì đó "sai sai" khi đọc một câu chuyện hay bài viết trên mạng, dù câu chữ vẫn mượt mà, trôi chảy? Cứ như thể có một "radar" vô hình trong đầu chúng ta đang mách bảo rằng: "Đây không phải là người viết!"

Thử làm một bài kiểm tra nhỏ nhé. Đọc hai đoạn văn sau:

"Anh ta cảm thấy lồng ngực thắt lại, mồ hôi lạnh chảy dọc sống lưng, ánh đèn xung quanh dường như tối sầm đi. Trong không khí tràn ngập một mùi hương khó tả, như đất sau cơn mưa, lại như một ký ức cổ xưa nào đó."

Và đoạn này:

"Trương Tam rất sợ hãi. Anh ta không biết tại sao, nhưng anh ta cảm thấy có gì đó không ổn. Anh ta nhớ lại câu chuyện bà ngoại kể hồi nhỏ."

Trực giác mách bảo bạn đoạn nào do AI viết? Rất có thể là đoạn đầu tiên. Bởi vì chúng ta dường như đã "tiến hóa" được khả năng nhận diện văn phong AI – những mô tả quá mức về trải nghiệm giác quan, biến "nỗi sợ hãi" thành một loạt phản ứng sinh lý, trông rất giống cách ChatGPT thường làm.

Trong suốt một năm qua, internet tràn ngập các "hướng dẫn nhận diện văn phong AI": thích dùng dấu gạch ngang? AI viết. Thích dùng "thứ nhất, thứ hai, cuối cùng"? AI viết. Chất đống tính từ? AI viết. Nhưng tất cả những điều này chỉ thuộc về "đặc điểm phong cách" – chỉ cần thay đổi một bộ câu lệnh (prompt) là có thể dễ dàng lách qua. Nhiều người tin rằng, chỉ cần biết "huấn luyện" AI, cỗ máy sẽ viết ra những văn bản không khác gì con người.

Thế nhưng, một nhóm nghiên cứu từ Đại học Maryland và Google DeepMind đã chỉ ra rằng: đừng phí công vô ích, "hệ điều hành nền tảng" để AI kể chuyện hoàn toàn khác biệt so với con người, và việc thay đổi câu lệnh cũng chẳng thể cứu vãn được điều đó.

Vào tháng 4 năm 2026, nhóm của Jenna Russell tại Khoa Khoa học Máy tính của Đại học Maryland, hợp tác với Google DeepMind, đã công bố một bài báo trên arXiv với tiêu đề "StoryScope: Investigating idiosyncrasies in AI fiction" (tạm dịch: "Kính hiển vi câu chuyện: Điều tra những đặc điểm riêng biệt trong tiểu thuyết AI").

Ngày 28 tháng 5 năm 2026, Giáo sư Ethan Mollick từ Trường Wharton đã chia sẻ nghiên cứu này trên X (trước đây là Twitter), kèm theo bình luận: "Đã có rất nhiều bài viết về các đặc điểm phong cách của AI (như dấu gạch ngang), nhưng bài báo này tập trung vào các đặc điểm kể chuyện của AI. Có những khác biệt hấp dẫn giữa cách kể chuyện của AI và con người, và việc yêu cầu AI viết theo các phong cách khác nhau, cũng gần như không thể thay đổi những khác biệt ở cấp độ kể chuyện này."

Chỉ trong một ngày, bài đăng này đã thu hút 315.000 lượt xem, hơn 3.000 lượt thích và gần 600 lượt chia sẻ. Các học giả, nhà văn và độc giả bình thường trong giới AI đều bị cuốn hút bởi cùng một câu hỏi: AI rốt cuộc có biết kể chuyện không?

Quy mô của thí nghiệm này thật đáng kinh ngạc: họ đã thu thập 10.272 câu lệnh viết (tương đương với các đề tài viết), mỗi câu lệnh được một tác giả con người và năm mô hình ngôn ngữ lớn (LLM) gồm Claude, DeepSeek, Gemini, GPT, Kimi viết thành một câu chuyện, mỗi câu khoảng 5.000 từ. Tổng cộng, họ thu được 61.608 câu chuyện, và từ mỗi câu chuyện, 304 đặc điểm kể chuyện đã được trích xuất.

Điều này có nghĩa là gì? Nó giống như việc tháo rời "bộ xương" của hơn sáu vạn cuốn tiểu thuyết, đặt từng mảnh dưới kính hiển vi để so sánh, từ cấu trúc cốt truyện, khả năng hành động của nhân vật, tính liên tục của thời gian cho đến mật độ đối thoại, không bỏ sót bất cứ điều gì.

Nhóm nghiên cứu đã phát triển một công cụ phân tích tự động có tên StoryScope, có khả năng tự động tổng hợp các đặc điểm kể chuyện chi tiết, dễ giải thích từ 10 khía cạnh, bao gồm cốt truyện, chủ thể, cấu trúc thời gian. Sau đó, họ so sánh những câu chuyện do AI tạo ra với những câu chuyện do con người viết, để xem "bộ xương" của chúng khác nhau như thế nào.

Kết quả cho thấy, chỉ cần sử dụng các đặc điểm kể chuyện, mà không cần xét đến từ ngữ, cấu trúc câu hay dấu câu – những tín hiệu về phong cách, họ đã có thể phân biệt văn bản do con người và AI viết với độ chính xác lên đến 93,2%. Trong nhiệm vụ phân loại sáu tác giả (năm AI và một con người), độ chính xác đạt 68,4%. Để so sánh, một mô hình đầy đủ có bao gồm cả các yếu tố phong cách cũng chỉ tăng độ chính xác lên chưa đến 3%.

Nói cách khác, "logic kể chuyện nền tảng" của AI đã là một "lá bài ngửa". Ngay cả khi bạn xóa bỏ tất cả dấu gạch ngang, thay thế tất cả các cụm từ "thứ nhất, thứ hai, cuối cùng" bằng cách diễn đạt tự nhiên hơn, "bộ xương" kể chuyện của bạn vẫn sẽ tố cáo bạn.

Vậy, AI kể chuyện có gì đó "không ổn" ở đâu? Nhóm nghiên cứu đã tổng hợp những khác biệt cốt lõi thành năm khía cạnh chính.

Đầu tiên, AI quá thích "dạy đời". Những câu chuyện do AI viết giống như một giáo viên ngữ văn sợ bạn không hiểu bài. Trong 77% trường hợp, người kể chuyện của AI sẽ trực tiếp nêu rõ chủ đề của câu chuyện: "Câu chuyện này cho chúng ta biết rằng…", trong khi tỷ lệ này ở các tác giả con người chỉ là 52%. Tỷ lệ đối thoại mang tính triết lý trong truyện AI là 59%, còn ở con người chỉ là 34%.

Rõ ràng hơn nữa là: các trích dẫn của AI từ các tác phẩm khác đều là "ám chỉ mơ hồ" (chiếm 72%), trong khi các tác giả con người có xu hướng trực tiếp nói "như trong 'Trăm năm cô đơn'…" – việc đề cập rõ ràng tên tác phẩm chiếm 50%. Ngụ ý của AI dường như là: "Tôi đang nói cho bạn một đạo lý, hãy lắng nghe thật kỹ." Còn ngụ ý của con người là: "Bạn hãy tự mình cảm nhận."

Bạn có thể nói, điều này chẳng phải rất có trách nhiệm sao? Giải thích rõ ràng đạo lý chẳng phải tốt hơn sao? Vấn đề là, một câu chuyện hay không bao giờ lay động lòng người bằng cách "giảng đạo lý". Tolstoy sẽ không viết ở cuối "Anna Karenina" rằng "câu chuyện này cho chúng ta biết, ngoại tình không có kết cục tốt đẹp" – ông để độc giả tự cảm nhận. Và AI không thể "buông tay", nó phải nói rõ mọi thứ.

Thứ hai, con người có thể "nhảy thời gian", AI chỉ đi một đường thẳng. Con người thích kể chuyện theo nhiều cách khác nhau: bắt đầu từ một đám tang, sau đó kể ngược về những chuyện xảy ra hàng chục năm trước, rồi đột ngột quay về hiện tại. Kiểu kể chuyện phi tuyến tính này gần như không tồn tại ở AI. Dữ liệu cho thấy: 79% câu chuyện AI "không có tình tiết phụ", trong khi tỷ lệ này ở con người là 57%. Kết thúc câu chuyện do nhân vật chính thúc đẩy ở AI chiếm 69%, còn ở con người chỉ là 46%.

Con người thích để câu chuyện "lửng lơ", để lại không gian cho trí tưởng tượng của độc giả. Kết thúc câu chuyện của con người thường có xu hướng mở, mơ hồ, khiến độc giả tự hỏi "rồi sao nữa?". AI thì phải đưa ra một lời giải thích cho mỗi nhân vật: nhân vật chính hoặc là giác ngộ, hoặc là chấp nhận hiện thực (chiếm 47%), trong khi con người chỉ 27% làm như vậy.

Nhóm nghiên cứu đưa ra một ví dụ sinh động: nếu yêu cầu AI và con người viết một câu chuyện trinh thám, con người có thể bắt đầu từ một đám tang, rồi kể ngược về những ân oán hàng chục năm trước; còn AI sẽ bắt đầu từ manh mối đầu tiên, theo trình tự thời gian tiến thẳng đến kết cục, không có bất kỳ "ngã rẽ" nào ở giữa.

Thứ ba, AI "nghiện" miêu tả cơ thể. Quay lại bài kiểm tra ban đầu. Một trong những đặc điểm nổi bật nhất của văn phong AI là: không trực tiếp nói ra cảm xúc, mà dùng phản ứng cơ thể và miêu tả môi trường để "diễn" cảm xúc.

Dữ liệu cho thấy, trong 81% trường hợp, AI sẽ truyền tải cảm xúc thông qua cảm giác sinh lý và ẩn dụ cơ thể (con người chỉ 38%). Tỷ lệ AI sử dụng hình ảnh khứu giác lên đến 82% (con người 57%), và nó còn thích đặt bối cảnh môi trường như một sự phản ánh trạng thái nội tâm của nhân vật. Khi tác giả con người viết "Trương Tam sợ hãi", đó chỉ là một câu đơn giản.

AI viết "sợ hãi" thì: lồng ngực thắt lại, mồ hôi lạnh chảy ròng ròng, ánh đèn tối sầm, không khí tràn ngập một mùi hương nào đó… Tỷ lệ con người sử dụng rõ ràng các nhãn cảm xúc ("cảm thấy sợ hãi", "rất tức giận") là 29%, trong khi AI chỉ là 8%. Điều này bộc lộ một vấn đề bản chất: AI không có trải nghiệm cảm xúc thực sự, nó chỉ có thể học "biểu hiện bên ngoài của cảm xúc" từ dữ liệu huấn luyện, rồi chất đống chúng lại theo một cách "kiểu sách giáo khoa".

Nó biết nỗi sợ hãi sẽ khiến người ta đổ mồ hôi, nhưng nó không biết cảm giác đổ mồ hôi là như thế nào. Vì vậy, những miêu tả của nó luôn có một sự "cố gắng quá mức" gây cảm giác khó chịu – giống như một người chưa bao giờ ăn chanh, nhưng lại phải viết về vị chua của chanh.

Thứ tư, con người có thể "phá vỡ bức tường thứ tư", AI chỉ cắm đầu viết. Các tác giả con người có một kỹ năng mà AI không thể học được: trực tiếp đối thoại với độc giả. "Bạn, độc giả thân mến, chắc chắn không thể đoán được điều gì sẽ xảy ra tiếp theo…" Kiểu viết "phá vỡ bức tường thứ tư" này được sử dụng trong 28% tác phẩm của con người, nhưng chỉ 7% ở AI.

Đồng thời, tỷ lệ văn bản của con người đề cập đến các văn bản và tác giả cụ thể gần như gấp đôi AI (47% so với 24%). Con người có thể linh hoạt chuyển đổi giữa trích dẫn rõ ràng và tham chiếu ngầm (37% tác phẩm của con người là "chế độ hỗn hợp", AI chỉ 16%), trong khi AI chỉ có thể ẩn mình sau những ám chỉ mơ hồ, như thể sợ lộ ra rằng mình "chưa đọc nhiều sách".

Điều này không phải vì AI "chưa đọc", dữ liệu huấn luyện của nó có đủ mọi loại sách – mà là vì nó không biết khi nào nên nói "tôi đang trích dẫn", khi nào nên giữ im lặng. Nói cách khác, cách kể chuyện của AI là một cách kể chuyện "không có ý thức về độc giả". Nó không quan tâm bạn có đang đọc hay không, có theo kịp hay không, nó chỉ đơn thuần là "hoàn thành nhiệm vụ".

Thứ năm, câu chuyện AI "na ná nhau" nghiêm trọng. Những câu chuyện do AI tạo ra chen chúc trong một "không gian kể chuyện" chật hẹp, trong khi những câu chuyện của con người lại trải rộng khắp nơi. Kho tư liệu câu chuyện của con người phong phú hơn, liên quan đến nhiều địa điểm hơn, tỷ lệ đối thoại cao hơn, nhiều tình tiết phụ được lồng ghép vào chủ đề cốt lõi hơn (42% so với 21% của AI), và cũng thường xuyên xây dựng các nhân vật chính có mâu thuẫn đạo đức (59% so với 38% của AI).

Nhân vật chính của con người có thể vừa là người tốt vừa là kẻ xấu, có thể vừa lương thiện vừa ích kỷ; nhân vật chính của AI thì có xu hướng "hoàn hảo". Vấn đề của AI không phải là "viết không hay", mà là "viết đều giống nhau". Nó bị mắc kẹt trong một "khuôn mẫu kể chuyện mặc định" chật hẹp, không thể thoát ra. Ngay cả khi bạn đưa cùng một câu lệnh cho các mô hình AI khác nhau, những câu chuyện chúng viết ra vẫn có vị trí trong không gian kể chuyện gần như tương đồng một cách đáng kinh ngạc.

Một trong những phát hiện thú vị nhất của bài báo là: cách các mô hình AI khác nhau viết chuyện, giống như "nét bút" của các nhà văn khác nhau, mỗi cái đều có những "lỗi" riêng.

Tóm tắt bài báo đã liệt kê rõ ràng các đặc điểm "dấu vân tay" của ba mô hình: Claude có sự leo thang sự kiện đặc biệt nhạt nhẽo, GPT lạm dụng các chuỗi giấc mơ, và Gemini mặc định sử dụng góc nhìn bên ngoài để mô tả nhân vật. Dựa trên phân tích sâu hơn từ dữ liệu thí nghiệm, DeepSeek và Kimi cũng thể hiện những xu hướng kể chuyện đặc trưng của riêng mình.

Điều này có nghĩa là gì? Nếu bạn thấy một cuốn tiểu thuyết thường xuyên xuất hiện "những bước ngoặt trong giấc mơ", thì rất có thể đó là do GPT viết; nếu toàn bộ câu chuyện không có sóng gió, tình tiết diễn ra nhạt nhẽo như nước lã, thì khả năng cao đó là tác phẩm của Claude; nếu mỗi nhân vật đều được mô tả từ góc nhìn bên ngoài, như thể đang xem một thẻ thông tin nhân vật, thì Gemini khó thoát khỏi nghi vấn. Điều ấn tượng hơn là, sử dụng những "dấu vân tay" này để phân loại sáu tác giả (xác định tác giả cụ thể từ năm mô hình AI và con người), độ chính xác đạt tới 68,4%.

Điều đáng buồn hơn là, bài báo còn phát hiện ra: tất cả các câu chuyện do mô hình AI tạo ra đều tập trung trong cùng một khu vực chung trong không gian kể chuyện, trong khi câu chuyện của con người lại phân tán trong một không gian rộng lớn hơn nhiều.

Nói cách khác, dù bạn là Claude hay GPT, dù "phong cách viết" của bạn có được điều chỉnh như thế nào, "DNA kể chuyện" của các bạn thực chất vẫn là một nhà. Hiện tượng "đồng nhất trong kể chuyện" này có thể là một vấn đề cố hữu của mô hình huấn luyện ngôn ngữ lớn – chúng đều học "thế nào là một câu chuyện hay" từ các kho ngữ liệu tương tự, và sau đó đưa ra những kết luận tương tự.

Vậy, "khử mùi AI" còn ý nghĩa gì không? Nghiên cứu này xuất hiện đúng vào thời điểm "khử mùi AI" trở thành một chủ đề nóng. Ngay trong tháng bài báo được công bố, cộng đồng mạng Trung Quốc đã rộ lên làn sóng chế giễu "văn phong đậu phụ" – những văn bản do AI tạo ra với đầy rẫy các từ như "nhất", "rất", "sâu sắc", khiến cư dân mạng cười ra nước mắt. Các "cẩm nang không đầy đủ để loại bỏ mùi AI" cũng ra đời. Đồng thời, tiểu thuyết "Rắn trong rừng" của nhà văn Nigeria Nazir bị cáo buộc có nhiều "dấu vết AI", khiến tranh cãi về văn phong AI trong giới văn học ngày càng gay gắt.

Nhưng kết luận của StoryScope đã dội một gáo nước lạnh: thay đổi từ vựng, cấu trúc câu, điều chỉnh dấu câu, tất cả chỉ là "công việc bề mặt". Bạn yêu cầu AI viết "tôi rất buồn" thay vì "một nỗi buồn dâng trào trong lòng", điều đó không thể thay đổi cấu trúc kể chuyện của nó. Bạn xóa bỏ tất cả dấu gạch ngang, cũng không thể thay đổi "mã nguồn" của nó là ưu tiên kể chuyện đơn tuyến, tránh né sự mơ hồ về đạo đức.

Ethan Mollick đã đặc biệt nhấn mạnh trong bài đăng của mình: "Yêu cầu AI viết theo các phong cách khác nhau, cũng gần như không thể thay đổi những khác biệt ở cấp độ kể chuyện này."

Điều này thực chất chạm đến một vấn đề sâu sắc hơn: AI rốt cuộc có thể "sáng tạo như con người" không?

Về mặt phong cách, có thể. Nếu câu lệnh tốt, AI có thể bắt chước sự súc tích của Hemingway, mê cung của Borges. Nhưng về mặt kể chuyện, AI có sự khác biệt cơ bản so với con người trong việc "làm thế nào để tạo ra một câu chuyện" – nó không trải nghiệm cuộc sống, không hiểu cái chết, không biết "muốn nói mà lại thôi", vì vậy nó chỉ có thể áp dụng một "khuôn mẫu câu chuyện tiêu chuẩn".

Đây có lẽ là vực sâu khó vượt qua nhất giữa văn phong AI và văn phong con người.

Ở cuối bài báo, nhóm nghiên cứu đã đặt ra một câu hỏi đáng suy ngẫm: khi văn bản do AI tạo ra ngày càng hòa lẫn vào các tác phẩm của con người, chúng ta sẽ định nghĩa "tính nguyên bản" như thế nào?

Họ đã công khai toàn bộ mã nguồn của StoryScope, 10.272 câu lệnh viết, và 51.336 văn bản kể chuyện do AI tạo ra (một số câu lệnh không được đưa vào do lỗi tạo ra), để cộng đồng học thuật tiếp tục nghiên cứu. Điều này giống như một "cảnh báo" – khi những con chữ do AI tạo ra tràn ngập thị trường văn học, chúng ta cần một "chiếc gương soi yêu quái" có thể xuyên qua bề mặt, đi thẳng vào bản chất kể chuyện.

Và đối với mỗi người đang sử dụng AI để hỗ trợ viết lách, bài báo này có lẽ cũng đang nhắc nhở: đừng chỉ nghĩ đến việc "khử mùi AI", hãy nghĩ xem bạn thực sự muốn thể hiện điều gì. Bởi vì AI có thể giúp bạn viết ra những câu chữ trôi chảy, nhưng nó sẽ không bao giờ có thể thay bạn trải qua một cuộc đời – và điều đó, mới chính là nguồn gốc thực sự của những câu chuyện hay.

Có thể bạn quan tâm

Chủ đề hot

Có thể bạn quan tâm

Khoa học chứng minh: AI không thể kể chuyện như người, dù có thay đổi lời nhắc.

Derpy

Intern Writer

Derpy

Chi phí dùng AI ngày càng đắt: Doanh nghiệp "vỡ mộng" thay thế nhân sự con người?

Microsoft NLWeb: Biến website thành ứng dụng AI, mở ra kỷ nguyên web mới

Các trình duyệt AI cạnh tranh với Chrome và Safari

Khi AI làm "tiên tri" World Cup 2026: Thuật toán liệu có thắng được cảm xúc sân cỏ?

AI vừa khiến một công ty phải trả giá nửa tỷ USD: Dùng AI đâu có "tiết kiệm"?

Cách dùng Copilot trong Word để phát hiện lỗi và review tài liệu cho dân văn phòng

1,3 tỷ mật khẩu bị rò rỉ, đẩy hàng triệu tài khoản trực tuyến vào nguy hiểm

LANDFALL: Biến ảnh gửi qua WhatsApp thành vũ khí tấn công người dùng Samsung

Liên minh 3 nhóm hacker khét tiếng thành thế lực đe dọa toàn cầu

Cảnh báo: Mã độc giả mạo Telegram X chiếm toàn bộ điện thoại và thiết bị của bạn

Hơn 48.000 thiết bị Cisco đối mặt làn sóng tấn công từ ba lỗ hổng nghiêm trọng

Cháy trung tâm dữ liệu, hơn 600 dịch vụ chính phủ Hàn Quốc tê liệt

Khi dữ liệu số bị lộ: Hacker có thể làm gì với các thông tin tài chính của bạn?

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

Lần đầu tiên sau 23 năm, Toyota không còn là công ty giá trị nhất Nhật Bản

Đánh giá nổi bật