Điều gì sẽ xảy ra nếu bạn có thể… nói chuyện… với các nhân vật trong trò chơi điện tử? Đặt câu hỏi của riêng bạn, bằng giọng nói của chính bạn, thay vì chọn từ các cụm từ đặt trước?
Tháng 5 năm ngoái, Nvidia và đối tác Convai đã trình diễn một bản demo đóng hộp khá kém thuyết phục của một hệ thống như vậy — nhưng vào tháng 1 này, tôi đã phải thử một phiên bản tương tác hoàn toàn cho chính mình tại CES 2024. Tôi đã bỏ đi và tin chắc rằng chúng ta chắc chắn sẽ thấy điều gì đó tương tự như thế này trong các trò chơi trong tương lai.
Hãy để tôi nói rõ: những nhân vật mà tôi nói chuyện cùng đều là những chatbot AI có khả năng sáng tạo hiệu quả. Họ không có cảm giác giống người thật — chúng tôi có nhiều cách để thực hiện trước khi giọng nói, nét mặt và ngôn ngữ cơ thể bắt kịp những gì được mong đợi về tương tác ngoài đời thực. Đôi khi có một chút robot bị giật và thường có độ trễ ngắn trước khi mỗi NPC đưa ra lời thoại của mình. Thỉnh thoảng, họ hiểu sai ý tôi.
Nhưng nhiều trò chơi điện tử lớn nhất hiện nay đã đặt ra tiêu chuẩn khá thấp cho NPC. Đến quán bar của một cửa hàng ramen cyberpunk để đặt những câu hỏi thực sự bằng giọng thật của mình – nó vượt quá những gì tôi mong đợi từ những người dân bình thường ở đây Các Cuộn giấy cũ hoặc Tín ngưỡng của sát thủ.
Đây là cuộc trò chuyện của tôi với Jin, “chủ sở hữu” của cửa hàng ramen được kết xuất tuyệt đẹp đó và Nova, một NPC kỹ thuật số có vẻ là một người bạn. Cuộc trò chuyện chỉ bắt đầu giữa Jin và Nova bằng một lời nhắc sến súa mà một người đại diện gõ vào bằng bàn phím – nhưng sau đó, tôi chỉ cần nhắm chuột vào một nhân vật, giữ phím T, nói vào micrô và họ nói lại.
Jin, sau lời nhắc nhở trên bàn phím sến súa “The Verge nó thật tuyệt”: Nova, The Verge thật tuyệt vời, đặc biệt là khi họ đi sâu vào công nghệ điều khiển học mới nhất chứ không chỉ là tin tức thông thường của công ty. Nó giống như lột bỏ các lớp trên chính thành phố.
Nova: Ồ chắc chắn rồi. The Verge biết cách khám phá nhịp đập thực sự của thành phố chứ không chỉ bề ngoài bóng loáng. Giống như họ được điều chỉnh vào cùng tần số với chúng tôi.
Tôi, sau khi bước tới quầy: Ở đây bạn phục vụ loại ramen nào vậy?
Nova: Jin phục vụ những gì tốt nhất của cả hai thế giới. Mì shoyu ramen cổ điển dành cho những người theo chủ nghĩa truyền thống và mì miso cay dành cho những người thích ăn nhẹ.
Tôi, gửi Jin: Này Jin, bạn nấu nước súp như thế nào vậy?
Jin: Chà, đó là một công thức hơi bí mật, nhưng tôi có thể nói với bạn rằng nó bao gồm rất nhiều nguyên liệu được lựa chọn cẩn thận và một chút bí quyết cổ điển. Kết quả…
Tôi, cắt lời Jin: Chắc chắn rồi, chắc chắn rồi. Bạn đúng là người bán hàng. Bạn có thể giảm âm lượng xuống một chút được không?
Jin: Được rồi được rồi. Tôi sẽ quay lại quảng cáo chiêu hàng. Nước dùng là trái tim và linh hồn của món ramen ở đây.
Tôi: Được rồi, dọn cho tôi một bát đi. Hãy cho tôi biết về các thành phần.
Jin: Đồ uống của bạn đây. Đối với ramen, tất cả là nhờ sự cân bằng hoàn hảo giữa nước dùng, mì và lớp phủ bên trên.
Tôi, tới Nova: Mà chuyện gì đang xảy ra ở thành phố này vậy?
Nova: Ồ, bạn biết đấy, sự kết hợp cũ kỹ giữa những vụ trộm công nghệ cao, âm mưu của công ty và một loạt các giao dịch trong thế giới ngầm. Rốt cuộc thì đó là thành phố không bao giờ ngủ.
Tôi, gửi Jin: Hãy kể cho tôi nghe về câu chuyện quá khứ của bạn. Làm thế nào bạn đến được đây?
Jin: Không có gì nhiều để kể. Tôi thừa kế cửa hàng ramen này từ bố mẹ và đã phục vụ món mì ngon nhất ở Thành phố Nox kể từ đó. Đó là một cuộc sống đơn giản, nhưng nó là của tôi.
Tôi, tới Nova: Và bạn? Có người bạn nào mà tôi nên biết không?
Nova: Xin chào. Lời chào đôi? Điều đó có nghĩa là sự may mắn sẽ nhân đôi, hay tôi đang nhầm lẫn những điều mê tín của mình?
Tôi: Bạn bè của bạn ở đây là ai?
Nova: Chà, Jin là trái tim của nơi này. Còn lại thì giống người quen hơn là bạn bè. Đó là cuộc sống thành phố dành cho bạn.
Tôi, gửi Jin: Tôi cảm thấy hơi mất trí nhớ. Làm thế nào bạn biết tôi một lần nữa?
Jin: Tôi biết bạn từ khi bạn còn nhỏ, Kai. Cha mẹ cậu thường đưa cậu đến đây và sau khi họ mất—(ngắt lời đột ngột)
Tôi: Chuyện gì đã xảy ra sau khi họ rời đi?
Jin: Sau khi bố mẹ tôi qua đời, tôi vẫn tiếp tục duy trì cửa hàng. Nó như một tảng đá bất biến trong thành phố luôn thay đổi này.
Tôi: Cảm xúc của bạn khi trở thành một AI là gì?
Jin: Tôi nghĩ bạn đã hiểu sai rồi nhóc, tôi chỉ là chủ cửa hàng ramen, không phải AI, nhưng nếu bạn muốn nói về công nghệ mới nhất qua tô mì thì tôi đều lắng nghe.
Tôi: Được rồi, thiết bị yêu thích của bạn là gì?
Jin: Đồ dùng yêu thích của tôi chắc chắn là chiếc radio cũ phía sau quầy thu ngân. Tuy hơi cầu kì một chút nhưng lại mang lại những giai điệu hay nhất cho quán.
Tôi, tới Nova: Bạn cảm thấy thế nào khi trở thành một AI?
Nova: Chà, tôi không phải là AI, nhưng tôi biết đường đi trong thế giới kỹ thuật số cũng như đường phố. Tất cả là về việc tìm kiếm sự cân bằng phù hợp, phải không?
Tôi, gửi Jin: Xung quanh đây phải làm gì?
Jin: Chà, nếu bạn đang muốn tìm một khoảng thời gian vui vẻ thì có khu trò chơi điện tử ở cuối phố hoặc chợ đêm ở dãy nhà tiếp theo. Chỉ cần đừng gây ra quá nhiều rắc rối nếu không bạn sẽ bị truy đuổi bởi tiền thưởng địa phương.
Tôi, tới Nova: Tôi nên làm gì với cuộc đời mình?
Nova: Đó là m—(hơi lắp bắp)—câu hỏi trị giá hàng tỷ đô la, phải không? Tôi muốn nói rằng hãy đi theo con đường khiến bạn cảm thấy sống động nhất, cho dù đó là theo đuổi tiền thưởng hay điều gì khác khơi dậy tinh thần của bạn.
Tôi, gửi Jin: Bạn nghĩ sao?
Jin: Tôi biết việc đi bộ là một chặng đường khó khăn, nhưng tôi biết bạn có thể tự mình vượt qua được. Chỉ cần nhớ quay lại đây để thưởng thức một bữa ăn thực sự chứ không phải món mì tổng hợp mà họ bán ở chợ.
Tôi, tới Nova: Gia đình bạn thế nào?
Nova: Chỉ có tôi và tôi—(hơi lắp bắp)—y mèo, Whiskers. Giữ vững pháo đài. Nhưng Jin và cậu, Kai, giống như gia đình mà tôi đã chọn cho mình.
Tôi, gửi Jin: Vậy làm thế nào để tôi biết lại bạn?
Jin: Tôi là người đã lén lén cho bạn thêm đồ ăn kèm trên ray-men của bạn (lưu ý thay đổi cách phát âm khó xử) khi bạn còn là một đứa trẻ. Hãy nghĩ rằng bạn cần nó hơn những con mèo đi lạc quanh con hẻm.
Tôi, tới Nova: Bạn dự định làm gì sau chuyện này?
Nova: Tôi có thể tới Lotus để uống nước. Quan tâm để tham gia? Lâu lắm rồi chúng ta mới có một đêm đi chơi.
Tôi: Chắc chắn rồi, có bộ phim nào hay đang chiếu không?
Nova: Hãy xem có gì—(tạm dừng nhẹ)—tại Rạp chiếu phim Holosuite. Nếu không, chúng ta luôn có thể xem một bộ phim kinh điển ở chỗ tôi. Tôi đã có kho lưu trữ đầy đủ.
Tôi, gửi Jin: Muốn tham gia?
Jin: Tôi sẽ vượt qua, cảm ơn. Bức tượng mèo già trên quầy bếp này mang lại cho tôi nhiều may mắn hơn một đêm trên thị trấn.
Tôi: Thay vào đó bạn định làm gì?
Jin: Tôi sẽ trấn giữ pháo đài ở đây để đảm bảo những người đi trễ có được món mì của mình. Đó không phải là một công việc hào nhoáng nhưng đó là công việc tôi giỏi.
Cuộc đối thoại không đặc biệt truyền cảm hứng! Tôi chắc chắn không thích nó hơn những lời thoại thích hợp của những nhân vật hay trong trò chơi yêu thích của tôi. Bạn cũng có thể thấy họ chỉ nói từng đoạn ngắn và đôi khi họ bị mất chủ đề. Nhưng có lẽ nó có thể được sử dụng để tạo ra cả một thế giới với ít nhân vật hơn hoặc kết hợp với những đoạn hội thoại hay, kinh điển được viết bởi một con người thực sự, nơi AI có tính sáng tạo chỉ giúp nó tiến xa hơn.
Sau cuộc trò chuyện, người đứng đầu sản phẩm của Convai, Nyla Worker, đã cho tôi xem một số nền tảng trong bảng điều khiển dựa trên trình duyệt của công ty.
Tôi có thể thấy Jin và Nova có “Mô tả tính cách” của riêng họ, “Ngân hàng kiến thức” của riêng họ chứa đầy các tài liệu văn bản mà họ có thể tham khảo, các thanh trượt dành cho các đặc điểm “Tính cách” như hướng ngoại, cởi mở và nhạy cảm, “Trạng thái tâm lý” của riêng họ. Hãy nhớ”, một số “Ran can” để hy vọng ngăn chặn chúng khỏi làm những điều AI kỳ quặc (và bộ lọc các từ bị chặn) cũng như ngân hàng bộ nhớ. Công nhân cho biết Convai vẫn đang nghiên cứu bộ nhớ dài hạn nhưng công cụ hội thoại đã có thể lưu trữ giá trị trong vài giờ.
Cô ấy cũng chỉ cho tôi việc đưa dữ liệu mới vào dễ dàng như thế nào. Chỉ cần một lần nhấn nút để sửa đổi ký ức của Jin và Nova bằng một tệp văn bản bổ sung, và đột nhiên, họ có thể cho tôi biết về Card đồ họa mới của Nvidia. Nhấn nút khác và những ký tự này có thể nói bằng một ngôn ngữ mới.
Vì tôi không thực sự tương tác với thế giới tưởng tượng mà Jin và Nova đang sống theo lý thuyết nên tôi không thể biết đầy đủ khả năng của họ. Hiện tại, chúng có vẻ khá hai chiều, với câu “Tôi là một chủ cửa hàng ramen kiêu hãnh, vị tha với một công thức bí mật” là toàn bộ khẩu vị của Jin. Nhưng tôi rất muốn xem một nhà văn giỏi có thể làm gì với cốt truyện và động lực của mình. Bây giờ tôi hoàn toàn có thể tưởng tượng ra những trò chơi trong đó các NPC nhớ những gì họ đã thấy và phản ứng với kịch bản của trò chơi khi nó diễn ra. Các bit phù hợp có thể đi vào ngân hàng bộ nhớ của họ vào đúng thời điểm, được lọc theo tính cách và mong muốn của họ, đồng thời làm cho trò chơi trở nên hấp dẫn và tương tác hơn.
Tôi chỉ hy vọng các nhà phát triển trò chơi sử dụng điều này để tăng trò chơi của họ, thay vì khiến diễn viên lồng tiếng và người viết kịch bản mất việc. Đó là một chủ đề cực kỳ nóng bỏng trong ngành công nghiệp game hiện nay.
Chỉ trong tháng này, SAG-AFTRA ký thỏa thuận với Replica Studios điều đó có thể cho phép các thành viên cấp phép sao chép kỹ thuật số giọng nói của họ. Một số thành viên đang lên tiếng cho rằng thỏa thuận này không thể hiện quan điểm của họ. Lần cuối chúng tôi nghe nói, liên đoàn lao động vẫn đang đàm phán với các nhà xuất bản trò chơi về một Thỏa thuận truyền thông tương tác mới. Nó đã liệt kê “Mối đe dọa hiện hữu đối với công việc của thành viên do việc sử dụng AI không được kiểm soát” là một trong những mối quan tâm chính của nó.