Tech

Viggle tạo ra nhân vật AI có thể điều khiển cho meme và hình ảnh ý tưởng

Bạn có thể chưa biết đến Viggle AI, nhưng bạn có thể đã thấy những video meme lan truyền mà nó tạo ra. Công ty khởi nghiệp AI người Canada chịu trách nhiệm cho hàng chục video remix của rapper Lil Yachty nhảy trên sân khấu tại một lễ hội âm nhạc mùa hè. Trong một video, Lil Yachty được thay thế bằng Joker của Joaquin Phoenix. Trong video khác, Chúa Jesus dường như đang kích động đám đông. Người dùng đã tạo vô số phiên bản của video này, nhưng một công ty khởi nghiệp AI đã làm nổi lên những meme đó. CEO của Viggle nói rằng video trên YouTube là nguồn nhiên liệu chính cho các mô hình AI của họ.

Viggle đã huấn luyện một mô hình cơ bản video 3D, JST-1, để có một “hiểu biết chân thực về vật lý,” như công ty tuyên bố trong thông cáo báo chí của mình. CEO của Viggle, Hang Chu, cho biết điểm khác biệt chính giữa Viggle và các mô hình video AI khác là Viggle cho phép người dùng xác định chuyển động mà họ muốn nhân vật thực hiện. Các mô hình video AI khác thường tạo ra các chuyển động nhân vật không thực tế không tuân theo luật vật lý, nhưng Chu khẳng định rằng các mô hình của Viggle khác biệt.

“Chúng tôi về cơ bản đang xây dựng một loại đồng hồ đồ họa mới, nhưng hoàn toàn với mạng nơ-ron,” Chu nói trong một cuộc phỏng vấn. “Chính mô hình đó khá khác biệt so với các trình tạo video hiện có, chúng chủ yếu là dựa trên điểm ảnh, và không thực sự hiểu cấu trúc và tính chất vật lý. Mô hình của chúng tôi được thiết kế để có hiểu biết như vậy, và đó là lý do tại sao nó đã đáng kể tốt hơn về khả năng điều khiển và hiệu quả tạo ra.”

Để tạo video về Joker như Lil Yachty, ví dụ, chỉ cần tải lên video gốc (Lil Yachty nhảy trên sân khấu) và một hình ảnh của nhân vật đó (Joker) để thực hiện chuyển động đó. Hoặc người dùng có thể tải lên hình ảnh của các nhân vật cùng với các hướng dẫn văn bản về cách hoạt hình chúng. Dưới dạng tùy chọn thứ ba, Viggle cho phép người dùng tạo ra các nhân vật hoạt hình từ đầu chỉ với hướng dẫn văn bản.

Nhưng meme chỉ chiếm một phần nhỏ người dùng của Viggle; Chu nói rằng mô hình đã được sử dụng rộng rãi như một công cụ hình ảnh cho các nhà sáng tạo. Các video không hoàn hảo — chúng rung lắc và khuôn mặt không biểu cảm — nhưng Chu nói rằng nó đã chứng minh hiệu quả đối với các nhà làm phim, nhà hoạt hình và thiết kế trò chơi video để biến ý tưởng của họ thành hình ảnh. Hiện tại, các mô hình của Viggle chỉ tạo ra nhân vật, nhưng Chu hy vọng sẽ cho phép tạo ra video phức tạp hơn vào sau này.

Hiện tại, Viggle cung cấp phiên bản AI miễn phí, giới hạn trên Discord và ứng dụng web của mình. Công ty cũng cung cấp một gói đăng ký trị giá $9.99 cho dung lượng tăng cấp, và cung cấp một số tác giả truy cập đặc biệt thông qua một chương trình tạo ra. CEO nói rằng Viggle đã nói chuyện với các studio phim và trò chơi video về việc cấp phép công nghệ, nhưng anh cũng thấy sự chấp nhận từ các nhà hoạt hình độc lập và nhà sáng tạo nội dung khác.

Vào thứ Hai, Viggle công bố rằng họ đã gọi vốn thành công $19 triệu trong chuỗi A do Andreessen Horowitz dẫn dầu, với sự tham gia từ Two Small Fish. Công ty khởi nghiệp nói rằng chuỗi này sẽ giúp Viggle mở rộng, tăng tốc phát triển sản phẩm và mở rộng đội ngũ của mình. Viggle cho biết cho TechCrunch rằng họ hợp tác với Google Cloud, cùng với các nhà cung cấp đám mây khác, để huấn luyện và vận hành các mô hình AI của họ. Những hợp tác Google Cloud này thường bao gồm truy cập vào các cụm GPU và TPU, nhưng thông thường không bao gồm video trên YouTube để huấn luyện mô hình AI.

Dữ liệu huấn luyện

Trong cuộc phỏng vấn với TechCrunch, Chu, chúng tôi đã hỏi dữ liệu mà các mô hình video AI của Viggle đã được huấn luyện trên.

“Cho đến nay, chúng tôi đã dựa vào dữ liệu mà đã được công khai,” Chu nói, truyền đạt một dòng tương tự như câu trả lời của CTO của OpenAI, Mira Murati, về dữ liệu huấn luyện của Sora.

Được hỏi liệu tập dữ liệu huấn luyện của Viggle có bao gồm video YouTube không, Chu trả lời một cách rõ ràng: “Có.”

Điều đó có thể là một vấn đề. vào tháng 4, CEO YouTube Neal Mohan nói với Bloomberg rằng việc sử dụng video YouTube để huấn luyện một trình tạo video văn bản sang video AI sẽ là một “vi phạm rõ ràng” của các điều khoản dịch vụ của nền tảng. Các ý kiến này được đưa ra trong bối cảnh OpenAI có thể đã sử dụng video YouTube để huấn luyện Sora.

Mohan làm rõ rằng Google, công ty sở hữu YouTube, có thể ký kết hợp đồng với một số tạo ra để sử dụng video của họ trong các tập dữ liệu huấn luyện cho Gemini của Google DeepMind. Tuy nhiên, việc thu thập video từ nền tảng không được phép, theo lời Mohan và các điều khoản dịch vụ của YouTube, nếu không được sự cho phép từ công ty.

Sau cuộc phỏng vấn của TechCrunch với CEO của Viggle, một người phát ngôn của Viggle đã gửi email về việc rút lại lời nhận xét của Chu, cho biết rằng CEO “nói quá sớm về việc Viggle sử dụng dữ liệu từ YouTube để huấn luyện. Thực tế, Hang / Viggle không thể chia sẻ chi tiết về dữ liệu huấn luyện của họ.”

Sau khi chỉ ra rằng những bình luận trước đó của Chu đều được ghi lại và yêu cầu một tuyên bố rõ ràng về vấn đề, người phát ngôn của Viggle đã xác nhận trong câu trả lời của họ rằng công ty khởi nghiệp AI này đang huấn luyện trên video YouTube:

Viggle tận dụng nhiều nguồn thông tin công cộng, bao gồm YouTube, để tạo nội dung AI. Dữ liệu huấn luyện của chúng tôi đã được tinh chỉnh và chọn lọc cẩn thận, đảm bảo tuân thủ tất cả các điều khoản dịch vụ trong quá trình. Chúng tôi ưu tiên duy trì mối quan hệ mạnh mẽ với các nền tảng như YouTube, và chúng tôi cam kết tôn trọng các điều khoản của họ bằng cách tránh lấy nhiều video không xác nhận và bất kỳ hành động nào khác liên quan đến việc tải video không cung cấp phép thu của họ.

Chúng tôi đã liên hệ với người phát ngôn của YouTube và Google, nhưng chưa nhận được phản hồi.

Công ty khởi nghiệp này tham gia vào một số khác sử dụng YouTube làm dữ liệu huấn luyện và do đó hoạt động trong khu vực mờ. Đã được báo cáo rằng nhiều nhà phát triển mô hình AI — bao gồm Nvidia, Apple và Anthropic — sử dụng bản chú thích hoặc đoạn video từ YouTube cho việc huấn luyện. Đó là bí mật “bẩn” tại Thung lũng Silicon không còn bí mật nữa: có lẽ mọi người đều đang làm điều đó. Điều thực sự hiếm khi là nói ra lớn tiếng.

Related Articles

Back to top button Back to top button