Trang chủ Sản phẩm - Dịch vụ ByteDance ra mắt mô hình AI để sản xuất các video siêu thực

ByteDance ra mắt mô hình AI để sản xuất các video siêu thực

bởi demo
1 Lượt xem

ByteDance – công ty mẹ TikTok vừa giới thiệu mô hình trí tuệ nhân tạo (AI) mới có tên OmniHuman-1, có khả năng sản xuất video deepfake mà người dùng thông thường gần như không thể phân biệt với video thật.

Công nghệ AI tạo hình ảnh, video và âm thanh giống người thật còn được gọi là “deepfake” – công nghệ ngày càng được sử dụng nhiều trong các vụ lừa đảo cũng như giải trí.

OmniHuman-1 có thể tạo ra các video giả mạo chỉ từ một bức ảnh và một đoạn âm thanh. Người dùng có thể điều chỉnh các yếu tố như tỷ lệ khung hình và cử động cơ thể. Hệ thống này thậm chí có khả năng chỉnh sửa các video hiện có, thay đổi chuyển động và cử chỉ một cách chân thực đến rùng rợn. Tuy nhiên, không phải lúc nào kết quả cũng hoàn hảo khi một số tư thế có thể trông hơi kỳ quặc, như khi một nhân vật cầm ly rượu vang.

Dù vậy, chất lượng tổng thể của video do OmniHuman-1 tạo ra vẫn vượt trội hơn so với các công nghệ deepfake trước đây. Hệ thống này đã được đào tạo trên 18.700 giờ dữ liệu video, sử dụng phương pháp “omni-conditions” cho phép nó học từ nhiều nguồn đầu vào như văn bản, âm thanh và tư thế cơ thể cùng một lúc. Các nhà nghiên cứu của ByteDance cho biết dữ liệu đào tạo phong phú này giúp AI “giảm đáng kể tình trạng lãng phí dữ liệu” so với các mô hình deepfake cũ.

ByteDance đang là một trong những công ty AI lớn nhất ở Trung Quốc. Ứng dụng Doubao của công ty là ứng dụng phổ biến nhất với người dùng đại lục.

Mặc dù, OmniHuman-1 chưa được phát hành rộng rãi ra công chúng, song các đoạn video mẫu đã nhanh chóng lan truyền rộng rãi. Một demo nổi bật là video dài 23 giây mô tả Albert Einstein đang phát biểu. Trang công nghệ TechCrunch mô tả sản phẩm của ứng dụng này “tuyệt vời đến mức gây sốc” và “là những video deepfake chân thực nhất cho đến nay”.

Nhà phát triển cho biết, OmniHuman-1 chỉ cần dữ liệu tham khảo là một hình ảnh duy nhất cùng dữ liệu âm thanh như lời nói hoặc giọng hát để tạo ra một đoạn video có độ dài tùy ý. Tỷ lệ khung hình video đầu ra có thể được điều chỉnh, cũng như “tỷ lệ cơ thể” của nhân vật trong đó.

ByteDance ra mắt mô hình AI để sản xuất các video siêu thực

Mối nguy hại từ mô hình deepfake của ByteDance

Tuy nhiên, sự phát triển này cũng đặt ra nhiều lo ngại. Deepfake đã được sử dụng trong các chiến dịch thông tin sai lệch, gian lận và nhiều mục đích xấu khác trong những năm qua. Trong bối cảnh bầu cử năm 2024, đã có nhiều vụ việc liên quan đến việc phát tán âm thanh và video deepfake nhằm đánh lừa cử tri. Năm ngoái, các vụ lừa đảo tài chính liên quan đến deepfake đã khiến hàng tỷ USD bị thiệt hại, trong đó có một trường hợp nổi bật khi một kẻ lừa đảo sử dụng AI để giả mạo Brad Pitt để lừa một phụ nữ chuyển 850.000 USD.

Trước những rủi ro này, hàng trăm chuyên gia về đạo đức AI đã kêu gọi ban hành các quy định về deepfake. Một số tiểu bang của Mỹ đã thông qua luật chống lại deepfake độc hại, nhưng vẫn chưa có luật liên bang bao quát. California đang xem xét một đạo luật cho phép các thẩm phán yêu cầu gỡ bỏ deepfake và áp dụng hình phạt cho những người đăng tải chúng, nhưng dự luật này vẫn đang bị đình trệ.

Nguồn: Tạp chí ATTT

Bài viết liên quan