Hướng dẫn cơ bản về trình tạo video AI: Cách sử dụng Sora 2, Veo 3 và hơn thế nữa

Di chuyển qua, chatbotmáy tạo hình ảnh: Đây là thời đại của máy tạo video AI.

Gần như mọi công ty công nghệ lớn đều đã loại bỏ một số loại mô hình video AI trong hai năm qua, đánh dấu làn sóng công nghệ AI sáng tạo tiếp theo. Giữa Sora, Veo 3 của Googlegiữa hành trìnhnó nhanh chóng trở thành một khu chợ đông đúc. Các video AI là một bước tiến vượt bậc trong các dịch vụ sáng tạo AI của công ty và chúng là thứ đáng để mắt tới khi AI sáng tạo trở thành một phần lớn hơn trong nội dung chúng ta tạo và xem trực tuyến. Điều này đặc biệt đúng với những câu hỏi về tính hợp pháp và đạo đức của video do AI tạo ra rất nhiều.


Đừng bỏ lỡ bất kỳ nội dung công nghệ khách quan nào và các bài đánh giá dựa trên phòng thí nghiệm của chúng tôi. Thêm CNET làm nguồn Google ưa thích.


Nhiều công ty trong số này cũng có chatbot và trình tạo hình ảnh, nhưng tôi rất ngạc nhiên khi thấy có những khác biệt riêng trong các trình tạo video. Ví dụ: một số tính năng tạo hình ảnh yêu thích của tôi xuất hiện trong các mô hình video, trong khi những tính năng khác lại vắng mặt một cách đáng chú ý. Vì có rất nhiều lựa chọn nên tôi đã tổng hợp tất cả các mô hình chính mà bạn có thể xem xét, bao gồm giá cả, quyền riêng tư và thử nghiệm thực tế của tôi đối với từng mô hình.

Đây là mọi thứ bạn cần biết về trình tạo video AI. Danh sách này được cập nhật thường xuyên với thông tin mới nhất về mỗi máy phát điện.

Trình tạo video AI là gì?

Trình tạo video AI là một trong những cách mới nhất mà các công ty công nghệ đang sử dụng AI tổng hợp. Các chương trình này sử dụng công nghệ chuyển văn bản thành video và hình ảnh thành video cho phép bạn tạo các video clip ngắn. Bạn nhập một mô tả ngắn gọi là lời nhắc hoặc tải hình ảnh lên để tạo hoạt ảnh và phần mềm sẽ tạo một clip hoàn toàn được tạo bằng gen AI. Các video AI này có xu hướng dài từ 5 đến 10 giây và một số kiểu máy nhất định cung cấp âm thanh được đồng bộ hóa. Vì công nghệ này mới nên có thể xảy ra lỗi – gọi là ảo giác.

Những mô hình video AI nào tôi có thể sử dụng ngay bây giờ?

Một số ví dụ về trình tạo video AI mà bạn có thể sử dụng hiện nay là Sora của OpenAI, Veo 3 của Google, Adobe đom đómGiữa cuộc hành trình V1. Tất cả chúng đều là những chương trình trả phí mang lại kết quả tốt và cho phép bạn tùy chỉnh ảnh của mình bằng bảng điều khiển. Runway, một công ty khởi nghiệp về AI đã đồng sáng tạo ra Trình tạo hình ảnh khuếch tán ổn địnhlà một tùy chọn video AI khác có gói freemium. Các mô hình AI khác từ LumaPika và chữ tượng hình cũng có sẵn.

Lily Hailyeh/CNET

Sora gia nhập gia đình ChatGPT vào cuối năm 2024, nhưng chính phiên bản cải tiến với Sora 2 vào tháng 10 năm 2025 đã khiến người hâm mộ đổ xô đến với AI. Bạn có thể biết tên Sora từ ứng dụng truyền thông xã hội mới của OpenAI có cùng tên. Nhưng Sora là tên của mô hình video AI ban đầu và bạn có thể tạo video bằng Sora mà không cần mã mời để sử dụng ứng dụng.

Thông qua trình duyệt web, Sora là một chương trình khá thân thiện với người dùng. Nó không có giao diện người dùng đàm thoại giống như Dall-E 3 — bạn không thể “trò chuyện” với Sora để thực hiện các sửa đổi tiếp theo. Thay vào đó, nó giống một dịch vụ sáng tạo AI truyền thống hơn. Trong Sora, bạn có một bảng điều khiển để tùy chỉnh kích thước, độ dài và phong cách của video. Bạn có thể nhập lời nhắc hoặc tải hình ảnh lên để Sora tạo hoạt ảnh và bạn có thể sử dụng một số tùy chọn chỉnh sửa để hoàn thiện video của mình từ đó. Các video của Sora cũng tự động được gắn hình mờ, chỉ rõ nguồn gốc AI của chúng.

Sora chỉ khả dụng cho người dùng ChatGPT trả phí. Nếu bạn là người dùng ChatGPT Plus ($20 mỗi tháng), bạn sẽ nhận được 50 tín dụng tạo ưu tiên mỗi tháng, với các video dài tối đa 5 giây ở 720p. Nâng cấp lên cấp Pro ($200 mỗi tháng) sẽ nhận được tín dụng hàng tháng cao hơn, bao gồm 500 video được tạo với mức độ ưu tiên/thế hệ nhanh và video không giới hạn với thế hệ thoải mái. Người đăng ký chuyên nghiệp cũng có thể tạo video có độ phân giải cao hơn ở mức tối đa 1080p, kéo dài thời lượng video lên tới 20 giây và có tùy chọn tải xuống video mà không có hình mờ.

Chính sách quyền riêng tư của OpenAI nêu rõ rằng nó có thể đào tạo nội dung của bạn trừ khi bạn chọn không tham gia. Để làm điều đó trong Sora, hãy đi tới Cài đặt > Cài đặt chung và tắt Cải thiện mô hình cho mọi người. Bạn cũng có thể loại trừ video của mình khỏi nguồn cấp dữ liệu khám phá công khai trong cài đặt. (Tiết lộ: Ziff Davis, công ty mẹ của CNET, vào tháng 4 đã đệ đơn kiện OpenAI, cáo buộc họ vi phạm bản quyền của Ziff Davis trong việc đào tạo và vận hành hệ thống AI của mình.)

Ảnh chụp màn hình/James Martin/CNET

Trình tạo video AI Veo 3 của Google đã làm say mê những người đam mê AI khi được ra mắt công khai tại hội nghị các nhà phát triển I/O năm 2025. Trong thử nghiệm của mình, tôi nhận thấy Veo 3 là một bước tiến tốt so với trải nghiệm đáng thất vọng của tôi với Veo 2, nhưng sự khác biệt thực sự là rõ ràng: Veo 3 có thể tạo và tự động đồng bộ hóa âm thanh với các video clip của bạn.

Video Veo 3 dài 8 giây, ở độ phân giải 720p và được tạo tự động ở định dạng ngang 16:9. Đây là một chương trình rất có khả năng và các video rất chi tiết và thú vị, nhưng nó không tránh khỏi tất cả các lỗi và ảo giác AI thông thường.

Veo 3 có sẵn thông qua gói Google AI Pro $20 mỗi tháng và chương trình Flow tập trung vào nhà làm phim. Bạn cũng có thể cho Veo chạy thử trên YouTube. Giờ đây, người sáng tạo có thể tạo nền do AI tạo cho video ngắn của họ, do Veo cung cấp.

Video tự động được nhúng hình mờ SynthID của Google (không hiển thị trên clip). Chính sách AI chung của Google Cloud nêu rõ họ không đào tạo dựa trên dữ liệu khách hàng nếu không được phép.

giữa hành trình

Midjourney là một trong những trình tạo hình ảnh AI phổ biến nhất và vừa phát hành mẫu video AI đầu tiên có tên V1. Bạn có thể sử dụng Midjourney để tạo các video clip dài từ 5 đến 21 giây ở độ phân giải 720p. Bạn có thể sử dụng Midjourney thông qua Discord hoặc trang web của nó. Hiện tại, việc tạo video được áp dụng tường phí cho người dùng nhưng đó là một trong những lựa chọn rẻ hơn ở mức 10 USD mỗi tháng.

Chính sách quyền riêng tư của Midjourney cho biết họ có thể sử dụng thông tin cá nhân và thông tin có trong lời nhắc của bạn để cải thiện dịch vụ của mình. Nếu bạn tạo ở chế độ Ẩn thì hình ảnh AI của bạn sẽ ở chế độ riêng tư; nếu không chúng sẽ được chia sẻ trong phòng trưng bày công cộng.

Tôi khá ấn tượng với giá trị của Midjourney so với mức giá, nhưng bạn sẽ cần phải kiên nhẫn và cụ thể với lời nhắc của mình.

Adobe

Trình tạo video AI độc lập của Firefly hiện có sẵn để bạn sử dụng trên máy tính và thông qua ứng dụng di động Firefly. Nếu bạn đã quen với các công cụ hình ảnh AI của Firefly thì việc thiết lập trình tạo video sẽ có cảm giác quen thuộc. Bảng điều khiển bên trái cho phép bạn tùy chỉnh clip của mình và nó có thêm lợi ích là cho phép bạn chọn loại chuyển động bạn muốn (phóng to và thu nhỏ, di chuyển sang phải và trái, v.v.). Bạn cũng có thể chọn góc máy ảnh bạn muốn, chẳng hạn như nếu bạn muốn bắt chước cảnh quay của máy bay không người lái với chế độ xem từ trên không.

Một số gói Creative Cloud bao gồm quyền truy cập Firefly, kể cả khi bạn trả tiền cho một chương trình hoặc tất cả các ứng dụng Adobe. Bạn có thể kiểm tra và so sánh các lựa chọn ở đây. Nếu hiện tại chưa có gói Adobe, bạn có thể dùng thử gói tiêu chuẩn Firefly ($10 mỗi tháng) để tạo tối đa 20 video mỗi tháng. Nếu bạn cần nhiều tín dụng tạo hơn, gói Pro ($30 mỗi tháng) sẽ giúp bạn có tới 70 video mỗi tháng. Cả hai gói Firefly đều đi kèm với khả năng tạo hình ảnh AI không giới hạn. Video Firefly của bạn sẽ dài 5 giây, ở độ phân giải 1080p và không có âm thanh.

Adobe cho biết các video được tạo bằng Firefly an toàn về mặt thương mại và chính sách AI của họ tuyên bố rằng họ sẽ không đào tạo về nội dung của bạn. Video Firefly không có hình mờ hiển thị nhưng thông tin xác thực nội dung của nó sẽ tự động được đính kèm vào tác phẩm của bạn. Các mô hình Firefly được đào tạo về nội dung thuộc phạm vi công cộng và được cấp phép.

Kelyn Chedraoui/CNET

Những người đam mê AI có thể nhận ra Runway là công ty khởi nghiệp đồng sáng tạo ra công cụ tạo hình ảnh AI nổi tiếng Stable Diffusion. Bạn cũng có thể nhận ra Runway từ một thỏa thuận mang tính bước ngoặt với một hãng phim lớn vào mùa thu năm ngoái. Lionsgate đồng ý mở danh mục của mình — hàng nghìn giờ phim như The Hunger Games và John Wick và các chương trình truyền hình như Mad Men — để sử dụng để tạo các mô hình AI tùy chỉnh cho hãng phim sử dụng.

Trong quá trình thử nghiệm dịch vụ ngắn gọn, tôi rất ấn tượng với các công cụ xây dựng nhanh chóng và sự dễ dàng tìm đường nói chung. Trước đây tôi cũng đã từng sử dụng dịch vụ này như một phần của ứng dụng Magic Media của Canva, rất tiện lợi nếu bạn là người yêu thích Canva. Bạn có thể sử dụng Runway miễn phí trên ứng dụng web của nó, với 125 tín dụng hàng tháng — bạn sẽ sử dụng khoảng 20 tín dụng cho mỗi thế hệ, vì vậy đây là giới hạn khá thấp. Nâng cấp ($15 mỗi tháng hoặc $144 hàng năm) giúp bạn nhận được 625 tín dụng hàng tháng, quyền truy cập vào các mẫu mới hơn và khả năng nâng cấp video lên 4K và tải xuống mà không có hình mờ.

Điều khoản dịch vụ của Runway cho biết họ có thể đào tạo AI theo lời nhắc của bạn và các video thu được nhưng không giữ quyền sở hữu chúng. Chính sách bảo mật của nó cũng nêu rõ rằng Runway có thể tiết lộ thông tin của bạn cho các chi nhánh, đối tác kinh doanh và tiếp thị. Các video bạn tạo sẽ tự động ở chế độ riêng tư.

Một số dự án video AI khác là gì?

Đáng chú ý vắng mặt trong danh sách này là Meta. Công ty đã dành nguồn lực của mình để phát triển AI, nhưng lại không có công cụ tạo video AI nào được cung cấp công khai. Nó đã giới thiệu một phiên bản của một chiếc vào tháng 10 năm 2024. Đây là những gì chúng ta biết cho đến nay.

Meta/Ảnh chụp màn hình của CNET

Mô hình video AI của Meta — Movie Gen — hiện chỉ là một khái niệm nghiên cứu và chưa được công bố rộng rãi cũng như không có thông tin gì về thời điểm nó có thể xuất hiện.

Nhờ một bài nghiên cứu được Meta xuất bản, chúng tôi biết video Movie Gen có thể có độ phân giải 1080p HD và dài tới 16 giây ở 16 khung hình mỗi giây. Điều đáng chú ý nhất đối với Movie Gen là khả năng đồng bộ hóa âm thanh. Meta cho biết Movie Gen cũng có thể được sử dụng để tạo hiệu ứng âm thanh, tiếng ồn xung quanh và nhạc cụ dài tới 45 giây. Luôn có khả năng tính năng này không được đưa vào bản cắt cuối cùng, nhưng nó sẽ mang lại lợi thế cho Meta.

Có lẽ giống như Google và YouTube, chúng ta sẽ thấy một số tính năng hỗ trợ AI xuất hiện đầu tiên trên các nền tảng xã hội như Instagram và Facebook. (Chúng tôi đã có một số tính năng AI khác chiếm dung lượng trên nguồn cấp dữ liệu của chúng tôi.) Các mô hình AI của Meta cho chatbot và trình tạo hình ảnh được đào tạo về nội dung có sẵn công khai trên Facebook và Instagram cũng như dữ liệu được cấp phép.

Để biết thêm, hãy xem hướng dẫn của chúng tôi để viết lời nhắc bằng hình ảnh AI tốt nhất và các chatbot AI tốt nhất.

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *