Google đã phát hành bản cập nhật mới cho mô hình tạo video Veo AI nhằm giúp nó thực hiện công việc bám sát lời nhắc và chuyển đổi hình ảnh thành video tốt hơn. Veo 3.1 hiện có sẵn để dùng thử thông qua API Gemini của Google và hiện cũng đang hỗ trợ trình chỉnh sửa video Flow của công ty.
Veo 3.1 được xây dựng dựa trên các khả năng mới mà Google đã giới thiệu khi ra mắt Veo 3 tại Google I/O 2025. Theo Google, mô hình mới này cung cấp khả năng “tuân thủ nhanh chóng” tốt hơn và sẽ giúp bạn tạo video dễ dàng hơn dựa trên “thành phần” hình ảnh mà bạn tải lên cùng với lời nhắc bằng văn bản của mình. Veo 3.1 cũng cho phép chuyển đổi hình ảnh thành video và tạo âm thanh cùng lúc, một khả năng không có ở Veo 3.
Trong Flow, Veo 3.1 hỗ trợ ít nhất một tính năng mới giúp bạn kiểm soát tốt hơn các video bạn tạo. Với cái mà Google gọi là “Frame to Video”, Flow cho phép bạn tải lên khung hình đầu tiên và cuối cùng, sau đó tạo video ở giữa. Adobe Firefly, được cung cấp bởi Veo 3, cung cấp tính năng tương tự, nhưng Flow sẽ có thể thực hiện nó và tạo âm thanh cùng một lúc. Những kỹ năng âm thanh được bổ sung đó cũng sẽ áp dụng cho khả năng mở rộng clip và chèn các đối tượng vào cảnh quay hiện có của trình chỉnh sửa video.
Dựa trên các mẫu mà Google đã chia sẻ, các video được tạo bằng Veo 3.1 vẫn có chất lượng kỳ lạ và có vẻ thay đổi rất nhiều tùy thuộc vào lời nhắc và chủ đề. Tuy nhiên, ngay cả khi nó thiếu một số tính chân thực của Sora 2 của OpenAI, quyết định của công ty là cố gắng làm cho Veo trở nên hữu ích hơn đối với những người thực sự làm việc với video thay vì nguồn spam trên mạng xã hội là một động thái đáng hoan nghênh.

