Sau khi nhìn thấy tất cả các fanfare chuối cho công cụ AI mới nhất của Google, tôi biết rằng tôi phải lấy nó cho một vòng quay. Được đặt tên là hình ảnh flash Gemini 2.5, mô hình nâng cấp khả năng chỉnh sửa ảnh của bạn bằng Gemini. Những người đam mê AI đã gọi nó là mô hình “chuối nano”, được thúc đẩy bởi một loạt các lời trêu ghẹo theo chủ đề chuối từ Google Execs.
Trong vài tuần nữa, mọi người đã tạo ra hơn 200 triệu hình ảnh AI và hơn 10 triệu người đã đăng ký sử dụng ứng dụng Song Tử, theo Josh Woodward, phó chủ tịch Google Labs và Gemini của Google.
Google đã đầu tư rất nhiều vào các mô hình phương tiện tổng quát trong năm nay, bỏ các phiên bản cập nhật của các mô hình tạo hình ảnh và video tại hội nghị nhà phát triển I/O hàng năm. Trình tạo video AI của Google, VEO 3 choáng váng với âm thanh được đồng bộ hóa, lần đầu tiên trong số những người khổng lồ AI. Và những người sáng tạo đã thực hiện hơn 100 triệu video AI với công cụ làm phim AI của Google, Flow.
Tôi đã dành rất nhiều thời gian để thử nghiệm phần mềm sáng tạo AI và tôi rất hào hứng khi thấy những gì Google đã nấu. Nhưng thử nghiệm hình ảnh flash 2.5 của tôi cho thấy chỉ vì một cái gì đó có lối vào hào nhoáng không có nghĩa là nó sẽ luôn sống theo sự cường điệu của nó. Đây là cách mà trải nghiệm của tôi với Gemini Nano Chuối đã đi: Tốt, xấu và bực bội.
Những gì đã làm việc
Mô hình chuối Gemini rất giỏi trong việc thêm các yếu tố vào các hình ảnh hiện có, pha trộn các yếu tố do AI tạo ra tốt vào bất kỳ hình ảnh nào bạn chụp. Nó cũng duy trì mức độ nhất quán của nhân vật ổn định – có nghĩa là những người trong các bức ảnh của tôi không bị bóp méo hoặc Winky sau khi trải qua quá trình xử lý AI. Đó là cả hai sự khác biệt quan trọng cho các chương trình hình ảnh AI và một cái gì đó Google cho biết nó đã hoạt động để cải thiện.
Bạn có thể thấy cả hai đặc điểm này trong bức ảnh này của chị tôi và tôi. Sự xuất hiện chung của chúng tôi không thay đổi trong phiên bản chỉnh sửa (phải), thể hiện tính nhất quán của ký tự. Tôi đã yêu cầu Gemini thêm một chị gái thứ ba trông giống với hai chúng tôi, điều đó thật đáng sợ bằng cách thêm một người phụ nữ thứ ba ở giữa hai chúng tôi.
Chào mừng bạn đến với gia đình, chị gái AI trông rất chính xác.
Tôi cũng khá ấn tượng với việc Song Tử có thể nhổ những hình ảnh đã hoàn thành nhanh như thế nào. Bất cứ nơi nào dưới một phút đều nhận được một ngôi sao vàng từ tôi và Gemini thường xuyên xử lý các yêu cầu trong vòng dưới 15 giây. Tôi cũng đánh giá cao cách nó thêm một hình mờ vào tất cả các hình ảnh mà nó tạo ra và chỉnh sửa-ngay cả khi tôi không thích cách các công ty công nghệ đã làm hỏng biểu tượng cảm xúc lấp lánh cho AI, điều cực kỳ quan trọng là phải có một số điểm đánh dấu của nội dung AI. Công việc tổng hợp và hậu trường của Google cũng giúp phân biệt nội dung AI với hình ảnh do con người tạo ra.
Gemini cũng giỏi tạo hình ảnh AI bán buôn, nhưng tôi khuyên bạn nên sử dụng ItageN 4 hoặc một trình tạo hình ảnh AI khác-họ có nhiều điều khiển và cài đặt thực hành giúp bạn gần gũi hơn với những gì bạn muốn với ít công việc hơn.
Những gì thực sự không hoạt động
Có những hạn chế nghiêm trọng đối với chuối Song Tử. Nó tự động tạo hình ảnh vuông và lời nhắc tiếp theo yêu cầu hình ảnh được điều chỉnh thành các kích thước khác đã bị bỏ qua hoặc không thành công.
Tôi cũng nhận thấy rằng Gemini đã giảm độ phân giải của nhiều bức ảnh của tôi. Tôi chủ yếu chụp ảnh với iPhone 16 của mình, có máy ảnh xuất sắc, nhưng sau khi trải qua mô hình chuối Gemini, những chi tiết tốt đó thường bị mờ. Điều đó thật khó chịu và sẽ không giành chiến thắng trước bất kỳ nhiếp ảnh gia nào.
Mặc dù yêu cầu của tôi để làm sáng các vòng của mục tiêu, bức ảnh gốc (bên trái) có nhiều sự phong phú và kết cấu hơn so với cái được chỉnh sửa AI (phải).
Tôi đã cố gắng nhiều lần để có được Song Tử để xử lý các chỉnh sửa ảnh mà tôi rất khó để làm thủ công. Đó là một lĩnh vực trong chỉnh sửa ảnh trong đó AI được cho là vượt trội-tự động hóa các chỉnh sửa trần tục nhưng chi tiết. Đáng buồn thay, Song Tử thực sự phải vật lộn với việc tuân thủ nhanh chóng ở đây, có nghĩa là nó không làm những gì tôi yêu cầu.
Tôi đã cố gắng nhiều lần để lấy Song Tử để loại bỏ những phản xạ từ một bức ảnh chụp ảnh phim thứ sáu kỳ dị hơn, nhưng chúng vẫn bướng bỉnh. Và tôi càng cố gắng để loại bỏ nó để loại bỏ các phản xạ, chất lượng của hình ảnh càng kém với mọi lời nhắc. Văn bản một lần rõ ràng cuối cùng là không thể đọc được sau khi cuối cùng tôi đã bỏ cuộc, chưa kể đến những thiệt hại vô tình, đáng sợ gây ra cho khuôn mặt của Lindsey Lohan và Jamie Lee Curtis.
Gemini nano chuối đấu tranh để tạo ra hình ảnh theo các kích thước khác nhau. Thay đổi kích thước và cắt xén hình ảnh là một quá trình chỉnh sửa ảnh cốt lõi, nhưng Song Tử không – hoặc không thể – xử lý các hướng dẫn kích thước đơn giản trong lời nhắc của tôi.
Tất cả những gì tôi muốn là để Gemini loại bỏ sự phản chiếu ở góc trên bên phải của poster, nhưng thay vào đó, nó đã làm cong vênh dòng thẻ phim và khuôn mặt.
Tôi đã liên hệ với Google về các vấn đề về nghị quyết và kích thước và người phát ngôn nói rằng công ty công nghệ “nhận thức và tích cực làm việc về cả hai vấn đề. Đó là một bản cập nhật lớn từ mô hình trước đây của chúng tôi nhưng chúng tôi sẽ tiếp tục cải thiện mô hình.”
Nhìn chung, chuối Nano Gemini đã chứng minh với tôi rằng Google rất nghiêm túc về việc tiếp tục thống trị trên phương tiện truyền thông. Nhưng nó có những cạm bẫy đáng kể, tập trung quá nhiều vào việc tạo ra các yếu tố mới thay vì sử dụng AI để cải thiện và điều chỉnh các vấn đề ảnh phổ biến. Hiện tại, mô hình chuối nano phù hợp nhất cho những người hâm mộ Song Tử muốn thực hiện các chỉnh sửa lớn một cách nhanh chóng. Đối với những người trong chúng ta đang tìm kiếm các công cụ chính xác hơn, chúng ta sẽ phải chờ bản cập nhật lớn tiếp theo của Google hoặc tìm chương trình khác.
Gemini nano chuối sẵn có, giá cả và sự riêng tư
Bạn không cần phải làm bất cứ điều gì để truy cập vào mô hình mới; Nó được tự động thêm vào mô hình flash Song Gemini 2.5 cơ sở. Gemini có sẵn miễn phí, với nhiều mô hình hơn và giới hạn sử dụng cao hơn có sẵn trong các gói AI của Google bắt đầu từ $ 20 mỗi tháng.
Nếu bạn là người đăng ký trả tiền, bạn cũng có thể truy cập mô hình thông qua Google AI Studio. Từ đó, tất cả những gì bạn phải làm là tải lên một hình ảnh và nhập lời nhắc của bạn. Mỗi lời nhắc sử dụng bất cứ nơi nào từ một đến hai nghìn mã thông báo, tùy thuộc vào mức độ chi tiết cần thiết. Người dùng Adobe Express và Firefly cũng có thể truy cập mô hình mới ngay bây giờ.
Chính sách bảo mật Song Tử của Google cho biết họ có thể sử dụng thông tin bạn tải lên để cải thiện các sản phẩm AI của mình, đó là lý do tại sao công ty khuyên bạn nên tránh tải lên thông tin nhạy cảm hoặc cá nhân. Chính sách sử dụng cấm AI của Công ty cũng ngoài vòng pháp luật tạo ra các tài liệu bất hợp pháp hoặc lạm dụng.
Để biết thêm, hãy xem các trình tạo hình ảnh AI tốt nhất và mọi thứ được công bố tại sự kiện Made By Google Pixel 10.
