Nano Banana đã đến: Gemini 2.5 Flash Image nâng chuẩn chỉnh sửa ảnh bằng AI
Gemini 2.5 Flash Image (nano banana) nâng chuẩn chỉnh sửa ảnh AI: nhanh, chuẩn, giữ nhân vật nhất quán.
Tóm tắt nhanh:
Google ra mắt Gemini 2.5 Flash Image, biệt danh vui là Nano Banana, một mô hình tạo và chỉnh sửa ảnh chất lượng cao, giữ ổn định nhân vật, cho phép chỉnh cục bộ bằng ngôn ngữ tự nhiên, trộn nhiều ảnh thành một và tuân thủ bố cục theo mẫu. Mô hình đã có trên Gemini app, Gemini API, Google AI Studio và Vertex AI, giá khoảng 0,039 USD mỗi ảnh. [1], [2], [3]
Vì sao đáng chú ý
Google khẳng định đây là mô hình hình ảnh tối tân của họ, tập trung vào chất lượng thị giác tốt hơn, làm theo chỉ dẫn chặt chẽ hơn và đặc biệt là giữ được diện mạo nhân vật khi biên tập qua nhiều lần. Đây là điểm yếu kinh điển của nhiều công cụ trước đây, nay được cải thiện rõ rệt. [1], [4]
Bảng so sánh do Google công bố cho thấy Gemini 2.5 Flash Image dẫn trước ở nhiều hạng mục như nhân vật, sáng tạo, infographics, vật thể và phong cách. Mục “Overall preference” tham chiếu từ LM Arena. Nhiều nguồn cộng đồng cũng ghi nhận bản “nano banana” đang đứng đầu bảng Image Edit Arena do Artificial Analysis tổng hợp. [5]
Những khả năng mới nổi bật
Chỉnh cục bộ bằng văn bản: xóa người, làm mờ hậu cảnh, thay đổi tư thế, khử vết bẩn, đổi màu vật thể, mà không phá vỡ tổng thể khung hình. [1]
Nhất quán nhân vật và sản phẩm: giữ tóc, trang phục, logo, giúp kể chuyện nhiều cảnh mà không cần huấn luyện thêm. [1]
Trộn nhiều ảnh thành một: nhập tối đa vài ảnh tham chiếu, đặt vật thể vào cảnh mới, restyle nội thất theo bảng màu mong muốn. ([1], [2])
Tuân thủ template: giữ bố cục cố định khi xuất loạt thẻ bất động sản, badge nhân viên, mockup sản phẩm. [1]
Hiểu biết thế giới: đọc phác thảo, sơ đồ, hiểu ngữ nghĩa đối tượng, làm theo chỉ dẫn phức hợp trong một lượt. [1]
Vòng lặp hội thoại: chỉnh nhiều lượt, trả lời ngắn gọn, tiếp tục tinh chỉnh. [1]
Giá cả và khả dụng
Bạn có thể thử ngay trên Google AI Studio, dùng qua Gemini API, tích hợp trong Gemini app, hoặc triển khai doanh nghiệp qua Vertex AI. Giá công bố là 30 USD mỗi 1 triệu output tokens, mỗi ảnh tính 1290 tokens, tức khoảng 0,039 USD mỗi ảnh. Google cũng công bố hợp tác với OpenRouter và fal.ai để mở rộng kênh cho nhà phát triển. ([1], [3], [2])
Mọi ảnh tạo hoặc chỉnh bằng mô hình này được gắn SynthID vô hình và thêm metadata để nền tảng nhận diện nguồn gốc. [1]
Mẫu mã code tối giản
Mô hình hiện đang ở trạng thái preview trong Google API và Google AI Studio, dự kiến ổn định hơn trong vài tuần tới. [1]
Hạn chế và nguyên tắc an toàn
Google lưu ý vẫn đang cải thiện render văn bản dài trên ảnh, tăng độ tin cậy của tính nhất quán nhân vật và các chi tiết thực tế rất nhỏ. Các trường hợp sử dụng bị chặn gồm nội dung nhạy cảm không có sự đồng thuận. [1]
Ứng dụng gợi ý
Marketing, thương mại điện tử: tạo bộ ảnh nhất quán cho sản phẩm, thay bối cảnh, đổi bảng màu theo mùa.
Bất động sản, doanh nghiệp: xuất loạt hình theo template, thêm badge, banner sự kiện.
Giáo dục, đào tạo: biến phác thảo thành hình minh họa, chỉnh sửa trực quan theo yêu cầu lớp học.
Nghệ thuật số: trộn ba nguồn ảnh để tạo bố cục siêu thực, vẫn giữ danh tính nhân vật.
Kết luận
Nếu ví AI thị giác như một xưởng phim nhỏ, thì Nano Banana chính là tay dựng vừa nhanh, vừa biết giữ thần thái diễn viên, lại rành bố cục. Điều còn thiếu, theo Google, là chữ nghĩa dài và chi tiết cực nhỏ, nhưng hướng đi đã rõ: chỉnh bằng lời, giữ nguyên bản sắc, xuất hàng loạt theo quy trình. [1]
Ghi chú về xếp hạng
Biểu đồ hiệu năng hình ảnh do Google công bố cho thấy ưu thế của Gemini 2.5 Flash Image trên nhiều hạng mục, riêng “Overall preference” được tham chiếu từ LM Arena. Cộng đồng cũng ghi nhận nano banana dẫn đầu Image Edit Arena của Artificial Analysis tại thời điểm công bố. Kết quả benchmark có thể thay đổi theo thời gian và bộ dữ liệu. [5]
Tài liệu tham khảo
[1] https://developers.googleblog.com/en/introducing-gemini-2-5-flash-image/
[2] https://cloud.google.com/blog/products/ai-machine-learning/gemini-2-5-flash-image-on-vertex-ai
[3] https://aistudio.google.com/?model=gemini-2.5-flash-image-preview
[4] https://www.lifewire.com/new-gemini-image-editing-model-11797052
[5] https://x.com/ArtificialAnlys/status/1960388401401880898
[6] https://www.axios.com/2025/08/26/nano-banana-google-ai-images
[7] https://blog.fal.ai/introducing-gemini-2-5-flash-image-edit-aka-nano-banana/