Google ra mắt Nano Banana 2, mô hình chụp ảnh hỗ trợ trí tuệ nhân tạo mới của hãng.

  • Nano Banana 2 là mô hình tạo và chỉnh sửa ảnh mới của Google, dựa trên Gemini 3.1 Flash Image.
  • Nó kết hợp thời gian phản hồi nhanh với độ trung thực hình ảnh cao, độ phân giải lên đến 4K và khả năng theo dõi các lệnh phức tạp được cải thiện.
  • Nó tích hợp với ứng dụng Gemini, Tìm kiếm, Lens, AI Studio, Google Cloud, Flow và Google Ads, với kế hoạch mở rộng triển khai sang nhiều quốc gia và ngôn ngữ hơn.
  • Nó bao gồm các tính năng nâng cao như văn bản dễ đọc và dịch trong hình ảnh, tính nhất quán của ký tự và đối tượng, và việc niêm phong bằng thông tin xác thực SynthID và C2PA.

Mô hình hình ảnh AI của Google Nano Banana 2

Google đã tiến thêm một bước mới trong chiến lược trí tuệ nhân tạo của mình với việc giới thiệu... Nano Chuối 2, cũng được xác định là Hình ảnh Flash Gemini 3.1Đây là mô hình tạo và chỉnh sửa hình ảnh nhằm mục đích thu hẹp khoảng cách giữa tốc độ phản hồi và chất lượng hình ảnh. Công ty mong muốn người tạo nội dung có thể làm việc với hình ảnh gần như thời gian thực mà không phải hy sinh kết quả chi tiết, hữu ích trong môi trường chuyên nghiệp.

Sự ra mắt này diễn ra sau Nano Banana đầu tiên và Nano Banana ProNhững phiên bản này đã củng cố vị thế của Google trong lĩnh vực tạo hình ảnh bằng trí tuệ nhân tạo. Với phiên bản mới này, công ty đang đặt cược vào một mô hình mang những tính năng trước đây được coi là "cao cấp" vào một quy trình làm việc linh hoạt hơn nhiều, được thiết kế dành cho... người dùng thường xuyên tạo hình ảnhTừ các đội ngũ tiếp thị đến các nhà sáng tạo độc lập và các công ty hoạt động tại châu Âu và các thị trường khác.

Nano Banana 2 là gì và nó đóng vai trò gì trong hệ sinh thái Gemini?

Google mô tả Nano Banana 2 là mô hình chụp ảnh tiên tiến nhất của mình. cho đến nay trong phạm vi Môi trường Song TửĐiểm độc đáo của nó là được xây dựng trên kiến ​​trúc Flash, tập trung vào tốc độ phản hồi cực nhanh. Mục tiêu là công cụ này không chỉ tạo ra những bố cục bắt mắt mà còn tích hợp liền mạch vào quy trình làm việc, nơi mỗi giây đều quý giá.

Trên thực tế, công ty khẳng định rằng Nano Banana 2 thừa hưởng kiến ​​thức về thế giới, khả năng suy luận và độ chân thực hình ảnh của Nano Banana Pro.Nhưng nó kết hợp chúng với tốc độ của các mô hình Flash. Điều này cho phép bạn tạo hoặc chỉnh sửa hình ảnh chỉ trong vài giây, điều đặc biệt quan trọng đối với những người làm việc với các vòng lặp liên tục, thử nghiệm A/B hoặc đánh giá nhanh với khách hàng và các nhóm ở nhiều quốc gia khác nhau.

Mẫu xe mới này hướng đến cả... sáng tạo từ đầu như là chỉnh sửa tài liệu hiện cóGoogle nhấn mạnh rằng các thay đổi, điều chỉnh hoặc biến thể có thể được áp dụng mà không cần chờ đợi lâu, điều này phù hợp với các công việc thường ngày trong các công ty, bộ phận truyền thông hoặc các doanh nghiệp nhỏ tự quản lý nội dung hình ảnh của mình.

Hơn nữa, công ty định vị Nano Banana 2 như một phần trọng tâm trong chiến lược trí tuệ nhân tạo tạo sinh của mình: nó được tích hợp vào các sản phẩm dành cho người tiêu dùng và các công cụ dành cho nhà phát triển, nhằm mục đích biến cùng một mô hình trở thành nền tảng cho các trải nghiệm trên thiết bị di động, trình duyệt và trong môi trường điện toán đám mây hướng đến doanh nghiệp.

Kiến thức và hỗ trợ toàn cầu trong tìm kiếm trên web

Một trong những trụ cột của Nano Banana 2 là cách nó tận dụng kho kiến ​​thức Gemini.Theo Google, mô hình này có thể dựa vào thông tin và hình ảnh thực tế từ thế giới thực. Tìm kiếm web thời gian thực Để thể hiện các khái niệm, đối tượng hoặc cảnh cụ thể với độ chính xác cao hơn.

Việc kết nối với internet cho phép nó tạo ra những hình ảnh phù hợp hơn với bối cảnh hiện tại, điều này rất hữu ích cho... Đồ họa thông tin, nội dung cung cấp thông tin hoặc hình ảnh hóa dữ liệu Điều này đòi hỏi phải phản ánh những tình huống cụ thể. Đối với các phương tiện truyền thông, blog chuyên ngành hoặc các bộ phận truyền thông của các tổ chức ở châu Âu, tính năng này có thể giúp minh họa các tin tức, báo cáo và bài thuyết trình mà không cần phải bắt đầu lại từ đầu mỗi lần.

Google lưu ý rằng sự hiểu biết sâu sắc hơn này cũng giúp ích cho Chuyển đổi ghi chú thành sơ đồ, dàn ý và biểu đồ giải thích.Nói cách khác, mô hình này không chỉ "lấy cảm hứng" từ một mô tả chung chung, mà còn cố gắng cấu trúc thông tin một cách trực quan rõ ràng, điều này đặc biệt hữu ích trong giáo dục, đào tạo doanh nghiệp hoặc tài liệu kỹ thuật.

Với cách tiếp cận này, công ty hướng đến việc tạo sự khác biệt cho Nano Banana 2 so với các mẫu khác chỉ tập trung vào hiệu ứng thẩm mỹ. Ý tưởng là công cụ này có thể được sử dụng cho cả các tác phẩm nghệ thuật và... Tài liệu trực quan đi kèm với dữ liệu, quy trình hoặc khái niệm phức tạp.Điều này càng củng cố sức hấp dẫn của nó đối với các tổ chức thường xuyên làm việc với báo cáo và phân tích.

Cải thiện khả năng xử lý văn bản trong hình ảnh, dịch thuật và bản địa hóa.

Một trong những vấn đề được thảo luận nhiều nhất trong việc tạo ảnh bằng trí tuệ nhân tạo từ trước đến nay là... Xử lý văn bản được tích hợp vào chính hình ảnh.Trong đó, lỗi chính tả hoặc ngữ pháp có thể phá hỏng một thiết kế vốn dĩ hoàn chỉnh. Google khẳng định rằng Nano Banana 2 đã giải quyết vấn đề này với một bước tiến vượt bậc về chất lượng.

Theo thông tin được cung cấp, mô hình này có khả năng Tạo văn bản dễ đọc và mạch lạc trong các bản thiết kế tiếp thị, áp phích, thiệp hoặc biểu ngữ.Điều này giúp giảm số lần thử thất bại do lỗi chính tả. Điều này đặc biệt hữu ích cho các nhóm nhỏ không có bộ phận thiết kế chuyên trách và cần kết quả chức năng nhanh chóng.

Những khả năng này được bổ sung bởi khả năng Dịch và bản địa hóa văn bản trực tiếp trong hình ảnhNói cách khác, hệ thống không chỉ phát hiện văn bản có trong ảnh hoặc bố cục, mà còn cho phép điều chỉnh văn bản đó sang các ngôn ngữ khác nhau mà không cần phải tạo lại từ đầu. Đối với các chiến dịch quảng cáo ở châu Âu trên nhiều thị trường, tính năng này có thể tiết kiệm thời gian và đơn giản hóa quá trình điều chỉnh văn hóa và ngôn ngữ.

Trong các lĩnh vực như thương mại điện tử, du lịch hoặc đào tạo trực tuyến, sự kết hợp này văn bản dễ đọc, dịch thuật và bản địa hóa Mục tiêu là tạo ra quy trình làm việc linh hoạt hơn. Cùng một tác phẩm sáng tạo có thể được tái sử dụng ở nhiều quốc gia, chỉ cần điều chỉnh văn bản và thông điệp với sự hỗ trợ của trí tuệ nhân tạo thay vì phải thiết kế lại toàn bộ cho mỗi ngôn ngữ.

Với tất cả những điều này, Nano Banana 2 tự định vị mình như một công cụ nhằm giảm thiểu một trong những khó khăn kinh điển của hình ảnh tạo sinh: sự cần thiết phải sử dụng các trình chỉnh sửa bên ngoài để trau chuốt hoặc sửa lỗi văn bản xuất hiện trong bố cục.

Tính nhất quán về hình ảnh, tuân thủ hướng dẫn và chất lượng đầu ra.

Một phần quan trọng khác của quảng cáo tập trung vào... Kiểm soát sáng tạo và tính nhất quán về mặt hình ảnhGoogle tuyên bố rằng Nano Banana 2 có khả năng duy trì hình dáng giống hệt như chuối thật. năm ký tự trong cùng một quy trình làm việc và đảm bảo tính chính xác đến từng chi tiết. mười bốn vật thểđể chúng không thay đổi quá nhiều từ hình ảnh này sang hình ảnh khác.

Dung lượng này được thiết kế cho các mục đích sử dụng như sau: kịch bản phân cảnh, tường thuật từng cảnh, chiến dịch quảng cáo, hoặc việc phát triển các vũ trụ hình ảnh mạch lạc.Trong những bối cảnh này, việc một nhân vật hoặc sản phẩm thay đổi hình thức từ khung hình này sang khung hình khác có thể phá vỡ trải nghiệm, vì vậy việc nhấn mạnh vào tính liên tục về mặt hình ảnh đặc biệt quan trọng đối với các thương hiệu và các dự án sáng tạo.

Công ty cũng ghi nhận sự cải thiện về tuân theo các hướng dẫn phức tạpMô hình sẽ có khả năng tốt hơn trong việc diễn giải những sắc thái tinh tế của các yêu cầu – từ các gợi ý về phong cách đến các hạn chế chi tiết về bố cục, ánh sáng hoặc khung hình – và đáp ứng sát hơn kỳ vọng của người dùng. Điều này sẽ dẫn đến việc cần ít lần lặp lại hơn để đạt được kết quả như ý.

Về mặt kỹ thuật, Nano Banana 2 cung cấp... Điều chỉnh tỷ lệ khung hình và nhiều độ phân giải từ 512 pixel đến 4K.Điều này cho phép điều chỉnh cùng một nội dung sáng tạo cho các định dạng dọc, ngang hoặc toàn cảnh, bao gồm mọi thứ từ các bài đăng nhanh trên mạng xã hội đến hình nền hoặc tài liệu được thiết kế cho màn hình độ phân giải cao.

Google khẳng định rằng mô hình này thể hiện một cải thiện tổng thể về chất lượng hình ảnhVới ánh sáng phong phú hơn, kết cấu rõ nét hơn và chi tiết sắc sảo hơn, mục tiêu là để chế độ Flash được coi không phải là một lựa chọn "cắt giảm", mà là một giải pháp thay thế nhanh chóng có thể mang lại chất lượng cao. Trong các lĩnh vực như thương mại điện tử hoặc truyền thông doanh nghiệp, sự kết hợp giữa tốc độ và chất lượng này có thể tạo ra sự khác biệt thực sự trong công việc hàng ngày.

Có sẵn trong các sản phẩm của Google và được triển khai trên phạm vi quốc tế.

Việc công bố Nano Banana 2 không chỉ giới hạn trong một môi trường thử nghiệm biệt lập. Google công bố chi tiết về việc triển khai rộng rãi trên toàn bộ hệ sinh thái của mình., bắt đầu bằng ứng dụng Song Tử và mở rộng sang một số dịch vụ chính của nó.

Trong ứng dụng Gemini, Nano Banana 2 Nó sẽ thay thế Nano Banana Pro ở các chế độ Quick, Thinking và Pro.để mô hình mới trở thành lựa chọn tiêu chuẩn cho những người tạo hình ảnh từ trợ lý ảo. Tuy nhiên, công ty làm rõ rằng người đăng ký của Google AI chuyên nghiệp và Siêu Họ sẽ tiếp tục có quyền truy cập vào Nano Banana Pro cho các tác vụ chuyên biệt, bằng cách truy cập vào phần mềm này từ các tùy chọn tái tạo hình ảnh khi cần thiết.

Mô hình này cũng xuất hiện tại Tìm kiếm Google thông qua Chế độ AI và LensCả trong ứng dụng chính thức lẫn trên trình duyệt di động và máy tính để bàn. Google nhấn mạnh rằng tính khả dụng đang được mở rộng sang nhiều lĩnh vực khác. 141 quốc gia và vùng lãnh thổ mới ya tám ngôn ngữ bổ sungĐiều này củng cố tiềm năng của nó như một công cụ sử dụng rộng rãi, vượt ra ngoài các thị trường cụ thể.

Trong lĩnh vực phát triển phần mềm và điện toán đám mây, Nano Banana 2 được cung cấp dưới dạng sản phẩm. AI Studio và thông qua API Gemini Hiện đang trong giai đoạn xem trước, tính năng này cho phép các công ty và nhà phát triển tích hợp việc tạo ảnh vào ứng dụng của riêng họ. Nó cũng được tích hợp vào... Google Cloud sử dụng Vertex AI Trong giai đoạn sơ bộ, mở ra cơ hội cho các dự án cần mở rộng quy mô tạo hình ảnh từ cơ sở hạ tầng được lưu trữ trên đám mây của công ty.

Hơn nữa, Google cho biết Nano Banana 2 sẽ trở thành... mô hình tạo ảnh mặc định trong FlowCông cụ này, hướng đến các quy trình làm việc sáng tạo và trong một số trường hợp, sản xuất nghe nhìn, được cung cấp miễn phí cho tất cả người dùng Flow mà không phải trả thêm phí tín dụng. Trong lĩnh vực quảng cáo, mô hình này được tích hợp vào... Quảng cáo của Google nhằm nâng cao chất lượng các gợi ý cho các nhà thiết kế đồ họa khi xây dựng chiến dịch, điều này có thể tác động trực tiếp đến công việc của các công ty quảng cáo và nhà quảng cáo tại Tây Ban Nha và phần còn lại của châu Âu.

Tính minh bạch, nguồn gốc và bảo mật của nội dung được tạo ra

Bên cạnh các tính năng sáng tạo, Google dành một phần quảng cáo cho... nguồn gốc và xác minh nội dung do AI tạo raĐây là một vấn đề ngày càng nhạy cảm đối với các cơ quan quản lý, người dùng và giới truyền thông châu Âu.

Công ty giải thích rằng họ kết hợp công nghệ của Dấu mờ SynthID với thông tin xác thực nội dung dựa trên tiêu chuẩn C2PADo đó, các hình ảnh được tạo ra bằng Nano Banana 2 bao gồm các tín hiệu vô hình và siêu dữ liệu được tiêu chuẩn hóa cho phép chúng ta biết liệu trí tuệ nhân tạo (AI) có được sử dụng trong quá trình tạo ra chúng hay không, và trong một số trường hợp, các chi tiết về mô hình được sử dụng và bối cảnh tạo ra chúng.

Google cho biết tính năng xác minh SynthID trong ứng dụng Gemini đã được sử dụng. hơn 20 triệu lần kể từ tháng 11Điều này cho thấy mức độ quan tâm đến việc xác định nguồn gốc nội dung hình ảnh. Công ty cũng tuyên bố ý định tích hợp xác minh C2PA vào ứng dụng, tăng cường khả năng truy xuất nguồn gốc phù hợp với các cuộc thảo luận về quy định đang diễn ra ở châu Âu liên quan đến nội dung tổng hợp.

Việc nhấn mạnh vào tính minh bạch này phù hợp với nhu cầu của các công ty, cơ quan hành chính nhà nước và giới truyền thông trong việc xác định rõ ràng hơn khi nào một hình ảnh có nguồn gốc từ mô hình AI. Trong môi trường mà nội dung hình ảnh lan truyền nhanh chóng qua mạng xã hội và các nền tảng kỹ thuật số, việc có các cơ chế gắn nhãn và xác minh đã trở nên vô cùng quan trọng để xây dựng lòng tin.

Nhìn chung, chiến lược của Google với Nano Chuối 2 Nó kết hợp nhiều lớp: một mặt là tốc độ, chất lượng và khả năng kiểm soát sáng tạo; mặt khác là sự tích hợp vào các sản phẩm hàng ngày và công cụ chuyên nghiệp; và ngoài ra, các biện pháp xác định nguồn gốc được thiết kế cho một kịch bản trong đó nội dung do AI tạo ra sẽ ngày càng hiện diện rõ rệt trong đời sống hàng ngày và hoạt động kinh tế ở Tây Ban Nha, châu Âu và các thị trường khác.

Hình ảnh GPT 1.5
Bài viết liên quan:
GPT Image 1.5: Trí tuệ nhân tạo đang thay đổi quá trình tạo và chỉnh sửa hình ảnh như thế nào?

Theo dõi chúng tôi trên Google Tin tức