news 2026/1/3 8:48:17

使用 Gemini(又称 Nano Banana 和 Nano Banana Pro)生成图片

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
使用 Gemini(又称 Nano Banana 和 Nano Banana Pro)生成图片

图片生成(文本转图片)

from google import genai from google.genai import types from PIL import Image client = genai.Client() prompt = ( "Create a picture of a nano banana dish in a fancy restaurant with a Gemini theme" ) response = client.models.generate_content( model="gemini-2.5-flash-image", contents=[prompt], ) for part in response.parts: if part.text is not None: print(part.text) elif part.inline_data is not None: image = part.as_image() image.save("generated_image.png")

注意:python要提前安装Pillow

pip install Pillow

图片编辑(文字和图片转图片)

from google import genai from google.genai import types from PIL import Image client = genai.Client() prompt = ( "Create a picture of my cat eating a nano-banana in a " "fancy restaurant under the Gemini constellation", ) image = Image.open("/path/to/cat_image.png") response = client.models.generate_content( model="gemini-2.5-flash-image", contents=[prompt, image], ) for part in response.parts: if part.text is not None: print(part.text) elif part.inline_data is not None: image = part.as_image() image.save("generated_image.png")

Gemini 3 Pro Image (gemini-3-pro-image-preview) 是一款先进的图片生成和编辑模型,针对专业资源制作进行了优化。Gemini 1.5 Pro 旨在通过高级推理来应对最具挑战性的工作流程,擅长处理复杂的多轮创建和修改任务。

  • 高分辨率输出:内置 1K、2K 和 4K 视觉效果生成功能。
  • 高级文字渲染:能够为信息图表、菜单、图表和营销素材资源生成清晰易读的风格化文字。
  • 使用 Google 搜索进行接地:模型可以使用 Google 搜索作为工具来验证事实,并根据实时数据(例如当前天气地图、股票图表、近期活动)生成图像。
  • 思考模式:模型会利用“思考”过程来推理复杂的提示。它会生成临时“思维图像”(在后端可见,但不收费),以在生成最终的高质量输出之前优化构图。
  • 最多 14 张参考图片:您现在最多可以混合使用 14 张参考图片来生成最终图片。

最多可使用 14 张参考图片

借助 Gemini 3 Pro 预览版,您最多可以混合 14 张参考图片。这 14 张图片可以包含以下内容:

  • 最多 6 张高保真对象图片,用于包含在最终图片中
  • 最多 5 张人像照片,以保持角色一致性

from google import genai from google.genai import types from PIL import Image prompt = "An office group photo of these people, they are making funny faces." aspect_ratio = "5:4" # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9","21:9" resolution = "2K" # "1K", "2K", "4K" client = genai.Client() response = client.models.generate_content( model="gemini-3-pro-image-preview", contents=[ prompt, Image.open('person1.png'), Image.open('person2.png'), Image.open('person3.png'), Image.open('person4.png'), Image.open('person5.png'), ], config=types.GenerateContentConfig( response_modalities=['TEXT', 'IMAGE'], image_config=types.ImageConfig( aspect_ratio=aspect_ratio, image_size=resolution ), ) ) for part in response.parts: if part.text is not None: print(part.text) elif image:= part.as_image(): image.save("office.png")
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/1/3 1:15:06

12、Linux文本格式化实用指南

Linux文本格式化实用指南 在处理文本以进行打印时,改变文本排列或呈现方式的方法和工具非常有用。本文将详细介绍如何改变文本的间距、设置页面、添加下划线、排序和反转文本以及对文本行进行编号等操作。 1. 文本间距调整 文本间距调整涉及到单词、行和段落之间的空白处理…

作者头像 李华
网站建设 2025/12/25 1:08:19

修改chrome配置,关闭跨域校验

修改Chrome浏览器配置以关闭跨域校验,核心是通过自定义启动参数实现(Chrome无内置图形化开关,需通过启动参数禁用同源策略)。以下是分系统的详细操作步骤,适配2025年最新Chrome版本(需注意:新版…

作者头像 李华
网站建设 2025/12/24 19:12:39

2025年深圳APP定制开发十大公司权威榜单

引言随着数字化转型加速,2025年深圳作为科技创新中心,APP定制开发需求持续增长。选择一家可靠的开发公司至关重要,需综合评估技术实力、行业经验与服务能力。本文基于行业数据、客户反馈及技术趋势,整理出深圳地区十大APP定制开发…

作者头像 李华
网站建设 2025/12/27 20:39:40

28、其他互联网服务使用指南

其他互联网服务使用指南 在互联网的世界里,除了电子邮件和网页浏览,还有许多其他实用的服务。本文将详细介绍一些常见的互联网服务及其使用方法,包括远程连接、文件传输、安全服务、新闻阅读、用户信息查询和在线聊天等。 1. 连接到远程主机 使用 telnet 命令可以连接到…

作者头像 李华
网站建设 2025/12/24 21:56:35

【RIS 辅助的 THz 混合场波束斜视下的信道估计与定位】在混合场波束斜视效应下,利用太赫兹超大可重构智能表面感知用户信道与位置附Matlab代码

✅作者简介:热爱科研的Matlab仿真开发者,擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。 🍎 往期回顾关注个人主页:Matlab科研工作室 🍊个人信条:格物致知,完整Matlab代码获取及仿…

作者头像 李华