[Guide] Nano Banana 提示词示例：Google 最新图像生成模型使用指南

Nano Banana 提示词基本原则：“描述场景”

与其他图像生成模型一样，使用 Nano Banana 最重要的原则也是“描述场景”。相比于简单的关键词罗列，一段叙事性的、细节丰富的描述几乎总能生成更好、更连贯的图像。

例如，与其使用“美丽的夜景”这样模糊的提示词，不如换成“湿漉漉的柏油路、斑马线、以及倒映在水坑里的霓虹灯”这样具体的描述，后者将生成远比前者更真实、更吸引人的图像。

实用的 Nano Banana 提示词示例：6 个场景化模板

1. 照片级写实肖像

模板：

> 一张照片级写实的[拍摄类型]风格的[主体]，[动作或表情]，场景设置在[环境]。整个场景由[光照描述]照亮，营造出[氛围]的氛围。使用[相机/镜头细节]拍摄，重点突出[关键纹理和细节]。图像应为[宽高比]格式。

实际提示词示例：

> 一张照片级写实特写：年迈的日本陶艺家，脸上布满深刻的日晒皱纹，面带温暖而睿智的微笑。他正在仔细检查一个刚上完釉的茶碗。场景是他那间质朴且阳光充足的工作室。柔和的金色夕阳从窗户射入，照亮了黏土的细腻质感和他的围裙布料。使用 85mm 人像镜头拍摄，背景呈现出柔和的虚化效果（焦外成像）。整体氛围宁静而显大师风范。垂直人像构图。

2. 可爱风格的贴纸和插画

模板：

> 一张[风格]风格的[主体]贴纸，具有[主要特征]和[色调]。设计应包含[线条风格]和[阴影风格]。背景必须为白色。

实际提示词示例：

> 一张可爱风格的贴纸：一只戴着小竹帽的快乐小熊猫，正在啃食一片翠绿的竹叶。设计具有粗大清晰的轮廓、简约的卡通渲染（Cel-shading）和鲜艳的色调。背景必须为白色。

3. 含精确文本的图像

模板：

> 为[品牌/概念]创建一个[图像类型]，其中包含文本“[要渲染的文本]”，字体为[字体风格]。设计应为[风格描述]，并采用[配色方案]。

实际提示词示例：

> 为一家名为“The Daily Grind”的咖啡店创作一个现代简约风格的 Logo。文本应采用干净、粗体的无衬线字体。设计中应包含一个与文本无缝融合的、简约风格化的咖啡豆图标。配色方案为黑白。

4. 产品模型与商业摄影

模板：

> 一张高分辨率、影棚光效的[产品描述]产品照，放置在[背景表面/描述]上。光照采用[光照设置]，目的是[光照目的]。相机角度为[角度类型]，以展示[特定功能]。超写实风格，焦点清晰地对准[关键细节]。[宽高比]。

实际提示词示例：

> 一张高分辨率、影棚光效的产品照：一个哑光黑色的极简主义陶瓷咖啡杯，放置在抛光的混凝土地面上。光照采用三点式柔光箱布局，旨在创造柔和的漫反射高光并消除硬阴影。相机采用略微俯视的 45 度角拍摄，以展示其简洁的线条。超写实风格，焦点清晰地对准从咖啡中升起的热气。方形图像。

5. 极简主义与留白设计

模板：

> 一幅极简主义构图，画面中只有一个[主体]，位于画面的[右下角/左上角等]位置。背景是广阔而空白的[颜色]画布，创造出大量的留白。光线柔和而微妙。[宽高比]。

实际提示词示例：

> 一幅极简主义构图：画面右下角有一片精致的红色枫叶。背景是广阔而空白的米白色画布，为文字预留了大量的留白空间。光线从左上方柔和地漫射下来。方形图像。

6. 连续艺术（漫画面板/故事板）

模板：

> 一幅[艺术风格]风格的单格漫画。前景是[角色描述和动作]。背景是[场景细节]。画面中有一个[对话/说明框]，内容为“[文本]”。光照营造出[氛围]的氛围。[宽高比]。

实际提示词示例：

> 一幅坚韧的黑色电影（Noir）艺术风格的单格漫画，采用高对比度的黑白墨水绘制。前景中，一名身穿风衣的侦探站在闪烁的路灯下，雨水浸湿了他的肩膀。背景里，一个荒凉酒吧的霓虹灯招牌倒映在水坑中。顶部的说明框写着“这座城市，是藏不住秘密的地方”。光线刺眼，营造出一种戏剧性而阴郁的氛围。横向构图。

Nano Banana 提示词的高级技巧

迭代优化

Nano Banana 的强项之一是能够通过对话逐步优化图像。你可以通过多轮对话进行微调，直到达到完美效果。例如，通过“把颜色换成橙色”、“紧接着出现第二只怪物”这样一次只提一个具体修改的方式，可以获得更精确的结果。

使用图像输入进行精确控制

为了对构图和风格进行更精细的控制，你可以使用现有图像作为视觉参考。无论是照片、数字艺术还是由 AI 生成的视觉稿，都可以用来锁定角色设计、服装、场景布置或整体美学。模型会将该图像作为第一帧的锚点，而你的文本提示则定义了接下来发生的事情。

实用建议：写出成功提示词的诀窍

清晰至上

“湿漉漉的柏油路、斑马线、以及倒映在水坑里的霓虹灯”这样具体的描述，远比“美丽的城市”这样模糊的短语能产生更清晰、更一致的输出。

镜头语言与构图

广角镜头强调空间和背景，而眼平高度的特写则将注意力集中在情感上。景深则增加了另一个维度：浅景深可以使主体从模糊的背景中脱颖而出，而深景深则能让前景和背景都保持清晰。

控制运动与时机

每一段镜头最好只包含一个清晰的机位移动和一个明确的主体动作。用节拍或计数来描述动作效果最好——例如小步、手势或停顿——这能让动作在时间上显得更真实。

一个更高效的思路：假如你不用再写提示词？

这些详细的模板很强大，但说实话，每次有一个新点子就要手动填一遍，确实有点像在做“体力活”。

如果能只说一个核心想法，比如“一只在太空漫步的猫”，然后一条细节丰富、结构完整的提示词就自动出现，那会不会很棒？

这时候，我最近在用的一个工具 Dativus 就派上用场了。它正是为这种场景设计的。你给它一个简单的想法，它就能为你生成结构化的提示词，并自动补上相机角度、艺术风格等专业细节。你可以直接使用生成的结果，也可以把它当成一个预填充好的模板进行微调。

最棒的是，它完全免费、无需注册，并且所有计算都在你的浏览器本地运行，不必担心隐私问题。如果你也想从写提示词的重复劳动中解放出来，把更多精力放在创意本身，那它值得一看。

希望它能帮到你：Dativus 官方网站

---

*参考资料：*

*Google AI Studio Documentation - Six text-to-image prompting tips for Nano Banana*
*Prompt Engineering Best Practices for Gemini 2.5 Flash Image*