Nano Banana 提示词基本原则:“描述场景”
与其他图像生成模型一样,使用 Nano Banana 最重要的原则也是“描述场景”。相比于简单的关键词罗列,一段叙事性的、细节丰富的描述几乎总能生成更好、更连贯的图像。
例如,与其使用“美丽的夜景”这样模糊的提示词,不如换成“湿漉漉的柏油路、斑马线、以及倒映在水坑里的霓虹灯”这样具体的描述,后者将生成远比前者更真实、更吸引人的图像。
实用的 Nano Banana 提示词示例:6 个场景化模板
1. 照片级写实肖像
模板:
> 一张照片级写实的[拍摄类型]风格的[主体],[动作或表情],场景设置在[环境]。整个场景由[光照描述]照亮,营造出[氛围]的氛围。使用[相机/镜头细节]拍摄,重点突出[关键纹理和细节]。图像应为[宽高比]格式。
实际提示词示例:
> 一张照片级写实特写:年迈的日本陶艺家,脸上布满深刻的日晒皱纹,面带温暖而睿智的微笑。他正在仔细检查一个刚上完釉的茶碗。场景是他那间质朴且阳光充足的工作室。柔和的金色夕阳从窗户射入,照亮了黏土的细腻质感和他的围裙布料。使用 85mm 人像镜头拍摄,背景呈现出柔和的虚化效果(焦外成像)。整体氛围宁静而显大师风范。垂直人像构图。
2. 可爱风格的贴纸和插画
模板:
> 一张[风格]风格的[主体]贴纸,具有[主要特征]和[色调]。设计应包含[线条风格]和[阴影风格]。背景必须为白色。
实际提示词示例:
> 一张可爱风格的贴纸:一只戴着小竹帽的快乐小熊猫,正在啃食一片翠绿的竹叶。设计具有粗大清晰的轮廓、简约的卡通渲染(Cel-shading)和鲜艳的色调。背景必须为白色。
3. 含精确文本的图像
模板:
> 为[品牌/概念]创建一个[图像类型],其中包含文本“[要渲染的文本]”,字体为[字体风格]。设计应为[风格描述],并采用[配色方案]。
实际提示词示例:
> 为一家名为“The Daily Grind”的咖啡店创作一个现代简约风格的 Logo。文本应采用干净、粗体的无衬线字体。设计中应包含一个与文本无缝融合的、简约风格化的咖啡豆图标。配色方案为黑白。
4. 产品模型与商业摄影
模板:
> 一张高分辨率、影棚光效的[产品描述]产品照,放置在[背景表面/描述]上。光照采用[光照设置],目的是[光照目的]。相机角度为[角度类型],以展示[特定功能]。超写实风格,焦点清晰地对准[关键细节]。[宽高比]。
实际提示词示例:
> 一张高分辨率、影棚光效的产品照:一个哑光黑色的极简主义陶瓷咖啡杯,放置在抛光的混凝土地面上。光照采用三点式柔光箱布局,旨在创造柔和的漫反射高光并消除硬阴影。相机采用略微俯视的 45 度角拍摄,以展示其简洁的线条。超写实风格,焦点清晰地对准从咖啡中升起的热气。方形图像。
5. 极简主义与留白设计
模板:
> 一幅极简主义构图,画面中只有一个[主体],位于画面的[右下角/左上角等]位置。背景是广阔而空白的[颜色]画布,创造出大量的留白。光线柔和而微妙。[宽高比]。
实际提示词示例:
> 一幅极简主义构图:画面右下角有一片精致的红色枫叶。背景是广阔而空白的米白色画布,为文字预留了大量的留白空间。光线从左上方柔和地漫射下来。方形图像。
6. 连续艺术(漫画面板/故事板)
模板:
> 一幅[艺术风格]风格的单格漫画。前景是[角色描述和动作]。背景是[场景细节]。画面中有一个[对话/说明框],内容为“[文本]”。光照营造出[氛围]的氛围。[宽高比]。
实际提示词示例:
> 一幅坚韧的黑色电影(Noir)艺术风格的单格漫画,采用高对比度的黑白墨水绘制。前景中,一名身穿风衣的侦探站在闪烁的路灯下,雨水浸湿了他的肩膀。背景里,一个荒凉酒吧的霓虹灯招牌倒映在水坑中。顶部的说明框写着“这座城市,是藏不住秘密的地方”。光线刺眼,营造出一种戏剧性而阴郁的氛围。横向构图。
Nano Banana 提示词的高级技巧
迭代优化
Nano Banana 的强项之一是能够通过对话逐步优化图像。你可以通过多轮对话进行微调,直到达到完美效果。例如,通过“把颜色换成橙色”、“紧接着出现第二只怪物”这样一次只提一个具体修改的方式,可以获得更精确的结果。
使用图像输入进行精确控制
为了对构图和风格进行更精细的控制,你可以使用现有图像作为视觉参考。无论是照片、数字艺术还是由 AI 生成的视觉稿,都可以用来锁定角色设计、服装、场景布置或整体美学。模型会将该图像作为第一帧的锚点,而你的文本提示则定义了接下来发生的事情。
实用建议:写出成功提示词的诀窍
清晰至上
“湿漉漉的柏油路、斑马线、以及倒映在水坑里的霓虹灯”这样具体的描述,远比“美丽的城市”这样模糊的短语能产生更清晰、更一致的输出。
镜头语言与构图
广角镜头强调空间和背景,而眼平高度的特写则将注意力集中在情感上。景深则增加了另一个维度:浅景深可以使主体从模糊的背景中脱颖而出,而深景深则能让前景和背景都保持清晰。
控制运动与时机
每一段镜头最好只包含一个清晰的机位移动和一个明确的主体动作。用节拍或计数来描述动作效果最好——例如小步、手势或停顿——这能让动作在时间上显得更真实。
一个更高效的思路:假如你不用再写提示词?
这些详细的模板很强大,但说实话,每次有一个新点子就要手动填一遍,确实有点像在做“体力活”。
如果能只说一个核心想法,比如“一只在太空漫步的猫”,然后一条细节丰富、结构完整的提示词就自动出现,那会不会很棒?
这时候,我最近在用的一个工具 Dativus 就派上用场了。它正是为这种场景设计的。你给它一个简单的想法,它就能为你生成结构化的提示词,并自动补上相机角度、艺术风格等专业细节。你可以直接使用生成的结果,也可以把它当成一个预填充好的模板进行微调。
最棒的是,它完全免费、无需注册,并且所有计算都在你的浏览器本地运行,不必担心隐私问题。如果你也想从写提示词的重复劳动中解放出来,把更多精力放在创意本身,那它值得一看。
希望它能帮到你:Dativus 官方网站
---
*参考资料:*
- *Google AI Studio Documentation - Six text-to-image prompting tips for Nano Banana*
- *Prompt Engineering Best Practices for Gemini 2.5 Flash Image*