Gemini Studio：基于 Gemini API 的 AI 图像生成

Project2025年10月

基于 Google Gemini API 的 AI 图像生成应用，使用 Next.js 与 shadcn/ui 构建，支持 Vercel 部署与 Docker 自托管。

#Next.js#shadcn/ui#Gemini API#TypeScript

市面上文生图工具不少，但大部分要么是套壳、要么把十个模型塞在一起每个都半成品。我想做一个反过来的东西：只接 Gemini 一家，但把这一家的能力调到顺手。

几个取舍

只接 Gemini API，不做多模型聚合。 每家文生图模型的参数、风格、返回格式差异很大，强行聚合会把界面变成一堆互不相干的开关。聚焦一家，把宽高比、分辨率、参考图、Grounding 这些能力调好，比「支持十个模型但每个都半成品」有用。

宽高比和分辨率做成显式选项，不让模型猜。 早期试过「用自然语言描述想要的尺寸」，结果用户写「横屏」模型理解成 16:9 还是 21:9 全凭运气。改成按钮选择之后，结果可预测，返工率明显下降。AI 工具最容易翻车的地方，就是该让用户明确决策的、却丢给模型去猜。

默认 Vercel 部署，同时提供 Docker 自托管。 前者降低使用门槛（fork 一键部署），后者给不想把 API Key 交给托管平台的人留出口。两条路并存，代价是 README 要维护两套说明，但比逼用户二选一省心。