
基于 Google Gemini API 的 AI 图像生成应用,使用 Next.js 与 shadcn/ui 构建。
#Next.js#shadcn/ui#Gemini API#TypeScript
项目简介
Gemini Studio 是一款基于 Google Gemini API 打造的 AI 图像生成应用,前端使用 Next.js 与 shadcn/ui,提供干净、现代且易上手的创作体验。
设计取舍
- 只接 Gemini API,不做成多模型聚合。 市面上文生图模型不少,但每家的参数、风格、返回格式差异很大,强行聚合会把界面变成一堆互不相干的开关。聚焦一家,把这一家的能力(宽高比、分辨率、参考图、Grounding)调到顺手,比「支持十个模型但每个都半成品」更有用。
- 宽高比和分辨率做成显式选项,不让模型猜。 早期试过「用自然语言描述想要的尺寸」,结果用户写「横屏」模型理解成 16:9 还是 21:9 全凭运气。改成按钮选择之后,结果可预测,返工率明显下降。AI 工具最容易翻车的地方,就是该让用户明确决策的、却丢给模型去猜。
- 默认 Vercel 部署 + 提供 Docker 自托管。 前者降低使用门槛(fork 一键部署),后者给不想把 API Key 交给托管平台的人留出口。两条路并存,代价是 README 要维护两套说明,但比起逼用户二选一更省心。
核心功能
文生图
输入描述即可生成高质量图像,支持多种风格与场景描述。
智能提示词优化
AI 会自动润色与扩写 Prompt,让生成结果更精准、更符合预期。
灵活的参数调整
- 多种宽高比:1:1、2:3、3:2、3:4、4:3、4:5、5:4、9:16、16:9、21:9
- 多档分辨率:1K / 2K / 4K
- 参考图:上传参考图引导生成方向
实时搜索增强
接入 Google Search,在生成图像时引入实时信息作为上下文辅助。
多语言支持
内置 7 种界面语言(English / 简体中文 / 日本語 / 한국어 / Français / Deutsch / Español),Prompt 优化也会按当前语言输出。
部署
支持 Vercel 一键部署 与 Docker 自托管,详细说明见仓库 README。