Gemini Studio
Project

基于 Google Gemini API 的 AI 图像生成应用,使用 Next.js 与 shadcn/ui 构建。
#Next.js#shadcn/ui#Gemini API#TypeScript

项目简介

Gemini Studio 是一款基于 Google Gemini API 打造的 AI 图像生成应用,前端使用 Next.jsshadcn/ui,提供干净、现代且易上手的创作体验。

设计取舍

  • 只接 Gemini API,不做成多模型聚合。 市面上文生图模型不少,但每家的参数、风格、返回格式差异很大,强行聚合会把界面变成一堆互不相干的开关。聚焦一家,把这一家的能力(宽高比、分辨率、参考图、Grounding)调到顺手,比「支持十个模型但每个都半成品」更有用。
  • 宽高比和分辨率做成显式选项,不让模型猜。 早期试过「用自然语言描述想要的尺寸」,结果用户写「横屏」模型理解成 16:9 还是 21:9 全凭运气。改成按钮选择之后,结果可预测,返工率明显下降。AI 工具最容易翻车的地方,就是该让用户明确决策的、却丢给模型去猜。
  • 默认 Vercel 部署 + 提供 Docker 自托管。 前者降低使用门槛(fork 一键部署),后者给不想把 API Key 交给托管平台的人留出口。两条路并存,代价是 README 要维护两套说明,但比起逼用户二选一更省心。

核心功能

文生图

输入描述即可生成高质量图像,支持多种风格与场景描述。

智能提示词优化

AI 会自动润色与扩写 Prompt,让生成结果更精准、更符合预期。

灵活的参数调整

  • 多种宽高比:1:1、2:3、3:2、3:4、4:3、4:5、5:4、9:16、16:9、21:9
  • 多档分辨率:1K / 2K / 4K
  • 参考图:上传参考图引导生成方向

实时搜索增强

接入 Google Search,在生成图像时引入实时信息作为上下文辅助。

多语言支持

内置 7 种界面语言(English / 简体中文 / 日本語 / 한국어 / Français / Deutsch / Español),Prompt 优化也会按当前语言输出。

部署

支持 Vercel 一键部署Docker 自托管,详细说明见仓库 README。