V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
tool3d
V2EX  ›  程序员

google 的新模型,智能文字修图,效果实在是很炸裂。

  •  
  •   tool3d · 3 小时 50 分钟前 · 293 次点击
    我就用了一个提示词,"把图片中的猫咪修改成柴犬"。

    能达到这种效果,是我完全没想到的。

    目前 API 这个功能已经上线,免费,并且可以直接命令行来使用! google 真是大善人。

    但是我想吐糟一句,google 把所有图片都转成了 base64 ,导致 api json 请求返回巨大。而且很不好写流式图片的加载代码(服务器返回的是 png ,如果是 jpg ,还能边解压边显示)。

    4 条回复    2025-03-15 03:23:35 +08:00
    tool3d
        1
    tool3d  
    OP
       3 小时 42 分钟前
    说一下如何调用 API ,官网暂时没写。

    先访问 https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash-exp:streamGenerateContent?key=%s

    把上传的猫咪图片压缩成 base64, 塞进 json 里的 inline_data 的 data 里。

    然后请求的 json 添加这句:"generationConfig":{"response_modalities":["Text","Image"]} 返回的结果,就能生成图文模式了。

    注:暂时没有对应的 openai 兼容调用,直接调用 openrouter 这类 API 中转,应该是没办法生成图片和修图的。必须直接调官方的 google api 。
    leighton
        2
    leighton  
       2 小时 51 分钟前
    ```
    但是我想吐糟一句,google 把所有图片都转成了 base64 ,导致 api json 请求返回巨大。而且很不好写流式图片的加载代码(服务器返回的是 png ,如果是 jpg ,还能边解压边显示)。
    ```

    理想的设计是什么样的呢
    77158158
        3
    77158158  
       2 小时 47 分钟前
    这个功能,感觉适合电商批量修图?
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   956 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 20ms · UTC 21:39 · PVG 05:39 · LAX 14:39 · JFK 17:39
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.