V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
fgt
V2EX  ›  分享创造

做了个小而美的 AI 产品,根据照片匹配古诗词,生成分享卡片

  •  
  •   fgt ·
    gui66497 · 2 天前 · 2114 次点击

    介绍

    大家好,这是我打算成为独立开发后的第一款 AI 应用

    应用名称:诗境

    访问地址: https://photo2poem.top/

    主要功能就是根据用户上传的图片分析主体和意境,匹配诗句,最终生成漂亮的卡片

    需求来源

    不知道你们有没有遇到过,就是拍了一幅很美的照片,想吟诗一首再发个朋友圈,奈何文化程度有限,往往想半天最后配了段大白话。

    这时候诗境就能派上用场,把图片喂给她,让她给你配个最符合当前画面意境的诗。

    界面截图

    e5ae49be89328ca1b841a05daa52c02b.jpeg

    主体功能流程

    1. 前置工作:古诗词向量化
    2. 用户上传照片,后台通过多模态接口分析图片主体和意境,格式化输出
    3. 根据上面的输出去向量库中匹配,返回 Top N 诗句
    4. 根据诗句反查得到整诗返给前端
    5. 前端呈现

    技术栈

    • 前端:Vue 、Tailwind CSS 、DaisyUI
    • 后端:Python 、Mysql
    • AI:Gemini 、LangChain 、m3e 、chroma
    • 登录鉴权:Clerk
    • 支付:独角数卡

    关于编码这块,AI 真的有大用途,我前端 WebStorm 和后端 Pycharm 都装了 Copilot 插件,有好多代码都是直接"提示"出来的;然后界面框架借助 ScreenshotToCode 、V0 等应用,真的能节省很多开发时间,这里就不展开讲了。

    关于支付这块,我也看了一些国际上主流的付款 Saas ,Strpe 需要公司资质,门槛太高,Lemon Squeezy 申请了,看我地址里出现中国,直接拒了(以美国禁令为由),各位大佬如果有更好的途径欢迎分享。

    特色

    • 使用目前主流的 UI 设计,简约美观
    • 一次性匹配 5 首诗,不满意可切换
    • 提供导出功能,一键导出图配诗,方便发圈装逼
    • 页面支持自定义,可以配置是否显示日历、边框、标题、作者和朝代等,支持调整诗句字体大小

    独立开发的思考

    我之前一直都是做 Java 的,现在这个行情大家也都知道,说不定哪天就毕业了,想着技多不压身,现在最火的就是 AI 了,就找了教程跟着学了,但光看是浮于表面的,就想练练手,于是这个项目就应运而生了。

    虽然是个很简单的项目,但奈何都是比较陌生的技术,真的是一边学一边开发,陆陆续续花了 3 周,这里我要吐槽一下,整个开发过程前端开发至少占了 7 成,后端接口写好之后基本就不用动了,前端细节太多了,经常调一个诡异的样式调半天。

    我感觉做独立开发,只能瞄准一些小众需求,让大厂觉得利益有限不屑于竞争,然后尽量将产品做精,做到真正的"小而美",和同质化产品拉开差距。

    最后

    产品还处于试用阶段,登录就送额度,有人感兴趣的话我下面会发激活码,谢谢大家~

    第 1 条附言  ·  2 天前
    感谢大家捧场~
    ff9e503b-a7ea-4253-b796-f8017d51c422
    528ce82f-bbd0-49c0-9f25-07e678771172
    88b52541-96f6-4fb8-af2d-0773f166e8c8
    b50cad96-287d-4edb-bd04-1684fe908d77
    26a14092-0f05-484a-9a85-7cd428f20cb3
    6a07dc06-9e3f-45e2-a4e8-8b6210e458e5
    137f458e-1153-4ff6-be3d-43d41376783c
    c1e36d40-47cc-4525-bfb8-329c1eb2a7e0
    44e6e737-a1f7-4cd6-b0ed-eca846940b04
    00a365da-d2b4-4291-8bb3-87700a96f1fd
    b2de60af-f60e-49a7-9e26-0d194becc656
    94bcbf95-3aaa-4285-ae5c-4c64723b249f
    609ad60e-747c-4782-bb86-a84789de1641
    8da5a07e-b192-4667-af23-d424f1f456bb
    b1294113-a17e-457e-a8be-dba91cc566f5
    第 2 条附言  ·  2 天前
    我看了下后台,报错主要有两大原因
    1. 原始图片太大,尽管我有做压缩但有的图还是有 2~4MB ,调 Gemini 接口超时了
    2. 图片敏感,只要稍微上传点 nsfw 的内容,Gemini 接口直接就报错了
    48 条回复    2024-06-29 12:00:23 +08:00
    chenzhengjian
        1
    chenzhengjian  
       2 天前
    创意不错,体验欠佳
    fgt
        2
    fgt  
    OP
       2 天前
    @chenzhengjian 哈哈,目前还处于半成品,还有很多优化空间,延迟现在至少都要 7 秒,我看大部分时间都花在了调用 Gemini 上,后面想办法把他换掉
    xuyihao
        3
    xuyihao  
       2 天前
    已经崩了😰
    authony2020
        4
    authony2020  
       2 天前
    想法挺好的, 照片是不是可以选择风格美化下。我试了一下报错了啊
    fgt
        5
    fgt  
    OP
       2 天前
    @authony2020 确实,大部分人发圈之前都要再美化下;服务重启了,应该好了
    xinchao
        6
    xinchao  
       2 天前

    挺好的,求点额度玩一下,[email protected]
    AiBoy
        7
    AiBoy  
       2 天前
    激活码错误
    jiejia
        8
    jiejia  
       2 天前
    感觉这种应用直接在 gpts 商店更适合一些
    fgt
        9
    fgt  
    OP
       2 天前
    @AiBoy 错误应该就是被用掉了,留邮箱吧
    Alexf4
        10
    Alexf4  
       2 天前
    如果中文的可以试试国内的千问,或者省心整个 gpt-4o, 估计会省事很多?
    codebs
        11
    codebs  
       2 天前
    求额度
    Ynp1OTUyN0BnbWFpbC5jb20=
    TabGre
        12
    TabGre  
       2 天前 via iPhone
    怎么可以直接发朋友圈的?
    fgt
        13
    fgt  
    OP
       2 天前
    @TabGre 需求+1 ,加个一键分享功能,目前只能右上角导出图片
    digd
        14
    digd  
       2 天前
    有没有对比直接用 GPT-4o 的 prompt 的效果的差距?
    fgt
        15
    fgt  
    OP
       2 天前
    @digd 我尝试过直接让大模型返回,但还是避免不了幻觉问题,他会给你凭空捏造一首诗,就算不是捏造的,标题和作者也经常搞错
    fgt
        16
    fgt  
    OP
       2 天前
    @codebs 已发~
    TabGre
        17
    TabGre  
       2 天前 via iPhone
    web 可以分享为朋友圈吗? 小程序都木有见过类似功能
    yb2313
        18
    yb2313  
       2 天前


    好好好
    yb2313
        19
    yb2313  
       2 天前
    @yb2313 何以销烦暑,端居一院中。
    眼前无长物,窗下有清风。
    热散由心静,凉生为室空。
    此时身自得,难更与人同。
    fgt
        20
    fgt  
    OP
       2 天前
    @yb2313 我试了下,第二首也不错,哈哈
    ![9e1c26e6e9efff89fc444168415e9c1f.png]( https://i3.mjj.rip/2024/06/27/9e1c26e6e9efff89fc444168415e9c1f.png)
    fgt
        21
    fgt  
    OP
       2 天前
    @yb2313 貌似 v2 只能预览 imgur 的图床
    digd
        22
    digd  
       2 天前
    很赞的点子,求额度 ZHVkb2dAb3V0bG9vay5jb20=

    现在那种“可怜现在文化低,只能卧槽”太多了
    wonderfulcxm
        23
    wonderfulcxm  
       2 天前 via iPhone
    @fgt 不错,讲了一个失足妇女的故事😅
    fgt
        24
    fgt  
    OP
       2 天前
    @digd 已发~
    Pepega
        25
    Pepega  
       2 天前
    天才!连个公众号你无敌了啊
    tomdddd
        26
    tomdddd  
       2 天前
    求问下这种分享卡片技术上是怎么实现的,能分享下么
    我也是 java 的独立开发选手,目前做了 2-3 款产品,希望加个 v 15889666941 多多交流~
    huang86041
        27
    huang86041  
       2 天前
    有反过来,在有诗的情况下,配图,然后分享的吗?
    huang86041
        28
    huang86041  
       2 天前
    求额度:aHVhbmc4NjA0QGdtYWlsLmNvbQ==
    fgt
        29
    fgt  
    OP
       2 天前
    @tomdddd 基本就是用 tailwindcss+daisyui 手搓出来的,网页导出成图片有现成的库 html2canvas
    tomdddd
        30
    tomdddd  
       2 天前
    @fgt 加个联系方式吧~看到有些小 bug 跟你反馈下哈哈 15889666941
    fgt
        31
    fgt  
    OP
       2 天前
    @huang86041 发了~ 你这个也是个思路啊,先用大模型分析诗句,生成图像提示词,然后用 sd 或者 mj 生成图片
    zzzyyysss
        32
    zzzyyysss  
       2 天前
    给图片列表把 view-transition 加上吧
    x007xyzabc
        33
    x007xyzabc  
       2 天前
    想法不错
    fgt
        34
    fgt  
    OP
       2 天前
    @zzzyyysss 很酷炫的效果啊,我去学习下怎么用
    ivyliner
        35
    ivyliner  
       2 天前
    话说, 你这个和 诗片 APP 啥关系啊 ? 我怎么感觉你是再抄袭人家 ?
    carrie999
        36
    carrie999  
       2 天前
    有兴趣合作做 ios 吗 可以联系我的 wx:771685809
    yhxx
        37
    yhxx  
       2 天前
    和诗片好像啊
    UI 几乎都一样
    fgt
        38
    fgt  
    OP
       2 天前 via Android
    @ivyliner 界面框子我是用 V0 生成的,就两个页面,这应该算是这类应用的设计范式了吧,就像各家大模型的对话界面基本都有 OpenAI 的影子
    而且我们平台也不一样,诗片那个只有 ios 上有
    yb2313
        39
    yb2313  
       2 天前
    @fgt #20 怎么就给我识别成荡子妇了, 你管管你家 ai 啊
    yb2313
        40
    yb2313  
       2 天前
    @wonderfulcxm 那种事情, 不要啊
    zhigangwu
        41
    zhigangwu  
       2 天前
    求交流,也是独立开发 wx: d3pnXzA3MjA=
    fgt
        42
    fgt  
    OP
       2 天前
    @yb2313 哈哈,不过这个女主确实有点败犬的感觉
    ivyliner
        43
    ivyliner  
       1 天前
    @fgt #38 UI 和 创意基本上都一样, 你看看 37 楼也是这么觉得. 用 V0 生成也不能保证生成的配色和文案 "选择我的照片" 一样吧.
    zhiyu1998
        44
    zhiyu1998  
       1 天前
    我擦 很有创意 帮你推荐到了我的第三期周刊《水母绚舞》了

    https://rrorangeandfriends.site/posts/2024/003#%E8%AF%97%E5%A2%83
    fgt
        45
    fgt  
    OP
       1 天前
    @zhiyu1998 多谢分享,订阅你的周刊了
    dawangyezi
        46
    dawangyezi  
       1 天前
    挺好玩儿
    linyongxin
        47
    linyongxin  
       21 小时 54 分钟前
    挺好的创意,如果能指定诗句也很不错。
    页面 css 或 js 有点问题,多了个 position: absolute; 导致遮罩不居中,页面设置后,遮罩无法关闭,也没看到确认按钮,全部不能动,非常难用。
    carrie999
        48
    carrie999  
       18 小时 39 分钟前
    @huang86041 这个用 midjourney
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   931 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 22:39 · PVG 06:39 · LAX 15:39 · JFK 18:39
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.