一开始的想法,是做一个类似 Lovart 的 AI 画布,然后在画布里融入 Skills 的概念。
最初设想其实挺“自动化”的: 比如用户丢一个项目进来(像游戏策划案),系统可以自动分析出这个项目可能需要的内容——比如整体美术风格、需要的图片/视频/音频资源,甚至 2D / 3D 的建模和动画需求,然后再去生成或辅助生成这些素材。
但问题很快就来了:服务器成本有点扛不住。 所以中间做了一次方向调整——把 Skills 里涉及“执行脚本”的能力基本砍掉,只保留“素材生成”这一层。
然后转成一个类似「 Skills 市场」的形式: 用户可以安装不同的 Skills ,每个 Skill 专注一种风格或能力,比如水墨画生成、四格漫画、某种特定视觉风格之类的。
做到一半的时候,又看到 Lovart 也上线了 Skills…… 体验了一下,说实话,完成度确实比我现在做的要好不少,当时有点动摇。
后来又想了一圈,准备换一个思路: 👉 不再做强依赖云端的东西,而是转向做一个本地应用。
这样有几个好处:
Skills 的能力可以放开,不用太顾虑服务器成本 可以做一些更“重”的能力(视频 / 音频 / 图像处理等) 也可以开放更多偏工具型的 Skills (甚至让用户自己扩展)
产品形态上,还是会保留一个“画布”:
画布可以承载不同类型的内容(图片 / 视频 / 音频 / 甚至建模?) 然后通过和 AI 对话的方式,直接在画布上进行修改和组合
技术上目前是:
后端 / 核心逻辑:Rust 前端:GPUI
现在的问题主要是几个:
这种「本地 + AI + 画布 + Skills 」的方向,有没有价值?还是有点自嗨? Skills 做成“素材风格插件” vs “通用能力插件”,哪个更合理?
目前整体还在比较早期阶段,也没完全想清楚产品边界。 如果有做过类似方向、或者对 Lovart / AI Canvas 这类产品有观察的,挺想听听大家的看法 🙏
用 AI 润色了一下我的文笔..(请勿介意)
1
afkool 1 天前
我目前也和技术朋友再做这个东西,单纯从产品层面自己的一点拙见:
画布本质的核心竞争力还是卖 api 的生意,虽然比如 1 毛的香蕉,你画布可以卖到 2 毛,但是 API 只要稳定,就可以做 B 端,而画布只能做 C 端散客。。大工作室、专业点的都去用 tapnow 、Lovart 之流了。 漫剧公司都去用那种一键生成漫剧改一改的 agent ,或者自己二开一个。 |