V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
SingeeKing
10.19D
V2EX  ›  分享创造

做了一个开源 AI 词典

  •  
  •   SingeeKing ·
    PRO
    ·
    ImSingee · 2 月 16 日 · 2086 次点击
    这是一个创建于 32 天前的主题,其中的信息可能已经有所发展或是发生改变。

    https://github.com/ImSingee/open-english-dictionary

    目前有 26.5w 的数据,主要是单词(因为主要来源是网上的语料,不太好从中提取词组/惯用语做数据清洗,后面可能考虑让 AI 去做词组的提取),基本够 90% 的场景用了

    可以自己导入到词典 app 中当成英英或者英汉词典来用( Release 给的 mdx 是英汉),也可以直接用数据库构建自己的 app 用(感谢现代 AI 模型的 Structured output 能力,所有数据都是结构化的)

    第 1 条附言  ·  2 月 16 日
    8 条回复    2026-02-22 10:26:02 +08:00
    dawn009
        1
    dawn009  
       2 月 16 日
    不太了解这一块,用 AI 生成词典数据与已有的传统词典相比有什么优势?
    SingeeKing
        2
    SingeeKing  
    OP
    PRO
       2 月 16 日
    @dawn009 我觉得唯一的优势:便宜

    词典的 API 收费太贵了,商业使用在线词典 API 动轴几万/年,离线更是能达到数百万的授权费
    83f420984
        3
    83f420984  
       2 月 16 日
    macos 词典 app 导入第三方词典文件需要.dictionary 格式吧?
    SingeeKing
        4
    SingeeKing  
    OP
    PRO
       2 月 16 日
    @83f420984 这我还真没注意过,我几乎没用过系统自带的词典、都是欧陆;我(让 AI )研究下看看怎么导入到 macOS 词典 app
    83f420984
        5
    83f420984  
       2 月 16 日
    ![IMG_2026-02-16-22-20-33-1.webp]( https://cdn.statically.io/gh/zhen-ke/img@main/202601/IMG_2026-02-16-22-20-33-1.webp)
    刚刚试了下你的 open-english-dictionary.mdx ,不知道为什么排版是乱的。😅😅
    SingeeKing
        6
    SingeeKing  
    OP
    PRO
       2 月 16 日   ❤️ 1
    @83f420984 #5 emm 这个 mdx 没有内置任何样式,只使用了标准的 html 标签;所以这应该是你用的那个软件没能给一个合适的「默认样式」

    我看上去,主要是你用的软件没能正确的处理 `<ul>` `<ol>` 这种序号标签的缩进,而且默认的 line-height / margin 也有点太挤了。。
    w2er
        7
    w2er  
       2 月 17 日 via Android
    致敬楼主的 AI 创新使用
    xp12047
        8
    xp12047  
       2 月 22 日 via Android
    感谢!大佬新年发大财!
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   914 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 40ms · UTC 22:25 · PVG 06:25 · LAX 15:25 · JFK 18:25
    ♥ Do have faith in what you're doing.