V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
davinci21s
V2EX  ›  分享发现

中文 LLaMA 模型

  •  
  •   davinci21s · 2023-04-06 15:03:11 +08:00 · 1859 次点击
    这是一个创建于 622 天前的主题,其中的信息可能已经有所发展或是发生改变。

    在 github 上发现这个项目:


    以 ChatGPT 、GPT-4 等为代表的大语言模型( Large Language Model, LLM )掀起了新一轮自然语言处理领域的研究浪潮,展现出了类通用人工智能( AGI )的能力,受到业界广泛关注。然而,由于大语言模型的训练和部署都极为昂贵,为构建透明且开放的学术研究造成了一定的阻碍。 为了促进大模型在中文 NLP 社区的开放研究,本项目开源了中文 LLaMA 模型和经过指令精调的 Alpaca 大模型。这些模型在原版 LLaMA 的基础上扩充了中文词表并使用了中文数据进行二次预训练,进一步提升了中文基础语义理解能力。同时,在中文 LLaMA 的基础上,本项目使用了中文指令数据进行指令精调,显著提升了模型对指令的理解和执行能力。


    https://github.com/ymcui/Chinese-LLaMA-Alpaca

    看着效果好像还不错,有没有试过和 chatgpt3.5 对比效果怎么样。

    3 条回复    2023-04-07 13:27:59 +08:00
    545347837
        1
    545347837  
       2023-04-06 23:56:05 +08:00
    本地跑过,效果一般,启动速度倒挺快的( m2 mac mini ),和 chatgpt3.5 没得比。。。
    gabon
        2
    gabon  
       2023-04-07 13:01:45 +08:00 via iPhone
    跑过,一般,没得比
    davinci21s
        3
    davinci21s  
    OP
       2023-04-07 13:27:59 +08:00
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1000 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 21:12 · PVG 05:12 · LAX 13:12 · JFK 16:12
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.