V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
wangshushu
V2EX  ›  分享创造

CherryStudio 开源大模型工具带来知识库啦, step by step 的教程!

  •  
  •   wangshushu · 15 小时 54 分钟前 · 489 次点击

    在 0.91 版本中,CherryStudio 带来了期待已久的知识库功能。

    下面我们将按步骤呈现 CherryStudio 的详细使用说明。

    添加嵌入模型

    1. 在模型管理服务中查找模型,可以点击“嵌入模型”快速筛选;
    2. 找到需要的模型,添加到我的模型。

    image.png

    创建知识库

    1. 知识库入口:在 CherryStudio 左侧工具栏,点击知识库图标,即可进入管理页面;
    2. 添加知识库:点击添加,开始创建知识库;
    3. 命名:输入知识库的名称并添加嵌入模型,以 bge-m3 为例,即可完成创建。

    image.png

    image.png

    添加文件并向量化

    1. 添加文件:点击添加文件的按钮,打开文件选择;
    2. 选择文件:选择支持的文件格式,如 pdf ,docx ,pptx ,xlsx ,txt ,md ,mdx 等,并打开;
    3. 向量化:系统会自动进行向量化处理,当显示完成时(绿色✓),代表向量化已完成。

    image.png

    image.png

    image.png

    添加多种来源的数据

    CherryStudio 支持多种添加数据的方式:

    1. 文件夹目录:可以添加整个文件夹目录,该目录下支持格式的文件会被自动向量化;
    2. 网址链接:支持网址 url ,如 https://docs.siliconflow.cn/introduction
    3. 站点地图:支持 xml 格式的站点地图,如 https://docs.siliconflow.cn/sitemap.xml
    4. 纯文本笔记:支持输入纯文本的自定义内容。

    image.png

    搜索知识库

    当文件等资料向量化完成后,即可进行查询:

    1. 点击页面下方的搜索知识库按钮;
    2. 输入查询的内容;
    3. 呈现搜索的结果;
    4. 并显示该条结果的匹配分数。

    image.png

    image.png

    对话中引用知识库,并生成回复

    1. 创建一个新的话题,在对话工具栏中,点击知识库,会展开已经创建的知识库列表,选择需要引用的知识库;
    2. 输入并发送问题,模型即返回通过检索结果生成的答案 ;
    3. 同时,引用的数据来源会附在答案下方,可快捷查看源文件。

    image.png

    image.png

    结语

    在 LLM 技术浪潮中,CherryStudio 顺应趋势,推出知识库与 RAG 功能,注入更卓越的检索与信息调用能力,也进一步拓宽了 CherryStudio 在多元生产力场景中的应用版图。

    诚然,受限于现阶段语言模型的基础能力,体验尚未臻于完美,但随着技术的不断迭代革新,RAG 技术必将成为 AI 应用的明珠,未来可期。

    7 条回复    2024-12-26 18:11:51 +08:00
    SilentOrFight
        1
    SilentOrFight  
       15 小时 51 分钟前
    支持👍
    wangshushu
        2
    wangshushu  
    OP
       15 小时 38 分钟前
    unco020511
        3
    unco020511  
       15 小时 16 分钟前
    感谢,用上了.之前上传附件的功能,也是用的 RAG 吗
    wangshushu
        4
    wangshushu  
    OP
       15 小时 14 分钟前
    @unco020511 是的,但是那个只能跟单一文件对话,而且检索匹配能力很弱,新版本是专用的嵌入模型和向量数据库处理的,处理大量文件优势非常明显
    unco020511
        5
    unco020511  
       15 小时 9 分钟前
    @wangshushu #4 请问背后是使用类似 dify 之类的编排框架吗,最近也在调研 RAG 这块如何和我们的业务结合起来
    kangfenmao
        6
    kangfenmao  
       15 小时 6 分钟前
    @unco020511 有源代码,你可以去看一下处理流程
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5095 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 19ms · UTC 01:17 · PVG 09:17 · LAX 17:17 · JFK 20:17
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.