Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

[Request] 未来新知识库功能请求 #6054

Open
BryceWG opened this issue Feb 12, 2025 · 28 comments
Open

[Request] 未来新知识库功能请求 #6054

BryceWG opened this issue Feb 12, 2025 · 28 comments
Labels
🌠 Feature Request New feature or request | 特性与建议 files 上传文件/知识库

Comments

@BryceWG
Copy link

BryceWG commented Feb 12, 2025

🥰 需求描述

一般认为知识库是主要利用rag技术,与直接把文件作为上下文相对应。
我的设想是为知识库新增一个功能:在对话中选择附加文件时,可以选择直接把已经在知识库里的‘文件’作为上下文,当然也保留把‘知识库’作为上下文。相当于为知识库增加一个云盘的功能,让里面的文件增加一个快速调用的方式。

🧐 解决方案

在对话中选择附加文件时,可以选择直接把已经在知识库里的‘文件’作为上下文

📝 补充信息

No response


@arvinxx : 借该 issue 召集下大家的诉求,如果有对知识库目前不满意的地方,欢迎提出来,3月份开始做知识库 2.0 改造,你的每个诉求我都会看到

@BryceWG BryceWG added the 🌠 Feature Request New feature or request | 特性与建议 label Feb 12, 2025
@dosubot dosubot bot added the files 上传文件/知识库 label Feb 12, 2025
@arvinxx
Copy link
Contributor

arvinxx commented Feb 12, 2025

其实现在的交互就是支持的,但是由于之前是 RAG 的方式没法做全文注入所以效果不理想,这次2.0会把全文注入的能力加上,应该在一些需要全文引用的场景,效果会大大提升的

@arvinxx arvinxx added this to the Knowledgebase 2.0 milestone Feb 12, 2025
@BryceWG
Copy link
Author

BryceWG commented Feb 12, 2025

说到引用,能不能实现引用对话的内容?类似豆包的这个功能,选中对话中的一段文字,作为上下文:

Image

@Alencryenfo
Copy link

说到引用,能不能实现引用对话的内容?类似豆包的这个功能,选中对话中的一段文字,作为上下文:

Image

same request
这个功能感觉很有用

@git268
Copy link

git268 commented Feb 13, 2025

补充一下,目前lobechat上传文件后还需要等待向量化才送给大模型。有些PPT或PDF文件本身有比较复杂的图表时会报错向量化失败。但是其他类似的平台例如cherry studio似乎是将整个文件发送给大模型,速度快而且读的内容更精准。

@BryceWG
Copy link
Author

BryceWG commented Feb 13, 2025

补充一下,目前lobechat上传文件后还需要等待向量化才送给大模型。有些PPT或PDF文件本身有比较复杂的图表时会报错向量化失败。但是其他类似的平台例如cherry studio似乎是将整个文件发送给大模型,速度快而且读的内容更精准。

我也用过cherry,只有少数服务商的api支持直接接收文件,按作者说的没有单独适配的api其实都是本地解析出文件内容再发送

@arvinxx arvinxx pinned this issue Feb 13, 2025
@Sun-drenched
Copy link

1.建议接入Doc2X等一线文档解析API,提高知识库文档解析精度。
2.由于直接向API传文档普适性不够,建议给出(解析后)全原文索引的功能(可以像现在的深度思考栏一样,单独分栏显示,默认不展开)
3.允许创建、便捷共享(可以做到团队空间/公有、私有助手市场里/or直接导出压缩包等可以直接导入的文件)附带向量化及原文知识库的助手
4.手机端拥有和桌面端一致的知识库管理功能。

@yagev5
Copy link

yagev5 commented Feb 15, 2025

希望后面版本中,知识库在设置里增加一个选择量化的模型的入口,方便用户选择自己想用的在线或本地模型构建知识库,帮助文档里,更改环境变量的方式,换了一下,有太麻烦了,有些模型又报错,后面知识库希望可以直接添加网页地址,自动量化网页数据到知识库

@SAnBlog
Copy link

SAnBlog commented Feb 17, 2025

期望可以在线创建文档,markdown格式在线编辑内容,保存后的数据可以手动向量化,在对话时可以勾选某个文档或者某个文档的目录,等同于AI笔记+对话

@memset0
Copy link

memset0 commented Feb 18, 2025

其实现在的交互就是支持的,但是由于之前是 RAG 的方式没法做全文注入所以效果不理想,这次2.0会把全文注入的能力加上,应该在一些需要全文引用的场景,效果会大大提升的

对于 Gemini 这样的服务商,提供了文件上传的接口,希望在全文注入时可选直接调用这种接口以获得更好的性能

@memset0
Copy link

memset0 commented Feb 18, 2025

个人建议可以在聊天界面的侧边栏增加一个 panel,里面有当前对话的文件/知识库列表及复选框,每次可选发送部分文件/在部分文件中进行 RAG 检索(或许是 NotebookLM 类似的交互体验)

@rollby
Copy link

rollby commented Feb 19, 2025

建议知识库加上这些功能
1、支持创建文件夹,便于知识库内分类管理
2、支持在线创建文件或分段,便于补充内容
3、支持文件存档或者版本更新,例如我有一个联系表会不断更新,我能够直接覆盖旧版本的文件,或者对旧版本文件进行存档
4、支持团队管理、团队共享知识库
5、支持对知识库文件打tag,便于快速查找文件,或者便于检索

@Steve235lab
Copy link
Contributor

现在对没有做过OCR处理的PDF分块会报错,希望对于这种文档可以内置一个ocrmypdf做下预处理

@huangkairan
Copy link

说到引用,能不能实现引用对话的内容?类似豆包的这个功能,选中对话中的一段文字,作为上下文:

Image

这个功能有什么场景?现在发送消息时应该是会把 chat history 作为上下文一起发送?

@BryceWG
Copy link
Author

BryceWG commented Feb 21, 2025

说到引用,能不能实现引用对话的内容?类似豆包的这个功能,选中对话中的一段文字,作为上下文:
Image

这个功能有什么场景?现在发送消息时应该是会把 chat history 作为上下文一起发送?

更方便的定位在上下文中需要详细解释或者提问的内容

@nightzjp
Copy link

希望服务端数据库版本的知识库支持配置是否团队共享~
这样管理员创建了知识库。所有员工都可以看到并使用了

@fengziadmin
Copy link

fengziadmin commented Feb 25, 2025

🥰 需求描述
减少知识库的分割导致信息断裂断层问题,提高信息检索精度。

🧐 解决方案
建议增加知识库的父子检索。

📝 补充信息
No response

@mengdahuang
Copy link

首先感谢LobeChat团队!
迫切期望本地部署版本能加上知识库带权限的团队共享功能。目前每个用户都是完全独立的
谢谢!

@Valen-C12
Copy link

现在的知识库好像只能带限定数量的文件片段?这是由于api限制还是知识库限制,之后能附带整个文件或者多个文件,整个文件夹作为上下文吗

@xuzhouqqq
Copy link

知识库如果包含图片,在回答输出的时候能把图片也输出么

@xuzhouqqq
Copy link

知识库里面,批量新增几百个文件,然后批量向量化,会存在某些文件向量化失败的情况。

能否在文件列表做个筛选,区分已经向量化和未向量化的文件,这样可以快速筛选失败的再次批量向量化

@51762344
Copy link

现在对没有做过OCR处理的PDF分块会报错,希望对于这种文档可以内置一个ocrmypdf做下预处理

感谢,看到你这个评论才知道为啥一直分块不成功

@ruanjunmin
Copy link

目前,我们的知识库仍然依赖于传统的相似度检索方法,这在处理复杂查询和语义理解方面存在一定的局限性。为了进一步提升知识库的性能和内容回复的精准度,我建议考虑引入知识图谱技术。

具体而言,可以考虑将以下项目集成到我们的知识库功能中:

LightRAG:
项目简介:LightRAG 是一个高效的知识图谱嵌入框架,能够通过图神经网络提升知识检索的准确性和效率。
GitHub 仓库地址:HKUDS/LightRAG
KAG(Knowledge Augmented Graph) :
项目简介:KAG 是一个基于知识图谱的增强型框架,旨在通过图谱结构优化信息检索和问答系统。
GitHub 仓库地址:OpenSPG/KAG

预期效果:

提升精准度:通过知识图谱的引入,系统能更准确地理解用户查询的语义,提供更精准的回复。
增强语义理解:知识图谱能够捕捉实体间的关系,提升系统对复杂查询的处理能力。
扩展知识覆盖:利用图谱的关联性,可以扩展知识库的覆盖范围,提供更全面的信息。

实施建议:

技术评估:对LightRAG和KAG进行技术评估,确定其与现有系统的兼容性。
原型开发:搭建原型系统,验证知识图谱嵌入的效果。
逐步集成:在验证效果后,逐步将知识图谱功能集成到主系统中。

希望团队能考虑这一建议,共同推动知识库功能的优化和升级

@k10876
Copy link

k10876 commented Mar 5, 2025

I hope that we can support direct file submission for capable multimodal models. The files contain PDFs or videos and other stuff.

Better if there's a tickbox "Send files without chunking" in the settings for respective models.

如果可以的话希望支持直接上传相关文件,特别是pdf文件。如果可以在模型设置里面对每个模型单独设置这个就更好了。

@Lockeysama
Copy link

希望有一个快捷功能,类似腾讯 IMA 的,快速把对话存储为笔记文件,然后可以选择手动或自动转为知识库~~另外要是能编辑笔记就更好了

@bbbugg
Copy link
Contributor

bbbugg commented Mar 9, 2025

多个文件一起提问,识别不到所有文件啊,只能识别部分文件的分块来回答。分开单个文件提问是没问题的

@screw-hand
Copy link

场景描述

环境配置

  • 部署方式:自托管(数据库版本)
  • 使用场景:高频使用"随意对话"图片上传功能

当前痛点

  1. 文件预览局限

    • 仅支持列表视图(Grid 模式),无法快速浏览图片内容
    • 批量管理时需逐一点击预览确认内容(文件名重复率高)
  2. 存储机制问题

    • 所有对话场景上传的图片默认持久化到知识库
    • 对话删除后相关文件仍保留在知识库
    • 长期使用后产生大量需要手动清理的冗余文件

功能建议

  1. 视图模式增强

    • 新增瀑布流(Masonry)图片预览模式
    • 支持缩略图尺寸调节
  2. 存储机制优化

    • 在设置新增选项:自动保存对话场景上传文件到知识库(默认开启)
    • 添加批量管理功能:
      • 按时间范围筛选
      • 按会话来源筛选
      • 多选删除操作

附加信息

当前文件管理界面示例:
文件名重复示例

优先级说明

若该需求当前优先级较低,我会在知识库重构后,尝试自己实现

最后:感谢owner开发了lobe,对我们AI重度用户很有帮助!!

@m0eak
Copy link

m0eak commented Mar 10, 2025

场景描述

环境配置

  • 部署方式:自托管(数据库版本)
  • 使用场景:高频使用"随意对话"图片上传功能

当前痛点

  1. 文件预览局限

    • 仅支持列表视图(Grid 模式),无法快速浏览图片内容
    • 批量管理时需逐一点击预览确认内容(文件名重复率高)
  2. 存储机制问题

    • 所有对话场景上传的图片默认持久化到知识库
    • 对话删除后相关文件仍保留在知识库
    • 长期使用后产生大量需要手动清理的冗余文件

功能建议

  1. 视图模式增强

    • 新增瀑布流(Masonry)图片预览模式
    • 支持缩略图尺寸调节
  2. 存储机制优化

    • 在设置新增选项:自动保存对话场景上传文件到知识库(默认开启)

    • 添加批量管理功能:

      • 按时间范围筛选
      • 按会话来源筛选
      • 多选删除操作

附加信息

当前文件管理界面示例: 文件名重复示例

优先级说明

若该需求当前优先级较低,我会在知识库重构后,尝试自己实现

最后:感谢owner开发了lobe,对我们AI重度用户很有帮助!!

赞同,如果上传图片时可以自动按对话的助手名称加日期进行命名就更好了,不然全是image头有点大,还不能缩略图查看

@Jean201093266
Copy link

建议支持自定义向量化工具

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
🌠 Feature Request New feature or request | 特性与建议 files 上传文件/知识库
Projects
None yet
Development

No branches or pull requests