Releases: aigc-apps/PAI-RAG
Release v0.2.0-2-20250219
更新概述
以下为本次版本更新的主要内容,包括每项功能和修复的概述,感谢所有贡献者的辛勤工作。
主要更改
- 压缩问题描述:添加了对中文提示的支持,提升了问题描述的简洁性。
- 修复 Poetry 配置:优化了项目的 Poetry 配置。
- 支持 Web 検索意图:增强了对 Web 搜索的意图支持。
- 新增阿里云搜索功能:集成了阿里云搜索服务。
- 优化历史记录功能:对历史记录的管理进行了优化。
- 优化提示模板:改进了提示模板的结构和内容。
- 修复多项问题:进行了一系列问题修复,提升稳定性。
- 修复查询变换及意图检测问题:解决了查询转换中的问题,并移除了意图检测功能。
- 修复 V1 聊天系统提示:更新和修正了聊天功能的系统提示。
- 升级阿里云访问密钥及响应解析:改进了阿里云的访问密钥管理和响应解析。
- 优化聊天记录存储:改进了聊天记录的存储机制。由 @moria97 提交。
- 修复 Markdown 树结构问题:解决了 Markdown 树的弹出问题。
- 将转换后的查询添加到查询字符串:增加了将转换后的查询附加到查询字符串的功能。
- 加入文本审查功能:添加了文本内容审查功能。
- 修复 GPU 配置:对 GPU 的配置进行了修正。
- 解决超时问题:修复了系统中存在的超时问题。
- 修改 Nginx 端口:将 Nginx 的端口从 8000 修改为 8680。
- 修复 pptx 处理问题:优化了 pptx 文件的处理问题。
- 新增 XLS 文件支持:加入了对 XLS 文件格式的支持。
- 修复防护措施及错误处理:改进了整体的错误处理与防护措施。
- 修复 Arms 问题:修复了与 Arms 相关的若干问题。
- 修复 Docker 中 pptx 处理问题:解决了 Docker 环境中 pptx 的处理问题。
- 使查询变换可配置:增加了查询变换配置选项。
- 个人化提示功能:增加了个人化提示功能。
- 隐藏 Quark 搜索功能:将 Quark 搜索功能进行隐藏以提升用户体验。
- 修复读取文件类型问题:改善文件读取功能以支持更多类型。
- 更新默认路径:修改了系统的默认路径配置。
完整变更日志
请访问 完整变更日志 以了解更多详细信息。
Release v0.2.0-20250212
新功能
- 文档处理增强
- 增加了 PDF 和图像的 OCR 选项,提升了对不同文档类型的支持。
- 添加了 Markdown 树解析器,优化了文档的结构化处理。
- 向量存储扩展
- 引入了 Tablestore 和 Dashvector 向量存储,增强了数据检索和管理能力。
- 搜索功能升级
- 支持 Deepseek 和 Quark 搜索,扩大了搜索的覆盖范围和精确度。
- 多语言支持
- 添加了英文版的提示模板,提升了多语言用户的使用体验。
主要改进
- 架构与性能优化
- 将 Ray 任务替换为 actors,提高了系统的并发处理能力和性能。
- 对 Personal/xi/nl2sql 模块进行了模块化重构,增强了代码的可维护性和扩展性。
- 用户界面优化
- 优化了参考文献的展示界面,提升了用户的浏览体验。
- 改进了聊天页面的功能,修复了相关的显示与交互问题。
- 解析器更新
- 更新了 SQL 解析器和 Markdown 解析器,增强了对复杂语法的支持和解析准确性。
错误修复
- 修复了 minerU、metadata、chunking 等模块中的多个关键错误,确保系统的稳定性。
- 针对多轮对话提示和聊天历史进行了修正,提升了对话的连贯性和准确性。
- 解决了与 LLM 令牌相关的字符串类型问题,优化了模型的响应生成。
依赖与版本更新
- 更新了 llama-index 和 gradio 的版本,确保依赖项的最新性和安全性。
- 添加了 Paddle 依赖,支持更多功能模块的开发与集成。
部署与文档
- 增加了 EAS 部署文档 和 Deepseek 文档,为用户提供了更全面的部署指南。
- 更新了 Docker Compose 文件,并新增了用于数据处理的 CPU 版本 Docker 文件,简化了部署流程。
Full Changelog: v1.0.0-20241206...v0.2.0-20250212
Image Release Note: 对应PAI-RAG线上镜像版本
- 0.1 [20250211发布]
- 0.2.0 [20250212发布]
Release v1.0.0
🎉 New features:
-
📸 Multi-Modal QA: Experience enhanced image processing and inference capabilities. Our platform now supports responses with images for a more engaging user experience.
-
🤖 Agentic RAG: Enjoy seamless function-calling and intelligent query routing, optimizing the processing and retrieval of information.
-
🗃️ Database Chat: Effortlessly analyze your data using our advanced text-to-SQL interface, making it easier to derive insights from your database.
-
📄 Enhanced Data Parsing: Benefit from improved parsing capabilities for a variety of file types, including PDF, Word, HTML, and PowerPoint, ensuring more accurate and efficient data extraction.
v0.1.0-20240802
- Add OpenSearch, PostgreSQL vector db.
- Add function-call support
- Add
.jsonl
file support - Bug fixes