avatar-decorate
获赞
5199
粉丝
214
关注
229
看过 TA
689
西昌学院
2011
golang
IP属地:北京
微信公众号:福大大架构师每日一题
私信
关注
ollama v0.13.1 发布:全新 Ministral-3 与 Mistral-Large-3 模型,增强工具调用与GPU兼容性Ollama 2025年12月3日发布了 v0.13.1 版本更新,本次更新重点引入了两个新的模型家族,并带来了多项功能增强、错误修复及底层改进,进一步提升了模型的部署灵活性与运行稳定性。一、 全新模型登场1. Ministral-3 系列:此系列模型专为边缘部署设计,能够在广泛的硬件设备上高效运行,为资源受限的环境提供了强大的本地AI能力。2. Mistral-Large-3 系列:这是一个通用的多模态混合专家(MoE)模型,旨在处理生产级任务和企业级工作负载,在复杂场景下表现出色。二、 核心功能与改进1. 引擎与工具调用:• nomic-embed-text 模型现在默认使用 Ollama 自身的引擎运行。• 为 cogito-v2.1 模型新增了工具调用(tool calling)支持。• 同样为 cogito-v2.1 模型添加了思维链(thinking)解析功能。2. GPU 与系统兼容性修复:• 修复了 CUDA VRAM 发现的相关问题。• 解决了在仅配备 CPU 的系统上,模型可能被错误驱逐(evict)的问题。• 修复了在某些旧款 GPU 上无法检测到 CUDA 的问题。• 改进了对 CUDA 计算能力(CC)与目标库版本的兼容性验证。• (Windows系统)增加了对 PATH 中潜在不兼容库文件(如 ggml-base.dll)的检测与警告。3. 错误处理与用户体验:• Ollama 现在能够更好地呈现和渲染错误信息,而非简单地显示 “Unmarshal: errors”。• API 客户端 (api/client) 增强了对非 JSON 格式流式错误响应的处理能力。4. 应用与文档:• 修复了应用内连接打开逻辑,优化了用户体验。• 更新了应用内帮助链接,使其指向官方文档网站。• 清理了文档中已弃用参数(如 mirostat, mirostat_eta, mirostat_tau)的说明。三、 重要代码变更摘要本次更新包含了 18个提交,涉及 33个文件 的更改,由 12位贡献者 共同完成。部分关键变更包括:• API/客户端:增强了错误处理逻辑,当服务器返回非JSON格式的错误响应(如纯文本或HTML)时,能正确传递状态码和错误信息。• 应用层:优化了 macOS 和 Windows 系统上处理自定义 URL 协议(如 ollama://)的逻辑。• 模型支持:• ministral-3:模型支持现已集成,并添加了相应的测试。• deepseek2:升级以支持运行 v3+ 版本的模型。• 模型解析器:新增了针对 cogito-v2.1 模型的专用解析器,以支持其独特的工具调用和思维格式。• mistral3 模型结构:在转换逻辑中增加了对 LLAMA 4 缩放因子等新 rope 参数的支持。• 底层与发现:• GPU 发现:改进了设备发现机制,避免库路径重叠,并加入了对 NVIDIA Jetson Jetpack 版本的更精确匹配要求。• KV 缓存:测试现在同时覆盖使用和不使用 PermutedV 的情况。• LLM 服务器:修正了在仅有 CPU 的系统上进行模型布局验证的逻辑,防止不必要的模型驱逐。四、 其他调整• 将 Vulkan 着色器文件标记为“已供应”文件。• 更新了 .gitattributes 以正确归类相关文件。• 移除了代码检查工具中的 gocritic 规则。总结Ollama v0.13.1 版本是一个以模型扩展和系统稳固性为主的更新。它不仅为用户带来了适用于边缘和企业场景的新模型选择,还通过一系列关键的缺陷修复和兼容性改进,显著提升了软件在各类硬件环境下的可靠性和用户体验。特别是对 cogito 和 ministral 系列模型支持的增强,展现了 Ollama 生态持续扩展对多样化模型架构的兼容能力。
0 点赞 评论 收藏
分享
DeepSeek-V3.2系列正式发布:开源模型首次达到GPT-5水平,斩获四项国际竞赛金牌继上周推出数学推理模型 DeepSeekMath-V2 之后,DeepSeek 再度更新,正式发布 V3.2 系列模型。这次一次带来两个版本,分别面向不同应用场景:日常使用与高难度推理。01 双模型定位与核心差异DeepSeek本次发布的V3.2系列包含两个定位分明的模型,以满足不同场景的需求 。DeepSeek-V3.2(标准版) 定位于日常使用场景,注重平衡推理能力与输出效率。该版本已全面部署于DeepSeek官方网页端、App和API服务 。在多项公开推理基准测试中,其表现接近GPT-5,仅略低于Gemini-3.0-Pro 。DeepSeek-V3.2-Speciale(研究版) 则专注于推动开源模型的极限推理能力边界。该模型是V3.2的长思考增强版,结合了DeepSeek-Math-V2的定理证明能力,在高度复杂任务上表现卓越 。02 卓越的性能表现DeepSeek-V3.2-Speciale在多项国际顶级竞赛中展现出惊人实力,成功斩获IMO2025(国际数学奥林匹克)、CMO2025(中国数学奥林匹克)、ICPCWorldFinals2025(国际大学生程序设计竞赛全球总决赛)及IOI2025(国际信息学奥林匹克)金牌 。其中,ICPC与IOI成绩分别达到了人类选手第二名与第十名的水平 。在主流推理基准测试上,Speciale模型的性能表现媲美Gemini-3.0-Pro,展现出强大的推理能力 。不过需要注意的是,该版本因推理链较长、Token消耗高,目前仅限研究使用 。
0 点赞 评论 收藏
分享
0 点赞 评论 收藏
分享
agno v2.3.3 发布:引入上下文压缩与内存优化,增强文件搜索和异步支持2025 年 11 月 27 日,agno 发布了 v2.3.3 版本,本次更新带来了多项新功能、性能改进以及 Bug 修复,尤其是在上下文管理、内存优化、文件搜索和异步支持方面有了显著增强。以下为详细更新内容。一、新功能(New Feature)1. 上下文压缩(Context Compression)• 新增运行时压缩工具调用结果的功能,有助于在智能体运行过程中对上下文进行管理。• 该功能可以帮助智能体保持在上下文窗口范围内,避免触发速率限制或响应质量下降。• 功能为 Beta 版,可参考官方文档获取更多信息。2. 内存优化(Memory Optimisation)• 新增总结用户记忆的能力,允许在智能体运行之外进行记忆摘要。• 在 MemoryManager 中新增 optimize_memories 和 aoptimize_memories 方法。• 当前仅支持一种策略,未来会扩展更多。• 功能为 Beta 版。3. Gemini 文件搜索支持(Gemini File Search Support)• 引入了对 Google Gemini File Search 的支持。4. 文件搜索存储管理(File Search Store Management)• 可创建、列出、获取和删除文档存储。5. 文件上传与导入(File Upload & Import)• 支持直接上传文件,可自定义分块配置及元数据。6. 文档管理(Document Management)• 支持基于元数据过滤列出、获取、删除和更新文档。7. 引用提取(Citation Extraction)• 提供辅助方法,从响应中提取并格式化引用来源。8. 异步支持(Async Support)• 全面支持 async/await 以满足生产环境负载需求。9. 示例 Cookbooks(暂未发布完整文档)• 基础文件搜索示例:cookbook/models/google/gemini/file_search_basic.py• 高级文件搜索示例:cookbook/models/google/gemini/file_search_advanced.py• RAG 文件搜索流水线示例:cookbook/models/google/gemini/file_search_rag_pipeline.py二、功能改进(Improvements)1. 运行时输出模式定义(output_schema on run/arun)• 可在 run() 和 arun() 方法(包括 Agent、Team 以及 AgentOS API)中动态覆盖 output_schema。2. AWS Bedrock API Key 支持• 新增对 AWS Bedrock API 密钥的支持。3. AWS Claude 兼容性增强• 增加对思考模型与缓存功能的支持。4. VertexAI Claude 兼容性增强• 增加对思考模型与缓存的支持。5. Gemini 3 思考等级(thinking_level)支持• 可为 Gemini 设置 thinking_level 参数。三、Bug 修复(Bug Fixes)1. 异步知识检索• 修复因缺少异步版本的 get_user_message,导致异步知识检索失败的问题。2. 团队成员事件流• 即使配置 stream_member_events=True 且 stream_events=False,仍确保成员事件能正确流式传输。3. 迁移管理器(MigrationManager)改进• 修复无法对 2.3.0 以下版本进行迁移的问题。• 新增强制迁移标志(force migration flag)。4. StopAgentRun 异常处理• 修复 StopAgentRun 无法正确终止智能体运行的问题。5. PDF 图像读取器• 修复生成 ID 基于文件名而不是 UUID 的问题。6. MCP 工具名前缀(tool_name_prefix)• 将默认值改为 None,避免默认添加“_”前缀。7. AGUI 界面修复• 修复工具调用 ID 出现重复值的问题。• 修复工具调用缺少助手消息的问题。四、本次版本主要变更总结(What's Changed)• 修正文档链接失效问题。• 修复异步知识检索逻辑。• 改进团队类的 JSON 输出逻辑。• 新增运行时可配置输出模式功能。• StopAgentRun 与 RetryAgentRun 正式实现。• 增加对 MongoDB 异步 SDK 的支持。• 引入记忆优化与工具调用压缩功能。• 优化 AWS Claude 兼容性及 API 密钥支持。• 增加 Gemini 文件搜索支持。• 修复测试用例中异步知识访问的稳定性问题。五、总结agno v2.3.3 版本是一次 功能与性能的双重提升 更新,尤其在 上下文压缩、内存优化、文件搜索能力 方面有重大改进,同时增强了 AWS Claude、VertexAI Claude 的兼容性,并全面支持 异步任务。
0 点赞 评论 收藏
分享
dify 1.10.1 多数据库时代开启:新增 MySQL 支持与性能全面优化2025年11月26日,Dify 正式发布 1.10.1 版本,这次更新不仅带来了重大功能增强和稳定性修复,更标志着 Dify 进入了 多数据库新时代 —— MySQL 支持终于到来,并与 PostgreSQL、OceanBase 一起形成完整的多数据库体系。🚀 新功能亮点1. 基础设施与 DevOps 升级• MySQL 适配完成:现在 PostgreSQL / MySQL / OceanBase 均已全面支持。• 新增 DB_TYPE 配置选项,用于选择数据库类型。• 支持 MySQL 特有的 JSON / LONGTEXT / UUID / 索引差异。• Alembic 迁移脚本更新,适配多数据库兼容性。• 引入跨数据库 SQL 辅助方法,优化统计与日期处理。• 数据集元数据过滤重写,使用 SQLAlchemy JSON 操作符。• 新增 MySQL 迁移测试 CI 工作流。这一改动是 Dify 后端架构的重要里程碑,多数据库支持首次成为一等公民。2. 性能与工作流编辑器优化• 工作流编辑器性能显著提升:去除了高成本的逐节点验证,减少不必要渲染,性能从 50 节点变卡到接近 200 节点仍保持流畅。3. 工作流引擎与界面优化• 改进了工作流编辑器 UI、稳定性、交互体验,包括变量检查、媒体组件、节点交互优化。🛠 修复与改进运行时与工作流执行稳定性• 修复高级聊天工作流无法正确停止的问题,避免进程被卡住。• 修复草稿模式下运行任意节点会触发 500 错误的情况,提升调试稳定性。• 修正循环/迭代评估时的令牌统计错误(不涉及计费)。• 修复工作流作为工具返回空文件字段的问题。• 解决 FileService 会话作用域导致文件删除异常的问题。知识库• 修复使用 weightedScore 检索选项时触发 500 错误的问题,恢复加权排名稳定性。开发体验与 SDK• 修复 Node.js SDK 路由与 multipart 上传的处理问题,保证文件与数据提交稳定性。• 修复 OpenAPI/Swagger 加载失败的问题,恢复开发文档访问。Web UI 与用户体验• 修复暗色模式下 ExternalDataToolModal 渲染不一致的问题。• 优化 Marketplace 搜索触发与滚动行为。• 修复查看 chatflow 日志详情时导航不正确的问题。• 修复 README 显示面板的排版与渲染问题。• 减少 useNodes hook 的多余渲染,提升前端性能。插件与集成• 更新插件验证逻辑,改为使用唯一标识符,保证安装与更新的正确性。系统健壮性• 防止 TriggerProviderIdentity 中出现可空标签,避免运行时错误。• 优化无效 webhook 请求的错误提示,更清晰定位问题。反馈与日志• 修复点赞/点踩反馈在日志中不显示的问题。国际化 (i18n)• 统一触发与计费事件的术语。• 修复执行相关翻译缺失或错误的问题。• 删除错误的“running”翻译条目。• 重构 i18n 脚本并移除过期翻译键。• 增补缺失翻译,提升多语言覆盖率。维护与开发工具链• 新增前端自动化测试规则。• 升级系统库与 Python 依赖,保持安全性与兼容性。• 更新启动脚本使用 pnpm dev,简化贡献者开发流程。
0 点赞 评论 收藏
分享
langgraph 1.0.4 最新发布:功能优化与修复详解2025年11月26日,langgraph 正式发布 1.0.4 版本,这是继 1.0.3 之后又一次重要的功能优化与问题修复版本。本次更新围绕稳定性、代码结构优化以及依赖清理进行了多项改进,同时发布了相关预构建版本。以下是详细更新内容:1. 功能与版本发布• langgraph 1.0.4 正式发布该版本延续了此前的功能特性,并在流处理、远程图配置等方面进行了微调与优化。• langgraph-prebuilt 1.0.5 发布针对预构建版本进行了更新,确保用户在无需手动构建的情况下也能获得最新功能与修复。• prebuilt 1.0.3 发布同步更新预构建依赖版本,修复了部分警告信息。2. 功能优化与结构调整• 移除远程图可配置字段中的线程 ID针对远程图的可配置字段做了清理,去除了线程 ID,以简化配置逻辑并减少潜在冲突。• 分离 prepare_push_* 系列函数对相关准备推送的函数进行重构和拆分,提升代码可维护性与模块化程度。• 清理部分引用删除了代码中不再使用的引用,保持代码整洁与可读性。3. SDK 与类型检查增强• Python SDK 增强类型检查增补了更多的类型检查规则,提升开发过程中类型推断的准确性,从而减少运行时错误。4. 问题修复• 修复流模式值中断问题修复了在流模式下可能发生的值中断问题,提升流处理的稳定性。• 预构建版本依赖警告修复修正了预构建版本中出现的依赖警告信息,保证构建输出的干净与稳定。总结本次 langgraph 1.0.4 更新主要集中在:• 性能优化:对远程图配置、预构建依赖进行了清理。• 代码结构升级:函数模块化、引用清理。• 稳定性提升:修复了流模式与依赖警告相关问题。• 开发体验改进:增强 Python SDK 的类型检查能力。
0 点赞 评论 收藏
分享
mediamtx v1.15.4 San Francisco 发布更新详解mediamtx 在 2025年11月21日发布了 v1.15.4 版本(代号 “San Francisco”),本次更新包含了多项修复与性能优化,涵盖了通用功能、RTP、RTSP、HLS,以及依赖库的升级,同时,还引入了安全构建机制,确保发布的二进制文件可信。以下为更新详情:一、通用功能更新• 支持多个 CORS 允许来源,提升跨域访问的灵活配置能力。• 新增 udpReadBufferSize 参数,可设置全局 UDP 读取缓冲区大小,应用于所有 UDP 套接字。• udpReadBufferSize 扩展到 WebRTC UDP 套接字,能够在不修改系统参数的情况下减少数据包丢失。• 修复录制功能中 FMP4 文件持续时间溢出的问题。两个采样之间的时间戳差值原本使用无符号整数存储,当为负数时会造成溢出。二、RTP相关更新• 在数据读取前先对 RTP 包进行重新排序,提升数据处理的连贯性和稳定性。三、RTSP相关更新• 支持没有状态消息的 RTSP 响应。• 修复在使用 Media Foundation 读取时的超时问题。• 修复 MIKEY 消息的 SP 负载,正确填充 PayloadSPPolicyParamTypeAuthTagLen 和 PayloadSPPolicyParamTypeSessionAuthKeyLen。• 支持动态 SSRC 的格式。• 优化性能,在解码时仅处理一次 RTP 头部。四、HLS相关更新• HLS 复用器中修复 FMP4 文件持续时间溢出的问题,避免播放时出现异常时间戳。
0 点赞 评论 收藏
分享
ragflow v0.22.1 发布:支持Word/Markdown导出、S3数据源接入、Flask升级为异步框架等重大改进一、主要改进1. Agent功能增强• 支持将 Agent 输出内容导出为 Word 或 Markdown 格式,方便用户进行后续文档处理与分享。• 新增 列表操作组件(List operations),实现对列表数据的处理功能。• 新增 变量聚合组件(Variable aggregator),用于聚合不同数据来源的变量值。2. 数据源拓展• 支持 S3 兼容的数据源,包括 MinIO 等对象存储系统。• 新增 JIRA 数据同步功能,实现与项目管理平台的数据联动。3. 界面与交互优化• 持续优化 Profile 页面布局,提升用户体验与交互流畅度。4. 服务架构升级• 将 Flask 框架从同步版本升级为 异步版本(Quart),显著提升并发能力,减少调用上游大模型服务时的阻塞问题。二、修复的主要问题• 解决 v0.22.0 中的 BUG:用户在包含已解析文件的数据集中,切换内置模型时无法正确解析或处理文件的问题。• 解决 Word 文档中图片拼接的显示问题。• 修复聊天记录中混合图片与文字未正确显示的问题。• 修复无法选择用户中心时区的问题。• 修复变量分配器连接其他运算符时的兼容性问题。• 修复在 API /api/v1/dify/retrieval 中查询无结果的问题。• 修复矿物解析(mineru_parser)属性获取逻辑错误。• 修复多次添加会话变量时被覆盖的问题。• 修复列表操作组件不支持对象数组排序的问题。• 修复 check_embedding 随机采样范围不合理的问题。• 修复圈状导入(circle imports)问题。• 修复结构化数据在某些操作中丢失的问题。三、新增支持的模型• Gemini 3 Pro Preview• 新增大模型服务提供商 Jiekou.AI四、其他功能优化与新增• 为 Agent 消息回复功能新增文件下载能力。• 新增动态变量赋值表单,提高变量管理的可视化体验。• 新增变量显示功能,在变量赋值节点中可直接查看当前变量值。• 为 RAPTOR 增加容错机制。• 为数据操作类组件增加结构化输出显示开关。• 新增删除查询变量时的用户警告提示。• 确保结构化数据仍存储于输出中,以兼容旧版本。• 允许 Begin 操作符的键值仅包含字母、数字与下划线。五、总结本次 ragflow v0.22.1 更新不仅在 Agent 功能、数据源类型、性能架构方面进行了大幅提升,还修复了多项影响使用体验的重要问题。同时,对多语言支持、结构化数据兼容性和可视化交互进行了细致优化,为构建高效、稳定的 RAG 工作流提供了坚实基础。
0 点赞 评论 收藏
分享

创作者周榜

更多
关注他的用户也关注了:
牛客网
牛客网在线编程
牛客网题解
牛客企业服务