第一影视网

展开菜单

DeepSeek-V3.2-Exp 发布,训练推理提效,API 同步降价

DeepSeek-V3.2-Exp 发布,训练推理提效,API 同步降价
深度求索正式推出 deepseek-v3.2-exp 模型,该版本为实验性(experimental)更新。 作为通向新一代架构的过渡性尝试,V3.2-Exp 在 V3.1-Terminus 的基础上集成了 DeepSeek Sparse Attention(DSA),引入了一种创新的稀疏注意力机制,重点针对长文本场景下的训练与推理效率进行了探索性优化与验证。 目前,官方 App、网页端及小程序均已全面升级至 DeepSeek-V3.2-Exp 版本,同时 API 费用大幅...

DeepSeek 更新线上模型,V3.2 版本发布在即

DeepSeek 更新线上模型,V3.2 版本发布在即
deepseek 官方今日下午发布了一则简短公告,宣布线上模型已顺利完成版本升级,并诚邀广大用户参与测试,积极提供反馈意见。 尽管官方未明确说明此次更新的具体型号,但结合其在 Hugging Face 平台的最新动态分析,业内普遍猜测这正是备受期待的 DeepSeek V3.2 版本。 据观察,今天下午约14时,Hugging Face 上悄然出现一个名为 “deepseek-v3.2” 的模型仓库。然而,该仓库最初仅包含一个.gitattributes 文件,并未释放实...

Omni-Infer v0.4.2 已经发布,超大规模 MoE 模型推理加速技术

Omni-Infer v0.4.2 已经发布,超大规模 MoE 模型推理加速技术
Omni-Infer v0.4.2 正式上线,带来面向超大规模 MoE 模型的高效推理加速方案 本次版本主要更新亮点如下: 核心功能升级 新增对 DeepSeek-v3.2-EXP with DSA 的全面支持 推出 Omni Proxy,实现高性能的 Prefill 与 Decode 分离调度(PD分离) 引入 KV offload 技术,结合主机内存扩展的 KVM 机制,使 MLA 场景下的 KV blocks 容量提升超过百倍,显著增强长上下文及多轮对话处理能力...

Claude Sonnet 4.5 发布,全球最强的代码模型

Claude Sonnet 4.5 发布,全球最强的代码模型
anthropic 推出了其最新一代 ai 模型 claude sonnet 4.5,宣称该模型在代码生成、构建高阶 ai agent 以及操作系统级任务执行方面处于全球领先地位。 Claude Sonnet 4.5 在多项核心评估基准上取得了突破性进展。其在 SWE-bench Verified 测试中斩获 77.2% 的高分,创下当前行业新纪录;而在 OSWorld 的实际任务完成率方面,性能从此前的 42.2% 大幅提升至 61.4%。 不仅如此,在逻辑推理、数学运算...

Volcano v1.13 发布,大模型训练与推理等调度能力全面增强

Volcano v1.13 发布,大模型训练与推理等调度能力全面增强
volcano v1.13 版本正式发布。本次更新在多方面进行了功能增强,为用户提供更完善的云原生批量计算解决方案。 新版本主要亮点包括:新增对大模型推理LWS的支持;新增定时任务管理能力;提供更灵活的网络拓扑发现机制,并增强对主流AI计算框架的兼容性。同时在混部架构上实现了重要改进,提升了在不同环境中的部署灵活性。这些增强功能共同提升了Volcano在复杂工作负载管理中的实用性和易用性,旨在打造更高效、更稳定的大规模计算平台,为AI时代的基础设施提供关键调度支撑。 大模...

OpenDataLab 发布文档解析视觉-语言模型 MinerU2.5 技术报告

OpenDataLab 发布文档解析视觉-语言模型 MinerU2.5 技术报告
上海人工智能实验室 opendatalab 团队近日正式推出 mineru2.5 技术白皮书,全面介绍其模型结构、训练方法、数据处理流程及多项评测表现。 MinerU2.5 是一款具备 12 亿参数的解耦式视觉-语言模型,专为高分辨率文档理解而设计。项目团队同步上线了官方 Demo,用户可在线体验其强大功能。 该模型采用创新的两阶段解析机制:第一阶段对降采样图像进行整体版面布局分析;第二阶段则在原始分辨率下,针对局部区域实现文本、数学公式与表格的精细化识别。这一架构在 Om...

Ruby 生态核心开源项目 RubyGems 爆发“控制权争夺战”

Ruby 生态核心开源项目 RubyGems 爆发“控制权争夺战”
近日,ruby 社区掀起一场围绕 rubygems 与 bundler 的“控制权之争”。 作为 Ruby 生态中最关键的包管理与依赖解决方案,这两项工具的主导权在未征得长期维护者同意的情况下,被 Ruby Central 单方面全面接管:包括将 RubyGems 的 GitHub 企业组织重命名为 “Ruby Central”,并大规模移除核心维护者的访问权限(如停用邮件账户、撤销对 RubyGems 的所有权),事件迅速引发社区震动。 RubyGems 和 Bundl...

RWKV7-G1a 2.9B 推理模型开源发布,继续推进纯 RNN 模型的思考能力

RWKV7-G1a 2.9B 推理模型开源发布,继续推进纯 RNN 模型的思考能力
2025 年 9 月 24 日,rwkv7-g1a 2.9b 推理模型正式开源,进一步推动纯 rnn 架构在语言理解与生成方面的能力边界。 该模型基于 RWKV7-G1 2.9B 持续训练了 1T tokens 的高质量数据,在多个维度上实现显著性能跃升。 模型客观评测表现 英文及多语言能力 在同参数规模的开源模型中,RWKV7-G1a 2.9B 在基础英语和跨语言任务上的表现更为出色: 作为一个未经针对性“刷榜”优化的纯预训练基座模型,其 MMLU 分数提升至 61.1%...

开启高效新纪元:罗技大师系列MX Master 4 高性能无线鼠标全新发布

开启高效新纪元:罗技大师系列MX Master 4 高性能无线鼠标全新发布
罗技首款支持触觉反馈的鼠标问世,让高效操作在指尖间流畅跃动 罗技推出旗下首款具备可自定义触觉反馈功能的鼠标,专为追求极致操控与效率的专业人士量身打造。 通过LogiOptions+ 软件提供的数字化界面——ActionsRing 智能行动环,用户可显著优化日常操作流程,实测数据显示,工作时间最多可节省约33%,重复性鼠标动作减少高达约63%。* 更强信号的射频芯片搭配优化后的天线设计,使无线连接性能相较前代提升近两倍,带来更稳定、低延迟的操作体验。 MX Master 4 商...

DeepSeek 拥抱国产 GPU 编程语言 TileLang

DeepSeek 拥抱国产 GPU 编程语言 TileLang
9 月 29 日,深度求索正式推出 deepseek v3.2-exp 模型(实验性版本),显著提升了长文本处理效率,并宣布 api 调用成本下降超过 50%。在此次发布的公告中,有这样一段值得关注的内容: 在新模型的研发过程中,需设计并实现大量全新的 GPU 算子。我们采用高级语言 TileLang 进行快速原型开发,以支持更深层次的技术探索。 据悉,TileLang 是一种轻量级的领域专用语言(DSL),专注于简化在 GPU 和 NPU 等加速器上的算子开发。其核心设计理...