Zoom创始人兼首席执行官袁征(Eric Yuan)在近期举办的TechCrunch Disrupt 2025大会上表示,随着AI助手的广泛应用,人类有望在未来五年内摆脱传统五日工作制,逐步过渡到每周仅需工作三至四天的全新模式。
他深入分享了Zoom如何将人工智能全面整合进其产品体系,并勾勒出一个由“数字分身”支撑的未来办公场景。袁征透露,今年他已在一次公司财报电话会议中,首次启用AI生成的“数字孪生”(digital twin)代表自己发言。这一尝试不仅证明了技术的可行性...
蚂蚁百灵大模型团队近日正式开源了 ring-flash-linear-2.0-128k 模型,该模型特别适用于超长文本下的代码生成、编程任务以及智能 agent 等复杂应用场景。
据悉,该模型采用线性注意力与标准注意力机制相结合的混合架构,在保证高效推理的同时实现了卓越的性能表现。通过融合成熟的 MoE(Mixture of Experts)设计与多项优化技术——包括 1/32 的专家激活比率和 MTP 层结构,Ring-flash-linear 能在仅激活 6.1B 参数的...
蚂蚁百灵大模型团队近日正式推出了全新开源全模态大模型——ming-flash-omni-preview,标志着首个参数规模突破千亿的全模态模型正式向社区开放。该模型基于ling 2.0的稀疏moe架构构建,总参数量达103b,激活参数仅为9b,在保持高效推理的同时显著提升了多模态理解与生成能力。
相较于此前广受好评的Ming-lite-omni-1.5,新模型在图像、视频、语音等多个模态任务中实现了全面升级,尤其在可控图像生成、流式视频理解和高精度语音识别方面表现突出,整体性...
小红书联合中国人民大学研究团队近日推出了一款名为“deepagent”的开源通用ai智能体。该智能体具备可扩展的工具调用能力,能够在端到端的推理过程中,自主搜索并使用来自超过16,000个rapidapi接口中的合适工具,以完成各类常见任务。
DeepAgent提出了一种统一、连续且高度自主的推理框架,突破了传统分阶段代理工作流的局限。其主要特性包括:
端到端深度推理:整个任务在一条连贯的思维链中完成,避免信息断裂
动态工具发现与调用:无需预先设定可用工具集,按...
复旦大学携手美团longcat共同发布了 r-horizon——首个专注于系统性评估与提升大型推理模型(lrms)长链推理能力的评测框架与训练方法。
R-HORIZON 创新性地提出了“问题组合”(Query Composition)策略,通过在不同问题之间建立逻辑依赖关系,将原本独立的任务转化为复杂的多阶段推理流程。
以数学推理任务为例,该方法包含以下三个关键步骤:
信息提取:从原始问题中抽取关键数值、变量等核心要素
依赖构建:将前一个问题的解答结果作为后续问题...
Electron 是一个基于 Node.js 和 Chromium 的框架,允许开发者使用 JavaScript、HTML 和 CSS 构建可在 Mac、Windows 和 Linux 上运行的跨平台桌面应用程序。它被广泛应用于 Atom 编辑器及其他众多桌面软件的开发。
最新版本 Electron v39.0.0 已正式推出,主要更新包括:
技术栈升级
Chromium 升级至 142.0.7444.52
包含 Chromium 142 的新特性
包含 Chromium...
这几年,生成式ai浪潮方兴未艾,各种应用如雨后春笋,更高级的智能体ai、具身ai也已经崭露头角,显现了无尽的潜力。
但是一个市场领域蓬勃发展时,往往是机遇与挑战并存。如何更好地抓住AI这一波机会,怎么玩才能实现收益最大化,从科技巨头到个人开发者都在思考。
其中,对于小型企业、工作室乃至个人开发者来说,端侧AI蕴藏着更多可能,而工欲善其事、必先利其器,如何选择高效、经济的端侧开发平台,就成了一道令人纠结的选择题。
所谓端侧AI,就是在本地设备上完成相关AI模型部署和推理计算,...
近日,soul app ai团队(soul ai lab)正式对外开源其最新研发的播客语音合成模型——soulx-podcast。该模型专为多人、多轮对话场景设计,支持中文、英文、四川话、粤语等多种语言与方言,并具备丰富的副语言表达能力,可稳定生成超过60分钟自然流畅、角色切换精准、韵律变化生动的长时语音内容。
除了在播客创作中表现出色,SoulX-Podcast在通用语音合成和声音克隆等应用场景下同样展现出卓越性能,带来更加真实且富有表现力的听觉体验。
SoulX-Pod...
https://www.php.cn/link/df2782c019d0d66a88af774011e8ab29
苹果公司近日推出了名为Pico-Banana-400K的大规模图像数据集,包含40万张精心筛选的图片。该数据集基于Google Gemini-2.5系列模型构建,相关论文《Pico-Banana-400K:面向文本引导图像编辑的大规模数据集》也已同步发布。
该数据集以OpenImages中的真实图像为原始素材,涵盖35种不同类型的编辑任务,归为8个主要类别。编辑...
Fetcher v2.15.2 正式上线:强化 React 防抖机制与可视化过滤器,全面提升开发流畅度
一款轻量级、模块化、以 TypeScript 为核心的 HTTP 客户端,原生支持 LLM 流式接口调用。
本次 Fetcher v2.15.2 版本聚焦于提升开发者体验,通过引入完整的防抖 Hooks 支持、功能丰富的可视化过滤组件,以及进一步优化的代码生成能力,助力你更高效地打造现代化前端应用。
✨ 核心更新内容
⚡ 全面支持 React Hooks 防抖功能
为减少...