第一影视网

展开菜单

腾讯云开源 DeepSeek 量化部署方案:性能最高提升 3.9X

腾讯云开源 DeepSeek 量化部署方案:性能最高提升 3.9X
腾讯云联合小红书hilab infra团队,在sglang 中实现了deepseek量化模型的高效推理优化,并在huggingface中发布了deepseek-v3.1-terminus的量化模型。 量化方案介绍 当前主流的大语言模型普遍采用MoE架构,这种架构可以在减少训推成本的同时提升模型性能,与此同时,模型体积也变得越来越大。比如,DeepSeek系列为671B,Kimi K2达到了 1TB,而当前主流的GPU单卡显存只有 80GB/96GB,通常需要双机分布式部署...

微软、辉达扩大投资Anthropic Azure云端协议规模达300亿美元

微软、辉达扩大投资Anthropic Azure云端协议规模达300亿美元
anthropic宣布将采购价值300亿美元的微软azure云端运算资源,并与微软及辉达(nvidia)正式启动新一轮战略合作,进一步强化其ai基础设施布局。 根据微软官方部落格公布的信息,Anthropic未来将在Azure平台上大规模部署其Claude系列AI模型,并可使用高达1吉瓦(gigawatt)的运算能力。此举将使微软的企业客户能够直接在Azure上接入并使用Claude Sonnet 4.5、Claude Opus 4.1以及Claude Haiku 4.5等核...

比对手更持久!苹果首款摺叠机传搭载史上最大电池 容量上看5800mAh

比对手更持久!苹果首款摺叠机传搭载史上最大电池 容量上看5800mAh
在科技巨头竞相投入摺叠装置市场之际,苹果(apple)预计将于明年推出首款摺叠式iphone,儘管外界对于其书本式设计与镜头配置已有多番揣测,但关于其续航表现,特别是在苹果近期追求轻薄化的趋势下,仍是市场关注的焦点。 根据韩国 Naver 部落格爆料帐号「yeux1122」彙整的最新消息指出,苹果目前正在测试容量介于 5,400mAh 至 5,800mAh 之间的电池。若此数据属实,这将创下所有现行及历代 iPhone 机种的最大电池容量纪录。作为对照,即将推...

欧盟拟终结困扰用户多年的网站“Cookie 弹窗噩梦”

欧盟拟终结困扰用户多年的网站“Cookie 弹窗噩梦”
11 月 19 日消息,自 2018 年推出以来,欧盟的 cookie 同意政策一直是欧洲网络浏览中一个既烦人又无法回避的部分。然而,这场“cookie 噩梦”即将终结,欧盟委员会今日宣布了一项重大的拟议改革,有望彻底改善这一状况。 根据新方案,欧洲用户今后无需再为访问的每个网站单独点击“接受”或“拒绝”Cookie 弹窗;欧盟正着手制定新规,允许用户直接在浏览器层面统一设置其 Cookie 偏好。“用户可集中设定其隐私偏好,例如通过浏览器,而网站必须予以尊重,”欧盟方面...

MiroThinker v1.0 发布,开源 Agentic “深度研究”模型

MiroThinker v1.0 发布,开源 Agentic “深度研究”模型
mirothinker 是一款开源的智能代理式“深度研究(deep research)”模型,专注于增强工具辅助下的推理与信息检索能力,适用于跨领域的复杂现实世界研究任务。 MiroThinker v1.0 正式上线,首次提出“深度交互Scaling”理念——告别单纯追求参数规模,转而让智能体通过“试错+反思”在环境中自主探索,高度复现人类解决复杂问题的思维过程。 关键进展 支持 256K 超长上下文与高达 600 轮的工具交互 在 BrowseComp 测...

蚂蚁开源高性能权重交换框架 Awex,支持万亿参数强化学习

蚂蚁开源高性能权重交换框架 Awex,支持万亿参数强化学习
蚂蚁集团宣布开源高性能权重交换框架 awex(asystem weight exchange framework),实现了在数千卡 gpu 集群上 5~10 秒内完成万亿参数级别的权重同步。 在千卡规模的集群上,Awex 使用 NCCL 传输数据可以在一秒内完成 10B 规模的模型权限交换,二十秒内完成 1T规模的模型权重交换,使用 RDMA 进行传输,1T 模型权重交换耗时可以进一步缩短到六秒钟。 据介绍,Awex 是为极致性能打造的训练推理引擎权重同步框架,解决...

Apple Watch变革期拉长?传重大设计更新将延至2028年

Apple Watch变革期拉长?传重大设计更新将延至2028年
在苹果(apple)于 2024 年对 apple watch 进行最近一次重大硬体重新设计之后,市场对于下一次大规模外观变革的期待可能需要延后。根据最新的爆料消息指出,apple watch 下一次的设计更新可能要等到 2028 年才会发生。 在中国社群媒体微博上,爆料帐号 Instant Digital 週日发文简短提及 Apple Watch 系列的计画。该爆料者表示,该系列产品线「很可能在明年」(意指 2026 年)将依照其惯常时程推出新品。 然而,对于 2027...

NEX 发布:下一代能动性模型体系与开源生态

NEX 发布:下一代能动性模型体系与开源生态
上海创智学院联合上海奇绩智峰、模思智能、跨赴科技等机构,正式推出全新一代能动性模型体系与开源生态——nex。 该项目致力于打造可持续进化的能动性闭环开源平台,通过关键技术突破推动产业智能化升级,加速迈入AI主动行为的新时代。 作为融合模型架构、训练数据、Agent开发框架及底层基础设施代码的全栈式AI Agent解决方案,Nex旨在显著降低AI智能体的研发与应用门槛,为学术研究者和产业开发者提供高性能、高可靠性、低成本的“即拿即用”能动系统,助力AI能动能力快速融入多样化的...

Gitee AI 队友新升级:PR 审查更智能,安全治理更灵活,个人用户也能用!

Gitee AI 队友新升级:PR 审查更智能,安全治理更灵活,个人用户也能用!
在 ai 驱动的开发协作迈向自动化与智能化新纪元的当下,gitee ai 队友也在持续升级,并于近期推出了一系列重磅新特性。 1. 全面开放个人与组织使用权限 为更好地服务多样化用户群体,现在无论是个人开发者,还是企业、组织用户,均可开通并使用 AI 队友功能。 个人、团队、机构皆可轻松接入 欢迎前往https://www.php.cn/link/d0509bdcf257b525756b981d54351da6申请开通,立即体验智能协作的高效便捷。 2. PR 审查能力全面...

MOSS-Speech 发布:真正的语音到语音大模型

MOSS-Speech 发布:真正的语音到语音大模型
国内AI领域最具影响力的学者之一——复旦大学计算机学院邱锡鹏教授及其团队学生近期推出了全新语音大模型 MOSS-Speech,宣称实现了真正意义上的语音到语音(Speech-to-Speech)交互。 据项目官方介绍,该模型标志着中国在语音人工智能领域迈入“端到端语音交互”的新纪元。与传统依赖“语音识别→文本处理→语音合成”三段式流程不同,MOSS-Speech 能直接从输入语音理解语义,并以语音形式生成回应,全程无需转化为文本中转。这一架构使得系统在回应过程中可保留并传递...