第一影视网

展开菜单

谷歌推出 AP2 协议,携手 PayPal 开启 AI 支付新时代

谷歌推出 AP2 协议,携手 PayPal 开启 AI 支付新时代
随着AI助手的能力不断提升,它们已能协助用户完成诸如预订航班、抢购演出票务等复杂操作。然而,当人工智能代理代替用户发起交易时,如何保障行为的合法性与安全性成为亟待解决的问题。为此,谷歌推出了全新的智能体支付协议 AP2(Agent Payments Protocol),并宣布将其开源,旨在为AI驱动的支付流程构建一个安全、透明且可信赖的基础框架。 这一协议的发布也标志着谷歌与全球领先的支付平台 PayPal 正式建立长期战略合作关系。双方将携手推进AI在商业和支付场景中的落...

AI视频再突破!Luma Ray 3推理模型上线,一键“思考”生成4K HDR大片

AI视频再突破!Luma Ray 3推理模型上线,一键“思考”生成4K HDR大片
视频生成ai迎来革命性突破。luma ai正式推出其最新力作——ray3模型,被誉为全球首款“具备推理能力的视频生成ai”,凭借内嵌的多模态推理系统,彻底重塑了ai在动态影像创作中的角色与边界。 Ray3的最大亮点在于其类人化的智能推理机制。与以往依赖随机采样的生成方式不同,该模型能够真正理解用户指令,像专业创意人员一样进行场景规划、逻辑推演和自我校验。它会先在内部构建虚拟故事板,经过多轮优化迭代后再输出最终视频,这种模拟动画师工作流的设计极大提升了内容的连贯性与艺术表现力。...

​阿里云推出全球首个全模态 AI 模型 Qwen3-Omni,实现文本、图像、音频与视频的统一处理

​阿里云推出全球首个全模态 AI 模型 Qwen3-Omni,实现文本、图像、音频与视频的统一处理
阿里云正式推出 qwen3-omni,宣告全球首个原生端到端全模态 ai 模型的诞生,该模型现已全面开源。qwen3-omni 能够无缝处理文本、图像、音频和视频等多种输入形式,并支持实时流式输出,无论是通过文字还是自然语音交互,均可实现快速响应与高效反馈。 在多项跨模态任务中,Qwen3-Omni 展现出了卓越的性能表现。依托早期以文本为中心的预训练策略以及混合多模态联合训练机制,模型在保持文本与图像处理高水准的同时,在音频和视频理解方面尤为突出。根据涵盖36项音频与视频...

面壁智能推出 VoxCPM:新一代高拟真语音生成模型

面壁智能推出 VoxCPM:新一代高拟真语音生成模型
在语音合成技术快速发展的背景下,面壁智能与清华大学深圳国际研究生院人机语音交互实验室(thuhcsi)近日联合发布了一款新型语音生成模型 ——voxcpm。这款模型以0.5b 的参数尺寸,致力于为用户提供高质量、自然的语音合成体验。 VoxCPM 的推出标志着高拟真语音生成领域的又一里程碑。该模型在自然度、音色相似度及韵律表现力等关键指标上,均达到了行业领先水平。通过零样本声音克隆技术,VoxCPM 能够以极少的数据,生成用户独特的声音,从而实现个性化的语音合成。这一技术进步...

告别P图烦恼!阿里Qwen-Image多图像编辑功能一键合成专业级广告大片

告别P图烦恼!阿里Qwen-Image多图像编辑功能一键合成专业级广告大片
aibase报道 - 阿里巴巴旗下ai图像处理工具qwen-image近期推出重磅功能更新,最受关注的是全新上线的多图编辑能力,为电商与数字营销领域提供了颠覆性的内容创作方案。 多场景融合编辑实现突破 最新版本Qwen-Image-Edit-2509现已支持多种图像协同编辑模式,涵盖人物+人物、人物+商品、人物+背景等多样化组合方式。用户可便捷地合成合影、构建场景画面或打造高水准的产品宣传图,全面适配电商平台展示与广告推广的复杂需求。 根据官方发布的实际演示效果,该工具在图像...

ChatGPT 曝出“ShadowLeak”漏洞:黑客可借“深度研究”模式无痕窃取 Gmail 账户信息

ChatGPT 曝出“ShadowLeak”漏洞:黑客可借“深度研究”模式无痕窃取 Gmail 账户信息
【AIbase 报道】根据 Radware 安全团队的最新发现,人工智能对话平台 ChatGPT 所搭载的“深度研究”功能曾暴露出一个高危漏洞,代号为“ShadowLeak”。该漏洞可被恶意利用,导致用户的 Gmail 账户信息(如姓名、地址等敏感数据)在未授权且无感知的情况下被窃取。 此次攻击的独特之处在于,整个过程完全在 OpenAI 的云端环境中进行,不留外部入侵痕迹,同时能有效规避本地防火墙和其他终端防护机制。研究人员形象地将这种被操控的 AI 代理称为“由外部驱动...

中科院推出类脑大模型 SpikingBrain:以2% 数据实现百倍速度突破

中科院推出类脑大模型 SpikingBrain:以2% 数据实现百倍速度突破
近日,中国科学院自动化研究所李国齐与徐波领衔的科研团队正式推出全球首个大规模类脑脉冲大模型——spikingbrain1.0。该模型在处理超长文本方面表现卓越,能够以超过现有主流 transformer 模型百余倍的速度完成400万 token 的文本处理任务,同时仅需其2%的训练数据量。 目前广泛应用的大语言模型,如GPT系列,大多依赖于Transformer架构。尽管其自注意力机制具备强大的语义捕捉能力,但随之而来的高计算复杂度成为显著瓶颈。当输入文本长度增加时,计算开...

​阿里云推出新一代动作生成模型 Wan2.2-Animate,全面开源!

​阿里云推出新一代动作生成模型 Wan2.2-Animate,全面开源!
近日,阿里云重磅宣布通义万相全新动作生成模型 wan2.2-animate 正式开源,此举有望为短视频创作、舞蹈模板生成以及动漫制作等行业注入全新动力。开发者和创作者可通过 github、huggingface 及魔搭社区免费获取该模型及其完整代码。同时,用户还能通过阿里云百炼平台调用其 api,或直接访问通义万相官网在线体验模型的强大能力。 Wan2.2-Animate 是在前代模型 Animate Anyone 的基础上实现全面进化的成果,在人物一致性、画面清晰度与动作...

通义万相全新动作生成模型Wan2.2-Animate正式开源

通义万相全新动作生成模型Wan2.2-Animate正式开源
2025年9月19日,阿里云正式宣布通义万相推出全新动作生成模型——wan2.2-animate,并全面开源。该模型可驱动人物、动漫形象及动物图片实现动态化,广泛适用于短视频创作、舞蹈模板生成、动画制作等场景。开发者和创作者可通过 github、huggingface 以及魔搭社区免费下载模型权重与代码,也可通过阿里云百炼平台调用 api,或直接在通义万相官网进行在线体验。 作为此前开源项目 Animate Anyone 的全面升级版本,Wan2.2-Animate 在角色一...

华为与浙大携手发布 DeepSeek-R1-Safe 大模型:AI安全与性能完美平衡

华为与浙大携手发布 DeepSeek-R1-Safe 大模型:AI安全与性能完美平衡
在刚刚落幕的华为全联接大会上,华为技术有限公司携手浙江大学共同发布了国内首款基于昇腾千卡算力平台打造的基础大模型——DeepSeek-R1-Safe。该模型聚焦当前人工智能领域中的安全与性能难题,标志着我国在AI安全技术研发方面迈出了关键一步。 ![图片](https://example.com/image1.jpg) 浙江大学计算机科学与技术学院院长任奎现场深入解读了该模型的技术亮点。他表示,DeepSeek-R1-Safe 采用了一套完整的安全后训练框架,涵盖高质量安...