苹果发布 Apple Intelligence 基础模型技术报告 - 夸克网盘 资源封面图

苹果发布 Apple Intelligence 基础模型技术报告

2026/01/31 11:57 0次浏览
AI 苹果 报告
报告公布两款多语言、多模态基础模型:一款约 3 B 参数的 本地模型(针对 Apple Silicon 优化),和一款基于 Parallel‑Track Mixture‑of‑Experts(PT‑MoE) 的 服务器模型,部署于 Private Cloud Compute。 本地模型通过 KV‑Cache Sharing 把 37.5 % 的层去掉 KV 投影并与前层共享缓存,令 TTFT 缩短约 37 %。 服务器模型将解码器拆分为并行“轨道”,每 N 层同步一次,最多可削减 87.5 % 同步开销;再叠加 MoE 层提高稀疏计算效率。 数据来自 Applebot 负责任抓取、授权语料与高质量合成内容,规模达 14 T tokens;视觉分支预训练于 6 B+ 图文对后与 LLM 联合训练,可处理图像‑文本混合输入。

网盘资源 (1)

  • 夸克网盘
    未检测

本站内容由网络爬虫自动抓取。本站不储存、复制、传播任何文件,仅作个人公益学习,请在获取后24小内删除!!!

老九网盘链接管理系统| v 1.5.0