首页>新闻>苹果资讯>苹果推出 300 亿参数 MM1 多模态 AI 大模型,拥有图像识别和自然语言推理能力

苹果推出 300 亿参数 MM1 多模态 AI 大模型,拥有图像识别和自然语言推理能力

2024-03-18
1068
来源:爱思助手

近日,苹果公司旗下研究团队在 ArXiv 中公布了一篇名为《MM1:Methods, Analysis & Insights from Multimodal LLM Pre-training》的论文,介绍了一款 “MM1”多模态大模型,该模型提供 30 亿、70 亿、300 亿三种参数规模,拥有图像识别和自然语言推理能力。


苹果推出 300 亿参数 MM1 多模态 AI 大模型,拥有图像识别和自然语言推理能力


苹果研究团队相关论文主要是利用 MM1 模型做实验,通过控制各种变量,找出影响模型效果的关键因素。研究表明,图像分辨率和图像标记数量对模型性能影响较大,视觉语言连接器对模型的影响较小,不同类型的预训练数据对模型的性能有不同的影响。

苹果推出 300 亿参数 MM1 多模态 AI 大模型,拥有图像识别和自然语言推理能力

苹果推出 300 亿参数 MM1 多模态 AI 大模型,拥有图像识别和自然语言推理能力


据介绍,研究团队首先在模型架构决策和预训练数据上进行小规模消融实验。之后利用混合专家(Mixture of Experts)架构及一种名为 Top-2 Gating 的方法构建了 MM1 模型,号称不仅在预训练指标中实现了最好的性能表现,在一系列已有多模态基准上监督微调后也能保持有竞争力的性能。


研究人员对“MM1”模型进行了测试,号称 MM1-3B-Chat 和 MM1-7B-Chat 优于市面上绝大多数相同规模的模型。MM1-3B-Chat 和 MM1-7B-Chat 在 VQAv2、TextVQA、ScienceQA、MMBench、MMMU 和 MathVista 中表现尤为突出,但是整体表现不如谷歌的 Gemini 和 OpenAI 的 GPT-4V。


苹果推出 300 亿参数 MM1 多模态 AI 大模型,拥有图像识别和自然语言推理能力


特别声明:本文版权归文章作者所有,仅代表作者观点,不代表爱思助手观点和立场。本文为第三方用户上传,仅用于学习和交流,不用于商业用途,如文中的内容、图片、音频、视频等存在第三方的知识产权,请及时联系我们删除。

标签: AI 苹果
相关文章
  • 苹果布局本地 AI 开启“买买买”模式,大量收购AI领域初创公司

    苹果公司这是想继续通过“买买买”的方法来扩充其 AI 领域实力吗?

  • 苹果发力人工智能:2 亿美元收初创公司 Xnor.ai

    据熟知内情的消息人士透露,苹果公司收购了西雅图初创公司Xnor.ai,后者是一家专业致力于研究设备人工智能(AI)技术的公司。消息人士称,苹果公司以大约2亿美元的价格收购了Xnor.ai。虽然苹果公司和Xnor.ai均拒绝就此消息置评,但Xnor.ai网站基本上已经下线。Xnor.ai的技术能让公司在智能手机和其他便携式设备上本地执行深度学习算法,而不是要求这些计算在云服务中执行。Xnor承诺完全保密数据,且内存负载和能量需求较低。鉴于苹...

  • 消息称苹果将斥资 47.5 亿美元采购 2 万台 AI 服务器

    集邦咨询最新报告显示,超微电脑正在积极拓展苹果公司 AI 服务器订单,这有助于苹果在 AI 领域的布局和发展。据分析师郭明錤透露,苹果预计将在 2024 年斥资 47.5 亿美元购买超过 2 万台服务器以支持其 AI 技术,这一投入远高于 2023 年的 6.2 亿美元。苹果 CEO 蒂姆·库克表示,公司计划 2024 年在生成式 AI 领域“开辟新天地”(break new ground),并强调这将为用户带来变革性的机遇。业界预计,苹果将在今年 6 月的 WWDC 2024 ...

  • 苹果通过一系列收购和招聘布局 AI 技术

    英国《金融时报》报道,为进行人工智能技术的研发,苹果公司在进行一系列收购和招聘。苹果公司一直在致力于解决如何在移动设备上运行人工智能这一技术难题。为此,他们收购了多家 AI 初创公司,最近一次是在去年年初收购了加州公司 WaveOne。该公司提供基于 AI 的视频压缩技术。摩根士丹利最近的研究报告指出,苹果公司近一半的 AI 招聘岗位提到了“深度学习”这一关键词,而深度学习正是生成式 AI 的核心算法之一。早前消息表明,...

  • 郭明錤:预估苹果明年将斥资 47.5 亿美元采购 2 万台 AI 服务器

    郭明錤近日发布市场研究简报,预估苹果公司在 2023 年将采购 2000-3000 台 AI 服务器,在全球 AI 服务器出货量中占比为 1.3%;2024 年将采购 1.8 万-2 万台 AI 服务器,占比达到 5%。郭明錤认为,苹果采购的 AI 服务器主要为最常见、用于训练和推理生成式 AI 的英伟达 HGX H100 8-GPU,明年第 4 季度的采购芯片会加入 B100。H100 一片以 25 万美元(当前约 183 万元人民币)的价格进行计算,预估苹果 2023 年在 AI 服务器上的采购...