DeepSeek深夜发布多模态大模型 图像性能跑分力压OpenAI竞品

  来源:财联社   就在华尔街周一紧张评估“DeepSeek风暴”之际,这家中国公司再度甩出新品:在图像生成基准测试中超越OpenAI“文生图”模型DALL-E 3的多模态大...

  来源:财联社

  就在华尔街周一紧张评估“DeepSeek风暴”之际,这家中国公司再度甩出新品:在图像生成基准测试中超越OpenAI“文生图”模型DALL-E 3的多模态大模型Janus-Pro,同样也是开源的。

DeepSeek深夜发布多模态大模型 图像性能跑分力压OpenAI竞品

  除夕凌晨钟声敲响前不久,DeepSeek工程师们在“抱抱脸”平台上传了Janus Pro 7B和1.5B模型。这俩模型是对去年10月发布的Janus模型的升级。

DeepSeek深夜发布多模态大模型 图像性能跑分力压OpenAI竞品

  15亿和70亿的参数量,意味着这两个模型具备在消费级电脑上本地运行的潜力。与R1一样,Janus Pro采用MIT许可证,在商用方面没有限制。

  据DeepSeek介绍,Janus-Pro是一个新颖的自回归框架,统一了多模态理解和生成。通过将视觉编码分离为“理解”和“生成”两条路径,同时仍采用单一的Transformer架构进行处理,解决了以往方法的局限性。这种分离不仅缓解了视觉编码器在理解和生成中的角色冲突,还提升了框架的灵活性。

DeepSeek深夜发布多模态大模型 图像性能跑分力压OpenAI竞品

  从报告给出的“跑分”数据来看,在部分文生图基准测试中,Janus-Pro 70亿参数模型表现好于OpenAI的DALL-E 3、Stability AI的Stable Diffusion 3-Meduim等。

DeepSeek深夜发布多模态大模型 图像性能跑分力压OpenAI竞品

  虽然DALL-E 3是OpenAI在2023年发布的一款“老模型”,同时Janus Pro目前只能分析和生成规格较小的图像(384 x 384)。DeepSeek在如此紧凑的模型尺寸中依然展现了令人印象深刻的性能。

  技术报告显示,在视觉生成方面,Janus-Pro通过添加7200万张高质量合成图像,使得在统一预训练阶段真实数据与合成数据的比例达到1:1,实现“更具视觉吸引力和稳定性的图像输出”。在多模态理解的训练数据方面,新模型参考了DeepSeek VL2并增加了大约9000万个样本。

  作为一个多模态模型,Janus-Pro不仅可以“文生图”,同样也能对图片进行描述,识别地标景点(例如杭州的西湖),识别图像中的文字,并能对图片中的知识(例如下图中的“猫和老鼠”蛋糕)进行介绍。

DeepSeek深夜发布多模态大模型 图像性能跑分力压OpenAI竞品

DeepSeek深夜发布多模态大模型 图像性能跑分力压OpenAI竞品

  公司也在报告中,给出了更多图像生成的案例。

DeepSeek深夜发布多模态大模型 图像性能跑分力压OpenAI竞品

本文来自作者[admin]投稿,不代表吹吹讯立场,如若转载,请注明出处:https://cc199.top/bm/202501_2039.html

(29)

文章推荐

  • 关联电缆故障?美媒曝洛杉矶“伊顿”山火可能起火点

      美国《纽约时报》26日报道,虽然调查尚无定论,但相关视频、照片以及目击者证词均显示,本月初以来肆虐加利福尼亚州洛杉矶地区东部的“伊顿”山火的起火点可能位于伊顿峡谷几座高压电塔下。  这几座电塔靠近圣加布里埃尔山。1月7日傍晚,伊顿峡谷附近一名居民看到电塔闪现明亮白光,随后塔基处燃起小火。另一

    2025年01月27日
    29
  • 多家打赢“翻身仗”!风险警示公司业绩预告扫描

      炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!  来源:证券日报之声  本报记者吴晓璐  上市公司2024年业绩预告披露如火如荼。据Wind数据统计,截至1月27日,A股已经有超过2700家公司预告了2024年业绩。  与此同时,部分风险警示公司(含ST、*S

    2025年01月28日
    31
  • 路特斯科技盘中异动 快速下跌5.17%报3.03美元

    北京时间2025年01月28日03时38分,路特斯科技(LOT.us)股票出现波动,股价大幅跳水5.17%。截至发稿,该股报3.03美元/股,成交量7.7746万股,换手率0.01%,振幅5.33%。最近的财报数据显示,该股实现营业收入2.57亿美元,净利润-2.08亿美元,每股收益-0.31美元

    2025年01月28日
    25
  • e家快服盘中异动 急速拉升5.07%报0.893美元

    北京时间2025年01月30日03时41分,e家快服(EJH.us)股票出现波动,股价大幅拉升5.07%。截至发稿,该股报0.893美元/股,成交量62.1269万股,换手率7.15%,振幅9.49%。最近的财报数据显示,该股实现营业收入50.69百万美元,净利润-19.39百万美元,每股收益-2

    2025年01月30日
    31
  • 特朗普签署行政令 制裁国际刑事法院

      当地时间2月6日,总台记者获悉,美国总统特朗普签署一项行政命令,制裁国际刑事法院(ICC)。  据美国媒体报道,特朗普指责国际刑事法院不恰当地针对美国和以色列。(总台记者张颖哲)

    2025年02月07日
    23
  • DeepSeek概念股维持强势 美格智能6连板

    专题:科技类资产价值正在重估机构称行情仍将继续演绎  2月10日消息,美格智能6连板,青云科技、杭钢股份、奥瑞德涨停,优刻得、并行科技、万顺新材涨超10%。  消息面上,QuestMobile数据显示,DeepSeek在1月28日的日活跃用户数首次超越豆包,随后在2月1日突破3000万大关,

    2025年02月10日
    28
  • 缅甸佤邦地区发布办理开采、选厂、探矿许可证的公告,供给侧修复预期,锡价夜盘大幅回落

      来源:广发期货研究  证监许可【2011】1292号  纪元菲 Z0013180  2025年2月27日星期四  行情导读:  截至2月26日夜盘收盘,沪锡主力合约下跌2.44%至256820元/吨。  驱动分析一:缅甸地区发布办理开采、选厂、探矿许可证的公告,

    2025年02月27日
    15
  • 分析师:预计美国还将对欧洲进口商品征收关税

      美国对加拿大和墨西哥的关税于周二生效。瑞讯银行分析师IpekOzkardeskaya在一份报告中称,预计在可预见的未来,美国还将对欧洲进口商品征收25%的关税。受此影响,欧股料将低开。  Ozkardeskaya在报告中写道:“因此,自周一以来市场一直处于紧张状态。”  与此同时,在特朗普

    2025年03月04日
    14
  • 七座旅行车七座旅行车有哪几款

    商务车奔驰商务车1、奔驰八座商务车目前只有一款,即威霆。以下是关于奔驰威霆八座商务车的具体信息:车型定位:威霆是一款中大型4门8座MPV,非常适合商务用途。车身尺寸:长度为5370mm、宽度为1928mm、高度为1880mm,轴距达到3430mm,确保了宽敞的内部空间。2、奔驰威霆9座商务车的售价

    2025年04月09日
    3
  • 一席之地的意思(一课译词一席之地)

    [Photo/Pexels]“一席之地”,汉语成语,意思是放一个席位的地方,比喻极小的一块地方,现在通常指应有的一个位置。可以翻译为“aproperplace/standing或aniche”。例句:她在这个领域取得了一席之地。Shehascarvedoutanicheforhe

    2025年04月14日
    6

发表回复

本站作者后才能评论

评论列表(4条)

  • admin
    admin 2025年01月28日

    我是吹吹讯的签约作者“admin”!

  • admin
    admin 2025年01月28日

    希望本篇文章《DeepSeek深夜发布多模态大模型 图像性能跑分力压OpenAI竞品》能对你有所帮助!

  • admin
    admin 2025年01月28日

    本站[吹吹讯]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • admin
    admin 2025年01月28日

    本文概览:  来源:财联社   就在华尔街周一紧张评估“DeepSeek风暴”之际,这家中国公司再度甩出新品:在图像生成基准测试中超越OpenAI“文生图”模型DALL-E 3的多模态大...

    联系我们

    邮件:吹吹讯@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们