新闻中心
这个消息一夜间在(原Twitter)上引来大批歪果网友关注,相当炸裂。画风是酱婶儿的:
毕竟,这次百度带来的不仅有半个多月前承诺的新一代原生多模态基础大模型文心大模型4.5,能力更全⾯的深度思考模型文心大模型X1也无预告突然同步上线。
看到新模型性能和这打了骨折的价格,歪果网友们更加坐不住,手动艾特奥特曼、OpenAI。
新模型发布,量子位童鞋按老规矩第一时间深入实测了一波,具体来看效果如何~
据介绍,文心X1是首个自主运用工具的深度思考模型,不仅理解、规划、反思、进化能力更强,且支持多模态。
而文心4.5,是百度自主研发的新一代原生多模态基础大模型,通过多模态联合建模实现协同优化,在图片、音频、视频等多模态理解方面都很给力。
根据模型特点,我们对文心X1重点测试了中文知识问答、文学创作、工具调用和逻辑推理等能力;对文心4.5考验其图片理解、视频分析能力。
有兄弟二人,哥哥上午说实话,下午说谎话,而弟弟正好相反,上午说谎话,一到下午就说实话。一个人问:你们谁是哥哥?胖子说:我是哥哥。瘦子说:我是哥哥。那个人又问:现在几点了?胖子说:快到中午了。瘦子说:已经过中午了。请问:现在是上午还是下午?谁是哥哥?
文心X1下场解题,推理过程一目了然,第一次尝试就成功了(答案:现在是上午,胖子是哥哥):
下面这题传说是爱因斯坦曾提出的一道高难度逻辑推理题,据说世界上只有2%的人能够推出正确答案。
随着题目难度提升,它的推理思考过程明显变长,一番详细分析后,不仅给出了正确答案“德国人养鱼”,还成功正确推导出德国人住在绿色房子里等更多信息。
逻辑推理强只是文心X1的一个方面,与其它推理模型相比,文心X1更大的特色在于能够灵活调用各种工具
目前,X1已⽀持⾼级搜索、⽂档问答、图⽚理解、AI绘图、代码解释器、⽹⻚链接读取、 TreeMind树图、检索、商业信息查询、加盟信息查询等诸多⼯具。
比如,当你询问《红楼梦》中主要人物关系时,它能自动调用高级联网和代码解释器,帮你绘制图表、生成配图。
随手上传一种没见过的蔬菜,它除了能正确回答出菜名,还自主补充了其营养价值、烹饪方法等更多信息,包括中药养生价值、储存方法这种细节。
要是让它写一份“五月新疆伊犁深度漫游指南”,从交通、住宿到每天具体行程安排和预算,它都能帮你一并搞定。
最后关于文心大模型X1,还有个特点值得一提,它的文本创作不仅观点鲜明,创意写作的想象力也让人眼前一亮。
比如让它用“红楼体”分析“高山和大树谁更自由”,它还真编出了一个有模有样的情景,belike:
文心4.5在多模态方面就更全能了,支持文档、图片理解,还能搞定音频、视频分析
对于视频,文心4.5能准确识别视频中的场景、画面、物品等信息。目前支持单个最大20MB视频分析。
文心大模型X1作为首个自主运用工具的深度思考模型,不仅在性能上对标DeepSeek-R1,具备“长思维链”,擅长中文知识问答、文学创作、逻辑推理等,而且增加了多模态能力和多工具调用,能理解和生成图片,还能调用工具生成代码、图表等丰富内容。
其一,递进式强化学习训练方法。即将学习任务分解成多个子任务,让AI在难度相对较低或更简单的阶段中先学习到一定的技能或知识,再逐步提高任务难度,或者再将这些技能组合起来,以应对更复杂、更具挑战性的环境。
X1创新性地应用了递进式强化学习方法,在创作、搜索、工具调用、推理等场景中全面提升模型的综合应用能力。
其二,基于思维链和行动链的端到端训练。针对深度搜索、工具调用等场景,根据结果反馈进行端到端模型训练,能显著提升训练效果。
研发人员为X1建立了统一的奖励体系,融合多种类型的奖励机制,为模型训练提供了更加鲁棒的反馈。
文心大模型4.5方面,值得关注的是“原生多模态”。相较于非原生多模态模型,原生模型联合预训练能实现更深层次的模态融合,实现更强的模态交互、理解能力。
FlashMask动态注意力掩码:加速大模型灵活注意力掩码计算,能有效提升长序列建模能力和训练效率,优化长文处理能力和多轮交互表现。多模态异构专家扩展技术:根据模态特点构建模态异构专家,结合自适应模态感知损失函数,解决不同模态梯度不均衡问题,提升多模态融合能力。时空维度表征压缩技术:在时空维度对图片和视频的语义表征进行高效压缩,大幅提升多模态数据训练效率,增强了从长视频中吸取世界知识的能力。基于知识点的大规模数据构建技术:基于知识分级采样、数据压缩与融合、稀缺知识点定向合成技术,构建高知识密度预训练数据,提升模型学习效率,大幅降低模型幻觉。基于自反馈的Post-training技术:融合多种评价方式的自反馈迭代式后训练技术,全面提升强化学习稳定性和鲁棒性,大幅提升预训练模型对齐人类意图能力。
另外,为了减少模型幻觉,文心两大新模型还有百度RAG、iRAG技术的加持。
RAG方面,百度研发了“理解-检索-生成”协同优化的检索增强技术,能够生成准确率更高、时效性更好的答案。
iRAG是百度自研的检索增强文生图技术,将百度搜索的亿级图片资源跟强大的基础模型能力相结合,能生成远胜于文生图原生系统的超真实图片。
正如开头所言,文心大模型两大新模型上线,迅速引爆了海内外大模型关注者的测评热情,影响力可见一斑。
△文心大模型时间线年,文心大模型日均调用量实现了持续高速增长。根据最新百度2024年第四季度及全年财报,与2023年同期的5000万次调用量相比,文心大模型日均调用量一年增长33倍,达到了16.5亿。
在此背后,百度一直坚持压强式、马拉松式的研发投入。近十年累计研发投入超过1800亿元。
25年来,我们始终走在技术的最前沿,始终相信技术创新才是百度的核心竞争力,我们多年来一直把超过收入20%的资金投入到研发上,并且不遗余力地尝试把最前沿的技术产品化、商业化,让更多的人从中受益,因为我们相信只有规模化的应用才能让技术发挥它的价值。
目前,百度已经实现芯片层、框架层、模型层和应用层的全栈自研布局。此番,这种自研技术储备也在模型API价格上体现出了优势——
2025年,基础模型在被预言“碰壁”之后,却又迎来一波更新的新高潮。而随着模型越来越强,同时又越来越便宜,大模型应用的爆发,已经蓄势待发。
03月07日,纪检监察机关推动深化治理餐饮浪费 纠歪风树新风,上海咨询师梁伊娃(Eva Liang,音译)曾经在伦敦生活,并在此期间几乎走遍了所有的西方国家。她说,中东是现在最吸引她的旅游目的地,疫情结束后,她已经去过伊朗、约旦、伊拉克、黎巴嫩和叙利亚。,OBET。03月07日,2024黄埔马拉松赛将于12月22日广州开跑,
03月07日,“二月二龙抬头” 来江西滕王阁“剃龙头”,“族主将祖器带来了!”,比分网,vwin德赢体育APP,新宝5注册登录网网址。
这是一个十四五岁的少年,身材高挑,发丝黑亮而柔顺,皮肤白皙,整个人很俊美,只是眼睛很冷,略微破坏了美感,令人感觉到了一种野性与残酷。
03月07日,华北、黄淮等地旱情持续发展 国家防总启动抗旱四级应急响应,“这就是虚神界的神秘所在,也是价值所在,精神在此磨砺,回归现实世界后,会将所有感悟都带给肉身,共同蜕变,就如同真身在此地修行一般!”柳树指点迷津。,正规真人实体在线现场平台,娱乐宝官网,搏贝棋牌官网。
03月07日,中国第40次南极考察 “雪龙2”号完成大洋综合调查及走航作业,
“狈村的人,你们不要逼我!”小不点眼睛红了,因为有一些铁箭射在了青鳞鹰的伤口上。
,万利官网登录,亚星官网登录入口,华体汇体育app下载官网。03月07日,河南“五一”揽客超6168万人次 文博场馆人气旺,“你再折腾的话,我真的要吃掉你!”小不点很认真的警告道。,必发在线开户,ld体育官网,BOB买球。
【编造涉汛谣言扰乱秩序 虚构社会事件混淆视听——中国互联网联合辟谣平台2024年7月辟谣榜综述】