多模态模型

GPT-4o图像生成功能上线今起免费用,我们和国内文生图PK了一下

3月25日消息,OpenAI创始人兼CEO萨姆·阿尔特曼直播发布了GPT-4o图像生成功能,作为多模态模型的GPT-4o补齐了图片生成这一重要拼图。GPT-4o图像生成可以遵循指令生成更准确的图像,OpenAI还为其挂载了固有知识库,可以根据知识库或上下文帮用户生成、编辑图像。今天起,GPT-4o图像生成已经作为ChatGPT中的默认图像生成器向Plus、Pro、Team和免费用户陆续推出。现

AI日报:淘宝全平台启动AI假图治理;OpenAI官宣支持MCP协议;阿里开源全模态模型Qwen2.5-Omni

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、阿里通义千问开源发布新一代端到端多模态模型Qwen2.5-Omni阿里云通义千问团队推出了Qwen2.5-Omni,这是一个新一代的多模态旗舰模型,旨在实现文本、图像、音频和

GPT-4o多模态生图正式上线 - 用嘴改图,此为王道。

声明:本文来自于微信公众号数字生命卡兹克,作者:数字生命卡兹克,授权站长之家转载发布。今天日子是2025年3月26日。OpenAI又是临时发了一个直播预告。凌晨2点要发东西。我:??????????当熬到2点看完了直播以后,我人都恍惚了,我怎么好像去年5月的时候,见过这个东西?怎么感觉特娘的我时间穿越回到1年前了?翻了一下,果然。。。2024年5月13号,GPT4o正式发布,那时候的blog里

OpenAI发布两款多模态推理模型o4-mini、满血版o3

在今天凌晨1点的技术直播中,OpenAI正式推出其最新且最强大的多模态模型o4-mini和满血版o3。这两款模型具备独特优势,不仅能同时处理文本、图像和音频,还可作为智能体自动调用网络搜索、图像生成、代码解析等工具,并且拥有深度思考模式,能在思维链中思考图像。OpenAI公布的测试数据显示,o4-mini表现卓越。在AIME2024和2025测试中,其准确率分别达到93.4%和92.7%,甚至超越

AI日报:字节发布豆包1.5深度思考模型;微信首个AI助手 “元宝” 上线;OpenAI发布o4-mini、满血版o3

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、OpenAI发布两款多模态推理模型o4-mini、满血版o3OpenAI在技术直播中推出了其最新的多模态模型o4-mini和满血版o3,这两款模型具备同时处理文本、图像和音频

谷歌AI Studio重磅更新:全新Gemini-2.0-flash-live-001正式上线

近日,谷歌人工智能开发平台Google AI Studio迎来了一次重大更新,全新的“Gemini-2.0-flash-live-001”模型正式亮相,并即刻取代了此前处于实验阶段的Gemini2.0Flash Experimental版本。这一消息迅速在全球开发者社区引发热议。据悉,这一新模型作为Gemini系列Live API的公开预览版本,已正式启用计费功能,标志着谷歌在实时AI交互技术上的