AI热点 7小时前 188 阅读 0 评论

AI日报:智谱上线PPT生成功能AI Slides;可灵 AI 发布可图2.1模型

作者头像

AI技术专栏作家 | 发布了 246 篇文章

AI日报:智谱上线PPT生成功能AI Slides;可灵 AI 发布可图2.1模型
AI日报:智谱上线PPT生成功能AI Slides;可灵 AI 发布可图2.1模型

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、智谱上线了类似Manus的PPT生成功能AI Slides,免费使用无限制

智谱推出了全新的AI Slides功能,基于GLM-Experimental模型,能够根据用户提供的主题或文档快速生成高质量的PPT。该功能结构清晰、数据图表直观,并且完全免费,用户可通过chat.z.ai体验。

【AiBase提要:】

🌟 AI Slides可根据主题或文档快速生成高质量PPT。

📊 生成的PPT结构清晰,运用图表展示数据,便于理解。

💻 用户可在chat.z.ai免费体验AI Slides功能。

详情链接:https://chat.z.ai

2、可灵 AI 发布可图2.1模型:图像生成能力大幅提升,支持180种风格

可灵 AI 发布了新一代图像生成模型 "可图2.1",在指令遵循、人像美感和电影质感等方面有显著提升,并且具备强大的文字生成能力。新模型支持超过180种风格响应,为用户提供更丰富的创作选择。

image.png

【AiBase提要:】

🧪 新模型在复杂指令理解方面表现突出,能够精准生成高质量图像。

🎨 文字生成功能增强,支持180种风格响应,拓宽创作空间。

📈 可灵 AI 推出可图2.1模型,图像生成能力显著提升,用户可免费体验7天。

3、NVIDIA 推出 DiffusionRenderer:全新 AI 模型实现视频到可编辑的逼真3D 场景

NVIDIA 和其合作伙伴推出的 DiffusionRenderer 是一项突破性的技术,能够将视频生成与编辑结合,实现对3D场景的理解和操作。该模型通过神经逆渲染器和神经前向渲染器协同工作,提升了视频的真实感和适应性,并在多项任务中表现出色。

image.png

【AiBase提要:】

🎥 DiffusionRenderer 结合生成与编辑功能,为3D场景创作带来新可能。

🔄 神经逆渲染器和神经前向渲染器协同提升视频真实感和适应性。

🔧 实际应用包括动态光照、材料编辑和对象插入,助力创作者轻松进行视频创作。

详情链接:https://youtu.be/jvEdWKaPqkc

4、墨刀AI重磅上线:输入想法30秒生成高保真、可编辑原型

墨刀AI推出全新原型生成功能,用户只需30秒即可从想法生成高保真、可编辑的原型,支持多轮对话优化和局部修改,提升产品设计与验证效率。

image.png

【AiBase提要:】

🚀30秒内生成可编辑原型,支持多终端适配和多轮对话优化

🎨 支持多种图像输入,智能解析草图、线框图等生成界面

🔧 双模式编辑与自动生成文档,实现设计即代码,覆盖多场景

5、上传10张照片,AI秒变时尚大片!Higgsfield Soul ID火爆全球,颠覆你的数字自我

Soul ID是Higgsfield AI推出的一款革命性AI工具,能够通过上传10张以上个人照片生成高度个性化的虚拟形象。其核心功能包括真实感与多样性的完美融合、多样化风格预设以及自动提示词优化,为内容创作者和时尚博主提供了强大的创作工具。

image.png

【AiBase提要:】

📷 个性化训练:用户只需上传10张以上照片即可生成专属AI角色。

🎨 多样化风格预设:内置60多种高级风格预设,一键切换多种视觉语言。

💡 自动提示词优化:用户输入简单描述,AI即可自动优化生成条件,输出高质量图像。

详情链接:https://higgsfield.ai/

6、谷歌DeepMind开源GenAI Processors:一键构建实时AI工作流

谷歌DeepMind开源了GenAI Processors库,为开发者提供了一个轻量级、高效的工具,用于构建异步、可组合的生成式AI工作流。该库支持多模态数据处理,显著提升了基于Gemini API的应用程序开发效率。

image.png

【AiBase提要:】

🔥 GenAI Processors通过模块化设计简化复杂AI工作流的开发过程。

🚀 支持音频、视频和文本等多模态数据的异步流处理,提升实时应用效率。

🌟 开源社区协作将进一步扩展库的功能,覆盖更多场景和编程语言。

详情链接:https://github.com/google-gemini/genai-processors

7、谷歌Veo3新增图像转视频功能,七周内用户创作超4000万个视频

谷歌在AI视频生成领域持续发力,推出图像转视频功能并强化内容识别机制,显示出市场对AI创作工具的强烈需求。

image.png

【AiBase提要:】

🖼️ 谷歌通过Gemini应用程序新增图像到视频生成功能,扩展AI创作工具能力。

🎥 用户可上传照片生成视频片段,并添加描述音频,支持下载或分享作品。

🔒 所有使用Veo3模型生成的视频将带有可见和不可见的数字水印,确保内容可追溯性。

8、Mistral AI 发布 Devstral2507:为代码中心语言建模而生

Mistral AI 与 All Hands AI 合作推出 Devstral2507系列模型,包含开源的 Devstral Small1.1和企业版的 Devstral Medium2507。这些模型专注于代码推理、程序合成和结构化任务执行,适用于大型软件代码库的实际应用。Devstral Small1.1在 SWE-Bench 基准测试中得分53.6%,而 Devstral Medium2507得分为61.6%,表现优于一些商业模型。

image.png

【AiBase提要:】

🌟 Devstral2507系列包括开源的 Devstral Small1.1和企业版的 Devstral Medium2507,旨在提升代码推理与自动化能力。

🚀 Devstral Small1.1在 SWE-Bench 基准测试中得分53.6%,而 Devstral Medium2507得分61.6%,后者表现优于一些商业模型。

💼 两款模型支持与代码代理框架集成,适用于从本地开发到企业级服务的多种应用场景。

详情链接:https://huggingface.co/mistralai/Devstral-Small-2507

(举报)

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!