标准会员
过期时间
会员积分 0
还没有账号? 立即注册
已有账号? 立即登录
95.03万
粉丝
11569
文章
214.41万
总浏览
5
平均评分
AI领域资深专家
仅用不到1200行代码,实现最小化且完全可读的vLLM!DeepSeek研究员俞星凯搞了个开源项目引得大伙拍手叫绝。项目名为Nano-vLLM(纳米级-vLLM),有三大特点:快速离线推理 :推理速度可与vLLM相媲美可读性强的代码库 :基于不到1200行Python代码实现,简洁干净优化套件 :包含前缀缓存、Torch compilation 、CUDA graph等下面是vLL
在企业软件的世界里,有一个默认的秩序:记录系统不可撼动。它们掌控着企业最关键的资产(数据),支撑着财务、销售、人力资源和供应链的核心运作,像地下水管一样,深埋在组织肌理中。SAP、Oracle、Salesforce 等巨头就靠着这个生意做到了千亿美元市值。不过,随着AI的到来,这个情况发生了变化。最近,国外SaaS领域最专业的投资机构Bessemer提出了一个观点:记录系统正在转向行动系统
AI也能预测台风!在性能上,谷歌首次推出了明确超越主流物理模型的AI台风预测模型。这有望拯救数万生命。昨天,谷歌DeepMind与谷歌研究团队正式推出交互式气象平台Weather Lab,用于共享人工智能天气模型。在热带气旋路径预测方面,谷歌这次的新模型刷新SOTA,是首个在性能上明确超越主流物理模型的AI预测模型。论文链接:https://storage.googleapis.com
Transformer,八岁了!开创如今这场生成式AI革命的论文《Attention Is All You Need》迎来了第8个年头。Transformer催生了ChatGPT、Gemini、Claude等诸多前沿产品。更重要的是,它让人类真正跨入了生成式AI时代。人类和生成式AI的命运从2017年6月12日周一下午17点57分开始交汇。Transformer的影响依然还在继续!
告别繁琐微调,一句话就能生成LoRA?!由Transformer作者之一Llion Jones联合创立的明星AI公司SakanaAI,近期推出Text-to-LoRA (T2L),彻底简化了模型适配流程:现在,微调大模型时动辄数周的数据集准备、反复调整超参数的复杂流程,可以省了。使用T2L生成的LoRA在参数压缩率上可达80%却仅降1.2%准确率,零样本场景下更以78.3%的平均准确率
2025 年,是 Agent 按下加速键的一年。从年初 DeepSeek 引发的惊叹,到 GPT-4o 和 Claude 3.5 接连登场,大模型的边界一次次被重写。但真正让 AI 产业链神经绷紧的,不是模型的性能迭代,而是 Agent 的横空出世。Manus、Devin 等产品的爆火,都在重申一个共识:大模型将不再只是工具,而是要成为可以自我调度的智能体。Agent 由此成为继大模型之后