A high-throughput and memory-efficient inference and serving engine for LLMs
推荐文章

腾讯最新开源太牛了,AI一键去油、告别塑料感!登顶Hugging Face模型榜
17小时前
•
开源项目

阿里开源「深度研究」王炸Agent,登顶开源Agent模型榜首
15小时前
•
开源项目

速抢(2核2G)77元/年香港免备案服务器
0秒前
•
开源项目

没想到,音频大模型开源最彻底的,居然是小红书
20小时前
•
开源项目

奇点智能研究院出席 GOSIM 杭州 2025:以 AI 开源推动治理创新,共建可信智能未来
1天前
•
开源项目

6.1B打平40B Dense模型,蚂蚁开源最新MoE模型Ling-flash-2.0
20小时前
•
开源项目

清华&字节开源人物视频生成模型HuMo:生成高质量真人视频!
1天前
•
开源项目

腾讯混元开源文生图模型SRPO,将AI图像美学质量提升300%!
18小时前
•
开源项目