AI热点 3 hours ago 186 Views 0 Comments

Z Potentials|专访胡渊鸣,清华姚班 × MIT博士,打造500万+用户的3D AI平台Meshy,一年营收增长18x

AI中国
AI中国

Published 11232 Articles

生成式 AI 正在重写 3D 内容的生产流程:从“DCC 工具 + 外包”的线性供给,演进到“资产规模化生成 + 管线可用”的指数供给模式。过去五年,技术范式经历了从实时体积渲染,NeRF,到Score Distillation,3D扩散的快速迭代;需求侧则由游戏与影视,向3D 打印、电商样机、数字人、教育培训、以及AR/VR等长尾场景外溢。行业痛点并未消失——几何精度、UV/拓扑、材质细节与可控性仍是落地瓶颈——但速度×成本曲线已被永久改写:从“2 周/$1000”降至“分钟级/$1”,这不仅降低了门槛,也催生了全新的商业机会与生态位。结论很清晰:未来 3–5 年的赢家不在炫技式的“单点 Demo”,而在构建起可规模化资产生产 + 标准化管线适配 + 高频迭代的产品运营体系


在这条演进路径上,Meshy 的创始人胡渊鸣展现出难得的跨领域能力组合:图形学 × 物理仿真 × 系统工程 × 产品同理心。他拥有清华姚班本科与 MIT 博士的扎实学术背景,对三维几何、物理仿真、可微计算等底层原理理解深入;从零开发“太极(Taichi)编程语言”的经历,也锻炼了他对复杂系统的抽象与工程实现能力。更重要的是,团队在商业化路径上实现了关键转型:从依赖“工具收费”转向更符合市场需求的“资产生成服务”,真正从技术驱动升级为用户价值驱动,形成了对产品节奏与市场竞争的务实认知。


在产品层面,Meshy 的定位非常聚焦——“用文字或图片生成 3D 模型”。在最新版本中,几何结构与细节密度实现跃迁级提升:空间分辨率三轴均翻倍,整体约8倍细节提升;角色与精细物体生成效果处于头部水准;生成 20–30 秒、贴图约 1 分钟,维持高吞吐与低时延并存。功能链路从 Text-to-3D、Image-to-3D 到重拓扑、动画与 API, 既满足入门用户“开箱即用”,也为专业用户提供可扩展的工作流支持。增长与营收同样硬核:累计 500 万+ 用户,站点月访 250–300 万,每个月收入也保持了两位数的增长,过去一年营收翻了18倍。Meshy 的护城河不在于论文数量,而来自三方面叠加:先发优势与专注力、高效的组织执行力、以及活跃的用户生态——这三者共同将“技术质量差距逐渐缩小”的现实,转化为“产品真正被工作流接纳”的结果。



接下来,我们将沿着“个人成长—学术底层—产品转型—技术演进—商业化与国际化”这一主线,还原胡渊鸣如何从清华姚班到 MIT,构建跨学科的技术视野与市场洞察;解析 Meshy 在几何结构、贴图细节、风格控制及速度/质量平衡上的工程取舍;并最终探讨其在全球 3D 生态中的定位与未来可能性。



  • 从“世界如何运行”的好奇,走到“让世界被创造”的能力。


  • 别做收缩市场的英雄,永远选在增长曲线里冲锋。


  • 工具难变现,但资产有人付费——从卖工具到卖资产,是关键路径纠偏。


  • 同理心是最好的产品经理:能提前“感到”用户哪里不顺。


  • 把“2周/$1000”打到“2分钟/$1”,商业边界随之改写。


  • 速度是入场券,质量是通行证:几何/UV/材质/可控性,逐项补课才算落地。


  • 好故事=愿景×第一性原理,唯一证明是持续、可量化的交付。


  • CEO的工作不是亲自执行,而是确保团队“整体能赢”。


  • 3D 的真正瓶颈不在算力,而在表达与可控生成的算法范式。


  • 把开源当伙伴、把大厂当客户;护城河是专注、执行力与用户关系复利。


01 从学术到创业:从“造世界”到“造产品”的底层跃迁


ZP:请先介绍一下您的成长经历,包括求学阶段(清华姚班本科;MIT博士)以及您在图形学、物理仿真方面的早期科研与学习,是如何锻造您在技术与市场机会上的敏感性的?


胡渊鸣:我是江苏扬州人,家里是知识分子家庭。小时候其实很难想象自己会去创业。长辈对我的期待更像是和他们一样成为大学老师或者科研人员。家庭对我最大的影响是做事认真、务实和勤奋。我很多年后才发现:原来不是所有的父母在几乎所有醒着的时间都在工作的,而我父母的工作在生活中的占比是很高的。


我很早就开始接触编程,小学时因为喜欢玩游戏,就想做自己的游戏,于是开始写代码。到高中时拿了NOI(全国青少年信息学奥林匹克竞赛)金牌,后来被保送清华,再后来考试考到了姚班。可能每一个清华同学都会有的一个人生阶段是,发现人和人的差距比人和草履虫的差距更大。清华的同学都非常优秀,我在姚班认识了一批很厉害的同学,对我做事情以及志向方面都设立了一个很高的标准。这些同学中后来也有很多人成为了教授或者创业者,而我其实算不上这其中最优秀的那一批人,所以总是被周围同学激励着。


博士阶段我去了MIT,主要研究图形学(这是我非常感兴趣的一个方向)、物理仿真和计算系统,这为我之后的工作打下了坚实基础,因为我确实是一个喜欢钻研技术的人。但其实那时候我缺少了对市场这方面的理解,我的知识分子家庭的背景也没有给我提供这方面的经验。坦白来说真正让我开始关注市场和创业,是在 MIT 读 Ph.D. 的时候在YouTube上看到很多创业者的视频。比如极客公园张鹏访谈的王兴,还有雷军介绍创业的一些视频等等。这些视频让我大概知道有一个企业家这样的群体存在。他们能够通过创新去解决一些社会上存在的问题,为用户创造价值,这个想法在我快毕业的那个时候非常吸引我。


那时是疫情期间,我对外界的交流很受限,我更强烈地意识到我不想一直只在实验室里做研究工作,而是希望做一些能真正让很多人真正用起来的东西。这种想法推动我后来去做“太极(Taichi)”编程语言,以及之后的创业探索。


十几年来我一直是在想做东西给自己和别人用,而产品方面的能力在读书的时候并不是我的强项。后来在做 Taichi 和创业的过程中,我的产品能力才慢慢锻炼出来。我相对于其它技术出身的创始人的一个优势是我的同理心会更强一些。即使深度参与产品开发当中,我也能把自己抽离到用户视角,去体会普通的用户用某个功能是否会觉得很丝滑,还是很不顺畅。这种对体验的关注和追求对我们做一个好用的产品有挺多帮助。在设计太极编程语言的时候,我自己就兼任了产品经理、研究、工程、市场等工作。这个过程其实对我是一个很好的锻炼,也是创业的预演。


ZP:您身边很多同学选择学术道路,而您从科研转向创业,是出于怎样的原因?


胡渊鸣:我一直是一个好奇心很重的人,喜欢尝试新的东西,这种好奇心伴随我的整个成长过程,也驱使我开始做计算机图形学。最早因为玩游戏,我就好奇游戏是怎么渲染出好看的画面,于是沿着这个好奇心就想自己做一个游戏出来。这个过程中,我又觉得 GPU 上的编程语言为什么都不大好用,基于好奇心就想着自己能不能设计一个更好用的语言,这就有了太极编程语言的尝试,后来又在思考是不是能够做一个可持续运营的公司,来实现更大的目标。


一路走来,有成功的,也有失败的,但我就是喜欢折腾。和很多同学选择学术舒适区不同,我更想做点新的、能真正被人用起来的东西。


ZP:在博士或早年科研阶段,您做过哪些项目或成果让您看到了“图形学+系统+高性能”的结合可能带来产品级别的创新?这些经历具体怎样影响了您作为创业者的思考框架与判断能力?


胡渊鸣:我认为图形学和物理仿真的核心魅力在于,它们能让你在计算机里创造一个虚拟的世界。这种兴趣我从小就有,我常常思考世界是由什么组成的、如何运行的。我经常想:如果我能掌握世界的底层规律,是否我也能创造出和现实一样的栩栩如生的模拟环境?


在我的认知之内,我发现图形学正好能回答这个问题:我们知道光线传播的规律,就能渲染非常逼真的画面;知道粒子如何相互作用,就能模拟物理特效。我的这些探索背后,一句话总结其实都是源于自己对“世界如何运行”的好奇心。


太极语言就是这种思考的产物。当时我既做研发、也做产品经理、市场和推广,相当于一个人扮演多个角色。这段经历锻炼了我对完整产品链路的把控,也让我逐渐培养了对用户体验的敏感性。


ZP:当初从学术界转向创业,尤其是创办太极图形时,您对商业化有哪些期待?现实中遇到的落差又是什么?


胡渊鸣:最初我希望能把太极编程语言商业化,但后来发现这条路并不好走。太极语言这个项目仍在维护中,但它没有形成特别好的商业模式。真正的商业化机会,后来反而是来自我们新的项目Meshy。


ZP:创业过程中有过哪些让您觉得“必须杀死过去的自己”的关键节点?这些节点如何改变了您的思考方式、执行方式或团队管理方式?


胡渊鸣:其实这其中有很多次的挫折和失败让我不得不反思。举个例子,我们在太极之后做过第二个产品——一个渲染器。当时认为这种渲染器产品有一定的市场,因为我们可以用全新的技术(云端 GPU 渲染)切入用户广泛使用的已有的市场,觉得能分一杯羹。但后来发现,这个想法只是表面可行。实际上这个市场本身已经在萎缩,用户量本身就在下降加之用户逐渐老龄化,他们对于新技术的接受度没有那么强了,而新用户几乎没有。哪怕技术有改进,只是一般的颠覆性也难以撬动用户从老产品切换到新产品。所以最后这个项目失败了。


但这次经历让我学到两个关键点:


第一,创业要选新兴的增长型的大市场,而不是收缩中的旧市场。


第二,用户反馈很宝贵。在做这个项目的过程中有用户对我们说:“我不会为你的软件付费,但如果你能提供3D资产库,我会为此付钱。”这让我意识到 3D 资产本身比 3D 工具更有价值。再加上ChatGPT等生成式AI技术的启发,我们才决定去做Meshy。


这其实是一个思维方式的转变。以前是从技术出发,找落地场景;后来变成从用户需求出发,再匹配技术。哪怕需求听起来很“low”或不够宏大,比如用户只是想要3D资产,但这是真实需求,值得被满足。


我业余时间会去看一些企业家的传记。比如任天堂的成长经历中就有很多有意思的事情。横井军平在做Game Boy的时候,有一个理论叫做“枯萎技术的水平思考”。他的思维方式还挺反直觉的,因为技术从业者很多时候都在追求一些新的技术,但其实一个产品能解决用户的问题是更重要的。在横井军平设计Game Boy时,竞争对手都在用彩色液晶屏,而他在用黑白液晶屏。横井军平认为用黑白液晶屏的话四节电池能玩15小时,如果换成彩色屏,六节电池才能玩六个小时,带给用户的续航体验是完全不一样的。当世嘉认为任天堂 “在用过时的黑白液晶屏技术” 的时候,横井军平认为 “世嘉只要用彩色屏幕就一定输了。”


很多时候需要有所取舍,对于尖端技术的追求肯定是有效的,但对于解决用户问题的商业思考上,二者一定要达到一个好的平衡,产品设计本身就是一个持续不断的且精密的思考过程,有大量的局部细节和全局目标需要统筹规划。


02 重塑3D生产力:从“分钟级生成”到产业级落地的Meshy范式


ZP:在当前AI生成3D(Text-to-3D, Image-to-3D, Texturing, Animation)大潮中,您是如何定位 Meshy.AI的?从您观察到的市场痛点与技术瓶颈中,您认为最迫切需要解决的问题是什么?


胡渊鸣:Meshy的定位其实很简单,一句话就是“把文字和图片变成3D模型”。以前游戏公司做一个模型大概需要两周时间、1000美元成本;现在通过Meshy,两分钟、1美元就能完成。速度上提高了一千倍,这是一个质的飞跃。


目前最大的挑战还是质量问题。虽然生成速度和成本优势很大,但和专业艺术家手工建模相比,AI生成模型的质量还有有比较大的差距,没办法直接无修改地投入到游戏中使用。这里的问题包括:几何结构不够精确、UV/拓扑质量欠佳、材质和贴图的细节不足,以及可控性不强。这些都需要通过持续的技术迭代去改善。目前一些场景是可以用的,比如作为一个独立游戏的原型,但对质量要求高的地方还是需要人工来做调整之后才能应用到游戏里。



ZP:请具体介绍下Meshy的最新产品进展(近期上线了Meshy 6,可以重点聊一下新版本优势)。在“几何结构、细节贴图、风格控制、速度与输出质量”等方面,您认为哪些改进是最显著的?现阶段还存在哪些核心不足?


胡渊鸣:最近上线的是 Meshy 6 的预览版。主要改进是几何结构和细节精度:空间分辨率在长宽高三个维度各提升两倍,总体上相当于八倍的细节增强。同时,模型的结构正确性也明显改善,类似“手指数量错误”这种常见问题基本可以避免。


速度方面依旧保持较快的水平:生成模型只需20–30秒,贴图大约一分钟。这次预览版主要是提升了几何方面的质量,最显著的提升是在角色类和精细物体类模型上,比如生物、人物,我们的效果在市场上处于非常领先的地位。


不足方面还是存在于AI生成3D中的一些通病,仍然存在拓扑还达不到人类的级别,可控性方面还不能支持用户对生成结果直接进行基于AI的修改,这是未来我们计划改进的方向。


现在来看,3D模型的应用已经不只是在游戏行业或工作室里,这个版本的Meshy上线后有大量用户的评价非常高,他们用Meshy生成大量的模型和手办,可以用打印机直接打印出来,这也是Meshy这个版本非常大的亮点,很适合用来3D打印。



ZP:在产品功能上,Meshy提供哪些创作路径与工具(如文本提示词生成/图像转3D/贴图/动画/API等)?这些功能之间如何协同,以支撑专业创作者与非专业创作者不同的需求?


胡渊鸣:我们的产品设计一直强调“易用性”和“直觉化”。我一直有一个观点是,一个好的产品一定是符合直觉的,就是应该让大多数用户开箱即用。Meshy的核心功能包括:文本生成3D、图像生成3D、贴图生成、动画,以及API接口。


对于非专业用户,我们会将常用功能放在更容易访问的位置,降低门槛;对于专业用户,则提供更多扩展功能,比如3D转视频、以及更精细的贴图和视频生成接口。我们的整体逻辑是尽可能去做一个“通用产品”,而不是面向极窄垂直领域的工具。重要的是找到跨行业的共性需求。


从用户视角出发,一般有两种方式,一种是倾听用户的需求,另一种是从第一性原理推导,比如贝尔在发明电话的时候是没有做用户访谈的,他只是知道人和人之间一定有快速通讯的需求,因此电话这个事是有市场需求的。用户的想法是很重要的一部分,但如果只按照用户说的去做而没有自己的思考,就会把产品开发引入歧途。比如汽车出现前,用户只会说想要一个更快的马车,而不是一辆汽车。


目前来看,无论是游戏、影视还是3D打印等行业,都能用Meshy满足创作需求。我们既要让专业用户觉得功能足够强大,也要让非专业创作者觉得简单好用。



ZP:用戶体验和用户生成内容反馈如何?您有没有哪些数据可以分享,比如用户数、月活/付费用户/增长倍速/下载量等?目前产品在用户口碑和真实落地场景中的表现如何?


胡渊鸣:目前我们有超过500万用户。根据SimilarWeb的数据,每月网站访问量在250万到300万之间。整体增长速度很快,每个月营收都保持了两位数的增长,过去一年营收增长了18倍。


用户口碑和满意度也在稳步提升。我们做过用户调查,反馈普遍积极。总体趋势是:用户创造价值越多,我们的商业化也就越容易。


ZP:能不能分享一两个真实的用户故事?例如某个游戏团队用Meshy从概念设计到最终模型交付只花了多少时间?


胡渊鸣:有一个海外的2A游戏工作室Stratton Studio,他们原本做一个坦克模型到放进游戏里要花4个小时,即便只是下载现成资源修改也需要耗时。用了Meshy,再结合Blender等工具,他们把整个流程缩短到4分钟,从4小时到4分钟,效率提升非常明显。



另一个故事很打动我。有位用户原本是建模师,但在一次意外中大脑受了损伤,导致无法再使用传统3D建模软件。他后来发现Meshy可以帮助他重新创作。他说“我以为自己再也不能建模了,但没想到技术发展让我重新掌握了这项技能”。这个反馈让我们团队非常感动。


ZP:技术挑战方面:Text-to-3D输出的可控性、贴图细节和UV/拓扑质量、硬表面模型棱边锐度、与现实光影动态交互一致性,这些是多位用户与您自己共同指出的问题。您当前在这些方向上的技术路线与资源投入是怎样的?


胡渊鸣:技术突破通常来自三个方面:数据、算法和算力。早期阶段,学术界会先探索新的网络架构,比如Transformer、DiT等,产业界则在其基础上通过更大规模数据和算力进行训练和优化。同时,数据在这个时代的重要性会比大家想象中更加重要一些。


3D相比于架构较为成熟的大语言模型的训练有一个特别之处:算法如何设计并没有确定下来,是待讨论的核心问题。3D的算法还处于快速迭代期,比如3D的表达方式、如何增强输入输出的对齐度、如何实现高效的可控生成。这些问题都需要团队逐一解决。


优化质量其实没有很 fancy 的事情,我们的思路很直接:找到最聪明的人,组建合理的组织架构,让他们一个个攻克难题。没有什么捷径,就是不断迭代。


ZP:定价与商业模式:Meshy的订阅计划结构是如何设计以兼顾个人创作者与工作室/团队使用者的?未来您看到哪些商业变现路径/合作模式是可行并且最有潜力的?


胡渊鸣:我们采用的是 Freemium 模式:用户可以免费使用基本功能,一部分会转化为付费用户。对于用量更大的用户,我们提供 Pro、Studio 和 Enterprise 等更高阶套餐。教育用户会有比较慷慨的折扣,希望培养未来市场。


我们定价的核心原则是:不同类型的用户需求不一样,但产品不能割裂成很多条线。所以我们提供一个核心产品,再通过不同套餐和定价满足创作者、工作室、团队和企业的需求。未来可能的商业模式包括更多与产业结合的合作,比如和游戏公司、影视制作、教育、AR/VR等生态深度合作,探索新的收入来源。


03 在不确定中前行:从技术信仰到全球化执行的创业进化论


ZP:您认为在3-5年内,Meshy的产品与市场会经历哪些阶段性的突破?(例如:质量门槛、渲染/实时化、引擎集成、VR/AR/元宇宙入口等)


胡渊鸣:我觉得能做的事情非常多。比如生成完整的 3D 场景,也就是多个物体的组合;再比如提升在游戏管线中的适配程度,包括几何拓扑、UV、材质质量等。我们还不断给产品加入新的 Workflow。比如我们最近推出的3D to Video 的功能,让用户可以把 Meshy 的 3D 模型组成可编辑的 3D 场景,并把这些 3D 场景变成图片、视频。



沿着3D上下游有非常多可以去做的事情。当你的产品有一些用户后,总可以做出新功能来满足他们的需求。我们未来的迭代方向包括:提升生成质量、优化上下游流程、增强可控性等。AI 生成可交互 3D 内容是一个趋势,但现在仍处在探索阶段,还不能替代成熟的实时引擎。不过我相信这是未来很有潜力的方向。


ZP:在国际化战略上,尤其对于非英语市场(中文、其他语言),Meshy是怎样规划界面、本地化、用户社群与支持等?这些方面对产品增长的影响有多大?


胡渊鸣:我们的界面设计从一开始就是国际化的,切换不同语言相对容易,本地化主要是提示词翻译等问题。回过头来看,我们的界面设计在整个 3D AI 行业是非常领先的。目前我们还是专注海外市场,尤其是欧美市场,因为那里的付费意愿偏强一些。未来我们会继续国际化。虽然一些海外国家人口规模不大,但游戏和软件产业非常成熟,生态更健康,也有很大空间。


ZP:您怎么看行业内竞争对手(如其他Text-to-3D或Image-to-3D的AI工具/开源项目/大型AI实验室)Meshy的护城河在哪里?


胡渊鸣:我觉得要分几类。一些项目看起来是竞争,但实际上更像合作伙伴。开源模型的生成质量目前和闭源还有很大差距,但开源确实推动了学术和产业的探索,我们也会吸收其中好的想法到我们自己的产品当中。我们还设立了 Meshy 奖学金,每年发给为产业界贡献了新想法的在读学生。


至于大公司,它们拥有的资源肯定会比我们多。比如 Google、NVIDIA、OpenAI,他们都曾在某个阶段做过3D,但很多最后都停止了,甚至成为了我们的客户,比如Meta。腾讯可能是依然在这个方向有较大投入的公司。相比大公司,创业公司的优势在于专注和决策效率高。我们的团队速度快、每个人的责任感和ownership都很强。


在和用户关系上,创业公司也更灵活,比如 CEO 可以直接参与客户沟通,这是大公司很难做到的。海外用户对创业公司通常也更友好。所以我认为Meshy的护城河主要在三个方面:


1.专注与坚持:我们是现在 3D 生成玩家中最早入局的,并且持续迭代,具有先发优势。


2.团队执行力:扁平的小团队能快速决策、快速试错、快速迭代。


3.用户关系和品牌:用户其实愿意和创业公司一起成长,而大公司往往显得“店大欺客”。


ZP:在从“太极图形”向“Meshy.AI”转型过程中,您遇到过哪些最难克服的瓶颈?您是如何决策并调整方向的?


胡渊鸣:有一些时刻其实我自己也不确定未来的方向,但必须要下注。比如我们最初在太极的基础上尝试NeRF(神经辐射场)技术,当时有两条路线:一条是用它做重建,一条是做生成。我们判断生成会是更大的市场,所以决定往生成方向走。


这个决策当时团队内部也没有共识,有些人觉得应该做重建。为了推动大家达成共识,我做了大量沟通。当时市面上几乎没有公开可用的3D生成产品。我们决定快速上线,即使产品质量不高,也要先跑通用户验证。


我记得第一个版本用了8个小时,也就是早上10点开会,晚上6点就上线了。一天之内有1000个用户注册,这给了我们很大的信心。在小步快跑的试错过程中也“被怀疑过”:初期很多用户觉得生成的东西“不靠谱”,甚至由于最初的生成质量不是很好,第一个把 Meshy 用在游戏中的场景是“用Meshy来做恐怖游戏的素材”。但随着基础模型不断迭代,用户逐渐改变了自己的看法。


这段经历让我体会到:在怀疑和不确定中保持信念和深度思考,并通过小步快跑的数据验证,就能带领团队不断地看到希望,一步步看清未来。


ZP:领导力与团队管理上,从一个研究者/技术人的身份进入CEO角色,您最需要提升或改变的是什么?有没有某些领导风格、组织制度上的经验教训可以分享?


胡渊鸣:我认为这个问题的核心是CEO到底在公司里面应该扮演什么样的角色。CEO(“首席执行官”)这个角色名字有点误导,但实际上,CEO最重要的任务不是自己去执行,而是确保整个公司能赢。


在产品与市场匹配之前,我作为 CEO 还要亲自写代码、调参数、做产品。但当团队扩大后,我写代码的边际价值很低,更重要的是思考团队如何整体运作。所以我的最大的转变是思维方式:从“我能做什么”变成每时每刻去想“团队能做什么”。会去思考哪一项工作是能给团队带来最大价值的。


所以我认为CEO要做的是:能够做出决策来保证战略能落地;能够提出更高标准,注重培养团队;知道该如何把合适的人放到合适的位置上,让擅长技术的人做专家,让擅长管理的人带团队。从关注事情和技术细节转向关注人,这个转变是我最大的成长。


ZP:在承受外部期望(被标榜为“天才少年”、行业焦点、舆论关注等)与内部产品真实质量/用户反馈之间,您如何处理那些矛盾?对外讲故事vs对内专注交付,这两者怎样平衡?


胡渊鸣:我觉得首先要做到坦诚,就是自己是一个什么样的人应该心中有数,不能去对外宣传自己没有做到的东西,因为一旦一个组织的CEO开始不坦诚,那么整个组织的文化都会被破坏。


在我看来,“对外讲故事”和“对内专注交付”不是对立的,而是一回事。因为讲出的故事是对未来的愿景描述,但必须是符合第一性原理和技术发展逻辑的,并且自己要真心相信。只有这样,故事才是讲得通的,才能把团队和用户凝聚在一起。


真正的挑战是:你必须不断交付,去验证你的故事是对的。故事不是“吹牛”,而是愿景加验证过程。所以我不觉得这两者有矛盾。


ZP:创业过程中有没有“几乎放弃”的时刻?当产品用户体验不达标、或技术瓶颈显著时,是如何保持信念与执行力的?


胡渊鸣:有的。比如前两个产品(太极语言和渲染器产品)都没能成功,再加上当时家里老人去世,压力特别大。那时候我甚至想过把钱退还给投资人。


后来和一些创业者交流,他们很坦诚地说,这些失败很正常,他们惨的时候比我惨多了。创业本来就是要做好经历失败的准备。慢慢地,我重新找回了信心。


经过这几年的“濒死体验”和摸爬滚打,我更清楚地认识了自己,也更能坦然面对自己的优点和缺点。和团队沟通时,我也会直接承认哪里做得不好或不对,需要调整。我认为这些磨练对于一个人和一个团队是相当必要的,如果一直都很顺利的话,是没办法有更深层次的认知的。


ZP:如果让您给希望在AI生成3D方向创业或产品设计的年轻创始者一个忠告,您最想强调哪两点?


胡渊鸣:首先我不认为我们已经发展到特别好的程度足够给他们建议,只能说我学到了两点比较重要。第一点是面对现实,要看清楚用户是否真的有需求,收入是一次性的还是有留存的,用户是否真正把产品用到了生产过程中,不要被暂时的假象迷惑,更不要自欺欺人。


第二点是保持勇敢,当你能够面对现实之后,就有勇气面对失败,你就会接受失败并从中快速学习,就能不断迭代,甚至越挫越勇。只要学得够快,总有一天会成功。只要还在尝试,就在通往成功的路上。


ZP:您平时关注的几个AI/图形/生成式内容创业公司里有哪几家您觉得做得好?它们给您带来了什么启发?


胡渊鸣:可能有些俗套,但我觉得OpenAI还是非常值得学习的公司。它的早期领导人 Ilya 坚持第一性原理的思考方式,比如认为智能水平与神经元数量成正比,人工神经网络和生物神经网络没有本质区别。以前的计算机可以模拟出老鼠大脑中的神经元数目,那如果把神经元的数目逐渐变大,它的智能水平就能接近猴子,甚至接近人类。这些最底层的思考支撑了他们走上AGI的道路,尽管经历了多次失败。OpenAI 15 年公司成立,但七年后(22年)才做出出圈的成果ChatGPT。


另外我很欣赏 Epics Game(ZP注:一家美国电子游戏与软件开发公司,创立于1991年,公司总部位于北卡罗来纳州卡里镇)。他们不仅做了虚幻引擎,还开发了《Fortnite》这款游戏,这是巨大的商业成功案例。虚幻引擎是整个图形学和人类视觉技术的集大成之作。


应用层公司里,我觉得Lovable和Cursor做得很好。他们抓住了用户真实的需求,找到了AI与已有的工作流程结合的场景,找到大市场并切入。我自己写代码时也会用Cursor,Lovable的原型功能也非常好。这些案例说明,只要找到足够大的机会,把AI与真实场景结合,潜力是巨大的。


ZP:最近有没有什么书、论文或者个人影响很深的作品/艺术家,让您在美学/技术/产品思考上有新的顿悟?


胡渊鸣:对我影响很大的人是马斯克。虽然他作为老板可能很严苛,但他的执行力和第一性原理思考方式非常值得学习。


在金融危机时,SpaceX和Tesla都快撑不下去了,但他依然坚持两条线都做,现在两家公司都非常成功。我自己也开Tesla的车,觉得它的FSD是目前最好的自动驾驶系统。


马斯克的特别之处在于:他既能讲出宏大的愿景故事,又能真正交付结果。这两点同时做到的人非常少。他对我启发很大。


请注意,此次访谈内容已经过精心编辑,并得到了Meshy的认可。有兴趣与Meshy合作的读者可以通过ZP联系公司 ,我们也欢迎读者通过留言互动,分享您对本访谈的看法。


Z Potentials 将继续提供更多关于人工智能、全球化市场、机器人技术等领域的创业者访谈。我们诚邀对未来充满憧憬的您加入我们的社群,与我们共同分享、学习、成长。


文章来自于微信公众号“Z Potentials”。


AI中国

AI中国

11232 Articles 2025165 Views 950300 Fans

Comment (0)

睡觉动画