288亿个独角兽即将出生! Fudan的一位才华横溢的女人开始了自己

作者: bet356体育官方网站 分类: 奇闻 发布时间: 2025-08-14 09:46
“运行到AGI”列专门用于切割和流行的AI技术和业务创新,例如AI模型,AI代理,AI应用程序,芯片和机器人。有一个Barry编辑丨Guan Ju图片来源丨烟花AI官方网站另一个中国妇女将在美国科学技术领域撰写新的传奇。根据技术媒体的信息,人工智能云服务初创公司烟花AI计划启动一个新的融资周期,目标是40亿美元(约合288亿元人民币),其中包括这笔融资的价值)。目前,著名的风险投资公司Lightspeed Venture Partners和Index Ventures正在与领先的投资进行 - 深入咨询。如果成功实现了这笔融资,那么对烟花AI的欣赏将在短短一年内获得7倍的跳高。它再次以AI Infra领域的投资机构的强烈利益结构,尤其是推理服务轨道。值得一提的是,这家公司赢得了许多领先的投资机构的支持。此前,经验丰富的硅谷风险投资(例如红杉资本和基准)以及Nvidia,AMD,Databricks Ventures和MongoDB Ventures等工业资本都参加了他们的早期融资。开展业务的Fudan才华横溢的女性扩大了全文 帮助企业以低成本和出色的效率自定义开放资源模型 这个Fudan计算机部校友默默地重写了AI基础设施的竞争规则。 从福丹大学(Fudan University)毕业于计算机科学学士学位后,林Qiao去了加州大学圣塔芭芭拉分校(UC Santa Barbara)攻读计算机科学博士学位。 他的职业生涯始于IBM的研究职位,重点关注数据基础架构和技术数据库,然后在LinkedIn担任技术总监,并最终担任AI的主要领导者Meta(以前是Facebook)的平台架构。他领导了一支由300多名工程师组成的团队,并领导了基础设施的研发以及Pytorch全球框架的大规模扩展。 从那以后,他带领团队成功地推广了Pytorch,作为该行业的开放资源,并将其发送到Meta的全球数据中心,移动设备和AR/VR平台。 烟火AI的联合创始人兼首席执行官Lin Qiao,资料来源:信息 Kthis是巨型技术巨头的抛光,积累了为Qiao Lin开发AI基础体系结构的深入体验。 作为全球机器学习机器的主要框架的主要Pytorch建造者,他带领团队克服了技术问题,这现在改变了AI烟花的基本竞争。 在元中,Qiao Lin见证了一个重要的规则:在十二个相似框架的比赛中“使复杂性”的关键是,Pytorch可以赢得十二个类似框架的竞争。将其留给团队,并为用户设计理念带来简单性。 尽管它的背后是由道路建造的复杂技术系统 - 工程师,但开发人员只需一个简单的呼叫即可实现强大的操作 - 用户体验的概念首先成为他建立烟花AI的最初意图。 “真正的变化并不在于功能的积累,而在于技术的回归本质。” Qiao Lin注入了对业务技能的思考。 2022年,烟花AI在美国加利福尼亚州雷德伍德建立。烟花AI的创始团队可以称为“梦想团队”:参加Meta Pytorch项目的六名高级工程师和一名前Google AI专家开发了一个主要的技术集团。他们继续在Pytorch期间由Qiao lin积累的过程非常简单,后端进行了大量优化。 烟花AI创始团队,起源:官方烟花AI网站 随着元元的投资 - 工程师建立了Pytorch生态系统,但使开发人员感到复杂性,AI Fireworks团队在80,000多个调整组合(例如分布式推理引擎)的技术困难中悄悄地取得了成功,但给最终用户留下了适当的经验。 从Qiao Lin的角度来看,AI领域的当前变化比以前的任何技术革命更重要。 “这不仅是一个简单的工业升级,而且是整个技术基础的地壳的重建。” 他努力地理解了生成AI的范式转变:在传统的机器研究中,企业必须从一开始就建立模型。通用人工智能(Genai)的出现已经改变了从“构建”变为“应用”的重点。 这种变化破坏了市场机会,爆炸 - AI的全球初创公司像雨季之后一样出现像蘑菇一样,传统企业和挖掘斜体本地力量也急于通过AI再生产品体验和服务过程。 市场研究表明,即使生成AI技术的阈值大大降低了,但企业仍然面临三个基础设施,专业人才和计算资源的基础。 当然,它针对鞭炮创建了独特的商业模式 - “推理提供商”。 烟火的核心AI是帮助企业运行并自定义成本较低和效率更高的开放资源模型,例如DeepSeek进行深入搜索,Qwen for Alibaba Cloud和Meta的Llama。 这些模型可能要求企业自己购买GPU服务器以运行,但是烟花已更改为一种更灵活的方法 - 他们租用了第三方 - 方NVIDIA服务器,然后直接通过API接口为开放资源模型的识别能力提供了开发人员。开发人员将其用作调用OpenA的GPT-4O我不必担心基础服务器。 他们的主要优势也是对GPU资源的深入优化:通过自开发的火灾注意引擎和其他技术,推理模型可以更快地完成,并提供更多资源的资源,并最终帮助客户降低使用成本。 它的背后是Qiao Lin对行业趋势的深入判断。 “当主模型的自行观念和大小逐渐变化时,竞争水平企业的关键在于如何使用所有权数据产生独特的价值。” 他说,如果这是一种开放资源或大型语言模型的封闭来源,其基本的架构和数据边界最终将达到,真正建立护城河的是如何正确地整合了公司的业务模型,通过该模型运行逻辑和AI功能。 这是AI致力于解决的主要建议AI基于其自己的土壤数据的应用。 让AI编程工具被删除 只需说一件事情要做AI更改代码 具体而言,具体来说,烟花烟路的产物被分为几个技术级别,最低级别是一种自发开发的分布推理引擎。该机器是专门为AI开发而构建的,例如为Pytorch定制的推理基础架构。 该发动机的设计功能非常适合和可以像构建块一样自由地结合,因此可以在发布新开放的资源模型的那天快速启动烟花AI。 之所以如此迅速地这样做的原因是AI炸药借用了Pytorch设计概念,从而进行了模块化和灵活的调整。 在服务模式下,烟火AI不使用“单尺寸适合所有”解决方案 - 没有可以解决所有问题的通用模型,并且它将没有适合所有使用背景的最佳调整。 每个用户的需求有所不同恩特。就像选择合适的尺寸购买衣服一样,烟花AI为可以根据三种尺寸的质量,速度和成本来定制的用户。 例如,有些用户更加关注答案的质量,有些则需要更快的响应速度,有些则需要考虑成本控制。该系统将帮助他们找到满足自己需求的最佳均衡。 为了实现这一目标,烟花AI开发了一种称为Fire Optimizer的工具。该工具就像智能助手一样,它可以根据用户的特定需求自动调整模型的调整和扩展计划(例如,对更快的响应或更高质量的渴望)。 ang tothis ol通常会选择一种现有模型之一,然后通过多种方法进行优化: 1。卷技术:以较低的精度运行模型(例如使用8位甚至4位数字而不是原始的16位),这可以提高计算效率,例如压缩高defini光滑的简短视频中的视频; 2。推论执行:让模型一次预测多个答案(例如一次预测4个单词而不是1个单词),以便识别速度可以急剧增加; 3。型号组合:如果您不确定让大型模型确认,请考虑效率和准确性,请使用小型模型给答案快速答案。 这些优化方法具有许多细节和技术,例如Asvolume可以应用于模型的不同部分(权重,激活值等)。每个过程对最终结果都有不同的影响,需要根据用户的特定需求选择。 尽管这些选项非常复杂,但烟花的目的AI是让用户不必担心这些技术细节,并且该系统将自动帮助他们找到最佳解决方案。 在商业化方面,最近的年度烟火AI收入超过2亿美元(约14亿元人民币),或每月近1700万美元(约1.22亿元),到年底,该公司预计将增加到3亿美元(22亿元)。 扩大其业务不会与快速发展的民间AI应用公司(例如AI编程独角兽Cursorand AI Search Unicorn)分开。 那么,AI编程编程工具的光标如何使用AI的技术比普通方法更快地编写代码写作? 光标是程序员专门使用的智能编程工具。它可以预测您的操作(例如,只需更改几行代码,并且可以猜测您要下一步要做什么),以自然语言更改代码(例如,“将此部分更改为XXX”),单击文件中丢弃文件中的生成代码,并且还可以“理解”整个项目代码,并将直接帮助您更正。 但是,使用这种类型的工具时,程序员有一个大问题:如果您希望AI更改大型代码(例如Hundr现有的AI模型(例如GPT-4和GPT-4O)通常是缓慢且不准确的,并且变得更加混乱,这特别影响效率。 为了解决此问题,光标专门培训了一个新模型来处理“快速代码更改”工作(称为“快速应用”)。它可以在700亿个参数的大型型号中每秒产生约1,000个令牌(约3500个字符),比GPT-4和GPT-4O快。培训数据使用使用指令更改代码的程序员的输入数据和实际操作,这是非常有针对性的。 但是,拥有强大的模型还不够,它必须更快地运行。烟火为光标提供了基础支持,并使用了两种关键技术: 首先,光标模型将被部署到其自身的推理引擎中,并且还针对“代码修改”工作进行了表现的优化; 第二个是利用投机奉献的技术 - 普通的AI生成了C带有令牌和令牌的颂歌,并得出缓慢的计算,但是猜测-haka -decting可以“猜测”可能出现的许多令牌(例如一次预测许多单词),然后证明是正确的时间。直接使用正确的框架,然后修复错误的框架,以便可以同时处理许多令牌并以速度直接删除它。 光标还创建了“投机性编辑”的升级版本,该升级版本专为更改代码的情况而设计,例如,在更改大型文本段落时,AI可以勇敢猜测“您可能想根据以前的操作将这些行更改为XXX”,然后同时提出一段时间,然后快速提出一段时间。烟花使用这项技术使光标型号速度每秒的速度高达1,000个令牌,比普通推理快13倍,比以前的GPT-4快9倍。 效果是程序员可以在更改t后几秒钟产生结果他的道路 - 代码的线条。无需等待很长时间。即使他很快被预测,他也会在“严格模式”结尾处进行检查,以确保代码正确。 可以说,程序员可以通过单击按钮或在句子中将AI作为代码直接在项目上直接处理AI生成的代码,并且效率已充分提高。 在NVIDIA投资烟花AI之后 为推理服务而情绪不佳的个人 在当前的竞争场景中,烟花的直接竞争对手AI包括AI和底座。 举例说明。其今年3月的年收入达到1.5亿美元(约11亿卢比),即每月约1,250万美元(约合9000万卢比),感谢30亿美元(216亿元)。 但是整个赛道面临更强大的对手。 NVIDIA获得推理的提供者Lepton之后,今年3月,它推出了GPU云服务市场,该市场直接直接进入AI烟花业务的主要领域。 投资银行审查指出,如果大型云服务提供商包括一个工业链来降低AI培训的成本并提供海关服务,那么此类初创公司可能是潜在的收购目标。 同时,烟花还面临收入挑战:尽管毛利率约为50%(与同行相比),但它低于订阅软件中常见的70%。 这主要是因为需要保留大量的服务器来应对高峰需求,同时还可以忍受GPU Cloud Traders(例如CoreWeave)的低价竞争。直到今天,该公司通过继续优化GPU的资源效率,将毛利率提高到60%,并被列为主要战略方向。 尽管如此,投资机构仍然依靠AI烟花的潜力。 Ruishou评论显示,AI烟花完成了两个融资自建立以来,T耗资7700万美元。在B轮融资之后,该公司的赞赏达到了5.52亿美元(约40亿元人民币),投资者包括红杉资本和基准等领先的资本投资者,以及工业资本,例如NVIDIA,AMD,DATABRICKS VENTURES和MONGODB企业。 可以说,Qiao Lin是一位商人,他既被NVIDIA的创始人兼首席执行官Huang Renxun兼首席执行官Su Zifeng,又是“ Chip of Chip” AMD的董事长兼首席执行官Su Zifeng。 Qiao Lin宣布,明年烟花汇的主要方法是加强火力优化系统 - 智能工具,能够达到模型的质量和响应速度,以找到成本之间的最佳解决方案。 目前,消防优化器在taginggon和成本控制的速度方面做得很好,并特别增强了其未来推理能力的能力。通过个性化的自定义,TH的影响E模型可以比通用模型或普通API更强大,尤其是如果增加客户自己的业务数据,效果会更好。 尽管用户体验易于复制,但真正扩大差距的护城河是公司本身和用户习惯积累的数据 - 此数据生成的反馈回路特别重要,并直接返回给他们使用的AI模型。 Qiao Lin预测2025将是“代理年”和“开源模型年”。 许多解决垂直问题的AI代理将出现在不同的行业中,开放的资源模型将带来井喷 - 例如Deepek是一个月前发布的,其中有500多个优化版本出现在Embrace Face上,并且已成功地适应了各种云设备和平台。混乱和他的客户Linnk还开发了用于金融服务的自定义版本。 但是,他还教导说,将来最大的挑战是: 如何更好地结合AI代理和开放资源模型的快速发展,在最后一英里实现优化质量,并为用户提供更好的实时体验。这也是烟花AI将重点放在今年解决的问题 - 开发商的工作流动。 在四月份在纽约举行的行业峰会上,乔林展示了团队的最终愿景:“我们押注真正了解产品的开发人员。任何人使用自己的数据和智能火车模型的人都将赢得胜利。” Fireworksai应该做的是提供工具和基础架构,以帮助开发人员自定义模型,数据数据,并全面提高质量,速度,并与推理结合使用 - 允许每个团队仔细抛光代表AI时间的产品。回到Sohu看看更多

如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!