在人工智能的快速的提升中,阶跃星辰无疑是这场科技革命中的一匹黑马。由前微软全球副总裁姜大昕于2023年4月创办的此公司,在低调中稳步推进其核心目标——实现通用AI(AGI)。
阶跃星辰的总部在创新之都上海,至今仅成立了两年多,但其发展势头不可小觑。2024年底,公司顺利完成数亿美元的B轮融资,并获得国有资本及腾讯等多家知名机构的强力支持。这些资金的注入,将为公司继续专注于大规模研发和应用提供了坚实基础。
姜大昕在一次演讲中提到,阶跃星辰的技术发展路线图已经清晰,目标从单模态模型到最终构建统一的世界模型,其中关键环节就是实现多模态能力。他深信,这是实现AGI的必由之路,旨在打造一个能够理解和生成不同形式信息的智能系统。
在阶跃星辰的技术矩阵中,Step系列多模态大模型无疑是核心。直到目前为止,该系列模型已经发布了11款,涵盖语音识别、生成,以及图像和视频能力。今年初发布的StepR-mini,标志着智能推理模型的首次落地。多模态的优点是,它不但可以处理多种输入,还能进行智能识别和反应,适应复杂的应用场景。
开源战略是阶跃星辰另一重要的发展趋势。当DeepSeek大模型开源引发全球关注后,2月18日,阶跃星辰与吉利共同发布了两个开源模型:Step-Video-T2V和Step-Audio。它们分别打破了视频生成和语音交互领域的技术壁垒,成为业界的标杆。
在今年的StepUP生态开放日中,姜大昕向与会者介绍了智能体(Agent)的发展阶段。他指出,Agent的核心特征是其能够自主执行复杂任务,既包含“自动”和“主动”两层含义。“自动”是指智能体能够在一定条件下自主达成目标,而“主动”意味着智能体更为智能,能按照每个用户的环境做出及时的反应和提示。
要实现Agent的技术转化,姜大昕强调了两个关键要素的必要性。首先是多模态能力,使得Agent能够全面感知和理解世界;其次是强大的推理能力,使其在执行任务时可以有效的进行深度思考。这在某种程度上预示着,Agent不仅能做到简单的反应,还能进行应变和主动规划,逐步迈向更高层次的智能会话。
阶跃星辰计划将智能终端Agent视为其大模型技术落地的核心驱动力。在姜大昕看来,无论是未来的智能手机、汽车,还是物联网(IoT)设备,都将配备一个多模态Agent,帮助用户完成日常复杂任务。尤其是在汽车应用场景中,结合人工智能模型、端到端智能驾驶技术等,未来的智能汽车体验将会实现质的飞跃。
对此,千里科技董事长印奇也在圆桌论坛中分享了对智能汽车行业的看法。他谈到,AI技术与智能汽车的结合将创造出全新的出行体验,从而提升整体的驾驶安全性与用户便利性。
在谈到Agent的技术层级时,姜大昕将其分为五个阶段:第一层是完成简单的任务,例如单一App的操作;第二层为组合任务,涉及多个操作;第三层则是深度思考,可以有效的进行全面分析;第四层体现了Agent的主动性,能在用户不要求时提供相关建议;而第五层,Agent不仅实现高效操作,还可以在情感上提供陪伴和支持。
在开放日上,阶跃星辰还与吉利汽车、OPPO、智元机器人等行业巨头深化了合作伙伴关系,并展望 AI技术将在更广泛的场景中实现突破。这一系列合作将加速智能终端Agent的落地应用,从而推动AI技术的实际应用。
未来,随着多模态和推理技术的逐步发展,阶跃星辰的技术成果有望为我们大家带来更加智能化的生活方式。能预见,AI将不单单是一种工具,而是我们生活中的得力助手,助我们更高效地完成各项任务,这样的未来值得期待。返回搜狐,查看更加多