您的位置:首页 >科技 >

国产AI破冰之旅:用行动粉碎模仿无创新质疑

导读 2024至2025年间,AI大模型技术持续飞速迭代。OpenAI通过模型架构创新提升了大模型智力水平。中国公司也不甘落后,DeepSeek通过MLA架构创新...

2024至2025年间,AI大模型技术持续飞速迭代。OpenAI通过模型架构创新提升了大模型智力水平。中国公司也不甘落后,DeepSeek通过MLA架构创新大幅降低推理成本。2025年初,MiniMax公司首次开源其最先进的底层技术,发布了MiniMax-01系列模型,包括基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。MiniMax的创新在于首次将Linear Attention机制引入商业化规模模型中,实现了模型上下文长度的显著提升。

MiniMax-01系列模型采用了独有的Lightning Attention机制,结合了Linear Attention和Softmax注意力,显著提高了模型在处理长上下文任务时的表现。此创新为AI的Agent能力打下坚实基础,预示着未来可能看到更多全自动AI在生活中发挥作用。MiniMax的开源行动表明中国AI公司不仅具备工程化和商业化能力,还能推动底层技术创新。这两次中国公司的开源动作,打破了基座模型创新已终结的传言,让人对中国AI公司的未来充满期待。

免责声明:本文由用户上传,如有侵权请联系删除!