火遍全网的DeepSeek创始人梁文锋来自吴川！更多细节披露

深度求索（DeepSeek）创始人梁文锋。图片来源央视网

“真没想到，这几天火遍全网的DeepSeek创始人梁文锋，来自咱们湛江吴川！”1月27日，家住吴川梅菉的陈先生在朋友圈这样说。

近日，中共中央政治局常委、国务院总理李强主持召开专家、企业家和教科文卫体等领域代表座谈会，听取对《政府工作报告（征求意见稿）》的意见建议。其中，来自湛江吴川的AI初创公司深度求索（DeepSeek）创始人梁文锋出席座谈会，并现场发言。

此前的2024年12月，梁文锋和团队开发的大模型“DeepSeek-V3”发布，这款大模型以低成本、高性能以及开源模式迅速轰动硅谷、震惊全球，被海外称作“来自东方的神秘力量”。

刷屏湛江人朋友圈的梁文锋，有着怎样的成长经历？1月27日，记者到吴川进行了深入寻访。

“他自小成绩优异，对科技怀有浓厚兴趣”

“梁文锋的小学时光是在吴川城区梅菉小学度过的，这里也是他科技梦想起航的地方。”据曾在梅菉小学任教并担任过梁文锋班主任的李先生讲述，梁文锋的父母均为小学教师，他的父亲在梅菉小学执教。“我记得梁文锋在梅菉小学六（3）班担任学习委员，成绩在班上名列前茅。”李先生说，1996年，梁文锋以优异的成绩从梅菉小学直升至吴川一中，成为当时整个梅菉小学仅有的4名直升生之一。

李先生回忆说，梁文锋在学习上有几大特点：一是课堂高度专注，他总能聚精会神地聆听老师的每一句话，生怕错过任何一个知识点；二是积极回答问题，每当老师抛出问题，他总是第一个举手回答；三是喜欢挑战难题，具有刻苦钻研的精神；四是善于总结学习方法，他总能迅速归纳老师的授课内容，形成自己的知识体系。

李先生说，除了学业上的优异表现，梁文锋还展现出了对科技的浓厚兴趣。课后，他积极参与科技小活动，热衷于制作航空、航海模型，动手实践的能力比较强。印象中，梁文锋在小学三、四年级的时候就爱好集邮，他集邮有一个特点是“以邮养邮”，就是收到邮票后拿去卖，卖后又集回，基本不用花父亲的钱。

梁文锋初中和高中阶段均就读于吴川一中，一直是学校里的“尖子生”，并在数学学科表现出极大天赋，初中时期就学完了高中数学，甚至开始学大学的数学，数学思维能力很强。据梁文锋的一位初三老师回忆，初中时期的梁文锋性格很文静，但不是书呆子，他在学习上很有自己的“一套方法”，很注重劳逸结合，像是很轻易就可以学好每一个学科。

2002年，17岁的梁文锋参加全国普通高考，以理科816分、吴川市第一中学“高考状元”的成绩考上浙江大学本科电子信息工程专业，于2007年考上浙江大学信息与通信工程专业研究生。在大学期间，梁文锋就与同学一起开始积累市场行情数据和探索全自动量化交易。

“他很有前瞻的眼光，完全是白手起家”

“读书的时候，梁文锋就经常做课题实验，学习刻苦，也热爱足球。”据梁文锋的一位高中同学兼好友陈先生介绍，大学时期，梁文锋读的AI工程专业前景并不明朗，但他很有前瞻的眼光。他说，梁文锋完全是白手起家，创业以来还做过全自动绣花机等产品，不断探索总结溯源。

陈先生还表示，梁文锋的衣着打扮和为人处世都非常低调，淳朴有善心，此前以个人名义捐了很多钱。

记者查询官方信息了解到，DeepSeek，全称“杭州深度求索人工智能基础技术研究有限公司”，成立于2023年7月，由知名量化资管巨头幻方量化创立。在硅谷，DeepSeek很早就被称作“来自东方的神秘力量”，也是网上热议的“杭州六小龙”之一。

真正让DeepSeek火出圈的是2024年12月26日，这家公司宣布上线并同步开源的DeepSeek-V3模型，并公布了长达53页的训练和技术细节。它以1/11的算力、仅2000个GPU芯片训练出性能超越GPT-4o的大模型。其总训练成本只有557.6万美元，而GPT-4o的约为1亿美元，使用25000个GPU芯片。双方的成本至少是10倍的差距。

在性能上，DeepSeek-V3在数学、代码能力和中文知识问答方面还超过了ChatGPT-4o。国外独立测评机构Artificial Analysis测试后，发出了“超越了迄今为止所有开源模型”的惊叹；Meta科学家田渊栋感慨：“这是非常伟大的工作。”“性价比”是商业社会中的制胜法宝之一，DeepSeek也因创新的模型架构和史无前例的性价比被称为“大模型界的拼多多”，引发字节、阿里、百度等大厂的大模型价格大战。

另据悉，早在2015年，30岁的梁文锋和朋友一起创办了杭州幻方科技有限公司，立志成为世界顶级的量化对冲基金。2016年10月，幻方量化推出第一个AI模型，第一份由深度学习生成的交易仓位上线执行。到2017年底，几乎所有的量化策略都采用AI模型计算。2023年5月，38岁的梁文锋宣布做通用人工智能（AGI）。同年7月，他正式创办杭州深度求索人工智能基础技术研究有限公司，就是DeepSeek公司，专注于AI大模型的研究和开发。从公开的工作经历和职业生涯来看，梁文锋在量化投资和高性能计算领域具有深厚的背景和丰富的经验，创业范畴横跨金融和人工智能领域。

梁文锋此前接受采访时曾表示，回望过去30多年IT浪潮，中国基本没有参与到真正的技术创新里。被外界视为理想主义者的梁文锋称，“我们觉得现在最重要的是参与到全球创新的浪潮里去。”他说，“过去很多年，中国公司习惯了别人做技术创新，我们拿过来做应用变现，但这并非一种理所当然。这一波浪潮里，我们的出发点，就不是趁机赚一笔，而是走到技术的前沿，去推动整个生态发展。”