临时链接,仅用于预览,将在12小时内失效
小贴士
2步打开 媒体云APP
  • 点击右上角“…” 按钮
  • 使用浏览器/Safari打开

火遍全网的DeepSeek创始人梁文锋来自吴川!更多细节披露

©原创 2025-01-28 10:49 湛江云媒  

深度求索(DeepSeek)创始人梁文锋。图片来源央视网

“真没想到,这几天火遍全网的DeepSeek创始人梁文锋,来自咱们湛江吴川!”1月27日,家住吴川梅菉的陈先生在朋友圈这样说。

近日,中共中央政治局常委、国务院总理李强主持召开专家、企业家和教科文卫体等领域代表座谈会,听取对《政府工作报告(征求意见稿)》的意见建议。其中,来自湛江吴川的AI初创公司深度求索(DeepSeek)创始人梁文锋出席座谈会,并现场发言。

此前的2024年12月,梁文锋和团队开发的大模型“DeepSeek-V3”发布,这款大模型以低成本、高性能以及开源模式迅速轰动硅谷、震惊全球,被海外称作“来自东方的神秘力量”。

刷屏湛江人朋友圈的梁文锋,有着怎样的成长经历?1月27日,记者到吴川进行了深入寻访。

“他自小成绩优异,对科技怀有浓厚兴趣”

“梁文锋的小学时光是在吴川城区梅菉小学度过的,这里也是他科技梦想起航的地方。”据曾在梅菉小学任教并担任过梁文锋班主任的李先生讲述,梁文锋的父母均为小学教师,他的父亲在梅菉小学执教。“我记得梁文锋在梅菉小学六(3)班担任学习委员,成绩在班上名列前茅。”李先生说,1996年,梁文锋以优异的成绩从梅菉小学直升至吴川一中,成为当时整个梅菉小学仅有的4名直升生之一。

李先生回忆说,梁文锋在学习上有几大特点:一是课堂高度专注,他总能聚精会神地聆听老师的每一句话,生怕错过任何一个知识点;二是积极回答问题,每当老师抛出问题,他总是第一个举手回答;三是喜欢挑战难题,具有刻苦钻研的精神;四是善于总结学习方法,他总能迅速归纳老师的授课内容,形成自己的知识体系。

李先生说,除了学业上的优异表现,梁文锋还展现出了对科技的浓厚兴趣。课后,他积极参与科技小活动,热衷于制作航空、航海模型,动手实践的能力比较强。印象中,梁文锋在小学三、四年级的时候就爱好集邮,他集邮有一个特点是“以邮养邮”,就是收到邮票后拿去卖,卖后又集回,基本不用花父亲的钱。

梁文锋初中和高中阶段均就读于吴川一中,一直是学校里的“尖子生”,并在数学学科表现出极大天赋,初中时期就学完了高中数学,甚至开始学大学的数学,数学思维能力很强。据梁文锋的一位初三老师回忆,初中时期的梁文锋性格很文静,但不是书呆子,他在学习上很有自己的“一套方法”,很注重劳逸结合,像是很轻易就可以学好每一个学科。

2002年,17岁的梁文锋参加全国普通高考,以理科816分、吴川市第一中学“高考状元”的成绩考上浙江大学本科电子信息工程专业,于2007年考上浙江大学信息与通信工程专业研究生。在大学期间,梁文锋就与同学一起开始积累市场行情数据和探索全自动量化交易。

“他很有前瞻的眼光,完全是白手起家”

“读书的时候,梁文锋就经常做课题实验,学习刻苦,也热爱足球。”据梁文锋的一位高中同学兼好友陈先生介绍,大学时期,梁文锋读的AI工程专业前景并不明朗,但他很有前瞻的眼光。他说,梁文锋完全是白手起家,创业以来还做过全自动绣花机等产品,不断探索总结溯源。

陈先生还表示,梁文锋的衣着打扮和为人处世都非常低调,淳朴有善心,此前以个人名义捐了很多钱。

记者查询官方信息了解到,DeepSeek,全称“杭州深度求索人工智能基础技术研究有限公司”,成立于2023年7月,由知名量化资管巨头幻方量化创立。在硅谷,DeepSeek很早就被称作“来自东方的神秘力量”,也是网上热议的“杭州六小龙”之一。

真正让DeepSeek火出圈的是2024年12月26日,这家公司宣布上线并同步开源的DeepSeek-V3模型,并公布了长达53页的训练和技术细节。它以1/11的算力、仅2000个GPU芯片训练出性能超越GPT-4o的大模型。其总训练成本只有557.6万美元,而GPT-4o的约为1亿美元,使用25000个GPU芯片。双方的成本至少是10倍的差距。

在性能上,DeepSeek-V3在数学、代码能力和中文知识问答方面还超过了ChatGPT-4o。国外独立测评机构Artificial Analysis测试后,发出了“超越了迄今为止所有开源模型”的惊叹;Meta科学家田渊栋感慨:“这是非常伟大的工作。”“性价比”是商业社会中的制胜法宝之一,DeepSeek也因创新的模型架构和史无前例的性价比被称为“大模型界的拼多多”,引发字节、阿里、百度等大厂的大模型价格大战。

另据悉,早在2015年,30岁的梁文锋和朋友一起创办了杭州幻方科技有限公司,立志成为世界顶级的量化对冲基金。2016年10月,幻方量化推出第一个AI模型,第一份由深度学习生成的交易仓位上线执行。到2017年底,几乎所有的量化策略都采用AI模型计算。2023年5月,38岁的梁文锋宣布做通用人工智能(AGI)。同年7月,他正式创办杭州深度求索人工智能基础技术研究有限公司,就是DeepSeek公司,专注于AI大模型的研究和开发。从公开的工作经历和职业生涯来看,梁文锋在量化投资和高性能计算领域具有深厚的背景和丰富的经验,创业范畴横跨金融和人工智能领域。

梁文锋此前接受采访时曾表示,回望过去30多年IT浪潮,中国基本没有参与到真正的技术创新里。被外界视为理想主义者的梁文锋称,“我们觉得现在最重要的是参与到全球创新的浪潮里去。”他说,“过去很多年,中国公司习惯了别人做技术创新,我们拿过来做应用变现,但这并非一种理所当然。这一波浪潮里,我们的出发点,就不是趁机赚一笔,而是走到技术的前沿,去推动整个生态发展。”

作者:文/记者林明聪
编辑:王闻闻
值班主任:苏碧银
值班编委:林小军

深度求索(DeepSeek)创始人梁文锋。图片来源央视网

“真没想到,这几天火遍全网的DeepSeek创始人梁文锋,来自咱们湛江吴川!”1月27日,家住吴川梅菉的陈先生在朋友圈这样说。

近日,中共中央政治局常委、国务院总理李强主持召开专家、企业家和教科文卫体等领域代表座谈会,听取对《政府工作报告(征求意见稿)》的意见建议。其中,来自湛江吴川的AI初创公司深度求索(DeepSeek)创始人梁文锋出席座谈会,并现场发言。

此前的2024年12月,梁文锋和团队开发的大模型“DeepSeek-V3”发布,这款大模型以低成本、高性能以及开源模式迅速轰动硅谷、震惊全球,被海外称作“来自东方的神秘力量”。

刷屏湛江人朋友圈的梁文锋,有着怎样的成长经历?1月27日,记者到吴川进行了深入寻访。

“他自小成绩优异,对科技怀有浓厚兴趣”

“梁文锋的小学时光是在吴川城区梅菉小学度过的,这里也是他科技梦想起航的地方。”据曾在梅菉小学任教并担任过梁文锋班主任的李先生讲述,梁文锋的父母均为小学教师,他的父亲在梅菉小学执教。“我记得梁文锋在梅菉小学六(3)班担任学习委员,成绩在班上名列前茅。”李先生说,1996年,梁文锋以优异的成绩从梅菉小学直升至吴川一中,成为当时整个梅菉小学仅有的4名直升生之一。

李先生回忆说,梁文锋在学习上有几大特点:一是课堂高度专注,他总能聚精会神地聆听老师的每一句话,生怕错过任何一个知识点;二是积极回答问题,每当老师抛出问题,他总是第一个举手回答;三是喜欢挑战难题,具有刻苦钻研的精神;四是善于总结学习方法,他总能迅速归纳老师的授课内容,形成自己的知识体系。

李先生说,除了学业上的优异表现,梁文锋还展现出了对科技的浓厚兴趣。课后,他积极参与科技小活动,热衷于制作航空、航海模型,动手实践的能力比较强。印象中,梁文锋在小学三、四年级的时候就爱好集邮,他集邮有一个特点是“以邮养邮”,就是收到邮票后拿去卖,卖后又集回,基本不用花父亲的钱。

梁文锋初中和高中阶段均就读于吴川一中,一直是学校里的“尖子生”,并在数学学科表现出极大天赋,初中时期就学完了高中数学,甚至开始学大学的数学,数学思维能力很强。据梁文锋的一位初三老师回忆,初中时期的梁文锋性格很文静,但不是书呆子,他在学习上很有自己的“一套方法”,很注重劳逸结合,像是很轻易就可以学好每一个学科。

2002年,17岁的梁文锋参加全国普通高考,以理科816分、吴川市第一中学“高考状元”的成绩考上浙江大学本科电子信息工程专业,于2007年考上浙江大学信息与通信工程专业研究生。在大学期间,梁文锋就与同学一起开始积累市场行情数据和探索全自动量化交易。

“他很有前瞻的眼光,完全是白手起家”

“读书的时候,梁文锋就经常做课题实验,学习刻苦,也热爱足球。”据梁文锋的一位高中同学兼好友陈先生介绍,大学时期,梁文锋读的AI工程专业前景并不明朗,但他很有前瞻的眼光。他说,梁文锋完全是白手起家,创业以来还做过全自动绣花机等产品,不断探索总结溯源。

陈先生还表示,梁文锋的衣着打扮和为人处世都非常低调,淳朴有善心,此前以个人名义捐了很多钱。

记者查询官方信息了解到,DeepSeek,全称“杭州深度求索人工智能基础技术研究有限公司”,成立于2023年7月,由知名量化资管巨头幻方量化创立。在硅谷,DeepSeek很早就被称作“来自东方的神秘力量”,也是网上热议的“杭州六小龙”之一。

真正让DeepSeek火出圈的是2024年12月26日,这家公司宣布上线并同步开源的DeepSeek-V3模型,并公布了长达53页的训练和技术细节。它以1/11的算力、仅2000个GPU芯片训练出性能超越GPT-4o的大模型。其总训练成本只有557.6万美元,而GPT-4o的约为1亿美元,使用25000个GPU芯片。双方的成本至少是10倍的差距。

在性能上,DeepSeek-V3在数学、代码能力和中文知识问答方面还超过了ChatGPT-4o。国外独立测评机构Artificial Analysis测试后,发出了“超越了迄今为止所有开源模型”的惊叹;Meta科学家田渊栋感慨:“这是非常伟大的工作。”“性价比”是商业社会中的制胜法宝之一,DeepSeek也因创新的模型架构和史无前例的性价比被称为“大模型界的拼多多”,引发字节、阿里、百度等大厂的大模型价格大战。

另据悉,早在2015年,30岁的梁文锋和朋友一起创办了杭州幻方科技有限公司,立志成为世界顶级的量化对冲基金。2016年10月,幻方量化推出第一个AI模型,第一份由深度学习生成的交易仓位上线执行。到2017年底,几乎所有的量化策略都采用AI模型计算。2023年5月,38岁的梁文锋宣布做通用人工智能(AGI)。同年7月,他正式创办杭州深度求索人工智能基础技术研究有限公司,就是DeepSeek公司,专注于AI大模型的研究和开发。从公开的工作经历和职业生涯来看,梁文锋在量化投资和高性能计算领域具有深厚的背景和丰富的经验,创业范畴横跨金融和人工智能领域。

梁文锋此前接受采访时曾表示,回望过去30多年IT浪潮,中国基本没有参与到真正的技术创新里。被外界视为理想主义者的梁文锋称,“我们觉得现在最重要的是参与到全球创新的浪潮里去。”他说,“过去很多年,中国公司习惯了别人做技术创新,我们拿过来做应用变现,但这并非一种理所当然。这一波浪潮里,我们的出发点,就不是趁机赚一笔,而是走到技术的前沿,去推动整个生态发展。”

相关阅读
打开APP
0 条评论
来说两句吧。。。
最热评论
最新评论
来说两句吧...
已有0人参与,点击查看更多精彩评论
加载中。。。。
表情