根据快科技 1 月 28 日的报道,DeepSeek 公司发布的大模型在国内外媒体中引起了热烈反响,并吸引了全球科技和投资界的关注。
DeepSeek 的创始人梁文锋是一位来自广东湛江吴川的 80 后。他的朋友陈先生最近透露了一些梁文锋的过去。
陈先生表示,在学生时代,梁文锋经常进行课题实验,展现出勤奋学习和远见卓识。
2002 年,梁文锋以吴川市第一中学高考状元的身份考入浙江大学电子信息工程专业,并继续在该校攻读研究生。
在大学期间,梁文锋不仅积累了市场数据,还探索了自动化量化交易领域。
陈先生进一步提到,尽管梁文锋在大学期间所学的 AI 工程专业前景并不明朗,但他始终保持着前瞻性思维。
对于梁文锋的成功,陈先生表示非常高兴,并透露梁文锋为人低调、淳朴善良,此前个人名义捐赠了大量资金。看到他取得成功,他感到十分欣慰,并前几天发信息祝贺。梁文锋表示今年过年会回吴川,但会低调出行。
公开资料显示,DeepSeek 成立于2023 年 5 月,是一家专注于大模型研发的创业公司。成立仅半年后,DeepSeek 就推出了免费商用、完全开源的代码大模型DeepSeek Coder。
2024 年 5 月,该公司发布了开源模型DeepSeek V2,将推理成本降低了近百倍,一举成名。
同年 12 月 26 日,DeepSeek 发布了全新系列模型DeepSeek-V3,在大模型主流排行榜中名列前茅。
今年 1 月 20 日,DeepSeek 又推出了性能对标OpenAI GPT-4 正式版的全新模型DeepSeek-R1,并同步开源了模型权重。这些成果在国内外 AI 领域引发了热烈讨论,DeepSeek 被誉为东方的神秘力量。
0 条